구글 Antigravity 로 <소버린AI 판정시스템>을 한번 재미삼아 만들어 봤습니다.
https://sovereign-ai-evaluator.streamlit.app
모델카드, 기술리포트, 허깅스페이스 링크 등을 넣어서 분석해볼수 있게 만들었습니다.
테스트 해보니, 모델카드에서는 좋은등급이 나와도, 기술리포트에서는 명확한 등급이 나오는것 같습니다. 되도록 기술리포트로 보는게 정확할거 같습니다.
1) https://github.com/epoko77-ai/sovereign-ai-tclass-2.0/
– 이 내용 토대로, 추가적인 몇가지 로직을 넣어서 만들었는데, 로직이 있어도 판정에는 gemini 3.0 을 사용하기 때문에, 답변이 매번 살짝 다르거나, 약간의 할루시가 있는 경우도 있습니다. 최소화하려고 노력했지만, 남아있는듯요
2) 이건 제가 만든 소버린 ai tclass 2.0 체계인거지, 공식적인 판정 체계나 그런건 아닙니다. 여러가지 기준점을 가지고 참고할수 있도록 만든 것이기 때문에, 역시나 문제가 있으면 언제든지 수정가능하고, 반영가능합니다.
** 제가 페북에도 올리고, 깃허브에도 올렸지만, 직관적이지 않아서, 쉽게 해볼수 있도록 재미로 만들어본거로 봐주세요. 참고용입니다!!!!!
하지만, 강조하고 싶은건 투명성입니다. 독파모 프로젝트에서 how, performance 가 평가되어야 한다면, 충분히 이렇게 가능하다는 점을 보여드리고 싶어서, 허접한 실력으로 만들어 본겁니다.
엄청나게 빠르게 발전하는 AI때문에, 정책입안자 나 평가자들 힘드실것으로 알고 있지만, 여러가지 방법들이 있다는 점을 인지해주시길 부탁드립니다.
* p.s : 이 등급체계를 글로벌 버전으로 만든게 아니라서, 해외 모델을 넣으면 이렇게 나옵니다.
Deepseek 3.2 를 돌렸더니….
등급 판정 (Decision)
[T4-2] (Scaler)
“독자적인 ‘DeepSeek Sparse Attention(DSA)’ 아키텍처를 설계하고 Base 모델부터 무작위 초기화(Random Init)하여 학습했으나, ‘한국어 전용 토크나이저’ 요건 미충족으로 T5 진입 불가 판정.”
“아키텍처 수준은 T5(Native Arch)에 해당하나, 대한민국 Sovereign AI 표준의 필수 요건인 ‘한국어 문법 및 문화에 최적화된 Native Tokenizer’가 부재하고 외산 인프라를 사용하였으므로 T4-2로 최종 확정합니다.
