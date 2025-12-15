<앵커>



우리 연구진이 개발한 국산 인공지능 모델의 실력을 가늠해보기 위해 올해 수능 문제를 직접 풀게 해봤습니다.



과연 얼마나 맞혔을지, 최승훈 기자가 그 성적표를 분석했습니다.



<기자>



국내 한 기업이 개발한 AI 모델입니다.



추론·연산 능력이 어느 정도 수준인지 실험해 봤습니다.



올해 수능 공통수학 18번 문제를 국산 AI와 제가 동시에 풀어보겠습니다.



문제를 읽고, 이해하고, 어떻게 풀지 생각하는 사이 벌써 30초가 흐르는데,



[최승훈 기자 : (AI가) 지금 이미 다 푼 건가요? (네.)]



AI는 벌써 답을 냅니다.



[최승훈 기자 : 12가 맞는 것 같은데. (네, 12가 맞습니다.) 12 맞죠. (풀었어?) 전 아직 못 풀었는데요.]



어려운 문제에 대해선 어떨까?



2026학년도 대학수학능력시험 확률과 통계 과목 30번 문항입니다.



주어진 조건에 따라 공 8개를 주머니 10개에 남김없이 나누어 넣는 경우의 수를 구해야 하는데, 오답률이 97%에 달할 만큼 어려운 문제로 꼽힙니다.



국내 대학 연구진이 우리나라 기업 5곳과 외국 기업 5곳에서 각각 개발한 인공지능 모델로 풀어봤습니다.



미국 구글의 제미나이, 중국의 딥시크 등 외국 AI 5개 중 4개가 정답을 맞혔지만, 업스테이지와 LG, 네이버, SK텔레콤, 엔씨소프트 등 국산 AI 5개는 모두 답을 맞히지 못했습니다.



어렵고 배점이 높은 수학 문제 20개를 풀고 성적표를 내봤습니다.



배점이 낮은 문제는 다 맞았다고 가정할 때, 외국 AI는 모두 1등급이 나왔지만, 국산 AI는 최고 2등급, 낮게는 4등급이 나왔습니다.



다만, 이번 실험에 쓰인 국산 모델들은 일반에 공개된 지 오래된 초기 버전인 데다, 추론에 특화하지 않은 모델도 있습니다.



전문가들은 다양한 문제를 빠르게 풀 수 있도록 학습하는 변수의 양을 대폭 늘리면 외국 AI와의 격차를 좁힐 수 있을 것으로 내다봤습니다.



[김종락/서강대 수학과 교수 : (성능을) 지금보다는 한 20%만 높여도 딥시크나 중국에서 나온 모델들이 있는데 그 모델 정도는 될 것 같다는 생각이 들었어요.]



정부는 이번 실험에 쓰인 AI 모델의 개발사들을 평가해 내년에 이른바 '국가대표 AI'를 선발하고 세계 10위권 수준에 진입시키겠다는 목표를 세웠습니다.



(영상취재 : 배문산, 영상편집 : 김진원)