<앵커>
지금까지의 우리나라의 독자 AI 개발 수준을 알아보기 위해 국내 연구진이 국산 AI로 올해 수능 문제를 풀어봤습니다.
실력은 과연 어땠는지, 최승훈 기자가 보도합니다.
<기자>
국내 한 기업이 개발한 AI 모델입니다.
추론·연산 능력이 어느 정도 수준인지 실험해봤습니다.
올해 수능 공통수학 18번 문제를 국산 AI와 제가 동시에 풀어보겠습니다.
문제를 읽고, 이해하고, 어떻게 풀지 생각하는 사이 벌써 30초가 흐르는데,
[최승훈 기자 : (AI가) 지금 이미 다 푼 건가요? (네.)]
AI는 벌써 답을 냅니다.
[최승훈 기자 : 12가 맞는 것 같은데. (네, 12가 맞습니다.) 12 맞죠. (풀었어?) 전 아직 못 풀었는데요.]
어려운 문제에 대해서는 어떨까?
2026학년도 대학수학능력시험 확률과 통계 과목 30번 문항입니다.
주어진 조건에 따라 공 8개를 주머니 10개에 남김없이 나누어 넣는 경우의 수를 구해야 하는데, 오답률이 97%에 달할 만큼 어려운 문제로 꼽힙니다.
국내 대학 연구진이 우리나라 기업 5곳과 외국 기업 5곳에서 각각 개발한 인공지능 모델로 풀어봤습니다.
미국 구글의 제미나이, 중국의 딥시크 등 외국 AI 5개 중 4개가 정답을 맞혔지만, 업스테이지와 LG, 네이버, SK텔레콤, 엔씨소프트 등 국산 AI 5개는 모두 답을 맞히지 못했습니다.
어렵고 배점이 높은 수학 문제 20개를 풀고 성적표를 내 봤습니다.
배점이 낮은 문제는 다 맞았다고 가정할 때, 외국 AI는 모두 1등급이 나왔지만 국산 AI는 최고 2등급, 낮게는 4등급이 나왔습니다.
다만 이번 실험에 쓰인 국산 모델들은 일반에 공개된 지 오래된 초기 버전인 데다 추론에 특화되지 않은 모델도 있습니다.
전문가들은 다양한 문제를 빠르게 풀 수 있도록 학습하는 변수의 양을 대폭 늘리면 외국 AI와의 격차를 좁힐 수 있을 것으로 내다봤습니다.
[김종락/서강대 수학과 교수 : (성능을) 지금보다는 한 20%만 높여도 딥시크나 중국에서 나온 모델들이 있는데 그 모델 정도는 될 것 같다는 생각이 들었어요.]
정부는 이번 실험에 쓰인 AI 모델의 개발사들을 평가해 내년에 이른바 '국가대표 AI'를 선발하고 세계 10위권 수준에 진입시키겠다는 목표를 세웠습니다.
(영상취재 : 배문산, 영상편집 : 김진원)
동영상 기사
동영상 기사
동영상 기사
동영상 기사
동영상 기사