뉴스

수능문제 30초 만에 '뚝딱'…국산 AI, 등급 매기자 반전

<앵커>

지금까지의 우리나라의 독자 AI 개발 수준을 알아보기 위해 국내 연구진이 국산 AI로 올해 수능 문제를 풀어봤습니다.

실력은 과연 어땠는지, 최승훈 기자가 보도합니다.

<기자>

국내 한 기업이 개발한 AI 모델입니다.

추론·연산 능력이 어느 정도 수준인지 실험해봤습니다.

올해 수능 공통수학 18번 문제를 국산 AI와 제가 동시에 풀어보겠습니다.

문제를 읽고, 이해하고, 어떻게 풀지 생각하는 사이 벌써 30초가 흐르는데,

[최승훈 기자 : (AI가) 지금 이미 다 푼 건가요? (네.)]

AI는 벌써 답을 냅니다.

[최승훈 기자 : 12가 맞는 것 같은데. (네, 12가 맞습니다.) 12 맞죠. (풀었어?) 전 아직 못 풀었는데요.]

어려운 문제에 대해서는 어떨까?

2026학년도 대학수학능력시험 확률과 통계 과목 30번 문항입니다.

주어진 조건에 따라 공 8개를 주머니 10개에 남김없이 나누어 넣는 경우의 수를 구해야 하는데, 오답률이 97%에 달할 만큼 어려운 문제로 꼽힙니다.

국내 대학 연구진이 우리나라 기업 5곳과 외국 기업 5곳에서 각각 개발한 인공지능 모델로 풀어봤습니다.

미국 구글의 제미나이, 중국의 딥시크 등 외국 AI 5개 중 4개가 정답을 맞혔지만, 업스테이지와 LG, 네이버, SK텔레콤, 엔씨소프트 등 국산 AI 5개는 모두 답을 맞히지 못했습니다.

어렵고 배점이 높은 수학 문제 20개를 풀고 성적표를 내 봤습니다.

배점이 낮은 문제는 다 맞았다고 가정할 때, 외국 AI는 모두 1등급이 나왔지만 국산 AI는 최고 2등급, 낮게는 4등급이 나왔습니다.

다만 이번 실험에 쓰인 국산 모델들은 일반에 공개된 지 오래된 초기 버전인 데다 추론에 특화되지 않은 모델도 있습니다.

전문가들은 다양한 문제를 빠르게 풀 수 있도록 학습하는 변수의 양을 대폭 늘리면 외국 AI와의 격차를 좁힐 수 있을 것으로 내다봤습니다.

[김종락/서강대 수학과 교수 : (성능을) 지금보다는 한 20%만 높여도 딥시크나 중국에서 나온 모델들이 있는데 그 모델 정도는 될 것 같다는 생각이 들었어요.]

정부는 이번 실험에 쓰인 AI 모델의 개발사들을 평가해 내년에 이른바 '국가대표 AI'를 선발하고 세계 10위권 수준에 진입시키겠다는 목표를 세웠습니다.

(영상취재 : 배문산, 영상편집 : 김진원)
Copyright Ⓒ SBS. All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지

많이 본 뉴스

스브스프리미엄

스브스프리미엄이란?