뉴스
대선 Pick
펼쳐보기

R&D 예산은 깎였지만…한국 AI가 세계 1등인 '이것' [스프]

[오그랲]

오그랲
 

세상 복잡한 이야기들, 5가지 그래프로 명쾌하게 풀어내는 오그랲입니다.
 

지금으로부터 11년 전인 2014년 스탠퍼드 대학교에서 한 프로젝트가 시작됩니다. 앞으로 AI가 우리 사회에 미칠 영향을 미리 파악해 보고, 또 다가올 미래를 예측하기 위해 인공지능 100년 연구 프로젝트, 'AI 100'을 시작한 겁니다. AI 100 프로젝트의 일환으로 스탠퍼드 대학교에선 AI에 관련된 데이터를 수집하고, 이를 분석해서 매년 보고서로 제공해주고 있는데요, 이름하여 AI Index Report입니다.

오늘 오그랲에선 지난 4월 초에 발간된 2025년 판 보고서를 정리해보려고 해요. 전 세계에서 모인 양질의 데이터가 담겨 있는 만큼 이 보고서를 보면 현재 글로벌 AI 시장이 어떻게 흘러가고 있는지, 또 그 안에서 우리는 어떤 전략을 세워야 하는지 힌트를 얻을 수 있을 겁니다. 보고서의 분량이 456페이지로 꽤 되는데요. 주욱 읽어보고, 중요하다고 생각하는 부분을 요약해서 여러분들에게 전달해 드리겠습니다.

오늘은 5개가 아닌 조금 더 많은 그래프들과 함께 오그랲 시작해 보겠습니다.


논문, 특허는 중국이 1위 vs AI 모델은 미국이 1위
일단 어느 나라가 AI를 휘어잡고 있는지부터 살펴보겠습니다. 뭐 말 안 해도 아시겠지만 미국과 중국이 주인공입니다.

먼저 특허와 논문을 살펴보면요, 중국이 미국을 크게 앞서고 있어요. 2023년에 AI 특허가 12만 2,511건인데 그중 69.7%가 중국 겁니다. 2위 미국과는 압도적으로 차이가 나죠. 특허뿐 아니라 논문에서도 중국의 영향력이 보입니다. 2023년에 나온 AI 논문이 모두 24만 2,736건인데 이 중 중국의 논문이 23.2%로 가장 많았습니다. 반면 미국은 9.2%였고요. 단순히 양적으로 압도하는 게 아니라, 질적으로도 그 영향력이 대단합니다. 논문의 퀄리티를 확인할 수 있는 인용을 보더라도 중국이 전체 인용 중 22.6%로 1등입니다.

하지만 실제 우리가 사용하는 모델들을 보면 미국 기업들이 꽉 잡고 있죠? 또 AI 하면 떠오르는 논문들도 대부분 미국산이고요. 맞습니다. 특허와 논문을 벗어나서 실제 모델들을 살펴보거나, 영향력 있는 논문들을 보면 여기선 미국이 주도하고 있어요.

2023년 가장 많이 인용된 AI 논문 100편을 꼽아보면 그중 절반을 미국이 차지하고 있습니다. 중국은 34편으로 2위를 차지했고요.

미국의 AI 연구기관 에포크 AI에서는 매년 뛰어난 능력을 가진 주목할 만한 모델을 꼽는데요, 지난해에 선정된 62개의 주목할 만한 모델들 중에 미국산이 40개입니다. 15개의 중국보다 배 이상 많은 수치죠.

그렇다면 우리나라는 어느 정도 수준인 걸까요? 우리나라도 보고서에서 1등을 차지한 게 있습니다. 바로 인구 10만 명당 AI 특허 건수죠.

우리나라가 17.27로 중국, 미국보다 앞선 1위를 기록하고 있습니다.

또 2023년 전 세계에서 가장 많이 인용된 논문 TOP 100에도 국내 논문 6편이 당당히 포함되어 있어요. 미국과 중국이 압도적이지만 독일, 홍콩에 이어서 우리나라가 캐나다와 공동 5위를 기록했죠. 2024년 에포크 AI가 선정한 주목할만한 모델에도 LG AI연구원에서 출시한 엑사원 3.5가 포함되어 있고요.

뛰어난 논문, 뛰어난 특허, 뛰어난 모델을 만들어내려면 고급 AI 인력을 모으는 게 중요할 텐데요, 이 보고서에는 링크드인 데이터를 활용해서 AI 인재가 어디로 흘러가는지도 분석해 두었습니다. 그렇다면 지난해 가장 AI 인재 유출이 심각한 나라는 어디였을까요? 바로 이스라엘과 인도였습니다. 특히 인도는 2019년부터 2024년까지 6년 연속 인재가 유출되었는데요, 인도를 떠난 인재들은 미국으로 넘어가 공부를 이어가고 있습니다.

2022년 미국의 국제 컴퓨터 사이언스 석사의 국적을 살펴보면 이렇게 인도 출신이 압도적으로 많습니다. 2등은 중국이고요. 사실 인도 출신 AI 인재들은 너무 많죠. 구글 CEO 순다르 피차이도 인도 출신이고요. MS, IBM, 퍼플렉시티 CEO 모두 인도 출신이죠.

2024년 인재 유출이 가장 심각했던 이스라엘의 상황도 살펴보겠습니다. 이스라엘 출신 개발자들도 빅테크 곳곳에 있습니다. 대표적으로 엔비디아를 볼까요? 엔비디아 임직원 중에 이스라엘의 최고 이공계 명문 대학인 테크니온 공대 출신을 살펴보면 1,119명으로 가장 많습니다. 2위인 스탠퍼드 대학교 출신이 671명이니까 거의 2배 수준이죠.

참고로 AI 인재가 가장 많이 유입되는 국가는 룩셈부르크였습니다. 6년 평균으로도 1등, 2024년만 놓고 봐도 1등이었죠. 룩셈부르크는 AI 스타트업의 인큐베이터를 자처하면서 스타트업 유치에 공을 들였어요.또 글로벌 빅테크들도 룩셈부르크에 연구소를 지어 AI 인재의 유인책이 되었죠.

반면 우리나라는요? 인도와 이스라엘과 비슷한 처지입니다. 2024년 우리나라 AI 인재 상황은 -0.36으로 순유출이고 조사국 가운데 우리나라 위로는 이스라엘, 인도, 헝가리, 튀르키예 밖에 없습니다.



AI 성능은 점점 상향평준화
보고서를 보면 다양한 모델들의 현재 성능이 얼마나 뛰어난지 확인할 수 있는 다양한 벤치마크 결과가 담겨 있습니다. 이 모든 결과를 한 문장으로 요약하자면, "AI 성능이 급격하게 향상되고 있다"로 정리할 수 있습니다.

AI의 성능이 너무 빠르게 좋아져서 기존에 나왔던 벤치마크는 무용지물이 되고, 그래서 더 복잡하고 어려운 테스트들이 등장하고 있습니다. 대학 수준의 과제들이 담겨있는 MMMU도 있고요, 언어모델의 고급 추론 능력을 확인할 수 있는 GPQA도 있습니다. 또 코드를 작성하고, 버그를 수정하는 AI의 능력을 확인할 수 있는 SWE도 있죠.

아예 끝판왕으로 인류 최후의 시험 HLE도 있습니다. 이 벤치마크에는 로마 비문을 번역하는 문제부터 저희 같은 범인들은 범접할 수 없는 생태학, 수학, 화학 문제들이 가득합니다.

MMLU 같은 다른 벤치마크에선 92점을 맞았던 오픈AI의 o1 모델이 인류 최후의 시험에선 8점이라는 성적표를 받을 정도로 고난도를 자랑합니다.

하지만 이런 고난도의 문제들을 개발했음에도 불구하고 불과 1년 사이에 AI 모델들은 좋은 성적을 내고 있습니다. MMMU는 18.8%p, GPQA는 48.9%p나 오를 정도로요. SWE는 2023년에 AI 모델이 코딩의 4.4%만 해결했는데, 1년 사이에 71.7%로 크게 늘었죠.

인류 최후의 시험의 경우엔 점수가 다른 벤치마크들 보다는 낮습니다.

딥시크R1이 8.5점을 받았고요, 구글 제미나이 2.5 프로가 18.4점을 받았습니다. 가장 최고점은 오픈AI의 o3가 받은 20.3점 수준이죠. 하지만 모델들의 성장세가 워낙 빠른지라, HLE를 만든 연구진들은 이 속도면 2025년 말이면 50점을 넘길 것으로 예측하고 있어요. 최고 수준의 문제에서 50점 이상을 받으면 대다수의 인간 전문가를 뛰어넘는 수준의 AI라고 봐야 한다는 사람도 있고요.

주목할만한 점은 이러한 성능 향상이 일부 특출난 모델에서만 발견되는 흐름이 아니라는 겁니다. 종류를 가리지 않고 많은 모델들의 성능이 상향 평준화되고 있어요. 모델의 상향 평준화가 국가를 가리진 않겠죠? 당연히 미국과 중국의 모델 사이의 성능 차이도 점점 줄어들고 있습니다.

이 그래프를 보면 알 수 있듯이 주요 벤치마크에서 격차가 거의 사라지는 모습입니다.

또 하나 주목할만한 점은 오픈소스로 대중에게 무료로 공개되는 모델들도 상향 평준화가 이뤄지면서 기업들이 공개하지 않는 모델들 못지않은 성능을 내고 있다는 겁니다. 게다가 기술 발전으로 모델을 학습시키는데 들어가는 비용도 줄어들면서 AI 기술을 쉽게 활용할 수 있는 환경이 만들어지고 있어요.

즉, AI 시장이 일부 국가들의 놀이터가 아니라 어느 국가라도, 또 어느 기업이라도 좋은 성능의 저비용 AI 모델을 활용해서 세상을 놀라게 할 수 있는 환경으로 변화하고 있다는 겁니다.


높아진 AI 성능... 노벨상을 낳다
과학계에는 인류가 달려들어도 여전히 풀지 못하는 난제들이 많이 있습니다. 수학을 보자면 밀레니엄 문제 7가지 문제 중 6개가 여전히 미해결 상태이고요. 넷플릭스 드라마 시리즈도 있는 삼체, 물리학의 삼체 문제도 다체 문제로 넘어가면 여전히 풀리지 않고 있어요. 생물학에도 이러한 난제가 있습니다. 바로 단백질 구조를 어떻게 규명할 것인가 하는 거죠.

단백질은 20가지의 아미노산으로 구성되어 있습니다. 그리고 어떤 아미노산이 어떤 순서로 구성되느냐에 따라 아주 다양한 구조를 가진 단백질이 나옵니다. 우리가 DNA를 분석하면, 단백질을 구성하는 아미노산의 순서는 알 수 있어요. 하지만 이 순서를 가지고 3차원 구조를 예측하는 일은 너무나 어렵습니다. 아미노산을 이루는 분자 간의 힘이 복합적으로 작용하면서 단백질이 접히고 꼬이고, 그러면서 매우 복잡하고 신기한 구조가 만들어지기 때문이죠. 이러한 형상을 프로틴 폴딩, 단백질 접힘이라고 하는데 이 문제를 해결하기 위해 수많은 과학자들이 달려들었어요.

이 단백질 구조를 확인하기 위해 수많은 시간과 돈이 들었습니다. 단백질에 X선을 쏘아서 실험적으로 그 구조를 파악하는데 수년의 시간이 걸릴 정도로 지난한 과정이었죠.

지난 1976년부터 2020년까지 인류가 밝혀낸 단백질 구조는 모두 17만 2,771개였어요. 전체 생물 종에 존재하는 단백질은 2억 개가 넘는데 말이죠.

실험적으로 단백질 구조를 파악하는 데 그치는 게 아니라 과학자들은 아미노산 정보로 단백질의 구조를 완벽하게 예측하기 위해 노력해 왔습니다. CASP이라는 대회에선 아미노산 서열 정보만 가지고 단백질 구조를 예측하는 모델을 만들어 겨룹니다. 모델 점수가 100점이면 실제 단백질과 예측이 완벽하게 일치한 거고 90점 이상이면 단백질 구조 예측에 성공한 것으로 보는데, 1994년에 시작된 첫 대회에서 어떠한 팀도 40점 이상을 받지 못했어요. 90점은 말 그대로 꿈의 점수였죠.

이 대회에서 뛰어난 성적을 낸 과학자가 있으니 바로 데이비드 베이커였습니다. 데이비드 베이커는 로제타라는 알고리즘을 이용했어요. 또 많은 사람들의 컴퓨터 리소스를 활용하기 위해 Foldit이라는 웹게임도 만들어서 연구에 활용했죠. 실제로 이 게임으로 에이즈 바이러스가 증식하는 데 필수적인 단백질 구조를 예측해 내기도 했습니다. 네이처에 등재된 이 논문에 게이머들은 공저자로 이름이 실리기도 했습니다.

데이비드 베이커의 로제타도 CASP에서 놀라운 성적을 보여줬지만 진짜 충격은 2018년에 등장합니다. 바로 알파폴드입니다. 알파고를 만든 구글 딥마인드가 단백질 접힘을 해결하기 위해 만든 알파폴드는 2018년 CASP에서 AI 기술을 활용해 58.9점이라는 뛰어난 성적을 냈어요. 그리고 다음 대회인 2020년엔 꿈의 성적인 90점을 넘겨버리죠.

2022년 7월엔 알파폴드가 예측한 단백질 구조를 공개하는 데 이때 공개된 단백질이 무려 2억 1,400만 개입니다. 44년간 17만 개를 확인하는 속도였다면 5만 년이 넘게 걸릴 난제를 단 몇 년 안에 AI가 해결해 버린 거죠.

그리고 이들은 작년에 노벨화학상을 수상합니다. 로제타로 컴퓨터를 활용해 새로운 단백질을 설계한 데이비드 베이커, 그리고 알파폴드로 단백질 구조를 예측해 낸 딥마인드의 데미스 허사비스와 존 점퍼가 주인공이었죠.

알파폴드를 필두로 과학분야에서 AI는 종횡무진하고 있습니다. 의학, 재료과학, 화학, 지구과학 등 분야를 가리지 않고 AI를 활용하고 있습니다. 일단 단백질 연구는 아예 AI 기반 연구로 중심축이 바뀌었어요. 단백질 구조 예측 같이 AI를 활용한 연구가 2024년 전체 생물과학 분야 연구의 19.7%를 차지할 정도로 말이죠.

엔비디아와 와이즈먼 연구소가 합작해서 만든 GluFormer는 AI를 활용해 4년 후 혈당 수치를 예측하고 있습니다. 당뇨병을 사후 치료가 아니라 사전 예방할 수 있도록 하겠다는 거죠. 이뿐만 아니라 임상 진료, 의약품 개발에도 AI가 적극적으로 활용되고 있어요.

미국 FDA가 2023년에만 AI가 적용된 의료기기 223건을 승인할 정도입니다. 2013년엔 3건뿐이었는데 10년 사이 엄청나게 늘어났어요.

AI로 220만 개의 신소재를 발견하기도 했고요. 양자컴퓨팅에 활용할 모델들도 있고, 단백질 예측을 넘어서 단백질 설계까지 AI를 활용하고 있습니다.


커져가는 AI 영향력... 규제와 투자 사이
과학계의 수많은 난제들을 풀어낼 정도로 AI의 성능은 높아지고 있습니다. 또 뛰어난 성능을 바탕으로 우리 생활 속에도 다양한 AI 서비스들이 스며들고 있죠. 하지만 사회 전반으로 AI가 확산되면서 관련된 사건 사고도 크게 늘어나고 있습니다.

AIID라는 데이터가 있습니다. AI의 윤리적 오용으로 발생한 사건들을 볼 수 있는데 2024년엔 그 수치가 233건으로 역대 최고치를 기록했어요. 이 사건들은 미디어에 보도된 것만 한정된 거라 실제 사건 수는 더 많을 수 있고요. 여기에는 지난 AI 상담 편에서 얘기했던 Character.ai와 대화를 하고 사망한 소년의 사례도 있고요, 우리나라 사례도 있습니다.

물론 AI 모델을 만들고 서비스하는 기업들은 모델의 편향성과 환각을 줄이기 위해 노력하고 있어요. 하지만 여전히 모델에서는 암묵적인 편견이 발견됩니다. 부정적 용어는 흑인과 연관 짓거나, 여성을 과학기술보다는 인문학과 자주 연결하고, 남성은 리더십과 붙이는 식으로 말이죠.

학계에서는 AI 모델의 위험성을 낮추기 위해 모델의 사실성과 진실성을 평가할 테스트도 출시하고 있습니다. 하지만 산업계에선 적극적으로 대응하고 있진 않아요. 각자 나름의 평가 지표만 내세울 뿐 책임 있는 AI를 평가할 수 있는 표준화된 시스템이 부재한 상황이죠.

일단 현재 흐름은 기업에서 부족한 지점을 국제기구에서 메꿔주는 모습입니다. OECD나 UN, EU에서 책임 있는 AI를 만들기 위해  투명성이나 신뢰성에 초점을 둔 프레임워크를 발표하고 있고, 정부와 기업들의 참여와 협력을 강화하고 있습니다.

AI의 잠재적 위험을 막기 위한 AI 관련 법안 제정도 크게 늘어났습니다.

2016년부터 누적해 보면 지난 9년간 전 세계에서 204건의 AI 관련법이 제정되었어요. 미국이 27건으로 가장 많았고 포르투갈, 러시아, 벨기에에 이어 우리나라가 5위입니다. 2024년만 놓고 보면 러시아가 7건으로 가장 많았고요. 미국은 딥페이크 같은 생성형 AI가 미칠 사회적 영향을 줄이기 위한 규제적 법률이 크게 늘어났다는 게 특징입니다.

물론 규제만 하는 건 아닙니다. 전 세계가 앞다투어 AI에 투자를 이어오고 있죠.

당연히 여기에서도 미국이 압도적인 1등입니다. 국가 수준에서 AI 공공 투자 규모를 살펴보면 2013년부터 2023년까지 누적치에서 미국은 52.3억 달러로 2위 영국과 거의 10배 차이가 납니다. 특이할만한 지점은 미국은 그 투자의 방향이 국방 영역이 압도적으로 높다면 유럽은 공공서비스와 교육이 높다는 겁니다.

AI 리더 그룹에 합류하고 싶은 다른 국가들은 대규모 투자를 약속하고 있어요. 캐나다는 AI 경쟁력 강화에 24억 캐나다 달러 투입 계획을 밝혔고요. 프랑스는 정부 주도로 1,090억 유로 규모의 민간 AI 투자 계획을 내놓았습니다. 영국은 AI 10년 대계를 발표하면서 약 140억 파운드를 투자할 것이라 약속했죠.

아시아 국가들의 상황을 보면 중국은 3,440억 위안의 반도체 펀드를 조성해 자국 반도체 산업 육성할 계획이고요. 인도는 ‘인도 AI 미션’에 향후 5년간 12억 5천만 달러 규모의 예산을 잡아 뒀고 사우디아라비아는 무려 1,000억 달러의 신규 AI 프로젝트 트랜센더스를 가동했습니다.

우리나라는 AI 세계 3대 강국이라는 목표는 내세우고 GPU를 신속히 확보해서 AI 연구를 돕겠다고 나서고 있지만 다른 국가들의 계획과 비교해 보면 여전히 격차가 크게 느껴집니다.


(남은 이야기는 스프에서) 더 깊고 인사이트 넘치는 이야기는 스브스프리미엄에서 보실 수 있습니다.
이 콘텐츠의 남은 이야기가 궁금하다면 하단 버튼 클릭! | 스브스프리미엄 바로가기 버튼
Copyright Ⓒ SBS. All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지

많이 본 뉴스

스브스프리미엄

스브스프리미엄이란?