<앵커>
샘 올트먼이 이렇게 적극적으로 움직이는 건 중국의 새 인공모델 딥시크의 등장과도 무관치 않습니다.
그럼 기존의 AI 모델과 딥시크의 차이는 뭐고 이게 우리 업체는 어떤 영향을 미칠지 이 부분은 홍영재 기자가 취재했습니다.
<기자>
지난 2016년, 이세돌 9단과 알파고의 2번째 대국 장면입니다.
알파고가 둔 이 37번째 수, 프로 기사들에게는 충격 그 자체, 신의 한 수로 받아들여졌습니다.
[와. 정말 정말 생각지도 못한..]
[이세돌 9단 : 머신에 불과하다고 생각을 했었는데 그 수를 보는 순간 '아니구나. 충분히 알파고도 창의적이다.']
이 37번째 수에 이세돌 9단은 12분 동안 장고하기도 했습니다.
이 수는 인간의 지도 아래, 인간이 제공한 수많은 기보, 즉 데이터를 학습한 결과가 아니라, 알파고 스스로 수많은 시행착오를 거쳐 찾아낸, 이른바 '강화학습'의 대표적 사례로 꼽힙니다.
챗GPT 같은 빅테크의 최신 AI 모델은, 훈련 과정에서 사람이 일일이 추론 값을 조정하는 방식이어서 개발 시간과 비용이 많이 들었는데, 중국의 '딥시크'는 사람의 개입을 줄인 이런 대규모 강화학습으로 GPT만큼의 추론 성능을 달성한 겁니다.
딥시크의 또 다른 차별점은 바로 '증류'라고 불리는 기법입니다.
이 그림을 보시면, 오픈 AI가 망망한 데이터의 바다에서 유의미한 데이터를 골라 챗GPT란 물통에 담아 놓는데, 딥시크는 오픈 AI의 물통 즉, 인공지능이 생성한 데이터 통에 낚싯대를 드리워 학습합니다.
'증류' 기법은 대형 AI 모델이 정제한 데이터를 이용해 대형 모델만큼의 성능을 낼 수 있습니다.
데이터 도용, 또 개발비용에 대한 논란이 있는 게 사실이지만, 상당히 저렴한 개발비용과 운용비용이 드는 AI 모델을 오픈소스, 누구나 활용 가능하게 공개했다는 게 전 세계를 놀라게 한 부분입니다.
빅테크처럼 큰돈을 들이지 않고도 AI 모델을 개발할 수 있구나, 또 이렇게 오픈소스로 나오니까 AI 앱만 잘 개발하면 성과를 낼 수 있구나, 하는 기대감이 높아진 겁니다.
[박지민/클라이원트 AI엔지니어 : 가격도 저렴한데 성능은 그만큼 좋고 또 이 딥시크 같은 모델이 나오면은 또 그들끼리 모델을 제공해 주는 기업들끼리 또 경쟁이 일어나고….]
샘 올트먼은 딥시크와 같은 오픈소스 전략도 고려 중이라고 밝혔는데, AI 개발, 그리고 활용 방식이 새로운 국면을 맞게 됐고, 우리 기업들에게도 기회가 될 가능성은 충분합니다.
(영상편집 : 정용화, 디자인: 강경림·조수인, VJ : 정한욱)