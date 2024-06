[젠슨 황/엔비디아 CEO (지난 2월) : 모든 나라는 자신들만의 인공지능을 만들 수 있어야 합니다. 이것이 바로 '주권 AI(Sovereign AI)'라는 개념이 등장한 이유입니다.]



지난 2월 엔비디아 CEO 젠슨 황은 한 대담 자리에서 세계 모든 국가가 자국의 데이터를 바탕으로 각 나라의 사회와 문화를 이해하는 인공지능을 가져야 한다는 소버린 AI, 즉 AI 주권 개념을 강조했습니다.



이해를 돕기 위해 사례를 들어보겠습니다.



지도에 한반도 동쪽 바다를 표시한 뒤 챗GPT에 이름이 뭐냐고 영어로 물었습니다.



대답은 'sea of japan'.



다시 'east sea', '동해'가 아니냐고 묻자 일반적으로 'sea of japan'이라고 하지만 한국에서는 '동해'라고 한다는 답이 돌아왔습니다.



한반도를 배경으로 한 역사 질문에도 때로는 틀리게, 때로는 맞게 대답합니다.



국산 AI 언어모델 하이퍼클로버X 개발을 이끄는 네이버의 하정우 AI 퓨처 센터장에게 이유를 물었습니다.



[하정우/네이버 퓨처 AI센터장 : 생성 AI의 어떤 특성이나 능력치는 어떤 종류의 데이터를 프리 트레이닝 과정에서 배합을 하느냐, 그리고 그 이후에 추가적인 학습 소위 말하는 파인튜닝이라고 얘기를 하죠. 이런 어떤 데이터들을 가지고 파인 튜닝을 하느냐에 따라서 성격이 많이 결정이 됩니다. 특히 전반적인 지식에 대한 이해도는 프리 트레이닝에서 충분히 많은 데이터가 확보가 되어 있어야 이해도가 높아지는 부분인데요. 실리콘밸리 빅테크가 만드는 생성 AI들은 대부분 미국 지역에서 만들어지는 인터넷 데이터 중심으로 되어 있습니다.]



오픈 AI가 만든 챗GPT가 학습한 데이터의 90%가 영문으로 알려져 있는데, 외국어 데이터를 많이 학습할수록 한국 고유의 문화와 역사, 사회적 인식을 이해하지 못하는 답변이 나올 가능성이 크다는 겁니다.



후속 조치들을 통해 고칠 수는 없을까.



[하정우/네이버 퓨처 AI센터장 : 근본적인 해결이라기보다는 어떤 임시방편 형태로 각각의 지식에 대해서 건 바이 건은 처리할 수 있지만 전반적인 이해도는 낮을 수밖에 없는, 그리고 그 낮은 이해도가 발생하는 거는 프리 트레이닝 즉 사전 운용 단계 단에서 관련된 지역의 데이터의 비율이 너무 부족하기 때문에 발생하는 그런 관점에서 보시면 되겠습니다. 두더지가 나오면 거기 딱 때리면 걔는 들어가는데 다른 게 해결이 안 되는 거예요.]



'소버린 AI' 찬성론자인 하정우 센터장은 미국 빅테크가 만든 AI 모델이 중심이 되는 세상을 이렇게 예견합니다.



[하정우/네이버 퓨처 AI센터장 : 어디에서 만들어진 데이터가 다수를 차지하느냐가 그 AI의 성격을 결정을 하게 되는데, 실리콘밸리에서 만든 AI는 당연하게 미주 지역, 북미 지역이 가장 큰 시장이다 보니까 미국에서 만들어진 인터넷 데이터를 가장 많이 활용을 합니다. 자연스럽게 미국의 사고관을 가진, 하지만 전 세계 모든 나라 언어로 글을 자연스럽게 쓸 수 있는 AI가 만들어지는 거죠. 그래서 무서운 겁니다. 전 세계 어느 나라 언어 글로도 언어 장벽이 사라진 채로 콘텐츠를 되게 자연스럽게 쓸 수는 있지만, 그 자연스러운 글 기저에 깔려 있는 사상 자체가 미국의 가치관으로 바라보는 세상의 콘텐츠가 되는 거예요.]



AI 기술이 전기와 같이 산업과 삶의 필수 인프라가 되는 미래를 대비해야 한다는 겁니다.



[하정우/네이버 퓨처 AI센터장 : 기반 기술이나 인프라 기술이 기술 종속이 됐을 때 생길 수 있는 여러 가지 위험성에 대해서는 너무나도 잘 알려져 있죠. 우리가 모바일 앱 생태계에서 앱 수수료를 올렸을 때 아무것도 할 수 없었던 거라거나 만약에 발전소나 전기 같은 시설들이 모두 외국 기업에 의해서 운영된다고 했을 때, 가격을 올렸을 때 할 수 있는 것들이 많이 없어지는 것과 거의 비슷한 맥락이라고 봐야 될 것 같고요.]



다만 소버린 AI라는 개념이 각 국가에 AI 가속기를 팔아야 하는 엔비디아나 이미 국산 언어모델을 발표하고 상용화에 나선 네이버와 같은 IT 기업들의 마케팅 전략이라는 일부 의심도 있습니다.



하지만 각국 정부와 기업들이 자체 AI 모델 개발에 뛰어든 것도 사실입니다.



[하정우/네이버 퓨처 AI센터장 : 중국은 화웨이가 2021년에 4월에 판구-알파를 발표를 했고 우리나라는 네이버가 5월에 발표를 했죠. 인도나 핀란드나 네덜란드나 더 많은 나라들이 자국어 AI를 확보하기 위해서 노력을 하고 있고요. 정부 차원에서도 열심히 기업들을 지원을 하면서 진행을 하고 있는데 일본도 요즘은 대표적이죠. 소프트뱅크에 현금 지원 보조금을 거의 4,500억, 작년 올해 합해 가지고 지원을 하면서 슈퍼 컴퓨터를 확보를 해서 초거대 AI, 소버린 AI를 확보하기 위한 노력을 진행을 하고 있고요.]



하정우 센터장은 AI 기술이 발전할수록 생산성 향상 및 사회 전반에 끼칠 영향이 훨씬 커지게 될 텐데 우리 지역 문화를 더 잘 이해하는 AI 모델도 반드시 가지고 있어야 한다고 강조했습니다.



(취재 : 홍영재, 영상취재 : 김용우, 영상편집 : 원형희, 제작 : 디지털뉴스편집부)