'업스테이지 도용 주장' 사이오닉AI 사과…"검증 엄밀하지 못해"


대표 이미지 영역 - SBS 뉴스

▲ 김성훈 대표 공개 검증

독자 인공지능(AI) 파운데이션 모델 정예팀 5개 가운데 하나인 업스테이지가 중국 모델을 도용했다고 주장했던 고석현 사이오닉AI 대표이사(CEO)가 사과했습니다.

고 대표는 소셜미디어(SNS)에 "레이어놈 레이어 값의 코사인(Cosine) 유사도만으로는 모델 웨이트(가중치) 공유 여부를 결론 내리기 어렵다"며, "해당 근거를 보다 엄밀하게 검증하지 않은 채 공개함으로써 불필요한 혼란과 논란을 야기한 점에 대해 진심으로 사과드린다"고 썼습니다.

고 대표는 지난 1일 업스테이지 AI 모델 솔라 오픈이 중국 기업 지푸AI의 'GLM-4.5-에어'와 일부 레이어에서 결정적인 유사도가 있다고 주장했습니다.

그러자 김성훈 업스테이지 대표는 바로 다음 날인 2일 고 대표의 주장이 사실이 아님을 증명하는 공개 검증회를 열고 사과를 촉구했습니다.

레이어놈의 유사성을 근거로 모델 가중치를 공유했다고 주장한 것은 통계적 착시라는 게 반박의 골자입니다.

해당 구간은 모델 전체의 0.0004%에 불과한 미세 영역으로 솔라 오픈의 99.9996%는 다른 모델과 완전히 상이하다는 게 김 대표 설명입니다.

김 대표에 따르면 레이어놈 유사성 판단에 사용된 '코사인 유사도' 역시 적절한 비교 기준이 아닙니다.

광고 영역

코사인 유사도는 벡터의 방향만 비교하는 단순 지표로, 통상 언어모델의 레이어놈은 비슷한 구조와 특성을 공유하기 때문에 독립적인 모델 간 유사도가 높은 건 자연스러운 현상입니다.

김 대표는 솔라 오픈이 GLM-4.5-에어의 토크나이저를 사용했다는 주장 역시 사실이 아니라고 말했습니다.

GLM의 어휘 수는 약 15만 개, 솔라 오픈은 19만 6천개로 공통 어휘는 약 8만 개에 불과합니다.

통상 동일 계열 토크나이저라면 70% 이상이 중복되는 게 일반적입니다.

김 대표는 "의견을 주고받는 건강한 토론은 환영하지만, 허위 사실을 단정적으로 전달하는 행위는 AI 3강을 향해 최선을 다하는 업스테이지와 정부 노력의 의미를 훼손하는 것"이라고 말했습니다.

업스테이지 도용 논란이 일단락되자 배경훈 부총리 겸 과학기술정보통신부 장관과 하정우 대통령실 AI미래기획수석도 소셜미디어(SNS)에 의견을 남겼습니다.

배 장관은 "AI 업계를 달군 기술적 논쟁을 지켜보며 대한민국 AI의 밝은 미래를 보았다"며 "사이오닉AI 대표의 사과를 보면 이렇게 K-AI가 발전한다는 생각이 들었다"고 적었습니다.

이어 "의혹 제기는 할 수 있는 것이고 의혹 제기를 공개 검증으로 증명한 업스테이지 대표, 의혹 제기 후 인정하고 멋지게 사과해주신 사이오닉AI 대표님 감사드린다"고 덧붙였습니다.

하 수석도 "(배 부총리에) 100% 동의하며 지난 이틀간 있었던 기술적이면서 건설적인 토론과 논쟁, 그리고 깔끔한 승복까지가 우리 AI 생태계가 글로벌 경쟁력이 있음을 보여준 단면이라고 생각한다"고 밝혔습니다.

(사진=유튜브 캡처, 연합뉴스)

Copyright Ⓒ SBS. All rights reserved.
무단 전재, 재배포 및 AI학습 이용 금지
광고 영역
이 시각 인기기사
기사 표시하기
많이 본 뉴스
기사 표시하기
SBS NEWS 모바일
광고 영역