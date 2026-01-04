▲ 김성훈 대표 공개 검증
독자 인공지능(AI) 파운데이션 모델 정예팀 5개 가운데 하나인 업스테이지가 중국 모델을 도용했다고 주장했던 고석현 사이오닉AI 대표이사(CEO)가 사과했습니다.
고 대표는 소셜미디어(SNS)에 "레이어놈 레이어 값의 코사인(Cosine) 유사도만으로는 모델 웨이트(가중치) 공유 여부를 결론 내리기 어렵다"며, "해당 근거를 보다 엄밀하게 검증하지 않은 채 공개함으로써 불필요한 혼란과 논란을 야기한 점에 대해 진심으로 사과드린다"고 썼습니다.
고 대표는 지난 1일 업스테이지 AI 모델 솔라 오픈이 중국 기업 지푸AI의 'GLM-4.5-에어'와 일부 레이어에서 결정적인 유사도가 있다고 주장했습니다.
그러자 김성훈 업스테이지 대표는 바로 다음 날인 2일 고 대표의 주장이 사실이 아님을 증명하는 공개 검증회를 열고 사과를 촉구했습니다.
레이어놈의 유사성을 근거로 모델 가중치를 공유했다고 주장한 것은 통계적 착시라는 게 반박의 골자입니다.
해당 구간은 모델 전체의 0.0004%에 불과한 미세 영역으로 솔라 오픈의 99.9996%는 다른 모델과 완전히 상이하다는 게 김 대표 설명입니다.
김 대표에 따르면 레이어놈 유사성 판단에 사용된 '코사인 유사도' 역시 적절한 비교 기준이 아닙니다.
코사인 유사도는 벡터의 방향만 비교하는 단순 지표로, 통상 언어모델의 레이어놈은 비슷한 구조와 특성을 공유하기 때문에 독립적인 모델 간 유사도가 높은 건 자연스러운 현상입니다.
김 대표는 솔라 오픈이 GLM-4.5-에어의 토크나이저를 사용했다는 주장 역시 사실이 아니라고 말했습니다.
GLM의 어휘 수는 약 15만 개, 솔라 오픈은 19만 6천개로 공통 어휘는 약 8만 개에 불과합니다.
통상 동일 계열 토크나이저라면 70% 이상이 중복되는 게 일반적입니다.
김 대표는 "의견을 주고받는 건강한 토론은 환영하지만, 허위 사실을 단정적으로 전달하는 행위는 AI 3강을 향해 최선을 다하는 업스테이지와 정부 노력의 의미를 훼손하는 것"이라고 말했습니다.
업스테이지 도용 논란이 일단락되자 배경훈 부총리 겸 과학기술정보통신부 장관과 하정우 대통령실 AI미래기획수석도 소셜미디어(SNS)에 의견을 남겼습니다.
배 장관은 "AI 업계를 달군 기술적 논쟁을 지켜보며 대한민국 AI의 밝은 미래를 보았다"며 "사이오닉AI 대표의 사과를 보면 이렇게 K-AI가 발전한다는 생각이 들었다"고 적었습니다.
이어 "의혹 제기는 할 수 있는 것이고 의혹 제기를 공개 검증으로 증명한 업스테이지 대표, 의혹 제기 후 인정하고 멋지게 사과해주신 사이오닉AI 대표님 감사드린다"고 덧붙였습니다.
하 수석도 "(배 부총리에) 100% 동의하며 지난 이틀간 있었던 기술적이면서 건설적인 토론과 논쟁, 그리고 깔끔한 승복까지가 우리 AI 생태계가 글로벌 경쟁력이 있음을 보여준 단면이라고 생각한다"고 밝혔습니다.
(사진=유튜브 캡처, 연합뉴스)
