▲ 지난달 30일 서울 강남구 코엑스에서 열린 '독자 AI 파운데이션 모델 프로젝트 1차 발표회'에서 방문자가 SK텔레콤 A.X K1 모델을 사용하고 있다.
SK텔레콤은 '독자 AI 파운데이션 모델 프로젝트'를 위해 개발한 초거대 AI 모델 'A.X K1'의 기술보고서를 오픈소스 플랫폼 허깅페이스에 공개했다고 7일 밝혔습니다.
SKT에 따르면 A.X K1은 약 5천억 개(500B) 이상의 파라미터를 갖춘 초거대 언어모델입니다.
모델 설계와 학습 전략을 수립하는 과정에서 투입할 수 있는 연산 자원과 학습량에 따라 성능이 비례한다는 이른바 '스케일링 이론'을 적용했습니다.
개발 과정에는 1천 개 이상의 그래픽처리장치(GPU)가 학습에 투입됐으며, 학습 효율을 높이기 위한 연산량 관리와 최적화 기법을 함께 사용했다고 SKT는 설명했습니다.
특히 A.X K1은 수학 문제 해결과 코딩과 같은 특정 과제에서 비교 평가를 통해 상대적으로 높은 성능을 보였다고 회사는 전했습니다.
수학은 AIME25 벤치마크에서 89.8점을 받아 딥시크-V3.1 모델(88.4점) 대비 102% 수준으로 앞섰습니다.
코딩 활용도 측면에서 측정한 라이브코드벤치에서는 영어 기반 75.8점, 한국어 기반 73.1점을 기록했습니다.
딥시크-V3.1 대비 각각 109%, 110% 높은 수치입니다.
SKT는 올해 중 A.X K1에 텍스트, 이미지, 음성, 영상 등 다양한 유형의 데이터를 동시에 인식해 처리할 수 있는 멀티모달 기능을 추가하고, 파라미터 규모를 조 단위로 확대하는 방안을 추진할 계획입니다.
(사진=SK텔레콤 제공, 연합뉴스)
동영상 기사
동영상 기사
댓글