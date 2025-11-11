뉴스

페이스북 모회사 메타가 1천 가지가 넘는 음성 언어를 인식할 수 있는 인공지능(AI) 기술을 선보였습니다.

메타의 기초AI연구팀은 소수 언어 등 1천600개 언어를 인식해 문자로 받아쓸 수 있는 자동음성인식(ASR) 체계를 현지시간 10일 공개했습니다.

메타는 모든 언어를 인식할 수 있다는 뜻을 담아 이 기술을 '옴니링구얼'(Omnilingual)이라고 명명했습니다.

메타는 옴니링구얼이 지원하는 언어 가운데는 지금까지 AI로 발음을 문자 체계로 전환한 적이 없는 언어 500종이 포함됐다고 설명했습니다.

이는 지금까지 주요 AI가 공식적으로 수십 가지 정도의 언어를 지원하는 데 그친 것과 대조적입니다.

대규모언어모델(LLM)에 의존하는 현재의 생성 AI는 관련 데이터가 많은 고자원 언어에서는 잘 동작하지만, 그렇지 않은 저자원 언어에서는 구동이 제한적입니다.

또 출시한 모델에 새로운 언어 지원을 추가하려면 전문가가 주도하는 미세조정을 거쳐야 하는 불편함도 있었습니다.

그러나 옴니링구얼은 소량의 음성-문자 데이터 쌍만 있더라도 기본적인 수준의 음성 인식 기능을 쓸 수 있다는 것이 메타의 주장입니다.

다만, 메타가 공개한 자료를 보면 옴니링구얼의 저자원 언어 문자 오류율은 고자원 언어보다는 상당히 높은 수준입니다.

고자원 언어 249종과 중자원 언어 881종에서는 오류율 10% 미만인 언어가 95%에 달했지만, 저자원 언어 546종에서는 오류율 10% 미만인 언어가 36%에 불과했습니다.

메타는 이날 옴니링구얼에 적용된 매개변수 70억 개 규모 음성 인코더를 누구나 활용할 수 있도록 오픈소스로 풀었습니다.

(사진=AP, 연합뉴스)
