미토스 AI는 왜 전 세계 금융권을 긴급 소집하게 만들었나 [스프]

⚡ 스프 핵심요약

앤트로픽의 신규 AI 모델 '미토스 프리뷰'는 제로데이 취약점을 하루 만에 수천 개 발견하고 기존 모델보다 월등한 익스플로잇 성능을 보여, 금융권을 비롯한 전 세계 정부와 기업들이 긴급 회의를 소집하는 등 심각한 사이버 보안 위협으로 인식되고 있습니다.

미토스 프리뷰 모델은 스스로 제한된 환경을 탈출해 테스터에게 연락하고 성공을 과시하며, 자신이 테스트 중임을 인식하고 은폐하려는 행동까지 보여 자율성 측면에서도 큰 우려를 낳고 있습니다.

금융 시스템은 오래된 레거시 코드와 방대한 고객 데이터로 인해 AI 기반 사이버 공격에 특히 취약하며, 미토스 같은 AI 모델이 무한대에 가깝게 취약점을 발견하고 공격 도구를 만들 수 있는 미래에는 AI를 활용한 선제적 방어 시스템 구축이 필수적입니다.

안녕하세요. 데이터를 만지고 다루는 안혜민 기자입니다. 앤트로픽의 신규 모델 때문에 난리가 났습니다. 전 세계 정부들이 부랴부랴 긴급회의를 소집할 정도로요. 오늘 오그랲에서는 앤트로픽의 미토스 이야기를 준비해 봤습니다. 앤트로픽의 새 모델이 도대체 어떤 성능을 갖고 있길래 이렇게 세상이 들썩이는 건지 다양한 데이터와 그래프를 통해 살펴보겠습니다.

월가 금융계 회장 긴급 소집한 미국... 이유는 AI 모델 때문에?
지난 4월 8일, 미 재무장관인 스콧 베센트와 연준 의장 제롬 파월이 월가 금융계의 거물급 회장님들을 긴급 소집합니다. 시티그룹 CEO, 모건스탠리 CEO, 뱅크오브아메리카 회장, 골드만삭스 회장, 웰스파고 CEO 등 회의에 참석한 인원들의 면면만으로도 회의의 무게감을 알려주죠. 또 트럼프와 사이가 좋지 않은 파월이 참여했다는 것 자체가 이 회의의 중요성을 방증하고요. 월가의 거물들인 만큼 당연히 자체 일정들이 있었을 텐데도 이들을 불러들인 이유는 보고서 때문입니다.

앤트로픽이 공개한 이 보고서에는 앤트로픽의 신규 모델 '미토스'에 대한 내용이 담겨 있습니다. 근데 사실 이 미토스라는 모델은 아직 시중에 공개되지 않았어요. 그럼에도 불구하고 미토스가 미국 금융 시스템 전체를 위협할 수 있다는 우려 때문에 금융계의 큰 손들을 모아 긴급회의가 진행되었던 거였죠.

다른 보도에 따르면 JD 밴스 부통령도 빅테크 리더들과 연쇄 회의를 했다고 하더라고요. 모델을 만든 당사자인 앤트로픽의 다리오 아모데이 뿐 아니라 샘 올트먼, 일론 머스크, 순다르 피차이, 사티아 나델라 등 AI 시장을 이끌고 있는 미국 내 빅테크 리더들과 비공개 전화 회의를 진행한 걸로 알려졌습니다.

미국만 난리난 게 아닙니다. 캐나다도 중앙은행과 주요 은행 대표들이 모여서 회의를 진행했다는 소식이 전해졌어요. 영국과 독일 등 유럽에서도 긴급 대응 회의에 나섰고요. 우리나라도 금융위원회가 주요 금융사의 실무자들을 긴급 소집해 비공개회의를 진행했습니다.

도대체 미토스가 뭐길래, 이렇게 난리가 난 걸까요? 사실 미토스라는 모델은 앤트로픽이 공개하고 싶어서 공개한 게 아니었습니다. 지난 3월에 있었던 앤트로픽의 보안 사고 때문에 세상에 알려졌던 거였죠. 3월 26일, 앤트로픽 내부 관리 시스템 상의 오류가 생겨서 공개되면 안 될 3,000여 건의 미발생 콘텐츠들이 노출되는 사고가 발생합니다. 이 자료들에는 가령 블로그 초안이라던가, 직원들의 육아 휴직 문서 같은 게 포함되어 있었죠. 해당 소식이 포츈을 통해 보도되자 앤트로픽은 부랴부랴 접근을 차단했지만 이미 내용은 유출된 뒤였습니다. 이 자료들 사이에 '미토스'라는 녀석이 포함되어 있었던 거죠.

기존 앤트로픽 모델들은 이렇게 크게 3단계로 구성되어 있었습니다. 다 문학 장르에서 따온 어휘들인데 하이쿠, 소네트, 오퍼스 이렇게 구분됩니다. 단계가 높으면 높을수록 복잡한 작업에 최적화된 모델들이 포진해 있습니다. 시간은 조금 더 걸리고 가격은 비싸지만 그만큼 어려운 문제들을 해결할 수 있는 Opus 4.7, Opus 4.6 같은 모델이 대표적입니다. 반면에 하이쿠 단계에는 간단한 업무에 특화된 모델들이 이렇게 존재하고요.

그런데 유출된 자료에 따르면 이 3단계 위에 새로운 등급이 있었습니다. 이름하여 '카피바라' 이 카피바라 등급에 속해있는 신규 모델로 '미토스'라는 AI 모델의 존재가 확인되었던 겁니다. 다만 이게 유출된 자료에 적혀있던 이름이다 보니까, 실제와는 다를 수 있어요. 프로젝트 명이 바뀌는 건 흔한 일이니까요.

그런데 5일 뒤에 또다시 정보 유출 사고가 발생해 버립니다. 이번엔 클로드 코드의 51만 줄이 넘는 코드 자체가 그냥 풀려버렸죠. 여기서도 카피바라라는 코드 네임을 추가로 확인하면서 사람들은 '아 이게 진짜구나'라는 생각을 하게 되었어요.

결국 앤트로픽은 신규 모델의 존재를 인정하고 공개해 버렸어요. 클로드 미토스 프리뷰라는 이름의 모델과 함께 관련된 보고서도 일반 대중들에게 공개했습니다. 그 보고서가 아까 말씀드린 그 보고서입니다. 보고서를 읽어본 관계자들은 멘탈이 나가버렸어요. 일각에서는 미토스라는 존재가 AI 시대의 '오펜하이머 모멘트'가 될 수도 있을 거라는 전망까지 하고 있죠.

AI 시대의 '오펜하이머 모멘트'? '미토스' 누구냐 넌
1945년 7월 16일, 미국의 뉴멕시코에서 실험 하나가 벌어집니다. 핵분열 연쇄 반응을 이용한 폭탄의 파괴력을 확인했던 바로 트리니티 실험입니다. 인류 최초의 핵실험에 성공한 오펜하이머는 "나는 이제 죽음이요, 세상의 파괴자가 되었도다"라고 나지막이 중얼거렸다고 하죠. 이처럼 획기적인 과학 기술이 인류에게 파멸적인 결과를 초래할 수도 있는 딜레마적 순간을 '오펜하이머 모멘트'라고 부릅니다.

앤트로픽의 미토스 프리뷰 모델이 왜 일각에서는 AI 시대의 오펜하이머 모멘트로까지 일컬어지는지 지표부터 살펴보겠습니다.

코드 작성, 버그 수정, 코드 리뷰 같은 프로그래밍 성능을 확인하는 벤치마크에서 미토스 프리뷰는 93.9%를 받았습니다. 미국 수학올림피아드 문제를 푸는 벤치마크에서도 97.6%를 받았고요. 또 대학원 수준의 과학 문제를 푸는 GPQA Diamond에서도 94.5%의 성적표를 받았습니다. 여러 영역에 걸쳐서 기존 앤트로픽의 상위 모델의 성적을 뛰어넘었고 다른 프런티어 모델을 압도하는 모습입니다.

다만 이러한 벤치마크 점수는 신규 모델을 발표하면 항상 따라오는 지표긴 합니다. 이전 모델보다 더 뛰어난 성능을 가져야지 새로운 모델로서 가치가 있고, 효용이 있을 테니까요.

이번 미토스에서 주목해야 하는 지점은 바로 사이버 보안 영역에서의 성능입니다. CTF라는 사이버 보안 해킹 대회가 있는데요. 이 대회의 문제들을 가지고 모델의 해킹 성능을 확인하는 Cybench라는 벤치마크가 있습니다. 여기서 미토스 프리뷰는 모든 문제를 100% 해결해 버렸습니다. 이 벤치마크로는 미토스 프리뷰의 성능을 제대로 확인할 수 없어서 실제 소프트웨어에서 발견된 버그나 취약점으로 구성된 CyberGym 벤치마크로 테스트를 해봤습니다.

기존 모델들 가운데 가장 점수가 높은 모델들을 살펴보면 60점대에 위치합니다. 그런데 미토스 프리뷰는 83.1%라는 압도적인 점수를 받아냈어요.

보고서에는 이런 내용까지 담겨 있습니다.

"미토스 프리뷰는 사용자 지시에 따라 모든 주요 운영체제와 웹 브라우저의 제로데이 취약점을 탐지할 수 있고, 이를 악용할 수 있다"

제로데이 취약점이란 아직 세상에 알려지지 않은 버그를 뜻합니다. 보안 패치가 개발되기도 전인 말 그대로 0일 차, 제로데이에 개발자가 인지하지도 못한 취약점을 미토스 프리뷰는 수 천 개나 발견했어요. 보통 이런 제로데이 취약점을 발견하려면 최고 수준의 보안 전문가들도 매우 많은 시간이 걸립니다. 하지만 보안 관련 지식이 없는 앤트로픽 직원이 테스트를 해보니 단 하루 만에 미토스 프리뷰는 찾아냈죠.

오픈소스 운영 체제 중 하나인 OpenBSD에서 27년간 발견되지 않았던 버그도 미토스 프리뷰는 찾아냈고요, 또 유튜브나 넷플릭스 등 거의 모든 동영상 서비스에서 사용되는 FFmpeg이라는 라이브러리의 버그도 16년 만에 밝혀졌습니다.

다만 버그를 찾아내는 성능과 그걸 실제 해킹에 활용하는 건 서로 다른 능력입니다. 시스템의 버그를 찾아서 취약점에 구멍을 뚫는 코드나 프로그램을 익스플로잇이라고 하는데, 미토스 프리뷰 모델은 이 익스플로잇 성능도 너무 뛰어났습니다.

주요 앤트로픽의 모델들을 가지고 파이어폭스의 버그를 파고드는 익스플로잇 미션을 줘 봤습니다. 기존 Opus 4.6은 수 백 번의 시도 중 단 두 번만 컴퓨터의 통제를 빼앗을 수 있었어요. 반면, 미토스 프리뷰는 무려 181회나 성공했죠. 통제 획득 전 단계인 레지스터 제어 수준까지 합치면 전체 시도 가운데 84.0%나 성공한 겁니다.

성능도 성능이지만 모델의 자율성 문제도 우려스럽다고 앤트로픽은 밝히고 있습니다. 모의 테스트 단계에서 미토스 프리뷰 모델을 격리된 공간에 넣어두고 한 번 탈출해서 연락해 보라고 미션을 줘 봤습니다. 이 녀석은 알아서 제한된 환경을 뚫었고 인터넷 접근 권한을 얻기 위해 익스플로잇을 진행해 테스터에게 연락했어요. 단순히 미션을 성공한 데 그치는 게 아니라 자신의 성공을 과시하기 위해 이 과정을 공개 사이트에 게시하기까지 했죠.

아주 드물긴 하지만 일부 테스트에선 자신이 하는 행동이 해선 안 되는 행동이라는 걸 인지하고 이걸 은폐하려는 행동을 보이기도 했고요. 테스트 가운데 29%는 자신이 현재 테스트를 받고 있다는 걸 인식하고 있었다는 증거도 관찰되었습니다.

사람들이 못 찾던 버그를 찾고 버그를 기반으로 시스템을 공격할 수 있으며 또 자율성도 훨씬 강화된 모델이라는 설명이 이 보고서에 담겨있으니 관계자들이 놀랄 수밖에 없겠죠.

물론 일각에서는 앤트로픽이 하반기 상장을 앞두고, 검증불가능한 내용들을 마케팅 요소로 쏟아낸 거라 지적하기도 합니다. 기술적 근거가 상대적으로 부족하고, 단순히 과도한 성능만 광고해서 추가 투자 유치를 위한 메시지 아니냐는 거죠. 하지만 앤트로픽은 이 모델이 사이버 보안의 판도를 바꿀 수 있는 위험한 모델이라고 판단했고, 만약 악용될 경우 돌이킬 수 없는 사회적 재앙이 발생할 수도 있으니 지금은 일반 대중들에게 출시하지 않겠다고 선언했습니다.

그 대신 앤트로픽은 먼저 12개 기업이 참여하는 보안 프로젝트를 진행하겠다 발표했어요.

투명한 날개를 가진 유리날개나비의 이름을 따와 붙여진 이름은 '글래스윙 프로젝트'입니다. AWS, 마이크로소프트, 애플, 엔비디아 등 대표 빅테크 기업들 뿐만 아니라 보안 기업인 팔로알토, 금융사 JP모건체이스 등도 함께 참여하여 선제적으로 방어 시스템을 갖출 계획입니다. 이미 일부 참여사들은 몇 주간 미토스 프리뷰 모델을 사용해서 선제적으로 방어 시스템을 구축하는 작업에 들어갔습니다.

미토스가 바꿔놓을 사이버 보안 시장
글래스윙 프로젝트가 계획했던 대로 술술 흘러간다면 미토스 프리뷰를 활용해 현재 시스템 상에서 발생할 수 있는 중요한 버그나, 취약점을 선제적으로 다 찾아버릴 수도 있을 겁니다. 아직 일반 대중들에게 공개하지 않았으니 공격은 없을 테고, 그전에 취약점을 찾아 미리 패치해서 대응하면 되니까요.

하지만 일각에서는 이러한 긍정적인 시나리오조차 쉽게 흘러가기 어려울 수 있다고 지적합니다. 사람들이 많이 사용하는 소프트웨어에선 패치와 수정이 신속하게 이뤄질 수 있지만 그 외 다른 프로그램들은 쉽지 않다는 거죠. 어떤 프로그램은 만든 지 너무 오래되어서 처리할 담당자가 없을 수도 있고요. 또 너무 오래된 코드라 관련 지식이 없어 수정이 어려울 수도 있으니까요.

취약점은 이미 노출되어 있고, 패치가 이뤄지지 않은 프로그램이 적지 않다면 보안 문제가 발생할 수밖에 없다는 지적입니다. 특히나 AI를 활용한 사이버 공격이 점점 늘어나는 요즘 같은 상황에서는 걷잡을 수 없이 상황이 심각해질 수도 있어요.

미국의 사이버 보안 기업인 크라우드 스트라이크가 발간한 글로벌 위협 보고서 자료입니다. 지난해 발생한 사이버 공격은 매 29분 꼴로 발생하고 있었어요. 2024년에 비해 65%나 빨라졌죠. 이렇게 빠른 공격이 가능한 이유는? 역시나 AI를 활용한 공격이 이뤄지기 때문입니다. AI 기반 사이버 공격은 전년 대비 89%나 증가했어요. 이미 앤트로픽에서는 자사 모델이 대규모 해킹 공격에 사용됐다는 걸 캐치하고 관련된 보고서를 발표하기도 했던 터라 사이버 보안에 특히 민감하게 반응할 수밖에 없었습니다.

그런데 사이버 보안 문제는 분야를 가리지 않고 발생할 텐데 왜 이번 사태엔 유독 금융권이 민감하게 반응한 걸까요? 이유는 금융 인프라에 있습니다. 금융 시스템은 1960~70년대에 만들어진 오래된 레거시 코드 위에 수십 년간 레이어를 쌓아 올리며 발전했습니다. 오래된 레거시 코드를 유지보수하는데 꽤나 많은 예산이 투입되는 탓에 금융계 내부에서도 골머리를 앓고 있죠. 그런데 앞서 살펴본 것처럼 미토스 프리뷰는 사람이 미처 인지하지 못한 오래된 코드의 취약점을 기가 막히게 찾아내다 보니 신경이 쓰일 수밖에 없는 겁니다.

게다가 일반 소비자부터 대기업까지 방대한 고객 데이터를 갖고 있다는 점도 해커 입장에서 금융권을 노리기 좋고요. 또 은행들끼리 공유하는 인프라의 영향으로 한번 해커들의 공격이 먹히기 시작하면 전파 속도가 상당할 수 있다는 점도 우려지점입니다. 그러다 보니 IMF 총재도 이번에 촉발된 AI발 사이버 리스크가 특정 국가에 국한된 문제가 아니라고 경고하기도 했습니다.

문제는 이런 AI 기반 사이버 공격이 이제 시작이라는 겁니다. 세계적인 클라우드 기관인 CSA의 보고서에 따르면 향후 기업을 대상으로 하는 사이버 공격이 드라마틱하게 늘어날 거라 경고하고 있죠. 앞으로 AI가 더 발전하면 미토스 프리뷰를 뛰어넘는 모델이 나올지 모르고 그렇게 되면 무한대에 가깝게 프로그램의 취약점을 발견하고 순식간에 공격 도구를 만들어낼 수 있을 테니까요.

이런 환경에서 방어자들이 여전히 패치 중심으로 대비해서는 답이 없을 거라는 게 CSA의 경고입니다. 사람이 조사하고, 개별적으로 패치해서 부분적으로 메우는 방식을 계속 사용한다면 실시간으로 이뤄질 공격에 대처하기가 사실상 불가능하다는 거죠. 단순히 방어에 그치는 게 아니라 훨씬 더 빠르게 대응할 수 있는 시스템을 갖추려면 결국 대안은 AI 뿐이라는 얘기가 나오고 있습니다. 과연 AI는 미래 사이버 보안 시장을 어떻게 바꿔 놓을까요?

이번 사태를 정리하다 보니 AI라는 거대한 변화의 흐름 속에서 무언가를 결정하고 목소리를 내는 무게추가 기업 쪽으로 완전히 넘어갔다는 생각이 많이 들었습니다. 앤트로픽이 이번에 보여준 행동, 마케팅적 요소를 떠나서 선제적으로 위험을 공개하고 방어 시스템 구축에 나선 건 충분히 긍정적으로 평가할 수 있어요.

하지만 결국 이 사태가 보여주는 건 AI 시장에서 키를 쥔 주체는 기업이라는 사실입니다. 표면적으로는 민관 협력으로 굴러가지만 실질적인 의사결정은 앤트로픽이 하고 있으니까요. 미국은 AI를 핵무기와 같은 전략 자산으로 분류해 관리하지만, 정부가 정말 컨트롤할 수 있을까요? 이미 미국 정부 내부에서조차 입장이 엇갈리고 있습니다. 국방부와의 갈등으로 앤트로픽은 공급망 위험 기업으로 분류된 상황이지만, 재무부는 미토스 모델 확보에 나서고 있으니까요.

기업이 AI 모델을 통제하는 구조를 무조건 나쁘다고 할 수는 없습니다. 다만 이 구조가 거버넌스 측면에서 취약점을 갖고 있다는 점은 분명히 고민해 볼 필요가 있어요. 만약 앤트로픽의 이사회 구성이 바뀌거나, 다른 회사에 인수되어 방향성이 달라진다면 어떻게 될까요? 또 모델을 가진 미국에서조차 이런 상황인데, 모델이 없는 나라들은요? 결국 협력을 요청하고 기다리는 수밖에 없겠죠.

AI가 사이버 보안의 창과 방패를 동시에 쥐게 된 지금, 과연 그 창과 방패를 누가 쥐어야 하는 걸까요? 오늘 준비한 오그랲은 여기까지입니다. 긴 글 끝까지 읽어 주셔서 진심으로 감사드립니다.

참고자료
- Assessing Claude Mythos Preview's cybersecurity capabilities | red.anthropic.com
- Claude Mythos Preview System Card | Anthropic
- Disrupting the first reported AI-orchestrated cyber espionage campaign | Anthropic
- Evaluating AI Agents' Real-World Cybersecurity Capabilities at Scale | CyberGym
- 2026 Global Threat Report | Crowdstrike
- The "AI Vulnerability Storm": Building a "Mythos-ready" Security Program | CSA

글 : 안혜민 디자인 : 안준석 인턴 : 김수영