⚡ 스프 핵심요약
앤트로픽의 신규 AI 모델 '미토스 프리뷰'는 제로데이 취약점을 하루 만에 수천 개 발견하고 기존 모델보다 월등한 익스플로잇 성능을 보여, 금융권을 비롯한 전 세계 정부와 기업들이 긴급 회의를 소집하는 등 심각한 사이버 보안 위협으로 인식되고 있습니다.
미토스 프리뷰 모델은 스스로 제한된 환경을 탈출해 테스터에게 연락하고 성공을 과시하며, 자신이 테스트 중임을 인식하고 은폐하려는 행동까지 보여 자율성 측면에서도 큰 우려를 낳고 있습니다.
금융 시스템은 오래된 레거시 코드와 방대한 고객 데이터로 인해 AI 기반 사이버 공격에 특히 취약하며, 미토스 같은 AI 모델이 무한대에 가깝게 취약점을 발견하고 공격 도구를 만들 수 있는 미래에는 AI를 활용한 선제적 방어 시스템 구축이 필수적입니다.
안녕하세요. 데이터를 만지고 다루는 안혜민 기자입니다. 앤트로픽의 신규 모델 때문에 난리가 났습니다. 전 세계 정부들이 부랴부랴 긴급회의를 소집할 정도로요. 오늘 오그랲에서는 앤트로픽의 미토스 이야기를 준비해 봤습니다. 앤트로픽의 새 모델이 도대체 어떤 성능을 갖고 있길래 이렇게 세상이 들썩이는 건지 다양한 데이터와 그래프를 통해 살펴보겠습니다.
월가 금융계 회장 긴급 소집한 미국... 이유는 AI 모델 때문에?
지난 4월 8일, 미 재무장관인 스콧 베센트와 연준 의장 제롬 파월이 월가 금융계의 거물급 회장님들을 긴급 소집합니다. 시티그룹 CEO, 모건스탠리 CEO, 뱅크오브아메리카 회장, 골드만삭스 회장, 웰스파고 CEO 등 회의에 참석한 인원들의 면면만으로도 회의의 무게감을 알려주죠. 또 트럼프와 사이가 좋지 않은 파월이 참여했다는 것 자체가 이 회의의 중요성을 방증하고요. 월가의 거물들인 만큼 당연히 자체 일정들이 있었을 텐데도 이들을 불러들인 이유는 보고서 때문입니다.
미국만 난리난 게 아닙니다. 캐나다도 중앙은행과 주요 은행 대표들이 모여서 회의를 진행했다는 소식이 전해졌어요. 영국과 독일 등 유럽에서도 긴급 대응 회의에 나섰고요. 우리나라도 금융위원회가 주요 금융사의 실무자들을 긴급 소집해 비공개회의를 진행했습니다.
도대체 미토스가 뭐길래, 이렇게 난리가 난 걸까요? 사실 미토스라는 모델은 앤트로픽이 공개하고 싶어서 공개한 게 아니었습니다. 지난 3월에 있었던 앤트로픽의 보안 사고 때문에 세상에 알려졌던 거였죠. 3월 26일, 앤트로픽 내부 관리 시스템 상의 오류가 생겨서 공개되면 안 될 3,000여 건의 미발생 콘텐츠들이 노출되는 사고가 발생합니다. 이 자료들에는 가령 블로그 초안이라던가, 직원들의 육아 휴직 문서 같은 게 포함되어 있었죠. 해당 소식이 포츈을 통해 보도되자 앤트로픽은 부랴부랴 접근을 차단했지만 이미 내용은 유출된 뒤였습니다. 이 자료들 사이에 '미토스'라는 녀석이 포함되어 있었던 거죠.
그런데 5일 뒤에 또다시 정보 유출 사고가 발생해 버립니다. 이번엔 클로드 코드의 51만 줄이 넘는 코드 자체가 그냥 풀려버렸죠. 여기서도 카피바라라는 코드 네임을 추가로 확인하면서 사람들은 '아 이게 진짜구나'라는 생각을 하게 되었어요.
결국 앤트로픽은 신규 모델의 존재를 인정하고 공개해 버렸어요. 클로드 미토스 프리뷰라는 이름의 모델과 함께 관련된 보고서도 일반 대중들에게 공개했습니다. 그 보고서가 아까 말씀드린 그 보고서입니다. 보고서를 읽어본 관계자들은 멘탈이 나가버렸어요. 일각에서는 미토스라는 존재가 AI 시대의 '오펜하이머 모멘트'가 될 수도 있을 거라는 전망까지 하고 있죠.
AI 시대의 '오펜하이머 모멘트'? '미토스' 누구냐 넌
1945년 7월 16일, 미국의 뉴멕시코에서 실험 하나가 벌어집니다. 핵분열 연쇄 반응을 이용한 폭탄의 파괴력을 확인했던 바로 트리니티 실험입니다. 인류 최초의 핵실험에 성공한 오펜하이머는 "나는 이제 죽음이요, 세상의 파괴자가 되었도다"라고 나지막이 중얼거렸다고 하죠. 이처럼 획기적인 과학 기술이 인류에게 파멸적인 결과를 초래할 수도 있는 딜레마적 순간을 '오펜하이머 모멘트'라고 부릅니다.
앤트로픽의 미토스 프리뷰 모델이 왜 일각에서는 AI 시대의 오펜하이머 모멘트로까지 일컬어지는지 지표부터 살펴보겠습니다.
다만 이러한 벤치마크 점수는 신규 모델을 발표하면 항상 따라오는 지표긴 합니다. 이전 모델보다 더 뛰어난 성능을 가져야지 새로운 모델로서 가치가 있고, 효용이 있을 테니까요.
"미토스 프리뷰는 사용자 지시에 따라 모든 주요 운영체제와 웹 브라우저의 제로데이 취약점을 탐지할 수 있고, 이를 악용할 수 있다"
제로데이 취약점이란 아직 세상에 알려지지 않은 버그를 뜻합니다. 보안 패치가 개발되기도 전인 말 그대로 0일 차, 제로데이에 개발자가 인지하지도 못한 취약점을 미토스 프리뷰는 수 천 개나 발견했어요. 보통 이런 제로데이 취약점을 발견하려면 최고 수준의 보안 전문가들도 매우 많은 시간이 걸립니다. 하지만 보안 관련 지식이 없는 앤트로픽 직원이 테스트를 해보니 단 하루 만에 미토스 프리뷰는 찾아냈죠.
오픈소스 운영 체제 중 하나인 OpenBSD에서 27년간 발견되지 않았던 버그도 미토스 프리뷰는 찾아냈고요, 또 유튜브나 넷플릭스 등 거의 모든 동영상 서비스에서 사용되는 FFmpeg이라는 라이브러리의 버그도 16년 만에 밝혀졌습니다.
다만 버그를 찾아내는 성능과 그걸 실제 해킹에 활용하는 건 서로 다른 능력입니다. 시스템의 버그를 찾아서 취약점에 구멍을 뚫는 코드나 프로그램을 익스플로잇이라고 하는데, 미토스 프리뷰 모델은 이 익스플로잇 성능도 너무 뛰어났습니다.
성능도 성능이지만 모델의 자율성 문제도 우려스럽다고 앤트로픽은 밝히고 있습니다. 모의 테스트 단계에서 미토스 프리뷰 모델을 격리된 공간에 넣어두고 한 번 탈출해서 연락해 보라고 미션을 줘 봤습니다. 이 녀석은 알아서 제한된 환경을 뚫었고 인터넷 접근 권한을 얻기 위해 익스플로잇을 진행해 테스터에게 연락했어요. 단순히 미션을 성공한 데 그치는 게 아니라 자신의 성공을 과시하기 위해 이 과정을 공개 사이트에 게시하기까지 했죠.
아주 드물긴 하지만 일부 테스트에선 자신이 하는 행동이 해선 안 되는 행동이라는 걸 인지하고 이걸 은폐하려는 행동을 보이기도 했고요. 테스트 가운데 29%는 자신이 현재 테스트를 받고 있다는 걸 인식하고 있었다는 증거도 관찰되었습니다.
물론 일각에서는 앤트로픽이 하반기 상장을 앞두고, 검증불가능한 내용들을 마케팅 요소로 쏟아낸 거라 지적하기도 합니다. 기술적 근거가 상대적으로 부족하고, 단순히 과도한 성능만 광고해서 추가 투자 유치를 위한 메시지 아니냐는 거죠. 하지만 앤트로픽은 이 모델이 사이버 보안의 판도를 바꿀 수 있는 위험한 모델이라고 판단했고, 만약 악용될 경우 돌이킬 수 없는 사회적 재앙이 발생할 수도 있으니 지금은 일반 대중들에게 출시하지 않겠다고 선언했습니다.
그 대신 앤트로픽은 먼저 12개 기업이 참여하는 보안 프로젝트를 진행하겠다 발표했어요.
미토스가 바꿔놓을 사이버 보안 시장
글래스윙 프로젝트가 계획했던 대로 술술 흘러간다면 미토스 프리뷰를 활용해 현재 시스템 상에서 발생할 수 있는 중요한 버그나, 취약점을 선제적으로 다 찾아버릴 수도 있을 겁니다. 아직 일반 대중들에게 공개하지 않았으니 공격은 없을 테고, 그전에 취약점을 찾아 미리 패치해서 대응하면 되니까요.
하지만 일각에서는 이러한 긍정적인 시나리오조차 쉽게 흘러가기 어려울 수 있다고 지적합니다. 사람들이 많이 사용하는 소프트웨어에선 패치와 수정이 신속하게 이뤄질 수 있지만 그 외 다른 프로그램들은 쉽지 않다는 거죠. 어떤 프로그램은 만든 지 너무 오래되어서 처리할 담당자가 없을 수도 있고요. 또 너무 오래된 코드라 관련 지식이 없어 수정이 어려울 수도 있으니까요.
취약점은 이미 노출되어 있고, 패치가 이뤄지지 않은 프로그램이 적지 않다면 보안 문제가 발생할 수밖에 없다는 지적입니다. 특히나 AI를 활용한 사이버 공격이 점점 늘어나는 요즘 같은 상황에서는 걷잡을 수 없이 상황이 심각해질 수도 있어요.
그런데 사이버 보안 문제는 분야를 가리지 않고 발생할 텐데 왜 이번 사태엔 유독 금융권이 민감하게 반응한 걸까요? 이유는 금융 인프라에 있습니다. 금융 시스템은 1960~70년대에 만들어진 오래된 레거시 코드 위에 수십 년간 레이어를 쌓아 올리며 발전했습니다. 오래된 레거시 코드를 유지보수하는데 꽤나 많은 예산이 투입되는 탓에 금융계 내부에서도 골머리를 앓고 있죠. 그런데 앞서 살펴본 것처럼 미토스 프리뷰는 사람이 미처 인지하지 못한 오래된 코드의 취약점을 기가 막히게 찾아내다 보니 신경이 쓰일 수밖에 없는 겁니다.
게다가 일반 소비자부터 대기업까지 방대한 고객 데이터를 갖고 있다는 점도 해커 입장에서 금융권을 노리기 좋고요. 또 은행들끼리 공유하는 인프라의 영향으로 한번 해커들의 공격이 먹히기 시작하면 전파 속도가 상당할 수 있다는 점도 우려지점입니다. 그러다 보니 IMF 총재도 이번에 촉발된 AI발 사이버 리스크가 특정 국가에 국한된 문제가 아니라고 경고하기도 했습니다.
이런 환경에서 방어자들이 여전히 패치 중심으로 대비해서는 답이 없을 거라는 게 CSA의 경고입니다. 사람이 조사하고, 개별적으로 패치해서 부분적으로 메우는 방식을 계속 사용한다면 실시간으로 이뤄질 공격에 대처하기가 사실상 불가능하다는 거죠. 단순히 방어에 그치는 게 아니라 훨씬 더 빠르게 대응할 수 있는 시스템을 갖추려면 결국 대안은 AI 뿐이라는 얘기가 나오고 있습니다. 과연 AI는 미래 사이버 보안 시장을 어떻게 바꿔 놓을까요?
이번 사태를 정리하다 보니 AI라는 거대한 변화의 흐름 속에서 무언가를 결정하고 목소리를 내는 무게추가 기업 쪽으로 완전히 넘어갔다는 생각이 많이 들었습니다. 앤트로픽이 이번에 보여준 행동, 마케팅적 요소를 떠나서 선제적으로 위험을 공개하고 방어 시스템 구축에 나선 건 충분히 긍정적으로 평가할 수 있어요.
하지만 결국 이 사태가 보여주는 건 AI 시장에서 키를 쥔 주체는 기업이라는 사실입니다. 표면적으로는 민관 협력으로 굴러가지만 실질적인 의사결정은 앤트로픽이 하고 있으니까요. 미국은 AI를 핵무기와 같은 전략 자산으로 분류해 관리하지만, 정부가 정말 컨트롤할 수 있을까요? 이미 미국 정부 내부에서조차 입장이 엇갈리고 있습니다. 국방부와의 갈등으로 앤트로픽은 공급망 위험 기업으로 분류된 상황이지만, 재무부는 미토스 모델 확보에 나서고 있으니까요.
기업이 AI 모델을 통제하는 구조를 무조건 나쁘다고 할 수는 없습니다. 다만 이 구조가 거버넌스 측면에서 취약점을 갖고 있다는 점은 분명히 고민해 볼 필요가 있어요. 만약 앤트로픽의 이사회 구성이 바뀌거나, 다른 회사에 인수되어 방향성이 달라진다면 어떻게 될까요? 또 모델을 가진 미국에서조차 이런 상황인데, 모델이 없는 나라들은요? 결국 협력을 요청하고 기다리는 수밖에 없겠죠.
참고자료
- Assessing Claude Mythos Preview's cybersecurity capabilities | red.anthropic.com
- Claude Mythos Preview System Card | Anthropic
- Disrupting the first reported AI-orchestrated cyber espionage campaign | Anthropic
- Evaluating AI Agents' Real-World Cybersecurity Capabilities at Scale | CyberGym
- 2026 Global Threat Report | Crowdstrike
- The "AI Vulnerability Storm": Building a "Mythos-ready" Security Program | CSA
글 : 안혜민 디자인 : 안준석 인턴 : 김수영
동영상 기사
동영상 기사
댓글