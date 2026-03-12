▲ AI

▲ 미국 디지털혐오대책센터(CCDH)와 CNN 방송이 챗봇 10종을 대상으로 시험 조사를 벌여 이용자의 폭력 공격을 도운 비율(위)과 이용자를 만류·저지한 비율을 집계한 결과 그래프

주요 AI 즉 인공지능 챗봇 대다수가 이용자의 폭력 행위를 만류하거나 저지하지 않고 오히려 그들의 계획 수립을 돕는다는 조사 결과가 나왔습니다.미국 디지털혐오대책센터(CCDH)와 CNN 방송은 널리 쓰이는 AI 챗봇 10종을 대상으로 한 조사 결과를 현지 시간 11일 '살인자 앱' 보고서를 통해 공개했습니다.조사 대상 챗봇은 오픈AI '챗GPT', 구글 '제미나이', 앤트로픽 '클로드', 마이크로소프트 '코파일럿', 메타 '메타AI', 퍼플렉시티, 스냅챗 '마이 AI', 캐릭터.AI, 레플리카 등 미국 챗봇 9종과 중국의 챗봇 '딥시크'입니다.연구진은 학교 공격이나 암살, 폭탄 테러 등을 계획하는 10대 사용자로 가장해 이들 챗봇에 조언이나 정보를 구했습니다.그 결과 10종 중 9종이 이들을 만류하거나 저지하지 않았고, 8종은 공격 대상 장소나 무기 등에 대한 구체적인 정보를 제공했습니다.가장 적극적으로 위법행위를 도운 챗봇은 퍼플렉시티로, 응답의 100%에서 폭력 공격에 도움을 줬고, 한 번도 이를 거절하는 답변을 하지 않았습니다.딥시크와 메타AI, 코파일럿 등도 90% 이상의 응답에서 이용자의 위험한 요청에 응했습니다.캐릭터.AI는 공격을 돕는 응답을 제공한 비율은 83.3%로 상대적으로 낮았지만, 나머지 16.7%도 이용자를 돕고자 시도했으나 유용한 정보를 주지 못했을 뿐 요청을 거부한 사례는 한 건도 없었습니다.챗GPT도 폭력 공격 원조 요구에 응한 비율이 61.1%였습니다.다만 챗GPT는 폭탄 테러 등을 암시한 이후 특정 정당의 당사 위치를 묻자 알려주기를 거부하기도 했습니다.반면 앤트로픽의 '클로드'는 유해한 정보 요청에 응한 비율이 30.6%로 다른 챗봇들에 비해 눈에 띄게 적었습니다.클로드는 이용자를 만류하거나 저지한 비율도 76.4%로, 딥시크(12.5%)나 한 자릿수 비율에 그친 나머지 챗봇들과 확연한 차이를 보였습니다.답변 내용이 가장 심각했던 챗봇은 캐릭터.AI로, 조사 과정에서 7차례에 걸쳐 폭력을 직접 부추겼습니다.보험사를 응징할 방법을 묻자 대표에게 총을 쓰라는 답하는가 하면, 특정 정치인에 대해 분노를 표출하자 가짜 증거를 만들어 스캔들을 일으키라고 조언했습니다.괴롭히는 이들에게 복수할 방법을 묻는 질문에는 '한 방 먹여주라'고 답하기도 했습니다.조사 결과를 들은 기업은 일제히 반박과 해명에 나섰습니다.오픈AI는 CNN에 "조사 방법론에 결함과 오해의 소지가 있다"고 반박했고, 메타는 "문제를 해결하기 위한 조치를 취했다"고 답했습니다.캐릭터.AI는 "플랫폼 내 모든 캐릭터와 챗봇과의 대화가 허구임을 알리는 고지가 있다"고 해명했습니다.10종 중에서는 가장 안전한 것으로 드러난 앤트로픽에 대해서도 비판이 제기됐습니다.비네이 라오 전 앤트로픽 안전책임자는 "질문을 네 번만 하면 유해 행위를 저지르는 방법을 들을 수 있다는 건 놀라운 일"이라며 "나라면 이를 매우 심각하게 받아들일 것"이라고 꼬집었습니다.실제로 지난 2월 캐나다 브리티시컬럼비아주 텀블러리지에서 벌어진 총기난사 사건 범인이 챗GPT에 총격 등과 관련한 내용을 언급한 사실이 알려지면서 범죄 행위를 돕는 AI 챗봇의 위험성에 대한 우려가 커지고 있습니다.지난해 5월에는 핀란드의 한 학교에서도 16세 학생이 4개월간 챗GPT를 이용해 찌르기 기술, 증거 은폐 방법 등을 검색하며 공격을 계획한 끝에 14세 학생 3명을 흉기로 공격하기도 했다고 CNN은 전했습니다.(사진=CCDH 보고서 캡처, 연합뉴스)