뉴스

SBS 뉴스 상단 메뉴

부산대 맞춤법 검사기에 500만 건 비정상 접근…"AI 학습에 악용"

검사기 화면 (사진=한국어 맞춤법 검사기 화면 캡처, 연합뉴스)

부산대가 20년 넘게 무료로 제공 중인 '한국어 맞춤법·문법 검사기'에 최근 특정 IP 주소로부터 수백만 건의 비정상적인 사용 정황이 포착됐습니다.

오늘(7일) 부산대 인공지능연구실에 따르면 지난 3월 초부터 4월 중순까지 한 달여 동안 경기 남부지역의 한 아파트로 추정되는 IP 주소에서 이 검사기에 500만 건 이상의 접근이 이뤄졌습니다.

이는 일간지 20년 치 분량으로 검사기 전체 이용자의 한 달 검색량의 절반에 해당하는 수준입니다.

검사기를 개발한 권혁철 부산대 정보컴퓨터공학부 교수는 "해당 아파트 거주자가 벌인 일은 아닌 것 같고, 누군가가 해당 IP를 해킹한 것으로 보인다"며 "문제의 IP를 차단했다"고 설명했습니다.

부산대 맞춤법 검사기 안내문 (사진=한국어 맞춤법 검사기 화면 캡처, 연합뉴스)

인공지능연구실은 해당 기간 서버 이용 요금이 갑자기 2배 이상 증가한 것을 수상히 여겨 조사를 벌였습니다.

그 결과 해당 IP 주소가 '딥러닝'을 위해 매크로 방식으로 검사기를 이용한 것으로 추정됐습니다.

실제 500만 건 이상의 사용에도 오류 수정이나 건의 사항 등 피드백 건수의 변화는 없었습니다.

인공지능(AI) 언어 학습에 필요한 30만 건의 데이터를 확보하려면 최소 15억 원이 드는 것으로 알려져 있는데 누군가가 무료 검사기를 악용했다는 분석이 제기됐습니다.

이런 일이 잦아지면 서비스 속도 저하로 다른 이용자가 피해를 볼 수 있고, 무료 서비스 제공에 차질이 발생할 수 있습니다.

권 교수는 "현재는 비정상적 접근이 없는 상태"라며 "서비스 이용 패턴을 꾸준히 점검해 상업적 이용과 대규모 데이터 수집을 제한할 계획"이라고 말했습니다.

한국어 맞춤법·문법 검사기는 1991년에 개발돼 2001년 무료 공개됐습니다.

한글과컴퓨터의 문서프로그램 '아래아 한글'의 맞춤법 검사 기능도 이 검사기에 기반하고 있습니다.

(사진=한국어 맞춤법 검사기 화면 캡처, 연합뉴스)
Copyright Ⓒ SBS. All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지

스브스프리미엄

스브스프리미엄이란?

    많이 본 뉴스