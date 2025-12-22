AI 개발 경쟁이 심화하면서, 빅테크 기업들이 다른 회사 AI의 학습에 활용될 수 있는 자사 데이터에 대해 철통 방어에 나서고 있습니다.



그러나 여전히 자사 AI 학습에는 일반 사용자와, 창작자들의 데이터를 무차별로 활용하고 있어 '내로남불'이란 비판도 커지고 있습니다.



구글은 최근 스타트업 '서프Api'가 저작권을 침해하고 있다며 법원에 소송을 제기했습니다.



이 회사는 크롤링, 데이터 스크래핑 회사로 알려져 있는데, 크롤링은 웹을 돌아다니며 정보를 찾는 과정이고, 데이터 스크래핑은 여기서 필요한 데이터를 뽑아내 재사용하는 걸 뜻합니다.



구글은 이 회사가 이렇게 모은 데이터로 AI 모델을 훈련 시켰다고 주장하고 있습니다.



구글은 소장에서 "이 회사는 구글 보안 시스템을 무단으로 우회해 수억 건의 가짜 검색 요청으로 데이터를 수집했다"며 "이들의 사업 모델은 '기생충'같다"며 강도 높게 비판했습니다.



그런데 정작 구글도 지난 9월 시각 예술가들로부터 저작권 침해 소송을 당했습니다.



구글의 이미지 생성 AI가 저작권을 무시한 채 이미지 데이터를 수집해 학습했다는 겁니다.



구글이 웹 데이터와 개인 정보를 무차별적으로 AI 학습에 활용했다며 사용자들이 집단소송에 나서기도 했습니다.



다른 빅테크 기업도 사정은 마찬가지입니다.



소셜미디어 X를 소유한 일론 머스크 테슬라 CEO는 데이터 약탈을 막겠다며 외부에서 데이터를 가져갈 수 있는 통로, X의 API를 유료화했지만, 정작 자신이 개발 중인 AI '그록'은 X 사용자들의 방대한 데이터를 무단으로 학습에 사용하고 있습니다.



메타도 자사의 소셜미디어 데이터를 크롤링하는 업체들을 강하게 비판하고 있지만, 정작 자사 AI 학습을 위해 불법 복제된 도서와 기사 콘텐츠를 수집했다가 작가와 출판사 단체로부터 집단소송을 당하기도 했습니다.



