[스프] AI가 내 사진을 마음대로 가져간다면?

독자 여러분 안녕하세요? 지난 일주일은 잘 보내셨나요? 지난주 마부뉴스에서 다뤘던 산불이 이번주에도 큰 상처를 남겼습니다. 강릉에서 발생한 산불로 인해 축구장 면적의 530배 규모의 산림이 소실되었죠. 화마를 미처 피하지 못한 한 분은 숨지기까지 했습니다. 피해가 심각한 상황인데 하루빨리 상황이 잘 수습되고 이재민들이 일상으로 회복되길 간절히 바랄게요.

오늘 마부뉴스에선 AI에 대한 이야기를 해보려고 합니다. 혹시 독자 여러분 인터넷에서 해리포터 캐릭터들이 90년대 발렌시아가 풍의 패션모델로 재탄생한 영상 본 적 있나요? 당장 이 영상이 공개되자 사람들은 비슷한 스타일의 콘텐츠를 제작하고 있더라고요. 침착맨과 발렌시아가를 조합한 영상도 인기가 많고요. 무궁무진한 생성형 AI의 힘이라고 할 수 있을 겁니다.

그런데 이런 제작물에 내 작품이 무단으로 도용된다면 어떨 것 같나요? 더 나아가 내 얼굴이 무단으로 도용된다면요? 오늘 마부뉴스가 독자 여러분에게 던지는 질문은 바로 이 지점입니다.

만약 AI가 내 사진을 마음대로 가져간다면?

AI와 함께라면 어떠한 콘텐츠라도 뚝딱?!

해리포터 발렌시아가 영상은 크리에이터 Demonflyingfox의 작품입니다. Demonflyingfox가 특별히 코딩 천재이고 그래픽 기술을 가지고 있어서 저 영상을 만들었던 건 아닙니다. 크리에이터는 오로지 생성형 AI만으로 해리포터 발렌시아가 영상을 만들어냈거든요. 사용한 프로그램은 모두 4개. 특별한 기술 없이도 챗GPT, 미드저니, Eleven Labs, D-ID만 활용하면 저 영상을 충분히 만들어 낼 수 있는 거죠. 어떤 방식으로 Demonflyingfox가 작업을 진행했는지 아래에 정리해 봤으니 혹시 관심 있다면 독자 여러분도 한 번 시도해 보세요.

스프 마부뉴스

먼저 Demonflyingfox는 우선 챗GPT에다가 해리포터 캐릭터 10명을 뽑아달라고 했습니다. 그리곤 챗GPT에게 20년 경력의 발렌시아가 디자이너라는 역할을 부여한 뒤, 디자이너로서 90년대 느낌으로 해리포터 캐릭터들을 스타일링해달라고 주문을 했죠. 그러면 챗GPT가 주루루룩 답변을 합니다.

이 답변한 내용을 미드저니에 붙여 넣으면 벌써 절반은 끝입니다. 미드저니는 텍스트를 이미지로 바꿔주는 생성형 AI 모델이니만큼 순식간에 90년대 풍의 발렌시아가 패션을 입은 캐릭터들이 등장하죠.

세 번째 단계는 목소리를 넣는 겁니다. Eleven Labs는 간단한 음성 파일을 넣으면 음성 데이터를 학습하고, 합성된 음성으로 다양한 스크립트를 읽어낼 수 있는 텍스트 음성 변환 AI거든요. 유튜브에 있는 해리포터 배우들의 인터뷰 영상을 mp3 파일로 다운 받은 뒤 이 음성 파일을 Eleven Labs에 넣어서 스크립트를 읽도록 하면 끝이죠.

마지막 단계는 애니메이션 작업인데 이것도 D-DI라는 AI 프로그램으로 금방 처리할 수 있습니다. 미드저니에서 만들어낸 이미지와 Eleven Labs에서 생성한 오디오파일을 넣으면 누구라도 손쉽게 애니메이션을 제작할 수 있습니다.

이런 방식으로 발렌시아가와 반지의 제왕의 만남, 80년대 일본 야쿠자 스타일의 해리포터 이미지, 침착맨과 루브르 박물관을 조합할 수 있는 거죠. 게다가 생성형 AI의 발전속도가 워낙 빠르다 보니 음악을 만들어주는 AI도 나오고, 글을 비디오로 만들어주는 알고리즘도 우후죽순 등장하고 있습니다. 그만큼 돈도 몰리고 있어요. 2022년 생성형 AI 스타트업에 대한 벤처캐피탈 투자 건수는 약 110건, 투자 규모는 27억 달러 수준으로 성장했습니다.

AI가 만들어내는 마부뉴스 일러스트

마부뉴스도 가만히 있을 수 없죠. 마부뉴스의 자랑이자 마부뉴스의 아이덴티티! 마부뉴스의 알파이자 오메가인 깔끔한 일러스트를 생성형 AI로 만들어봤습니다. 기존에 나와있는 이미지 생성 AI는 방대한 데이터를 이미 학습해 온 모델을 우리가 이용하는 식이라 새로운 데이터를 넣어서 학습시키기가 까다롭습니다. 데이터를 헤칠 가능성도 있기 때문에 원천적으로 막아두는 AI도 있고요.

그런데 구글에서 작년에 드림부스라는 일종의 미세조정 방법론을 발표했는데 이 드림부스를 활용하면 기존 모델이 훈련한 데이터에 포함되지 않은 다양한 이미지를 생성할 수 있게 됩니다. 즉 다양한 생성형 AI에 새로운 데이터를 학습시켜서 비슷한 느낌을 내는 이미지를 만들어 낼 수 있다는 거죠. 그래서 올해 마부뉴스가 발송한 레터 중에 마부뉴스 일러스트 25개를 뽑아 드림부스를 활용해 Stable Diffusion에 학습시켰어요. 그리고 나온 결과를 보여드리겠습니다.

스프 마부뉴스

놀랍지 않나요? 25개 이미지를 학습시키는 데 걸리는 시간은 약 1시간. 아마 컴퓨터의 사양이 좋았다면 시간은 훨씬 줄어들었을 겁니다. 마부뉴스 일러스트를 학습시킨 Stable Diffusion에 “Woman eating Sandwich”라는 명령어를 넣으면 순식간에 위와 같은 일러스트를 만들어냅니다. 학습 데이터를 더 많이 넣고 파라미터를 미세 조정한다면 지금 이 그림들보다 훨씬 더 '마부뉴스'스러운 일러스트를 뽑아낼 수 있게 되겠죠.

생성형 AI에서는 결국 어떤 데이터를 학습시키느냐가 가장 중요합니다. 콩 심은 데 콩 나고 팥 심은 데 팥 나는 것처럼, 어떤 데이터를 넣으냐에 따라 나오는 결과물이 달라질 테니까요. 그런데 이런 생각이 들 수도 있을 것 같아요. 이렇게 누구나 간단하게 코드만 이용하면 마부뉴스 스타일의 그림을 뚝딱 그려낼 수 있는데, 만일 마부뉴스와 관계없는 사람들이 이렇게 마부뉴스 일러스트를 학습시킨 데이터로 일러스트를 그린다면 어떨까요? 발렌시아가처럼 이름난 패션 브랜드를 학습시켜서 생성한 디자인으로 옷을 만든다면요? 그리고 그것으로 경제적 이익을 본다면요?

원작자의 동의 없이 학습되는 AI

이젠 글자만 넣으면 논문 수준의 글이 나오고, 음악이 나오고, 그림과 비디오가 나오는 시대입니다. 이렇게 생성형 AI가 수많은 것들을 생산할 수 있었던 기반은 방대한 데이터를 학습했다는 데에 있죠. 생성형 AI는 대부분의 머신러닝 알고리즘과 마찬가지로 수많은 데이터를 학습해 그 패턴을 식별하고 복제해 새로운 무언가를 만들어냅니다. 문제는 학습하기 위해 긁어온 웹상의 수많은 데이터들이 저작권과 얽혀있다는 겁니다.

독자 여러분 혹시 <매직 더 게더링>이라는 게임 해본 적 있나요? 갑자기 게임 이야기를 꺼낸 건 다름이 아니라 <매직 더 게더링>의 컨셉아트에 참여한 그렉 루트코프스키라는 일러스트레이터 이야기를 하려고 하거든요. 워낙 이 방면에서 잘 나가는 사람이라 Stable Diffusion에서만 그의 이름이 93,000번 가량 사용되었다고 하죠.

처음에는 좋았다고 합니다. 많은 사람들로부터 자신의 작품이 인정받고 있다는 거니까요. 하지만 시간이 가면 갈수록 자신이 작업하지 않은 작품에 버젓이 자신의 이름이 달려있는 경우가 많아지면서 문제가 시작됐어요. 이런 상황이 지속되면 아티스트 수익에 타격이 올 수밖에 없잖아요. 그렉에게 따로 부탁하지 않아도 그렉의 일러스트 스타일대로 만들 수 있게 되면 굳이 돈을 들일 필요가 없게 되는 거니까요.

결국 그렉은 자신의 홈페이지에 “No to AI generated images”라는 공지를 걸어뒀습니다. 더 이상 자신의 작품을 허락 없이 AI에 사용하지 말라는 경고였죠. 최근엔 AI 기업들로부터 자신들의 작품과 데이터를 보호하는 유럽 예술가 단체인 EGAIR(European Guild for Artificial Intelligence Regulation)에 가입해 저작권 보호를 위한 활동을 계속해 나가고 있어요.

스프 마부뉴스

그렉과 같은 아티스트들이 얼마나 될지 확인하기 위해선 생성형 AI의 학습 데이터를 살펴봐야 할 텐데 그게 쉽지만은 않습니다. AI 업체들이 그 데이터를 공개하고 있지 않고 있기도 하거니와, 설령 확인이 된다고 하더라도 이미 학습된 모델에다가 마부뉴스가 드림부스를 이용했던 것처럼 언제든지 추가로 학습시킬 수 있는 가능성이 있거든요.

그래도 Stable Diffusion이 공개한 학습데이터를 한 번 살펴봤어요. WAXY라는 곳에서 분석한 자료인데 훈련 이미지 1,209만 6,835개를 정리해 봤습니다. 물론 최초 훈련 때 사용한 23억 개의 데이터에 비교하면 조족지혈 수준이지만요! 1,200만 개의 이미지를 살펴봤을 때 가장 많이 등장한 아티스트는 누구였을까요? ‘빛의 화가’라는 별칭을 가진 토마스 킨케이드가 9,268번으로 가장 많이 등장했습니다. 그다음으로 2위를 차지한 건 빈센트 반 고흐였어요. 8,376번 등장했죠. 상위 25명의 아티스트 중에 22명의 작가들이 이미 세상을 떠난 상태였습니다. 자신의 작품이 AI 학습에 사용되었는지를 확인할 수 있는 작가는 단 3명뿐이었죠.

그림에서만 이런 상황이 발생하는 건 아닙니다. 코드에서도 비슷한 상황이 펼쳐지고 있죠. 깃허브에서 만든 Copilot이라는 프로그램이 있습니다. 혹시 독자 여러분 사용해 본 적 있으신가요? 이 녀석은 깃허브에 올라온 수많은 코드들을 GPT-3을 이용해 학습한 뒤, 프로그래머들이 코딩이 막히더라도 그 해결책을 뚝딱뚝딱 제시해 주는 프로그램입니다. 사용해 보면 신세계를 경험할 수 있습니다. 문제는 Stable Diffusion과 마찬가지로 코드 생산자의 권리를 무시하고 학습을 했다는 점입니다. 저작자의 이름을 표시하는 조건으로 공개한 코드도 다 포함해서 학습하면서 코드 생산자의 저작권은 사라져 버렸죠.

Q. Stable Diffusion에 자주 언급된 화가들, 이름은 어디서 들어봤는데... 도대체 누구인가요?

토마스 킨케이드: 전원적이고 사실적인 그림을 그린 미국의 화가로, 킨케이드의 그림은 동화 같은 느낌을 줍니다.
빈센트 반 고흐: 서양 미술사에서 가장 위대한 사람 중 하나로, '별이 빛나는 밤', '해바라기' 등이 대표적이죠.
레오니드 아프레모브: 붓 없이 팔레트 나이프만으로 색색의 물감을 떠 그림을 그리는 화가로, 화려한 빛의 묘사가 인상적입니다.
클로드 모네: '인상, 해돋이', '수련연못' 등으로도 우리에게 익숙한 프랑스의 인상주의 화가입니다.
에드워드 호퍼: 미국의 화가로, 주로 고독과 소외가 만연한 도시의 일상적인 모습을 사실적으로 그렸어요.
노르만 록웰: 미국의 20세기 화가이자 일러스트레이터로, 대표작으로는 '거울 앞의 소녀'와 '세 겹의 자화상' 등이 있습니다.
윌리엄 아돌프 부그로: 프랑스의 아카데미 회화를 대표하는 화가. 신화적인 주제를 사실적으로 그렸어요.
알버트 비어스타트: 미국 서부의 광활한 풍경 그림으로 가장 잘 알려진 독일계 미국인 화가입니다.
존 싱어 사전트: 미국에서 태어난 초상화가로 상류사회를 주로 그렸어요.

독자 여러분, 우리나라 정부가 2021년 말에 출입국 심사용 인공지능 개발을 위해 1억 7,000만 건의 얼굴 사진을 24개 민간 업체에 넘겼다는 이야기 기억나시나요? 예전 <개인 생체정보, 보호해야 할까? 활용해야 할까?> 레터에서 다뤘었는데, 혹시 기억이 나지 않는다면 지난 레터를 한 번 읽어보세요. 안면인식 AI 연구에는 수많은 사람들의 얼굴이 필요합니다. 제대로 식별하기 위해선 개인 얼굴 이미지를 학습시켜야 할 테니까요. 지극히 개인적인 정보인 안면 인식 정보에 대한 문제는 우리나라뿐 아니라 전 세계적으로 문제가 되고 있습니다.

Exposing.ai라는 프로젝트가 있어요. 얼굴 인식 AI에 사용된 학습 데이터를 추적해 개인정보 침해 가능성은 없는지 살펴보는 프로젝트인데, 살펴보니까 플리커라는 SNS 사진 공유 사이트에서 가져온 사진들이 많았죠. 문제는 플리커에 올라온 개인 사진들이 저작자를 표시하거나 비상업적인 목적에만 허용해 줬는데 실제 사용은 그러지 않은 경우가 많다는 겁니다.

스프 마부뉴스

위 그래프는 100만 장 이상의 이미지를 사용해 학습한 얼굴 인식 AI 별로 얼마나 많은 플리커 사진이 사용되었는지를 나타낸 그래프입니다. 가장 많은 이미지가 포함된 메가페이스 데이터셋은 미국 워싱턴 대학교에서 만든 건데요. 전체 이미지가 무려 475만 장이 넘죠. 그중 75.3%가 플리커 사진이었습니다. 문제는 이 데이터셋이 기업이나 군사기관 등으로 재배포되었다는 겁니다. 알리바바, 아마존, 구글, 미쓰비시, 삼성, 텐센트 등 기업들을 비롯해 미 육군과 중국 정부도 메가페이스 데이터 셋을 사용했어요. 뒤늦게 워싱턴 대학교에서는 데이터를 폐기했지만 이미 많이 사용된 후였죠.

이렇게 비영리 목적으로 제공한 내 정보가 타고 타고 넘어가다가 영리적인 목적에 사용되는 경우들을 이른바 ‘AI 데이터 세탁’이라고 합니다. 사실 이런 데이터 세탁은 AI 산업에서 비일비재해요. 일단은 비상업적 연구기관에서 AI 모델을 만들고, 그 모델을 기업에서 사용하는 식인 거죠. 저작권과 개인정보에 문제가 될 수 있는 모델링만 연구소에 아웃소싱 하는 식으로 말입니다.

메타가 공개한 생성형 AI 모델은 학술 목적으로 비상업적 데이터 세트를 사용해서 훈련했어요. Stable Diffusion이 훈련한 방대한 데이터도 모두 독일의 비영리단체 LAION에서 제공한 자료들이죠. 챗GPT를 만든 OpenAI도 비영리단체입니다. 하지만 OpenAI가 만든 GPT 모델로 이득을 보는 건 MS죠. 기업들이 돈을 버는 모델을 학습시킨 건 비영리 목적으로 제공한 수많은 사람들의 개인정보라는 불편한 진실. 독자 여러분은 어떻게 생각하시나요?

허락을 받고 사용해야 할 개인정보를 AI 기업들이 무단으로 이용한 것도 문제가 되지만 최근엔 딥러닝 알고리즘을 통해 개인정보가 유출될 가능성이 있다는 지적도 나오고 있습니다. 구글, 딥마인드, UC버클리, 취리히 공과대학교, 프린스턴 대학교 연구진으로 구성된 공동 연구팀의 논문 자료인데, Stable Diffusion과 같은 모델들이 학습데이터에서 개별 이미지를 기억하고 있기 때문에 조절만 잘하면 학습데이터가 추출이 가능하다는 걸 밝혀냈거든요.

스프 배너