뉴스

SBS 뉴스 상단 메뉴

[스프] 챗지피티(ChatGPT)랑 대화하면 생수 1병이 소비된다고?

[마부뉴스] 데이터로 보는 AI와 물 발자국



스프 마부뉴스
독자 여러분 안녕하세요. 날씨가 부쩍 추워졌죠. 23일 서울 아침 체감 온도가 영하 21.7도를 기록하면서 올 겨울 들어 가장 추웠더라고요. 오늘까지 한파가 이어진다고 하니 다들 몸조리 잘하길 바라겠습니다. 그래도 반갑게도 주말엔 최고 온도가 영상까지 올라간다고 하니 조금만 견뎌 보자고요.

날씨 예보는 우리 일상생활에 빠져서는 안 되는 중요한 영역입니다. 단순히 하루의 옷차림을 결정할 뿐 아니라 농사를 짓는 사람들, 어업을 하는 사람들에게 있어서는 하루 일의 방향을 결정하는 요소 중 하나죠. 물론 날씨 예측의 정확도가 막 좋다고 이야기하긴 어렵지만 최근 구글에서 AI를 활용해 예측 모델의 정확도를 높인 새로운 날씨 예측 모델을 발표했더라고요. 정말 다양한 영역에서 힘을 발휘하고 있는 듯합니다.

오늘 레터에선 이 AI 이야기를 조금 더 해보려고 합니다. 혹시 독자 여러분은 AI 서비스를 사용하는 데 물이 상당히 많이 들고 있다는 사실을 알고 있었나요? 오늘 마부뉴스에서는 AI의 물발자국이 얼마나 많이 발생하는지를 정리해 봤습니다. 오늘 마부뉴스가 독자 여러분에게 던지는 질문은 바로 이겁니다.

ChatGPT랑 대화하면 생수 1병이 소비된다고?
 

AI와 함께 늘어나는 데이터센터

최근 삼성전자에서 세계 최초로 스마트폰 기기에 AI가 탑재된 AI폰인 갤럭시 S24를 발표했습니다. S24 발표 내용을 보니까 이 스마트폰만 있으면 AI가 실시간으로 통화를 번역해 주고, 텍스트 내용을 요약해 주고, 사진 편집도 도와주더라고요. 스마트폰뿐만 아니라 AI는 점점 더 적용 범위를 확장시키고 있습니다. 세계 최대 가전 전시회인 CES 2024에서도 전 세계 기업들은 AI를 활용한 다양한 가전제품과 기기를 선보이기도 했죠.

멀리 CES가 열렸던 미국으로 갈 필요 없이, 이미 우리 주변엔 우리가 이용하고 있는 다양한 AI 서비스들이 있습니다. 우리가 인터넷에서 무언가를 검색할 때면 구글에서는 바드(Bard)가, 마이크로소프트의 Bing에선 코파일럿(Copilot)이, 네이버에선 큐(cue:)라는 AI가 따라붙어서 검색에 도움을 주고 있으니까요. 무엇이든 대답해 주는 ChatGPT, 원하는 그림을 그려주는 DALL.E 같은 생성형 AI도 이제는 익숙해졌습니다.

AI 서비스의 양적 팽창이 이뤄지는 상황 속에서, 더 앞서나가고 싶은 기업들은 더 품질이 좋은, 더 고도화된 AI 모델을 만들어내기 위해 몰두하고 있어요. AI 모델을 고도화시키기 위해 필요한 건 엄청난 양의 데이터입니다. 더 많은 데이터를 가지고 공부하고, 더 질 좋은 데이터를 활용한 AI의 실력이 좋은 건 어찌 보면 당연한 일일 테니까요.

그런데 이 과정에서 필요한 데이터의 양이 워낙 많다 보니, 이 데이터를 감당할 데이터센터의 수요가 늘어나고 있습니다. 특히나 10만 대 이상의 서버를 운영할 수 있는 대규모 데이터센터, 이른바 하이퍼스케일 데이터센터의 수요가 올라가고 있죠. 그런데 이 데이터센터를 운영하는 데에 엄청난 양의 전기와 물이 들어간다는 사실! 10만 대 이상의 서버가 돌아가는 데에 전기가, 또 돌아가는 대규모 서버의 과열을 막기 위한 냉각장치엔 물이 필요합니다.

스프 마부뉴스
AI 하면 떠오르는 구글, 마이크로소프트, 메타, 이렇게 AI 삼대장 기업들의 물 취수량 데이터를 가져와 봤어요. 2023년 보고서 자료라 가장 최근 데이터가 2022년이라는 점은 양해 바랍니다. 세 기업이 2022년 한 해에만 끌어온 물의 양은 무려 443.7억 리터입니다. 국제대회용 수영장 규격이 통상 200만 리터이니까, 수영장 2만 2,185개를 채울 수 있는 양의 물을 딱 이 세 기업이 사용한 거죠.

3개 기업 중 단연 구글의 수치가 눈에 띕니다. 2022년 구글이 수원으로부터 끌고 온 전체 취수량은 287억 6,760만 리터! 메타와 마이크로소프트를 합친 것보다 더 많은 규모죠. 2021년 취수량과 비교하면 20.7% 증가했어요. 287.7억 리터 중 87.1%가 구글의 데이터센터에서 사용되었을 정도로 물 소비에서 데이터센터는 압도적인 비율을 차지하고 있습니다. 마이크로소프트는 구글과 비교해서 취수량 자체는 적지만 2021년과 비교해 보면 2022년에 32.7%나 상승했어요. 반면 메타는 전년 대비 3% 감소했습니다. 메타 역시 구글과 마찬가지로 전체 물 취수량 중 데이터센터가 차지하는 비율이 73.9%나 될 정도로 높고요.
 

GPT에게 질문 29.6번당 물 500ml

지금부터는 본격적으로 AI의 물 발자국에 대해 살펴보도록 할게요. 일단 AI 모델을 학습하는 과정에서 어디 어디에 물이 사용될까요? 일단 첫째로, 데이터센터에서 AI 모델을 학습시키면서 발생하는 열을 식히는 데 사용할 냉각수가 있을 겁니다. 두 번째로, 서버를 돌리는 데 필요한 전기 생산에도 물이 들죠. 재생에너지로 전기를 생산하면 모르겠지만 화력발전소를 이용할 경우엔 막대한 양이 들어가거든요.

캘리포니아 리버사이드 대학교와 텍사스 알링턴 대학교 연구진은 AI 학습에 물이 얼마나 드는지 추정해 봤습니다. 연구진은 데이터센터에서 사용되는 물을 on-site 사용량, 발전소에서 사용되는 물을 off-site 사용량이라고 분리해서 각각을 계산했습니다. 연구진이 분석한 AI 모델은 GPT-3, 그리고 데이터센터는 마이크로소프트의 센터들을 기준으로 했어요. 마이크로소프트에선 자사 데이터센터가 어떤 물 효율, 전기 효율을 가지고 있는지 공개하고 있는데, 이 수치를 활용했다고 합니다.

아래 그래프에 흩뿌려져 있는 점 하나하나는 마이크로소프트의 데이터센터들을 의미합니다. 점의 크기가 크면 클수록 GPT-3를 학습하는 데 물이 많이 들었다는 의미죠. 미국 내에 있는 마이크로소프트의 데이터센터는 붉은색으로, 해외에 위치한 데이터센터는 초록색으로 표현했습니다. X축의 WUE(Water Usage Effectiveness)는 물 효율, Y축의 PUE(Power Usage Effectiveness)는 전력 효율을 나타내는데, 수치가 작으면 작을수록 효율이 좋다는 뜻입니다.


스프 마부뉴스
일단 마이크로소프트의 미국 내 데이터센터에서 GPT-3을 학습시킨다면 얼마나 많은 양의 물이 들까요? 평균적으로 미국 내 데이터센터에서는 데이터센터에서만(on-site) 70.8만 리터의 물을 사용하고, 발전소에서 사용되는 물(473.1만 리터)까지 합치면 총 543.9만 리터의 물을 소비합니다. 그래프를 보면 알겠지만 데이터센터별 물 발자국은 천차만별이죠. 아일랜드 데이터센터에선 231.3만 리터로 GPT-3을 학습시킬 수 있지만, 워싱턴에선 1,553.9만 리터나 듭니다.

이렇게 AI 모델을 학습시키는 데 효율이 다른 것처럼, 우리가 ChatGPT와 대화하는 데 드는 물의 양도 다릅니다. 생수 500ml를 넣고 아일랜드에선 GPT가 69.6번의 추론이 가능하지만, 워싱턴에선 동일한 생수를 가지고 10.4번 밖에 하질 못하거든요. 효율이 떨어지는 데이터센터를 이용해서 ChatGPT를 이용한다면, 동일한 질문에 더 많은 물을 소비해야 하는 셈입니다.

다만 이 논문에선 GPT-3이라는 과거 모델을 두고 계산한 자료인지라, 최근 모델인 GPT-4로 계산하면 더 많은 물과 전력이 소비될 수 있습니다. 게다가 이 논문에서는 포함하지 못한 물 발자국도 존재하죠. AI 반도체를 제조하고, 서버를 만드는 데 드는 일종의 공급망에 드는 용수도 있거든요. 웨이퍼 제조에 필요한 초순수의 양, 반도체 공장의 냉각을 유지하기 위한 물의 양 등… 안타깝게도 이 데이터들은 제대로 파악되지 있지 않는 상황인지라 감춰진 물 발자국은 더 클 수 있습니다.
Q. WUE, PUE가 좋은 데이터센터는 물 사용량이 적어야 하는 것 아닐까?

위의 그래프를 유심히 보면 궁금한 점이 생길 수 있을 것 같아요. 물과 전기 효율이 좋은 데이터센터인데도 불구하고, 그렇지 않은 곳보다 물 사용량이 왜 더 많을까요? 그래프에 대해서 조금 더 설명을 하자면, 일단 WUE, PUE 두 변수를 통해서 계산할 수 있는 데이터는 on-site 물 사용량이라고 할 수 있습니다. off-site 물 사용량을 계산하려면 물과 전기 사용량 변수를 따로 계산해야 하는데, 이건 그래프에 빠져있습니다.

이뿐만 아니라 AI의 물 발자국을 계산하는 데 필요한 변수들이 더 있어요. 우선 데이터센터의 위치가 있습니다. 위치에 따라서 전력 생산 수단이 달라지는 만큼, 그에 따라 물 발자국에 영향을 줄 수도 있죠. 화력 발전소에서 전기를 끌고 와야 하는 센터가 있을 거고, 상대적으로 물 발자국이 적은 재생에너지 발전소에서 끌고 오는 센터가 있을 테니까 말입니다. 센터의 지역 기후 조건, 지역별 물 사용 규제 등도 AI의 물 발자국에 영향을 줄 수 있는데, 위의 그래프에는 이런 변수들이 더 반영되었다고 보면 될 겁니다.

(남은 이야기는 스프에서)

더 깊고 인사이트 넘치는 이야기는 스브스프리미엄에서 보실 수 있습니다.
이 콘텐츠의 남은 이야기가 궁금하다면 하단 버튼 클릭! | 스브스프리미엄 바로가기 버튼
Copyright Ⓒ SBS. All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지

스브스프리미엄

스브스프리미엄이란?

    많이 본 뉴스