뉴스

SBS 뉴스 상단 메뉴

[취재파일] 공공 데이터 공개…부작용 막을 대비는?

[취재파일] 공공 데이터 공개…부작용 막을 대비는?
최근 정부는 정부가 가지고 있는 공공 데이터, 이른바 빅 데이터를 공개하겠다고 밝혔습니다. 그것을 통해 일자리도 창출하겠다는 입장인데요. 빅 데이터는 무엇인지, 그리고 그것을 공개했을 때 발생할 수 있는 문제는 무엇인지 살펴보려고 합니다.

◈ 빅 데이터의 의미

빅 데이터는 이름 그대로 크다는 의미의 '빅(Big)'과 정보를 의미하는 '데이터(Data)'가 합성된 말로 많은 데이터를 의미하는 단어입니다. 데이터가 어느 정도가 되어야 '빅 데이터'는 기준은 없는 것 같습니다만, 분산된 정보 혹은 축적된 정보가 다른 곳으로 쓰일 수 있는 가치가 있을 때 그 전체를 '빅 데이터'라고 통칭하고 있는 것 같습니다.

이것을 어떻게 활용할 수 있느냐? 그것은 축적된 데이터를 이용해 상관 관계를 발견할 수 있다는 전제에서 시작합니다. 12시에 지하철 종각역에 내리는 사람이 많을 때 점심 시간 종각역 주변 상권은 활기를 띨 것이라는 추정은 할 수 있습니다. 다만, 반드시 종각역 주변 상권이 활기는 띠는 건 아니기 때문에 인과관계를 가진 것은 아닙니다.

빅 데이터를 활용하는 가장 쉽고, 기본적인 모습은 사람들이 많이 이용하고 있는 포인트 카드에서 찾을 수 있습니다. 포인트 카드를 가입할 때, 성별과 나이 혹은 직업 등 많은 정보를 기입하게 되는데요, 이후에 축적된 포인트 카드 사용 정보를 이용해서 어떤 나이대의 사람은 어떤 제품을 많이 사는지, 성별에 따라서 어떤 영화를 많이 보는지 등의 정보를 뽑아낼 수 있습니다. 물론 이런 정보는 기업이 새로운 제품을 프로모션하고 마케팅의 주안점을 어디에 맞출지를 정하는데 도움이 될 겁니다.

이런 사례는 인터넷에서도 찾을 수 있습니다. 인터넷 포털 사이트에 들어가면 볼 수 있는 어떤 지역 인기기사, 어느 연령대 인기 기사라고 뜨는 경우가 그렇습니다. 또 구글 트렌드를 보면 어떤 검색어를 어느 지역에서 많이 검색을 하는지도 찾을 수 있는데요. 미국의 경우 '감기약'이라는 검색 빈도가 높은 지역에 독감이 유행할 것을 예상하고 보건당국이 대응한다는 것은 널리 알려져 있습니다.

지하철


◈ 공공 빅 데이터는 어떤 것?

그럼 공공 데이터는 어떤 것이고, 어떻게 이용될 수 있을까요?

쉽게 생각할 수 있는 공공 데이터는 앞서 잠시 언급한 것 처럼 어느 지하철 이용객이 많은지, 특히 어떤 시간대에 많은지 등의 정보입니다. 이런 정보를 활용한다면 주변이 점심 때 많이 붐비는지, 아님 저녁에 많이 붐비는지, 주중보다 주말에 많이 붐비는지 등의 정보를 뽑아낼 수 있습니다. 이럴 경우 해당 상권의 특색에 맞는 업종을 차린다면 성공 가능성은 좀 더 높아질 겁니다.

좀 더 나아간다면 납세 정보 등도 공공 데이터입니다.어떤 지역 혹은 어떤 아파트 주민들이 재산세를 많이 내는지, 그리고 자동차세는 어떤 지역이 많은지 등의 정보를 활용하면 기업의 입장에서는 지역에 맞는 마케팅 전략을 수립하는데 많은 도움이 될 겁니다.

◈ 정보 보호 준비는 되어 있나?

문제는 어떤 정보를 공개할 것이고, 축적된 정보를 과연 제대로 관리할 수 있겠느냐에 맞춰집니다.

산업 발전에 도움이 된다는 점만으로 개인의 의료 정보와 같은 것도 공개를 할 수 있을까요? 아니 공개를 하는 것이 맞을까요? 개인들의 정보를 동의없이 '빅 데이터'라는 이름으로 공개하는 것이 옳을까요?

민감한 개인 정보만 가리고 활용성이 높은 정보만 공개하는 방법을 생각해 볼 수 있을 겁니다. 하지만, 공공데이터가 공식적으로 공개되지 않은 상황에서도 개인정보가 유출돼 주기적으로 홍역을 치르고 있는데 데이터가 개방된다면 개인정보 유출 등은 더 많아지는 것 아니냐고 많은 사람들이 우려하고 있습니다. 빅 데이터 활용에서 우리보다 앞서 있는 미국의 경우, 개인정보를 수집해 판매하는 이른바 '데이터 브로커'가 활개를 치고 있는 상황이니 개인 정보 유출 등에 대한 걱정은 충분히 타당성이 있습니다.

하지만 정부 내에서는 창조 경제를 활성화를 위해서 공공 데이터를 공개하겠다는 구호만 거창한 것 처럼 보입니다. 만일의 경우를 대비한 대책, 특히 개인의 프라이버시 보호에 대한 목소리는 거의 들리지 않고 있는 것이 현실입니다. 물론 내부적으로 많은 준비를 하고 있을 것이라고 생각하지만, 혹시 창조 경제 실현이라는 목표만 보고 과정을 생략하고 있는 것은 아닌지 우려스럽습니다.

혹자는 '빅 데이터는 새로운 노다지다'라고 이야기합니다. 다행인지 불행인지 아직은 그렇게 목청 높여 이야기하는 사람은 많지 않은 상황입니다. 혼자만 알고 있던 맛집이 소문이 나면 정작 나는 가지 못하는 상황이 발생하고, 가격만 올라가고, 맛은 없어지는 경우가 많습니다. 많은 사람들이 빅 데이터에 관심을 가지고 그것의 가치를 알게될 때 혹시나 그런 부작용은 생기지 않은지 걱정입니다. 부작용을 막기 위해서는 미리 그리고 반복해서 준비를 하는게 필요합니다. 공공정책을 수립하고 이행하는데 있어서 유비무환처럼 감안해야할 중요한 고사성어는 없습니다.
Copyright Ⓒ SBS. All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지

스브스프리미엄

스브스프리미엄이란?

    많이 본 뉴스