뉴스

SBS 뉴스 상단 메뉴

[취재파일 스페셜] 빅데이터 속 표심을 찾아라…'SBS 빅-지수'를 매주 발표합니다!

SBS 빅-지수 ① 2월 4주차

[취재파일 스페셜] 빅데이터 속 표심을 찾아라…'SBS 빅-지수'를 매주 발표합니다!
■ 'SBS 빅-지수'는 어떻게 만들어지나?
 
SBS가 인공지능 빅데이터 전문기업 '다음소프트'와 함께 주간 단위로 매주 화요일 대선주자별 'SBS 빅-지수'를 발표합니다.
[SBS 빅-지수] 빅데이터에 숨은 표심 읽기…2월 4주차
'SBS 빅-지수'는 3가지 요소로 구성됩니다. 관심도+호감도+주목도입니다. '관심도'는 네이버 추정 검색량과 유튜브 조회수를 합산해 집계합니다. 네이버 추정 검색량이 0.8, 유튜브 조회수가 0.2의 비중으로 반영됩니다.

'호감도'는 트위터 같은 SNS와, 웹 상의 각종 블로그, 카페, 커뮤니티 게시판 글에서 각 대선주자에 대한 긍정적인 언급량을 수집해 측정합니다.

'주목도'는 인터넷 상 뉴스 가운데 대선주자들이 얼마나 언급되는지를 반영합니다. 'SBS 빅-지수'는 이 세가지 요소, 관심도와 호감도, 주목도를 1:1:1로 합산해 산출하는 방식입니다.
 
SBS와 함께 지수를 개발한 '다음소프트' 최재원 이사는 'SBS 빅-지수'의 의미를 이렇게 표현했습니다. “그동안의 빅데이터 분석은 ‘언급량’ 분석이 많았습니다. 인터넷 공간에 적극적으로 글을 쓰는 사람들이 남긴 흔적을 반영한 것입니다. ‘SBS 빅-지수’는 이를 뛰어 넘어, 인터넷에 적극적으로 글을 남기지는 않더라도, 특정 후보를 검색하고 뉴스를 보는 ‘조용한 다수’의 움직임도 반영하는 지수입니다”
 
■ 빅데이터 지수는 '숨은 표' 탐색 가능
 
지난해 미국 대선에서 ‘승자는 트럼프, 패자는 여론조사’라는 말이 있었습니다. 선거 전 각종 여론조사는 대부분 힐러리 우세를 점쳤습니다. 그러나 결국 승자는 트럼프였습니다. 숨어있는 ‘샤이 트럼프’ 표심이 실제 선거에서 드러난 것인데, 빅데이터 동향으로 이런 결과를 예측한 분석 보도들이 선거 뒤에 줄을 이었습니다.
 
아래 그래프는 미국 대선 전 1년 치 구글 트렌트 그래프입니다. 1년 중 대부분 기간 동안 트럼프 검색량이 힐러리를 앞섰습니다. 그래서 빅데이터 전문가들은 트럼프의 ‘이변’을 예상하기도 했다고 말합니다.
 
[SBS 빅-지수] 빅데이터에 숨은 표심 읽기…2월 4주차

미국 사례는 이번 우리 대선에도 시사하는 바가 있을 겁니다. 1000명 패널로 측정하는 여론조사에서는 보이지 않는 ‘숨은 표심’의 흐름을 빅데이터 분석으로 엿볼 수 있는 가능성이 있으니까요.
 
■ 2월 넷째 주 'SBS 빅-지수'는?
 
3가지 요소를 합산해 산출한 2월 넷째 주 'SBS 빅-지수‘입니다. 문재인 250, 안희정 242, 이재명 234, 안철수 227, 황교안 220, 유승민 182로 나타났습니다.
 
(3일 출고)[취재파일 스페셜] 빅데이터 속 표심을 찾아라…'SBS 빅-지수'를 매주 발표합니다!
 3가지 요소를 합산하지만 그렇다고 300점이 만점인 지수는 아닙니다. 특정 대선주자의 화제성이 높으면 지수가 더 올라갈 수도 있고, 화제성이 떨어지면 지수가 확 내려갈 수도 있는 셈이지요. 아래는 지수 산출에 반영된 로데이터(raw data, 원자료)입니다.
[SBS 빅-지수] 빅데이터에 숨은 표심 읽기…2월 4주차
  
■ 추이를 봐야 흐름이 보인다
 
'SBS 빅-지수‘는 주간 단위 지수도 중요하지만 추이를 살펴보는 것이 더 중요할 겁니다. 그래야 대선주자별 관심 흐름을 살펴볼 수 있고 다음 추이를 예측해 볼 수 있습니다. 아래 그래프는 저희가 이 프로젝트를 시작한 1월부터 현재까지 'SBS 빅-지수‘ 추이입니다.
 
[SBS 빅-지수] 빅데이터에 숨은 표심 읽기…2월 4주차
'SBS 빅-지수‘가 가장 변화가 컸던 시기는 2월 첫째 주를 전후한 시기입니다. 이 때 안희정 충남지사와 황교안 대통령 권한대행의 지수가 급상승했습니다. 이유가 뭘까요? 큰 정치적인 변화가 있었기 때문입니다. 2월 1일은 반기문 유엔 전 사무총장이 대선 불출마를 선언한 날입니다. 반 전 총장의 퇴장과 동시에 진보 쪽에서는 안 지사, 보수 쪽에서는 황 대행으로 대중이 관심이 폭발적으로 쏠린 겁니다.
[SBS 빅-지수] 빅데이터에 숨은 표심 읽기…2월 4주차
그런데 2월 둘째 주부터는 두 사람의 빅-지수 희비가 엇갈리고 있습니다. 안 지사는 2위권을 지키고 있는 반면, 황 대행의 빅-지수는 하락세입니다. 안 지사가 반 전 총장 불출마 바로 다음날 ‘대연정론’을 공식화하면서 화제성을 이어갔다면, 황 대행은 출마 여부에 대한 모호한 답변을 계속하며 별다른 화제를 만들어내지 못한 때문으로 보입니다.
 
■ 이번 주 ‘SBS 빅-지수’에 영향을 미칠 일들은?
 
이번 주 월요일(27일) 황교안 권한대행이 특검 수사기간 연장 요청을 거부했고, 헌재는 탄핵심판 최종 변론을 했습니다. 금요일(3일)에는 민주당 경선 예비후보들의 첫 라디오 토론이 예정돼 있습니다. 상대적으로 큰 ‘사건’이 적었던 지난 두어 주에 비해 이번 주는 굵직굵직한 정치적 이벤트들이 있는 만큼, 'SBS 빅-지수'에도 적잖은 변화가 예상됩니다.

( 디자인 : 안준석 )  

▶ [SBS 빅-지수] 빅데이터에 숨은 표심 읽기…2월 4주차
▶ 'SBS 빅-지수'로 숨은 표심 읽기…금주에 영향 줄 변수는 
Copyright Ⓒ SBS. All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지

스브스프리미엄

스브스프리미엄이란?

    많이 본 뉴스