[사실은] 넘쳐나는 여론조사, '정말' 믿어도 될까요?

2020 총선, 데이터로 팩트체크 ④ 이번 총선 여론조사 편

이경원 기자 leekw@sbs.co.kr

작성 2020.03.31 09:03 수정 2020.03.31 10:32 조회수
프린트기사본문프린트하기 글자 크기
기사 대표 이미지:[사실은] 넘쳐나는 여론조사, 정말 믿어도 될까요?
하루가 멀다 하고 쏟아지는 여론조사들, 정말 믿어도 되는지 취재해달라는 요청을 받고 저희 '사실은'팀이 이를 검증하고 있습니다. 오늘은 그 두 번째 시간으로, 올해 총선을 앞두고 진행된 여론조사들을 집중 분석하겠습니다.

지난 편 복습하고 가겠습니다. 2016년 총선 직전 여론조사 3개월 치를 모두 모아 경향성을 분석했습니다. 마음에 드는 '특정 여론조사'의 '수치'가 아니라, 분석 가능한 '모든 여론조사'의 '추이'를, 실제 총선에서 정당 득표율과 비교하는 식이었습니다.

당시 추이에 영향을 미친 건 '북한 변수'와 각 당의 '공천 갈등'으로 분석됐습니다. 지난 편 참고하시면 됩니다. ▶ (2020.03.24) [사실은] 넘쳐나는 여론조사, 믿어도 될까요?

STEP 1. "경향성이 안 보여요"

이 방식 그대로 이번 총선 여론조사를 들여다보겠습니다. 올해 1월 1일부터 3월 25일 현재까지 발표된 여론조사 62건, 각 정당에 대한 '지지율'을 전수분석했습니다.
CG : 안혜민 데이터전문기자하단에 노란색으로 된 정의당, 주황색으로 된 국민의당이 있고, 그 위 회색은 무당층입니다. 그 위 분홍색은 미래통합당, 그 위 파란색은 더불어민주당입니다. 특정한 지지율이 일정한 방향으로 쭉 가긴 하지만, 위아래로 많이 퍼져있습니다. 퇴적암 같습니다. 그만큼 여론조사별로 차이가 크다는 걸 뜻합니다. 어떤 경향성을 파악하기 어렵습니다.

사실 지난 편에서는 여론조사 추이를 살펴본 뒤, 경향성에 변화가 있던 그 날 즈음에 무슨 일이 있었는지 찾아보는 식으로 작업을 진행했는데, 올해 여론조사 추이는 경향성 자체가 뚜렷하지 않아서 이 작업이 무의미할 것 같기도 합니다. 정말 '변수'라 될 만한 뉴스가 없었던 건지, 올해 1월부터 3월까지 무슨 일이 있었는지 찾아봤습니다.
CG : 안준석 디자이너올해 총선 기간에는 굵직한 이슈들이 무척 많았습니다. 지난 총선 가장 큰 변수가 됐던 당내 공천 갈등은 이번에도 계속됐지만, 옛 새누리당의 '옥새 파동', 더불어민주당의 '친노 컷오프'와 같은 극적인 상황은 덜했습니다. 다만, '비례정당'이라는 전례 없는 상황과 맞물리면서 다른 갈등이 더해졌습니다. 더불어민주당은 '비례연합정당'을 만들면서 소수 정당들과 대립각을 세웠습니다. 미래통합당은 비례정당인 미래한국당 비례 공천을 두고, 한선교 전 대표가 사퇴했습니다. 두 거대 정당 모두 지역구 공천보다는 비례대표 공천으로 진통을 겪었습니다.

북한이 발사포를 발사하고, 김여정 북한 당 중앙위 제1부부장이 청와대 비난 담화를 발표하는 등 '북한 변수'도 없다고 볼 수는 없습니다.

하지만, 이 모든 이슈들은 코로나 19에 묻혔다고 해도 과언이 아닐 겁니다. 1월 20일 국내에 코로나19 첫 확진자 발생 이후 국내 뉴스는 코로나19로 채워졌습니다. 2월 18일 대구에서 31번 환자가 나오고, 그 다다음날 첫 사망자가 나오면서 다른 뉴스들이 비집고 들어갈 틈이 별로 없어졌습니다. 상황이 긴급하게 돌아가면서 공천 갈등은 세간의 관심에서 멀어졌고, 북한 변수는 제대로 언급조차 되지 못했던 것 같습니다. 자연히 총선에 대한 관심도 떨어졌습니다.

어쩌면 코로나19 정국이 여론조사의 '무질서'에 영향을 줬는지도 모르겠습니다.

STEP 2. 편차 큰 통합당 지지율

그렇다면, 올해 총선 여론조사는 분석 가치가 없을까요? 그렇지 않습니다.

위에 그래프 다시 보시죠. 미래통합당 지지율은 눈으로 딱 봐도 다른 당들에 비해 위아래로 많이 퍼져 있습니다. 조사기관마다 편차가 심하다는 뜻입니다.

얼마나 퍼져 있는지 수치로 알아봐야겠습니다. 우리가 중학교 때 배운 '표준편차'라는 개념을 이용하겠습니다. 대학수학능력시험 치른 분이라면 '표준점수'라고 다 아시죠. 이 표준점수가 '표준편차'를 반영한 점수입니다. 각 여론조사에서 정당의 지지율의 평균에서 얼마나 퍼져있는지, 그걸 나타내는 통계 기법인 표준편차를 계산하는 겁니다. 표준편차가 클수록 평균에서 떨어진 값이 많이 존재한다는 뜻입니다.
관련 이미지통합당은 평균을 중심으로 5.30% 퍼져 있습니다. 정당들 중에 가장 큽니다. 많이 퍼져있다는 뜻입니다. 민주당은 3.18%고, 정의당이 1.03%로 가장 작습니다.

달리 말하면, 지금의 여론조사가 미래통합당 지지층의 민심을 정확하게 잡아내지 못한다고 볼 수 있습니다.

여기서 더 살펴봐야 할 건 지지 정당이 없다고 답한 사람들, 무당층입니다. 무당층의 표준편차는 7.80%, 그야말로 조사마다 널뛰기입니다. 이건 무슨 의미일까요? 무당층은 대체 어떤 사람들일까요?

STEP 3. 통합당 지지율과 무당층의 상관관계

무당층은 지지 정당이 없거나, 혹은 정하지 않은 사람들입니다. 다만, 귀찮은 여론조사 전화에 응답을 해주신 걸 보니, 그래도 정치에는 조금이라도 관심이 있고, 따라서 선거 때 투표소를 찾을 가능성이 큽니다. 어떤 정당이든 찍을 가능성이 크다고 전제해도 될 것 같습니다.

각 여론조사에 나타난 무당층의 규모가 어떤 정당의 지지율에 큰 영향을 미치는지 알아보려고 합니다. 각 정당의 지지율과 무당층의 규모의 상관관계를 살펴보려고 하는데, 이번에는 '상관계수' 값을 활용하려고 합니다.

상관계수는 두 지표의 상관성을 알아볼 때 압도적으로 많이 쓰이는 통계 기법입니다. 상관 계수 값은 반드시 -1과 1 사이에 위치하는데, -1에 가까울수록 강한 음의 상관관계, 1에 가까울수록 강한 양의 상관관계입니다. 0에 가깝다면 상관성이 없다고 볼 수 있습니다. 보통 +0.5 이상 혹은 -0.5 이하면 '높은 상관관계가 있다'고 보고 있습니다.

결과 값은 다음과 같았습니다.
관련 이미지통합당과 무당층의 상관계수는 -0.91로 매우 강한 음의 상관관계를 보였습니다. 민주당도 -0.76로 비교적 강한 음의 상관관계지만 통합당 만큼은 아니었습니다. 정의당은 상관관계가 거의 없었습니다.

상관계수가 -0.91이면 '정확한 반비례' 관계라고 볼만합니다. 즉, 무당층이 많아질수록 통합당 지지율이 가장 많이 빠졌고, 반대로 무당층이 적어질수록 통합당 지지율이 상대적으로 많이 올라간다는 뜻입니다.

이게 무슨 말이냐, 꽤 많은 무당층이 통합당 지지를 고민하고 있는 걸로 읽힙니다. 그만큼 통합당 지지율이 무당층의 변심에 따라 기민하게 움직일 수 있다는 겁니다.

STEP 4. 요동치는 여론조사, 평가는 어떻게…

지금까지 여론조사 분석은 "어떤 정당을 지지하느냐."라는 질문에 대한 답변이었습니다. 과거에는 이 질문이 실제 총선 정당 득표율의 결과에 수렴했다고 전제할 수 있지만, 이번에는 상황이 또 다릅니다. 비례정당, 사실상 각 정당의 위성정당이 '난립'하고 있는 특수한 상황입니다. 가령, 민주당 지지자라도 비례정당인 '더불어시민당'을 찍을 수도 있고, '열린민주당'을 찍을 수도 있습니다. 심지어 '정의당'을 찍는 민주당 지지자도 있을 겁니다.

즉, "이번 총선에서 비례대표는 어느 정당을 뽑을 것인가." 혹은 "비례대표 투표는 어떤 정당을 선호하는가."라는 질문에 대한 여론조사 분석을 따로 해야 합니다.

정계개편이 완료된 게 얼마 되지 않아서 3월 중순 여론조사부터 반영이 가능할 것 같습니다. 통합당의 비례정당인 미래한국당, 범여권 비례연합정당인 더불어시민당, 정의당, 열린민주당, 국민의당 등을 조사한 여론조사 9개에 대한 분석 결과입니다.
관련 이미지미래한국당은 위아래로 많이 분산된 형태고, 더불어시민당은 약간 하향형, 반면, 더불어시민당은 상향형 경향을 보이기는 합니다. 하지만, 추이를 단정하기에는 표본이 많지도 않습니다. 위에 첫 번째 그래프처럼, 신뢰수준과 오차범위를 반영해 추이를 물결무늬로 나타낼 수 있는 프로그램에 넣어봤더니, 아예 깨져서 나왔습니다. 그만큼 추이란 게 없는 겁니다. 그래서 점만 크게 표시했습니다.

다만, 여기서도 통합당 뽑겠다는 비율, 특히 무당층의 규모는 앞선 추이와 마찬가지로 요동칩니다. 무당층의 흐름이 중요해 보입니다.

결과적으로 그 어느 때보다 여론조사의 추이, 경향성을 알기 어려울 정도로 혼탁합니다. 여론조사가 제대로 되지 않았던가, 아니면, 민의가 제대로 수렴될 정치적 환경이 아니던가, 둘 중 하나일 겁니다. 유감스럽게도 전자보다는 후자에 가까워 보입니다. 지금의 정치 질서가 유례를 찾아볼 수 없을 만큼 복잡하기 때문입니다. 당 대표들도 당 이름을 헷갈려하는 판입니다. 지난 4년간의 평가를 내려야 할 유권자는 혼란스럽습니다. 20대 국회에 대한 평가가 제대로 이뤄질 수 있을지 걱정이 앞섭니다.

지금까지 2020 총선 팩트체크였습니다.

(자료조사 : 김혜리, 김정우)

추신. SBS뉴스 데이터저널리즘팀 '마부작침'의 뉴스레터 서비스, '마부뉴스'를 구독하시면 훨씬 엣지 있는 뉴스를 받아 보실 수 있습니다. 총선을 앞두고 고품격 뉴스가 많이 준비돼 있습니다. 이번 총선 기간에는 SBS뉴스 팩트체크팀 '사실은'도 함께 합니다.
▶마부뉴스 구독하기
관련 이미지   

많이 본 뉴스