뉴스

SBS 뉴스 상단 메뉴

[취재파일] '개표 조작 의혹'…못 다한 이야기

[취재파일] '개표 조작 의혹'…못 다한 이야기
어제(28일) SBS 8뉴스 '사실은' 코너에서는 지난 대선 개표 조작 의혹을 비롯해 전반적인 개표 불신에 관련한 의혹을 따져봤습니다. (☞ 관련기사 바로가기 : [사실은] "박근혜 미분류표 1.5배, 조작된 숫자?"…의혹 살펴보니) 시간 관계상 방송에서 미처 못다한 이야기를 정리해보려고 합니다. 

개표조작 의혹을 다룬 영화가 화제입니다. 영화제작팀은 지난 대선 당시 박근혜 후보와 문재인 후보의 득표율 차이가 유독 미 분류표에서 더 벌어지는 것에 주목했습니다. 그래서 통계전문가에 의뢰해 분류표에서 박근혜 후보와 문재인 후보의 득표율 차이와 미분류표에서의 박 후보와 문 후보의 득표율 차이의 비율을 알아보고 이를 'K값'이라고 명명했습니다.

그 결과 전국적으로 일관 되게 미 분류표에서 나온 유효표의 비율이 분류표 대비해 "박근혜 후보가 문재인 후보보다 1.5배 많은 것으로 드러났다"고 밝혔습니다. 전국적으로 수치는 높낮음은 있었지만 대체로 1.5에 모였습니다. 예를 들어, 분류표에서 박근혜 후보가 50%, 문재인 후보가 50%의 비율로 득표했다면 미분류 표에선 박 후보가 60%, 문 후보가 40%를 득표한 것입니다.
개표 조작 의혹
저희 '사실은'팀이 취재를 시작했을 때 선관위는 이미 해명을 내놓은 상태였습니다. 선관위는 "박근혜 후보는 50-60대의 압도적 지지를 받았다. 그런데 50-60대는 다른 연령대에 비해 정확히 투표지에 기표하지 않은 경우가 많다. 50-60대의 투표지들이 투표지분류기에 의해 미 분류표로 많이 걸러지니, 결국 미 분류표에서 박근혜 후보의 표가 문재인 후보보다 더 많이 나온 것이다."라는 답이었습니다.

관련 구체적 데이터가 있냐고 물어봤더니, 251개 구시군별 개표소를 대상으로 미 분류율이 높은 지역 순위와 60대 이상 투표자 비율이 높은 순위를 매겨, 연관성을 파악해 봤다며 데이터를 보내줬습니다. 순위로만 봤을 때는 60대 이상 비율이 많은 지역과 미 분류율이 대체로 비례했고, 20,30대는 반대로 나타났습니다.

저희는 순위가 아닌 실제 결과로 상관성이 있는지 확인이 필요하다고 판단했습니다. 그래서 사내 데이터저널리즘팀인 '마부작침팀'에 데이터분석을 의뢰했습니다. 251개 구시군 별 실제 데이터를 이용해 해당 지역의 60대 이상 투표자 비율과 미 분류율이 상관 관계가 있는지 분석해봤습니다. 연령대는 실제 개표결과에는 드러나지 않죠. 그래서 연령대는 개표결과와 근접했던 당시 방송3사 출구조사 결과를 적용했습니다.

아래 그래프는 상관관계를 분석한 결과입니다. 회귀분석 모델입니다.

[표1] 60대 이상 투표자 비율과 미 분류율의 상관관계 (251개 선거구)
[표1] 60대 이상 투표자 비율과 미 분류율의 상관관계 (251개 선거구)
좌표 평면의 X축은 연령대별 투표자수 점유율 중 60대 이상, Y축은 미분류율(미분류 투표지수/ 분류기 통과 투표지수)입니다. 점들은 각 지역의 관찰 값, 파란 직선은 +1의 상관관계를 보여줍니다. 이 선을 중심으로 값들이 밀집돼 있을수록 상관관계의 정도도 커집니다. 이런 정도를 파악하기 위해서 나타내는 값이 '상관계수(r)'입니다. 계수는 -1.0~1.0사이에 있는데, 1에 가까울수록 강한 양(+)적 상관관계, -1에 가까울수록 강한 음(-)적 상관관계, 상관계수가 0이면 아무 관계 없이 독립적이라는 걸 뜻합니다. 양적 상관관계이면 점들이 오른쪽 위로 올라가는 형태로 모이고, 반대로 음이라면 점들이 오른쪽 아래로 향하게 됩니다. 

분석결과 상관계수가 0.75로 강한 양적 상관관계가 존재한다고 할 수 있었고, "60대 이상 점유율 - 미분류율" 사이에는 유의미한 상관관계가 있다고 할 수 있었습니다.

지역별 그룹으로 구분해서 상관관계를 분석해보아도 60대 이상의 점유율과 미분류표 비율의 상관성은 유사하게 나타났습니다. 지역적 편차 없이 상관성을 보여줬습니다.

[표2] 지역별 상관관계 (17개 시도)
정연 취재파일 관련 그래프입니다.
(범례: BS 부산 / CB 충북 / CN 충남 / DG 대구 / DJ 대전 / GK 경기 / GW 강원 / IC 인천 / JB 전북 / JJ 제주 / JN 전남 / KB 경북 / KJ 광주 / KN 경남 / S 서울 / SJ 세종 / US 울산) 

결론적으로 선거구의 60대 이상 비율이 높을수록 미 분류율이 높다고 할 수 있는 것입니다.

아래는 각 연령대별 미분류율 상관관계 그래프입니다. 20, 30, 40대 점유율과 미분류율은 음의 상관관계가 나타났고, 50대와 60대 이상 점유율은 양의 상관관계가 나타났습니다.

[표3] 연령대별 미 분류율 상관관계 
정연 취재파일 관련 그래프입니다.
저희 팀은 영화의 기본이 되는 논문도 들여다봤습니다. (논문제목: A Measure to detect between-candidate relative inequality generated by optical scan counters: An analysis of the 2012 presidential election data in South Korea)
 
논문에서는 연령계층별 지지자 별 미분류율을 같은 'r'로 정의하고 있습니다. 

<논문내용>
“Intuitively, if valid ballots have an equal chance of being unclassified by the op-scan counters regardless of candidates, the K-value should be close to 1."
“직관적으로, 유효표가 후보자와 관계 없이 투표지 분류기에 의해 분류되지 않을 가능성(r)이 같다면 K 값은 1에 가까워야 한다.”

 
하지만 연령계층별로 지지성향의 차이가 존재하고(2030 진보 / 5060 보수) 기표 미숙확률이 노년층이 높다고 한다면 r 값이 같을 수 없습니다. 따라서 K값은 1보다 크게 나올 수 밖에 없고, 분석에서 알 수 있듯이 노년층의 비율이 높아짐에 따라 미분류 확률이 높아지므로 기표 미숙확률이 노년층으로 갈수록 높다고 할 수 있습니다. 즉 K값이 1이 아닌 것은 어찌 보면 자연스러운 일인 것입니다.

추가로 선거구 별로 당시 박근혜 후보의 득표율과 K값이 상관관계가 있는지 파악해봤습니다.
 
[표4] 선거구별 박근혜 득표율과 K 값
X축 park : 전국 선거구 박근혜 득표율(박근혜 득표수 / 총 득표수)
Y축 K :  (박의 미분류 득표율 / 문의 미분류 득표율) / (박의 분류 득표율 / 문의 분류 득표율)
 
분석 결과, 선거구별 박 후보의 득표율과 K 값은 양적 상관관계가 있고, 상관계수는 0.45로 어느정도 상관관계가 있음을 확인하였습니다. 결론적으로 박 후보의 득표율이 높은 지역일수록 K값이 높다고 할 수 있습니다.

논문에는 이런 내용도 있었습니다.

<논문내용>
“When the op-scan counters operate properly, only invalid ballots are expected to be
sent to the unclassified.”
"투표지분류기가 정상이라면, 오직 무효표만 미분류 될 것으로 기대한다.”


하지만 현재 투표지분류기는 무효표 뿐만 아니라 기계가 못 읽은 기표가 애매한 표들도 미분류로 나오게 세팅돼 있습니다. 이런 표들은 ‘선관위 유효표 판단 기준’에 따라 육안으로 확인해 정상표로도 갈 수 있습니다. 저희가 분류기 작동방법을 테스트해 본 결과 미분류표에는 기표가 애매하지만 정상으로 판단되는 표들이 더 많았습니다.

시연 장면은 방송으로도 나갔는데 보도 이후, 분류기 1칸에 서로 다른 투표지가 들어갔다고 지적해주신 분들이 계셨습니다. 분류가 잘못됐다는 얘기인데 화면만 보면 그렇게 이해됩니다. 사실은 이렇습니다. 시연 당시, 투표지 분류기의 후보자별 칸이 12칸인데, 투표지에 적힌 후보자는 15명으로 정했습니다. 이미 한명이 그만뒀지만 그 전에 만든 예시용 투표지입니다.

그래서 시연 당시에 의석이 있는 정당인 1번부터 6번까지는 후보자 별로 한 칸씩 지정하고, 7번 이후부터는 한 칸에 2~3명씩 지정하였습니다. 7번째 구분 칸에는 7번과 8번이 같이 들어가도록 지정했는데 그 부분이 방송이 된 것입니다. 저희가 시간관계상 시연 방법을 구체적으로 설명 드리지 못한 것에서 온 오해임을 말씀 드립니다. 

이번 취재를 통해 가장 크게 느낀 점은 개표 과정의 불신이 너무 깊다는 것이었습니다. 사소한 실수나 오류들이 쌓이다보면 불신도 깊어집니다. 선관위는 원한다면 대선 후, 지난 대선 개표 과정에 대한 검증 작업을 벌이겠다고 밝힌 바 있습니다.

하지만 선관위는 이에 앞서 이번 대선에는 어떠한 의심이 생기지 않아야 하는 막중한 책무를 갖게 됐습니다. 개표 과정에 참여 혹은 참관하며 애쓰시는 분들의 노력과 소중한 한 표를 행사하러 오는 유권자들의 뜻이 정당히 반영되기를 기대해봅니다.            
Copyright Ⓒ SBS. All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지

스브스프리미엄

스브스프리미엄이란?

    많이 본 뉴스