[뉴욕타임스 칼럼] Nate Silver: Here's What My Gut Says About the Election, but Don't Trust Anyone's Gut, Even Mine. by Nate Silver
* 네이트 실버는 책 "On the Edge: The Art of Risking Everything"의 저자다.
7개 경합주의 여론조사 결과가 모두 1~2%P 이내의 접전으로 나오는 상황에서 두 후보의 당선 가능성을 책임지고 예측하라고 하면 "50 대 50"이라고 답하는 수밖에 없다. 카멀라 해리스와 도널드 트럼프의 토론 이후
내 선거 결과 예측 모델이 꾸준히 내놓는 답도 비슷하다.
하지만 이처럼 만족스럽지 못한 뉴스를 전하면 꼭 이렇게 질문하는 사람이 있다. "네이트, 그래도 네 촉이라는 게 있을 거 아냐?"
그 질문에 답하자면 내 촉은 도널드 트럼프의 승리를 가리킨다. 불안에 떠는 민주당 지지자 중에도 나와 비슷한 예감이 자꾸 드는 사람이 많을 것이다.
하지만 나의 촉은 물론이고 누군가의 직감을 크게 믿어서는 안 된다. 50 대 50이라는 조사 결과가 말 그대로 50 대 50임을 받아들여야 한다. 또한 그런 예측이 빗나갈 가능성, 그리고 해리스와 트럼프 가운데 누구라도 승자가 될 수 있다는 사실 역시 열린 마음으로 받아들여야 한다.
내가 직감이라는 개념 자체를 믿지 않는다는 것은 아니다. 예를 들어 포커 게임에서 직관은 매우 중요한 역할을 한다. 내가 만나본 프로 포커 선수 대부분은 직감이 추가적인 무기가 될 수 있다고 말했다. 확신할 수는 없지만, 직감으로 경쟁자가 블러핑하는 패턴을 발견하면 나의 승리 가능성을 60대 40 정도로 높일 수도 있다는 것이다.
그러나 여기서 포커 선수가 그 미묘한 느낌의 근거로 삼는 것은 최소 수천 번의 경험이다. 반면 대통령 선거는 4년에 한 번 돌아온다. 누가 이길 것 같냐는 질문에 많은 이가 트럼프를 꼽는 이유는 최신 편향(recency bias) 때문이다. 트럼프가 2016년에 예상을 깨고 승리했고, 2020년에는 여론조사에서 한참 뒤진다는 이야기가 있었음에도 거의 이길 뻔했으니 그런 생각이 드는 것이다. 하지만 2012년 대선을 떠올려보자. 당시 버락 오바마는 여론조사 결과를 뛰어넘는 압승을 거뒀다. 여론조사 오류의 방향을 예측하기란 이렇게 어렵다.
트럼프가 승리할 수도 있는 이유 (여론조사에서 트럼프의 지지세가 실제보다 낮게 나타나고 있을지 모르는 이유)
트럼프의 승리를 직감하는 사람들은 종종 '샤이 트럼프(shy Trump)', 즉 숨은 트럼프 지지자라는 개념을 언급한다. 영국의 여론조사가 보수당 지지세를 과소평가하는 경향을 설명한 '샤이 토리(shy Tories)'에서 따온 개념인데, 사람들이 사회적인 낙인 때문에 보수 정당을 지지하는 사실을 잘 드러내지 않는 경향으로 인해 발생하는 현상이다.
하지만 이 '샤이 유권자' 이론에는 근거가 별로 없다. 그리고 전 세계 선거판에서 우파 정당이 지속적으로 여론조사 결과를 뛰어넘는 성과를 낸 경향도 나타나지 않는다. (일례로 마린 르 펜의 국민 행진이 지난여름 치러진 프랑스 국회의원 선거에서 받아 든 결과는 여론조사 결과에 미치지 못했다.) 보수 정당을 지지하는 사람들이 그 사실을 부끄러워할 거라는 주장에 담긴 일종의 우월의식도 짚고 넘어가야 한다. 실은 트럼프 지지를 자랑스럽게 여기는 사람들이 많고, 특히 지금은 그 어느 때보다 낙인 효과가 약해진 것도 부인할 수 없는 현실이다.
무응답 편향은 해결하기 어려운 문제일 수 있다. 전화 여론조사는 아무리 잘해도 응답률이 한 자릿수에 불과하니, 어떻게 보면 전화 여론조사에 응하는 사람들이 특이한 축에 든다. 더구나 트럼프 지지자들은 시민 참여도와 사회적 신뢰가 낮은 경우가 많아서 언론사에서 실시하는 여론조사에 응할 가능성이 더욱 낮다. 여론조사 기관은 학력(대학 교육을 받은 유권자는 여론조사에 응할 가능성이 높다)이나 과거 투표 참여 여부에 따른 가중치를 두는 등, 더욱 공격적인 데이터 마사지 기법을 동원해 이 문제를 해결하려고 노력 중이지만, 효과를 보장할 수는 없다.
트럼프가 실제 선거에서 여론조사를 뛰어넘는 성과를 낸다면 적어도 한 가지는 분명해질 것이다. 민주당은 더는 정당 지지율에서 우위를 점하지 못하며, 이제는 공화당 지지를 자처하는 사람이 민주당 지지자만큼 많다는 사실이다.
해리스가 최초의 여성 대통령이자 두 번째 흑인 대통령이라는 타이틀에 도전하고 있다는 점도 트럼프 지지세가 여론조사에 제대로 반영되지 못하는 한 가지 요인일 수 있다. 1982년 캘리포니아 주지사 선거에 출마했지만, 여론조사 결과에 미치지 못하는 성적표를 받았던 LA 시장 출신 톰 브래들리의 이름을 딴, 이른바 '브래들리 효과'라는 것이 있다. 사람들이 여론조사에서 흑인 후보자에게 투표하지 않을 거라고 차마 말하지 못해 마음을 정하지 못했다고 답하는 경향을 일컫는 말이다. 2008년과 2012년의 버락 오바마는 브래들리 효과를 피해 갔지만, 민주당이 내세웠던 또 다른 여성 대선 후보의 경우에는 '마음을 정하지 못했던' 유권자의 표심이 실제로는 반대로 크게 기울었던 것을 우리 모두 알고 있다. 그러니 해리스 후보는 '힐러리 클린턴 효과'를 우려하지 않을 수 없다.
해리스가 승리할 수도 있는 이유 (여론조사에서 해리스의 지지세가 실제보다 낮게 나타나고 있을지 모르는 이유)
해리스 후보를 과소평가한 여론조사가 선거 결과를 잘못 예측할 가능성이 반대 경우보다 반드시 낮다고도 할 수 없다. 보통 여론조사는 평균 3~4%P 정도 빗나가므로, 해리스는 현재 여론조사의 오차 범위 안에서도 2008년 오바마 이후 전체 득표와 선거인단 득표에서 모두 가장 큰 격차로 승리할 수도 있다.
그런 일은 어떻게 일어날 수 있을까? 2017년 영국에서 일어난 일과 비슷한 상황이 벌어지면 가능하다. 당시 선거를 앞두고는 보수당의 싹쓸이가 예상됐지만, 정작 보수당은 과반 의석을 잃고 말았다. 여론조사 기관 사이에서도 의견이 분분했는데, 일부는 결과를 정확하게 예측하기도 했다. 하지만 여러 기관이 '샤이 토리' 효과를 너무 오랫동안 걱정한 나머지 데이터를 믿지 못하고 과도하게 조정하는 실수를 저질렀다.
여론조사는 점점 더 미니 모델처럼 변해가고 있다. 즉, 여론조사 기관이 전체 유권자를 대표하기에는 턱없이 부족한 원본 데이터를 토대로 유권자의 뜻을 정확하게 반영할 수 있도록 변환하는 방법을 놓고 갈수록 더 많은 결정을 내려야 한다. 여론조사 기관이 또다시 트럼프 지지세가 과소평가 되는 것을 두려워한다면, 의식적, 또는 무의식적으로 트럼프에게 유리한 가정을 하게 될 수 있다.
예를 들어, 여론조사 기관이 도입한 새로운 기법을 과도하게 적용하게 될 수 있다. 지난 선거에서 누구에게 투표했는지를 물어 가중치를 두는
기법의 경우, 응답자들은 종종 자신이 실제로 누구에게 투표했는지를 잘못 기억하고 있거나, 실제로 누구에게 투표했는지와 관계없이 승자(2020년의 경우 바이든)에게 투표했다고 응답할 가능성이 있다.
그렇다면 지난 대선에서 바이든에게 투표했다고 답했지만, 실제로는 트럼프에게 투표한 응답자들은 사실과 달리 새로운 트럼프 지지자로 분류되기 때문에 응답 데이터를 조정하는 과정에서 해리스에게 불리한 쪽으로 가중치가 적용된다. 2020년 여론조사의 오류가 부분적으로 코로나19 때문이었다는 주장도 일리가 있다. 팬데믹으로 인한 봉쇄 기간 민주당 지지자는 공화당 지지자보다 집안에 머무를 가능성이 더 크므로, 전화 여론조사에 응할 시간과 기회가 더 많았다는 것이다. 코로나19는 한 세기에 한 번 있을까 말까 한 일인데, 이런 요인을 이번 여론조사에도 그대로 반영한다면 실제 지지 성향과 투표 결과를 정확히 예측하는 일은 요원해질 수밖에 없다.
끝으로 대법원이 '로 대 웨이드' 판결을 폐기한 뒤 지난 2년간 민주당은 보궐선거와 주민투표, 2022년 중간선거에 이르기까지 계속 강세를 보이고 있지만, 이번 대선에서는 민주당이 그런 결과를 기대하기 어렵다는 이야기가 있다. 뉴욕타임스-시에나 여론조사와 같이 신뢰도 높은 여론조사가 투표율이 낮은 선거(대선이 아닌 중간선거 등)에서도 반드시 투표하는 가장 의욕적인 유권자 사이에서는 민주당이 강세를 보이지만 투표율이 높은 선거에서는 트럼프가 나머지 유권자의 대부분을 얻는다고 가정하기 때문이다. 그러니 민주당은 투표율이 낮아지기를 바랄 것이다. '나머지 유권자'들이 투표장에 나타나지 않는다면 해리스가 더 좋은 성적을 낼 수 있겠지만, 이들이 투표에 참여하면 선거는 트럼프에게 더 유리해질 수도 있다.
(남은 이야기는 스프에서)