트럼프의 승률을 낮게 예측한 선거예측 모델에 대해 데이터 저널리스트들이 말하다
(What data journalists say about the election models giving Trump slim chance of winning)
올리버 다시(Oliver Darcy), CNN 비지니스
많은 미국인들은 도널드 트럼프가 확률을 거슬러 힐러리 클린턴을 패배시켰던 2016년의 상처를 여전히 안고 있다.[힐러리 클린턴의 당선 가능성을 높게 봤던 2016년의 선거예측 전문가들을 지칭하는 것으로 보임] 4년이 지났고, 정치적 실망감 때문에 많은 미국인들은 트럼프가 바이든을 이길 확률이 아주 적다는 지금의 (선거예측) 모델을 불신하고 있다. 현장의 유권자들이나, 전화상으로 가족으로부터, 또한 그룹 채팅방의 친구로부터 이런 취지의 말을 들어본 적이 있을 것이다. “그래, 전문가들은 트럼프가 바이든을 이길 가능성이 낮다고 하지. 하지만 전문가들은 2016년에도 같은 소리를 했고, 그들의 예측은 틀렸지.”
확실히 하고 넘어갈 점은, 선거예측 모델들이 2016년에 트럼프가 이기는 것은 불가능했다고 말한 적은 없었다는 것이다. 예를 들어, 파이브서티에이트(FiveThirtyEight)는 28.6%의 확률로, (뉴욕타임스의) 업샷(The Upshot)은 15% 확률로 트럼프의 승리를 예측했다. 하지만 클린턴이 이미 선거전을 지배하고 있었다는 강한 인상 때문에 많은 예측들은 잊혀졌다. 선거가 클린턴에게 재앙적인 결과로 끝나자, 여론조사와 여론조사를 활용해 선거결과를 예측했던 데이터 저널리스트들에 대한 불신이 생겼다.
올해 (선거예측) 모델들은 다시한번 트럼프에 대한 나쁜 소식을 전하고 있다. 파이브서티에이트는 트럼프의 재선 확률을 약 11%로 보고 있다. 이코노미스트(The Economist)는 트럼프의 재선 확률을 4%보다도 낮은 것으로 본다. 선거예측 모델들은 트럼프가 지난 2016년보다 더욱 가혹한 상황에 있다고 보는 한편, 여전히 트럼프가 재선할 가능성도 열어두고 있다. 만약 트럼프가 선거에서 이긴다면? 만약 우리가 트럼프가 승리를 거두는 11% 또는 4%의 세계에 살게 된다면? 이런 결과는 데이터 저널리스트와 그들의 예측 모델의 신뢰도에 대해 어떤 의미를 갖게 될까?
“저도 그에 대한 생각을 많이 한다”
나는 이코노미스트의 G. 엘리엇 모리스(G. Elliott Morris)에게 전화를 걸어 생각을 물었다. 그는 트럼프가 모든 역경을 뚫고 다음주 대선에서 이겼을 경우 벌어질 일에 대해 걱정을 하고 있을까? 모리스는 “저도 그에 대한 생각을 많이 한다. 만약 우리가 이번에 틀린다면, 여론조사는 고쳐 써먹을수도 없고, 우리의 분석도 헛소리일 뿐이라는 인식이 상당한 손해를 가져올 것이다. 나는 그것이 걱정된다.” 모리스는 2016년의 일에 대해 “(2016년의 일은) 실제 오류라기 보다는 인지된 오류였다[여론조사가 엉터리로 이뤄진 것은 아니지만, 빗나갈 가능성은 있었고, 실제로 빗나갈 줄은 몰랐다는 의미]”며 예측모델들은 트럼프의 승리도 예측하고 있었다고 말했다. 그는 이코노미스트의 예측모델에 대해 확신하고 있다.
하지만 모리스는 모델링이 고려하지 않는 요소들도 있다고 지적했다. 예를 들어 모리스는 연방대법원의 최근 결정[사전 우편투표에 대해 선거일 이후에 선관위에 도착하는 사전투표는 인정하지 않는다고 결정함] 때문에 위스콘신에서 상당수의 표는 계산되지 않을 것이라고 말했다. “이 건은 우리 모델이 고려할 수 있는 부분이 아니다”
“제가 선거 결과에 대해 할 수 있는 일은 없다”
나는 파이브서티에잇(FiveThirtyEight)의 네이트 실버(Nate Silver)와도 접촉했다. 그 역시 자신과 동료들은 2016년 선거에서 트럼프가 이길 가능성이 있었다고 말했단 점을 강조했다. 실버는 “우리는 사람들에게 트럼프가 이길 가능성이 있다고 경고했지만 많은 사람들은 경고에 귀를 기울이지 않았다”라고 말했다. 그는 올해의 선거예측 모델에 대해서 “우리는 우리가 무엇을 믿고 있는지 말하는게 아니다. 우리는 확실한 것만 말한다. 바이든이 여러 여론조사에서 상당히 앞서 있고, 여론조사에서 이정도 차이로 앞서는 후보가 보통 이긴다”라고 말했다.
이번 선거에서 트럼프가 이길 경우, 사람들이 선거예측 모델에 대해 믿지 않으려 하지 않겠느냐고 물었다. 실버의 선거예측 모델은 트럼프의 승리 가능성도 있다고 한다. 실버는 “별로 신경 쓰지 않는다, 제가 선거 결과에 대해서 할 수 있는 일은 없기 때문이다. 분명히 환멸감을 느끼거나 하는 사람들이 있을거라 생각하지만, 그건 내가 어찌할 수 없는 일이다”라고 말했다. 또한 실버는 “10%의 확률의 사건도 어쩌다 한번은 실제로 일어난다. 일어날 수도 있는 일이다! 거기에 대해 우리가 할 수 있는 일은 많지 않다”라고 덧붙였다.
인튼 기자의 관점
CNN의 해리 인튼(Harry Enten)은 이메일로 이같이 답했다.
“나는 여전히 내 전 직장인 파이브서티에이트에서 (2016년 당시) 트럼프에게 적절한 정도의 승률(거의 30%)을 줬다고 생각한다. 하지만 나는 바이든이 올해 대선에서 대체로 앞서고 있다는 여러 모델과 예측들이 들어맞을 거라 생각한다. 몇 가지 이유가 있다. 바이든은 주별 여론조사에서 더 나은 위치에 있다.(바이든이 미시건, 위스콘신에서 10% 가까이(high single digit) 앞선 것을 보라) 그는 전국적으로 9~10%P 앞서고 있다. 힐러리 클린턴은 3~4%P만 앞서고 있었다. 끝으로, 여론조사기관이 2016년 이후 (조사방식에 대해) 몇가지 수정을 가했다.(예를 들어 교육수준에 따라 가중치를 주기도 하고, 핵심 경합주에서는 마지막 순간까지 여론조사가 이뤄질 것이다.)”
인튼의 해설은 이어진다. “당연히 트럼프가 진다는 보장은 없다. 내 생각에 데이터 저널리즘의 역할은(최소한 내 관점에서는) 확률이 어느정도 되는지 설명하는 데 있다. 그동안 나는 매우 신중하게 트럼프에게도 승률이 있다고 말해 왔다. 가끔 흔치 않은 일이 일어나기도 한다. 난 솔직히 바이든이 이긴다고 해서 (현재의) 선거예측 모델이 맞았다고 확언할 순 없다고 본다. 한두번의 선거로 단정할 순 없다. 나는 모델이 현실에서는 꼭 들어맞지 않을 수 있다는 점을 알고 있다. 사람들은 트럼프가 이길 경우 이를 선거예측모델이 틀렸다는 신호로 받아들일 것이다. 난 그 점이 약간 걱정된다. 하지만 솔직히 세상엔 그보다 더 걱정할 일들이 많다.”
<설령 여론조사가 빗나가더라도>
지난 수요일, 뉴욕타임즈의 네이트 콘(Nate Cohn)은 설령 여론조사가 2016년만큼 빗나가더라도 여전히 바이든이 이길 것이라고 지적했다. 콘은 기사에서 마지막 여론조사는 선거일보다 거리가 있는 여론조사에 비해 “보통 더욱 정확하다”고 썼다. “만약 향후 며칠간 지지율 차이가 좁혀지지 않는다면, 트럼프는 여론조사가 4년 전보다도 더 많이 빗나갈 것을 기대할 수밖에 없다.”
네이트 콘과는 인터뷰를 할 수 없었지만, 뉴욕타임스의 데이터 편집장인 어맨다 콕스(Amanda Cox)는 나에게 콘의 기사는 “여론조사 방식에 대해 상세히 연구한” 결과라며, 40개 이상의 주별 여론조사를 다루고 있다고 말했다. 콕스는 “우리의 보도는 독자들에게 우리가 아는 것과 모르는 것을 모두 전달하고 있다”며, “투표일 밤부터 투표 결과가 나올 때까지 우리는 웹사이트와 앱에 올라오는 결과 프리젠테이션을 통해 많은 표들이 개표되지 않은 주들을 강조해 보여줄 것이다. 이를 통해 독자들에게 선거가 얼마나 불확실했는지 전달할 것이다.”라고 덧붙였다.