문제는 출구 조사의 정확도 이다.
전체 조사 집단인 ‘모집단’과 그 모 집단에서 일정한 수치만 뽑은 집단인 ‘표본집단’간의 상관관계를 응용하여 구한다.
정확한 조사를 위해서는 모 집단 전체를 조사해야 한다.
문제는 모집단은 워낙 큰 수치여서 전부를 조사하려면 많은 비용과 시간이 들게 된다는 점이다.
그래서 표본을 만든다.
모집단과 성격이 가장 유사한 표본조사을 만들어 그 표본집단을 통해 나온 결과를 통해 모집단의 특성을 추정하는것이다.
그동안 역대 대선 투표에서는 공중파 방송 3사들의 출구조사가 그런대로 맞았다.
이같은 표본이론을 잘 활용한 결과이다.
올해는 돌발변수가 생겼다.
대선 역사상 처음으로 사전 투표를 실시한 것이다.
사전투표의 투표율이 무려 26%를 넘어섰다.
모두 1000만명이 사전 투표를 했다.
이 사전 투표는 출구조사를 하지 않았다.
결국 오늘 대선 출구조사는 사전투표 1000만명 분을 뺀 것이다.
그런만큼 신뢰도는 떨어질 수 밖에 없다.
지난 18대 대선 출구조사에서 박근혜 전 대통령 50.1%, 문재인 후보 48.9%의 득표율이 나왔다.
실제 득표율은 박근혜 후보 51.6%, 문재인 후보 48.0%였다.
조사 오차범위를 넘어서면서 득표율 예측에 정확성 논란이 발생하기도 했다.
그래도 순위는 맞추었다.
올해는 사전 투표 때문에 정확성을 담보할 수 없게 됐다.
출구조사에 큰 비중를 둘 수 없는 이유다.
여론조사 발표에 신뢰 수준 95%’, ‘오차 범위 ±0.5%’ 등의 표현이 있다.
이는 표본을 선택할 때 생기는 오차에 대한 내용이다.
여기서 ‘신뢰 수준’은 동일한 조사를 반복했을 때 오차 범위 내의 같은 결과치가 나올 가능성을 말하는 것이다.
신뢰수준 95%라는 말은 100번 조사했을 때 오차 범위 내의 결과가 95번은 나올 수 있다는 뜻이다.
오차범위 ±0.5%’ 라는 말의 뜻은 어떤 후보의 지지율이 36%±0.5% 라면 ‘35.5% (36-0.5)%’에서 ‘36.5(36+0.5)%’ 사이라는 것이다.
①②③④
김재희 기자 tiger8280@g-enews.com