[Opinion poll]2012년을 달군 대선과 여론조사…알쏭달쏭 여론조사 과연 믿을 만한가
입력 : 2013.02.04 13:50:43
수정 : 2013.02.26 09:21:25
2012년은 20년 만에 총선과 대선이 같은 해에 치러진 선거의 해였다. 4.11 총선을 대비해 여론조사 전문기관은 2011년 말부터 눈코 뜰새 없이 바빴다. 여러 언론사와 기관의 의뢰를 받은 여론조사 업체들은 지난 1년간 정기·비정기 여론조사를 실시하면서 정신없는 한 해를 보냈다.
그러나 여론조사의 정확성과 객관성을 두고 유권자들 사이에서는 끊임없이 의문이 제기되고 있다. ‘같은 기간 여론조사가 실시됐는데 지지율 차가 왜 이렇게 큰가요?’ ‘보수 성향 언론과 진보성향 언론의 조사 결과가 다른 이유가 있나요?’ ‘출구조사 결과를 정말 믿어도 되는 건가요?’ 등 여론조사의 신뢰성을 부인하는 질문이 적지 않다. 과연 여론조사는 유권자들의 생각을 특정 세력이 자의적으로 해석하는 수단에 불과할까? 아니면 선거 결과를 정확히 예측하고 해석할 수 있는 과학적·객관적 도구일까?
아래 7가지 질문에 대한 답을 통해 여론조사와 대선에 대한 궁금증을 풀어 본다.
1. 여론조사 정말 과학적일까?
정답부터 얘기하면 여론조사는 과학적인 조사 방법임에 틀림없다. 다만 ‘무작위 추출(랜덤 샘플링)’이라는 원칙이 지켜졌는지 여부가 조사의 정확성을 담보하는 기본이자 핵심이다.
여론조사가 과학적인 이유는 일정 규모 이상의 표본을 무작위로 추출해 전체를 파악하는 수학적·통계학적인 원리를 바탕으로 하고 있기 때문이다. 1820년대에 시작된 여론조사는 1935년경 갤럽에 의해 과학적인 방법으로 발전됐다. 갤럽은 1000명의 샘플 조사를 통해 미국 국민 전체의 생각을 알 수 있는 수준까지 여론조사의 정확성을 발전시켰다. ‘무작위 추출’이라는 원칙이 정확하게 지켜졌다면 100번의 여론조사 중 95~96번은 ±3% 내의 오차범위에서 같은 결과가 나오게 된다.
여론조사가 현실을 정확하게 반영하지 못한 이유의 대부분은 바로 랜덤 샘플링을 제대로 하지 못했기 때문이라는 것이 전문가들의 설명이다.
2. 조사기관 성향 따라 결과 조작하지 않나?
같은 기간 대선 주자의 지지율 차이가 조사기관별로 다른 경우에 대해 궁금해 하는 사람도 있다. 대체로 보수 언론은 여당 주자의 지지율이, 진보성향 언론은 야당 주자의 지지율이 높다는 지적도 한다. 그러나 여론조사 전문가들은 조사기관이 결과 자체를 왜곡할 가능성은 없다고 설명한다. 거의 범죄에 가까운 조사결과 조작이라는 불법행위를 할 여론조사 기관은 없다는 얘기다.
다만 여론조사를 위한 질문지가 가치중립적으로 만들어져 현실을 제대로 반영하는지, 무작위 추출의 원칙이 잘 지켜졌는지를 살펴볼 필요가 있다는 설명은 한다. 여당이나 야당 주자에 유리하거나 불리한 결과가 나오도록 질문지에 오류가 있거나 특정 연령대나 특정 성별, 특정한 성향의 표본이 과대 반영되도록 무작위 추출에서 실패하면 여론조사 결과에 왜곡이 생기게 마련이다.
예를 들어 노년층 응답자가 인구 전체 표본에 비해 과대하게 반영될 경우 여당 주자의 지지율이 현실보다 유리하게 나오게 된다.
3. ARS와 조사원 여론조사 중 무엇이 더 정확할까?
사실 자동응답시스템(ARS)을 이용한 조사 결과와 조사원이 직접 전화로 실시한 여론조사 결과 간 차이가 있어서는 안 된다.
그러나 ARS에 비해 조사원을 이용한 여론조사 결과가 더 정확하다는 것이 전문가들의 설명이다. 이유는 ARS 여론조사에서는 랜덤 샘플링의 문제가 발생하는 경우가 많기 때문이다. 일반적으로 잘 훈련된 조사원들이 전화 여론조사를 실시할 경우 응답률은 30% 정도로 알려져 있다. 반면 ARS 여론조사에 대한 응답률은 5% 전후로 추정된다. ARS 여론조사에 응답하는 사람은 특별히 정치에 관심이 많거나 특정한 의도를 갖고 있는 사람일 가능성이 높다.
그러나 ARS 조사의 매력은 비용이 적게 든다는 것이다. 이런 이유로 지난해 대선에서 한 기관은 여론조사 전문회사를 통해 매일 대선 지지율 조사를 했다. 이에 대해 전문가들은 하루 만에 조사결과의 오차가 3~5%포인트씩 나타났다는 점에서 ARS 조사에 문제가 있다고 지적한다. 지지율의 연속성의 측면에서 참고할 수 있을지 몰라도 정확성 면에서는 문제가 있었다는 설명이다.
4. 유선전화와 휴대전화 조사의 차이는?
10여년 전만 해도 KT의 전화번호부를 이용한 여론조사는 유선전화를 대상으로 실시하는 경우가 많았다. 그러나 최근에는 유선전화와 함께 휴대전화를 조사 대상으로 30~50%가량 섞는다. 이유는 랜덤 샘플링에서의 오류를 막기 위해서다. KT 전화에 등록된 유선전화로 여론조사를 실시할 경우 경제활동을 하지 않는 주부나 노년층이 과다하게 표본에 반영될 가능성이 높다. 이런 상황에서 여론조사를 실시하면 상대적으로 안정을 추구하는 여당성향 지지자들의 지지가 과다하게 반영된다.
최근에는 대부분의 기관들이 자동번호추출(RDD) 방식의 조사를 시행한다. 지역번호와 국번을 제외한 나머지 4자리 번호를 컴퓨터로 자동 추출하고, 선정된 번호를 활용해 전화하는 형식이다. 조사기관별로는 랜덤 샘플링의 정확도를 높이기 위해 수억원을 투입해 무작위로 번호를 추출하고, 오류를 줄여주는 시스템을 구축하기도 한다. 1000명을 조사할 경우 인구비례에 의해 서울은 240명, 강원도는 46명 이런 식으로 지역마다 다른 수의 표본을 추출하는 것은 기본이다.
출구조사 정말 믿을 만한가?
미국에서 시작된 출구조사는 한국에서는 1996년 15대 총선에서 처음 도입됐다. 이후 속보 경쟁을 벌이는 방송사들이 출구조사를 주도했다. 전국적으로 많은 인원을 동원해 실시하는 대선의 경우 출구조사가 비교적 정확하게 들어맞았다. 2002년 대선 출구조사 결과는 노무현 49.1%, 이회창 46.8%였다. 실제 결과는 노무현 48.9%, 이회창 46.6%이었다. 2007년 대선 때 출구조사 결과는 이명박 50.3%, 정동영 26.0%였고 실제 결과는 이명박 48.7%, 정동영 26.1%로 나왔다.
2012년 대선에서는 지상파 방송3사는 출구조사 결과를 박근혜 50.1%, 문재인 48.9%로 예상했다. 실제 결과는 박근혜 51.6%, 문재인 48.0%로 출구조사 결과 보다 좀 더 차이가 벌어졌다. 출구조사가 정확하지 못한 경우는 표본이 너무 작거나, 표본이 솔직한 응답을 하지 않을 때 발생한다. 실제로 총선과 지방선거에서는 출구조사 결과가 빗나가는 경우가 적지 않았다. 대표적인 경우가 2012년 19대 총선이었다. 당시 박빙의 수도권 지역구에서 야권 후보가 근소하게 승리했다는 출구조사 결과가 곳곳에서 나왔지만 오히려 승부는 여당인 새누리당 후보의 승리로 뒤집힌 경우가 적지 않았다.
보다 솔직한 표본의 응답을 끌어내기 위해 조사원으로는 40대 주부가 가장 적합하다는 주장도 있다. 대선 출구조사를 위해 20대 여학생이 대거 조사원으로 동원되는 것이 관례인데 여권 주자를 지지한 유권자들이 솔직한 대답을 하지 않는 경우가 적지 않다는 것이 전문가들의 지적이다.
숨어 있는 표는 진보성향표가 더 많을까?
정답은 ‘아니오’다. 흔히 정치권에서는 진보성향의 표가 숨어 있다는 얘기를 많이 한다. 투표율이 상대적으로 낮은 젊은층의 표를 더 끌어낼 수 있다는 야권의 희망이 반영된 속설이기도 하다. 그러나 실증적으로 보면 보수층의 표가 더 많이 숨어 있었다.
예를 들어 2002년 대선 직전 한국갤럽의 단순 여론조사(12월 17일 실시)와 판별분석 결과(12월 18일 실시)를 비교하면 노무현 후보는 46%에서 48.2%로 2.2%포인트 상승했고, 이회창 후보는 41%에서 46.4%로 5.4%포인트 늘어났다. 실제 득표율을 살펴봐도 이런 경향을 알 수 있다. 여론조사 보도금지 직전인 11월 25일 여론조사와 실제 득표율을 비교하면 노무현 후보는 44%에서 48.9%로 오르는 데 그쳤지만 이회창 후보는 37%에서 46.6%로 9.6%포인트나 뛰었다.
2012년 대선에서도 비슷한 현상이 나타났다. 여론조사 공표 금지 기간인 선거 전일 여론조사 결과 문재인 민주당 후보는 추격을 거듭해 박근혜 새누리당 후보의 지지율과 거의 동률을 이뤘다.
그러나 보수층의 숨은 표는 힘을 발휘했고 박 당선인은 문 후보와 3%포인트 이상 차이를 벌리며 승리했다.
TV토론은 막판 판세에 큰 영향 미칠까?
흔히 언론에서는 박빙의 승부를 결정짓는 것이 TV토론이라는 말을 한다. 그러나 실증적으로는 TV토론이 대선에 큰 영향을 주지 않는다는 것이 전문가들의 얘기다. TV 토론이 큰 반향을 일으켰던 지난 1997년 대선에서도 TV 토론의 영향력은 크지 않았다는 것. 당시 이인제 후보의 지지율이 TV토론 직후 2~3% 올랐지만 약 5일 후에는 다시 원상태로 지지율은 수렴됐다.
2012년 대선을 앞두고 실시된 TV토론에서도 문재인 후보가 상대적으로 공세적인 입장을 취했고, 박근혜 당선인은 방어적인 모습이었다.
토론 자체의 성적표만 봐도 문 후보가 앞선다는 평가가 적지 않았다. 그러나 많은 유권자들은 TV 토론을 통해 정책이나 후보의 능력을 평가하기보다는 후보의 신뢰성을 가늠하는 보조적인 수단으로 사용했다. 18대 대선에서도 TV토론이 각 후보의 지지율에 영향을 거의 주지 못했다.
Key point
여론조사 정확도는 랜덤 샘플링에 달려 있다. 진보 세력보다 보수층의 표가 더 많이 숨어 있다.