중병에 걸린 환자에게 통계는 어떤 의미일까. 같은 증상을 가진 환자 100명 중 80명이 완치된다면 완치율 80%라 하겠다. 하지만 이 같은 수치는 환자에게 그다지 위안이 되지 못할 수 있다. 나머지 20% 확률에 대한 두려움 때문이다. 환자의 관심은 오로지 완치가 되는 환자 대열에 들어가느냐의 여부다. 1865년 실험의학의 아버지라는 프랑스 의사 클로드 베르나르가 했던 이야기로, 지금도 의학이나 통계 관련 글에서 자주 인용된다. 통계 수치는 전체적으로는 옳지만 개별적으로는 틀릴 수 있다는 것을 말해 준다.

▦ 토드 로즈의 저서 ‘평균의 종말’에 따르면 19세기 초에 이르면서 여러 국가들이 차츰 대규모 관료 체제와 군대를 꾸리면서 월별 출생아 수 및 사망자 수, 연간 수감되는 범죄자 수, 도시별 발병자 수 등 국민과 관련된 막대한 규모의 데이터를 일람표로 만들어 발표하기 시작했다. 당시에는 이런 잡다한 자료를 유익하게 해석할 방법을 찾지 못했으나 천문학자들을 중심으로 측정값 중에서도 평균적 측정값을 산출하는 방식을 개발하면서 분석방법이 한층 발전했다. 하지만 평균값은 개별 특성 파악에는 취약했다.

▦ ‘통계는 비키니’라는 얘기가 있다. 대부분 보여 주지만 중요한 것은 가리기 때문이다. 오류도 많다. 이혼율이 대표적이다. 2002년 국내 이혼율이 47.4%를 기록했다는 통계자료가 발표됐다. 국내 부부 절반이 이혼을 했다는 것인데 통계분석 오류로 드러났다. 특정 연도에 이혼한 부부의 수를 동일한 연도에 결혼한 부부의 수로 단순히 나누는 실수를 한 것이다. 결혼은 특정 연도에 하지만 한참 전에 결혼해 그해에 이혼한 부부와 비교를 했다니 황당한 경우였다. 정부가 통계나 변수를 조작하거나 ‘마사지’하는 경우도 흔하다.

▦ 실업률 통계는 착시를 유발할 때가 많다. 통계청이 발표한 5월 고용동향 통계를 보면 고용률이 61.3%인데 실업률은 4%에 불과하다. 고용률 61.3%는 경제활동인구와 비경제활동인구를 포함한 생산가능인구 100명 중 61.3명이 일을 하고 있다는 뜻이다. 그렇다면 실업률은 왜 38.7%가 아니라 4.0%일까. 실업률에는 취업을 포기한 사람은 대상에서 아예 제외하고 학생과 주부도 원칙적으로 제외한다. 그래서 현실보다 실업률이 과소 추정되는 경향이 있다. 경제는 성장한다는데 국민은 느끼지 못하는 것도 현실과 통계의 괴리다.

조재우 논설위원 josus62@hankookilbo.com

인기 기사

web_cdn 저작권자 © 한국일보 무단전재 및 재배포 금지

오피니언 최신기사