통계학은 으레 수학에 포함된 학문이라고 생각했었는데, 조재근 경성대학교 응용통계학부 교수는 다르게 생각했던 모양이다. 순진하던 시절에 사회학이나 경제학, 그리고 자연과학과 인문학까지 두루 배우는 줄 알고 통계학과에 들어갔다가 어려운 수학이 잔뜩 들어간 과목들을 공부하느라 무척 고생했다고 말한다. 그래서 그런지 조재근 교수가 바라보는 통계학은 범위가 넓은 것 같다. 한국문학사의 <융합과 통섭의 지식 콘서트>시리즈 중 하나인『통계학, 빅데이터를 잡다』에서 그의 광범위한 통계학을 만날 수 있다.
이 책에서 우리는 통계청을 비롯한 국가기관이 관리하는 사회·경제 통계와 더불어 의학·생물학·금융 등 여러 분야를 두루 넘나드는 통계학의 다양한 모습들을 만날 것이다. 물론 빅데이터와 인공지능, 그리고 머신러닝의 각종 학습법들이 서로 어떻게 연결되고 어떻게 다른지도 살펴볼 것이다. 그런데 여러 세기 동안 수량 데이터가 널리 활용되면서 통계는 한편으로 본래의 역할에서 벗어나 지나친 권위를 갖게 되기도 했다. 특히 관료주위와 결합한 통계 수치들은 객관성과 정확성이라는 명목으로 사람의 얼굴을 쉽사리 지워 버리는 냉혹한 역할까지 종종 떠맡게 되었다. (p. 10)
조재근 교수는 최근의 예로 세월호와 메르스 사태를 든다. 통계 숫자에 쉽게 지워지고 마는 희생자들을 기억하려면 비판적 사고가 필요하다고 말한다. 이 책이 지향하고 있는 융합과 통섭의 근본에는 바로 비판적 사고가 자리 잡고 있다.(p. 10) 지난 광화문 촛불집회만 보더라도 경찰과 주최 측의 추산결과가 너무 큰 차이가 나서 혼선이 있었다. 조재근 교수는 먼저 집회에 모인 사람의 수가 대단히 중요하다고 말한다.
집회에 모인 사람 수가 많을수록 그 집회에서 나온 목소리는 뚜렷한 대의명분을 얻기 때문이다. 분명한 입장을 갖고 있지 않은 사람들은 그 수를 보고 여론의 방향을 짐작하고 그에 따라 자신의 생각을 정하는 경우도 많으므로 사람 수는 차후 여론의 향방을 가르는 역할까지 한다. 또한 그 집회가 정부에 항의하는 집회라면 정부 측에서는 대규모 집회에서 나온 요구를 쉽게 무시할 수 없게 된다. 그러므로 행사를 준비하는 측에서나 행사를 막고 싶은 측에서나 모인 사람의 규모를 가지고 집회의 성공 여부를 판단하게 된다. 그런데 문제는 사람들이 입장권이나 번호표를 받고 집회에 모이는 것이 아니기 때문에 정확한 참가인원 수를 알기가 매우 어렵다는 것이다. 같은 공간에 모인 사람 수를 헤아리는 일이 무척 단순해 보이지만 사람 수가 수쳔 명만 되어도 정확한 수치를 얻기는 어렵다. 하물며 수만, 수십만을 넘어 백만 명이 넘게 모인 집회라면 참가자 수를 대략적으로 추정하기도 매우 어려워진다. (p. 235)
그래서 집회 참가인원 통계에는 진실과 다른 편향이 생길 이유가 크게 두 가지 존재하는 셈이다. 하나는 현실적으로 사람 수를 집계하기가 매우 어렵다는 점이고, 다른 하나는 집계하는 측의 입장에 따라 각각 수를 부풀리거나 축소해야 할 이유가 충분하다는 점이다.(p. 235) 언론 보도 역시 반정부집회의 경우 어떤 언론은 주최 측의 추산을, 또 어떤 언론은 경찰의 추산값을 강조해서 보도한다. 집회 참가자 수 보도에서 각 신문, 방송의 정치적 입장이 그대로 드러나는 것이다.(p. 238) 객관적 사실을 그대로 나타내야 할 통계가 정치적 도구로 전락한 사례인데, 그럴수록 비판적인 사고로 통계를 바라봐야 할 것이다.
확률이라고 하면 우리는 학교 수학시간에 배웠던 공을 뽑는 경우의 수를 먼저 생각한다. 그런데 확률은 수학책 속에만 갇혀 있는 것이 아니라 우리의 일상 속으로 무척 가까이 들어와 있다. 우리는 공뽑기의 확률과 로또복권에 당첨될 확률, 그리고 내일 비가 올 확률, 또는 친구의 말이 참이라고 믿을 확률 등 서로 매우 다른 경우들에 확률을 이용하고 있다. 확률이라는 것이 이처럼 다양하게 사용되다 보니 과연 확률이라는 것을 하나로 정의할 수나 있을지 의심스러울 정도다. (p. 121)
조재근 교수는 로또를 도박과 비교해서 설명한다. 우리나라 로또복권 사업실적을 보면 매년 당첨금과 판매액의 비가 0.5로 일정하다. 이로부터 우리는 복권 판매액의 절반만 복권을 산 사람들에게 돌아간다는 사실, 즉 1,000원을 내고 복권 한 장을 산다고 할 때 당첨금의 기댓값이 500원임을 알 수 있다. 도박으로 치면 전혀 공정한 게임이 아닌 것이다.(p. 132~ 133) 나머지 500원은 복권을 발행하는 측이 가만히 앉아서 돈을 가져가기 때문이다.
정부 입장에서 볼 때 복권은 시민들로부터 ‘별다른 저항 없이 세금을 걷는 좋은 방법’이다. 또 특히 하층계급 사람들에게 “부자가 되는 일은 누구에게나 가능하다”는 환상을 심어줌으로써 사회 · 경제적 문제에 관심을 갖지 못하게 하고 불평등을 당연하게 받아들이도록 유도하는 역할을 하기도 한다. (p. 134)
설사 복권에 당첨되어 부자가 되더라도 또 다른 문제가 불거지는 경우가 많다. 환상을 무작정 좇기보다는 현실을 직시해야 한다. 비판적인 사고를 가지고 불평등에 목소리를 높여야 한다. 이 책은 통계학에 대해 설명하면서도 비판적인 안목으로 살필 수 있는 통찰력으로 그 너머를 봐야 한다고 강조한다. 그 너머를 볼 수 있다면 때때로 정치적 도구로 전락하는 통계에 속지 않을 것이다. 그러고 보면 통계에 냉혹하다고 할 게 아닌 것 같다.