사람은 얼마나 많은 거짓말을 할까? 누구나 남에게 좋은 모습을 보여주고 싶어하기 때문에, 거짓을 보태서라도 자신을 좋게 포장하는 건 이상한 행동이 아니다. 그렇다면 사람들의 속마음을 어떻게 알아볼 수 있을까? 이런 의문에 이 책의 저자는 데이터로 알 수 있다고 주장한다.
이 책에는 흥미로운 이야기가 가득하다. 그래서 시간 가는 줄 모르고 책을 읽었다. 하지만 책 내용에 마냥 동의할 수 없는 것들도 있어서 책 내용을 다시 읽고 생각해보는 데에 시간이 꽤 걸렸다.
가령 어떤 연구팀이 인간의 폭력적인 행동을 조장하는 것에 폭력적인 영화가 얼마나 영향을 미치는지 확인하기 위해, 폭력적인 영화가 개봉한 날에 발생한 폭력 범죄 건수 데이터를 조사해서 분석했다는 설명이 있었다. 그런데 이 데이터가 저 주장을 뒷받침하는 근거로 쓸 수 있는 것인지 의문이었다. 폭력적인 영화가 개봉했다고 범죄자가 그 영화를 봤다고 주장할 수 있을까? 저 내용은 범죄자들이 폭력적인 영화를 실제 얼마나 봤는지를 확인해야 하는 거 아닐까? 뭔가 데이터를 끼워 맞추는 느낌이 들어 생각에 생각이 꼬리를 물기도 했다.
하지만 그렇더라도 이 책은 데이터 분야에 관심이 있다면 꼭 읽어보시라 추천하고 싶다. 데이터를 구하는 방법과 이용하는 방법 그리고 데이터를 취급할 때 주의할 점 등을 여러 예시를 통해 알려주기 때문에 데이터를 큰 맥락에서 이해할 수 있도록 도와주기 때문이다.
저자는 데이터를 통해 세상이 어떻게 돌아가는지 이해할 수 있다고 했다. 나도 이 점에 전적으로 동의한다. 우리 주변의 모든 것이 데이터가 될 수 있고, 이미 여러 분야에 이런 데이터가 활용되어 우리 생활을 변화시키기까지 하고 있으니까 말이다. 하지만 그만큼 주의해야 할 점도 많은 것 같다. 빅데이터는 결국 불완전한 인간이 만들어 낸 정보이고, 그 데이터를 해석하는 것도 불완전한 인간이니까. 데이터 해석에 관한 것은 차치하고, '데이터를 어떻게 모을 것인가'라는 관점에서 볼 때 이 책은 탁월한 통찰력을 제시해준다고 생각된다.
#모두거짓말을한다, #세스스티븐스다비도위츠, #더퀘스트, #컬처블룸, #컬처블룸리뷰단
인류가 수렵을 하던 시기를 떠올려보면, 우리의 조상들은 어떤 대상이 남긴 흔적을 추적하여 단서를 모으고 그 정보를 종합해서 사냥감을 사냥했습니다. 바닥에 난 이 패턴은 사냥감의 그것과 일치하는지, 이 패턴이 바리키는 다음 방향은 어디인지 예측하는 것이 중요했죠. 생각해보면 정보를 모으고 선별하여 활용하는 능력은 생존 자체와 직결되었기에, 오래 전부터 양질의 정보를 활용하는 능력은 인간이 갖추어야할 필수적인 능력이었습니다.
오늘날에도 방대한 데이터를 모으고 선별해서 활용하는 능력은 매우 중요합니다. 인간을 더 잘 이해하기 위해서라도 말이죠. 인문학과 심리학을 연구하고 뇌과학을 통해서 지금도 우리는 다양한 측면에서 인간을 알기위해 노력합니다. 그리고 온라인 상에 남겨진 흔적들, 데이터를 통해서 우리는 새로운 관점에서 인간과 이 세상을 이해하는데 도움을 받을 수 있습니다.
이 책의 저자는 데이터 전문가입니다. 구글 트렌드와 구글 애드워즈를 활용해서 구글 데이터 사용에 관한 여러가지 논문도 발표했죠. 디지털화된 데이터는 어떤 강점이 있을까요?
저자가 말하는 빅데이터의 강점은 인간이 타인에게 하지 않을 얘기를 이 거대한 검색엔진에는 한다는 점입니다. 일찍이 프로이트와 같은 심층심리의 대가들이 얘기했듯이 인간은 '페르소나'를 가지고 있습니다. 사회적 관계, 지위와 역할을 고려한 가면을 쓰고 우리는 살아갑니다. 그리고 우리는 진실한 내면을 다 드러내지 않고 숨기거나 어떤 경우는 억압을 통해서 무의식 속으로 밀어넣죠.
그런데 우리가 가진 내밀한 욕망과 충동은 페르소나를 쓰지않아도 되는 곳에서 잘 표출됩니다. 초자아의 견제를 받기에 터놓고 할 수 없는 이야기, 행동, 욕망은 익명성과 개인적인 공간을 보장받는 곳인 온라인 세계에 민낮과 흔적을 남깁니다.
빅데이터를 분석하며 얻을 수 있는 놀라운 결과들이 있습니다. 선거에서 투표율이 실제로는 얼마가 될 것인지, 여론 조사와는 달리 누가 더 선출될 가능성이 높은지를 빅데이터는 알고 있었습니다. 인종 차별, 외모지상주의, 동성애나 성적 판타지에 대한 남녀 간의 관심도 등 기존의 여론조사나 연구로는 다 파악하기 어려운 문제들에도 접근할 수 있습니다. 책에 흥미롭고 다양한 주제들이 담겨 있으니 확인해보시기 바랍니다.
물론 데이터를 활용하는 것은 만능이 아닙니다. 그리고 데이터를 활용해서 인간을 이해하는데 도움받을 수도 있지만, 경계하고 하지말아야할 것들도 있습니다. 하나의 새롭고 강력한 도구가 어떻게 쓰여져야하는지는 고민이 필요합니다.
데이터를 분석하고 예측하여 그려내는 인간과 세상이 궁금하시다면 이 책을 읽어보시기 바랍니다. 빅데이터의 한계를 알고 빅데이터를 유용하게 활용하는 법에 대해 알고 싶은 분도 읽어보시길 바랍니다. 빅데이터의 역할과 빅데이터가 가져오는 흥미로운 변화들에 눈이 뜨이실 겁니다.
-컬처블룸에서 책을 제공받아 작성한 서평입니다-
늘 설문조사에 대한 의구심을 지우기 쉽지 않았습니다. 음모론을 이야기하고자 하는 것이 아닙니다. 물론 설문조사 때 정직하게 답변하는 사람도 많을 것입니다. 하지만 모두가 자기 속마음을 솔직하게 답해줄 것이라고는 좀처럼 생각이 들지 않았습니다. 저자는 이를 가리켜 사람들이 거짓말을 한다고 표현했습니다. 조금 과격하게 들리기도 하지만 틀린 말은 아닙니다.
그런 의미에서 저자의 연구 발상이 대단한 것 같습니다. 저는 앞서 말했듯 그저 설문조사에 대한 의구심을 품는 데 그쳤지만, 저자는 사람들의 진정한 속마음을 알 수 있는 방법을 찾아냈기 때문입니다. 비록 그가 경제학자이자 데이터 분야의 전문가라고 하더라도, 새로 등장한 도구를 활용해 사람들의 생각을 읽어내고자 했고, 실제로 그것을 해낸 것은 정말 굉장한 일이라 생각합니다.
빅데이터 기술의 등장과 발전 끝에 '구글 트렌드'라는 새로운 서비스가 제공되면서 저자의 연구 방법이 가능해졌다고도 볼 수 있을 것입니다. 구글이 세계 최대 검색 엔진이고 그만큼 데이터가 방대한 것은 분명 사실이지만, 여기서는 대량의 데이터만큼이나 검색 엔진이라는 점도 중요합니다. 사람들의 검색 기록은 거짓을 말할 수 없습니다. 자신이 정말 궁금한 것, 알고 싶은 것, 보고 싶은 것을 검색하기 때문입니다. 그렇기에 저자도 '사람들의 생각을 알아보는 데 있어 구글 검색 기록이야말로 그 어떤 데이터 세트보다 중요하다'라고 힘주어 말하는 것이 아닐까요?
투표로 생각해 봐도, 사전조사, 출구조사와 실제 투표 결과가 완전히 일치하지는 않습니다. 앞서 살펴본 것처럼 사람들이, 저자의 표현을 빌자면, 거짓말을 하기 때문이겠죠. 이렇게 설문조사 결과와 실제 벌어진 현상이 다르자, 저자는 검색 기록 분석을 통해 두 결과가 달랐던 이유와 실제 현상의 근거를 찾아낸 것입니다.
그는 한 수학자의 '경제학자의 책을 끝까지 읽는 사람은 아주 극소수'라는, 정확히 그러한 사실을 뒷받침한다고 하기에는 한계가 있지만, 연구결과를 들며 매우 흥미롭게 이 책의 결론을 내립니다.
저자의 말처럼, 시간이 비록 걸릴지라도 언젠가는 반드시 이뤄질, 빅데이터를 통한 사회과학 등 과학의 발전은 어떤 모습일지, 벌써부터 기대됩니다.
※ 출판사로부터 책을 받았으나, 본 서평은 오로지 제 주관적 견해로 작성하였습니다.