728x90

모두 거짓말을 한다 - 구글 트렌트로 밝혀낸 충격적인 인간의 욕망
세스 스티븐스 다비도위츠 (지은이)
이영래 (옮긴이)더퀘스트2018-06-17
원제 : Everybody Lies (2017년)

https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=147998227

목차는 이러합니다.

서론: 빅데이터 혁명의 개요

1부 빅데이터와 스몰데이터
1. 직감은 불완전하다

2부 빅데이터의 힘
2. 프로이트가 옳았을까?
3. 데이터를 보는 새로운 눈
신체 데이터
단어 데이터
사진 데이터
4. 디지털 자백약
섹스에 관한 진실
증오와 편견에 관한 진실
인터넷에 관한 진실
아동학대와 낙태에 관한 진실
페이스북 친구에 관한 진실
고객에 관한 진실
진실을 어떻게 다뤄야 할 것인가?
5. 클로즈업
우리 지역, 시, 마을에서는 정말로 어떤 일이 벌어지고 있나?
우리는 시간을 어떻게 보내는가
도플갱어 찾기
데이터에는 이야기가 있다
6. 온 세상이 실험실
A/B 테스트의 기초
잔인하지만 큰 깨달음을 주는 자연 실험

3부 빅데이터: 취급 주의
7. 빅데이터로도 할 수 없는 일
차원의 저주
측정 가능한 것에 대한 지나친 집중
8. 빅데이터로 하지 말아야 할 것
권력화된 기업에서 생기는 위험
권한을 부여받은 정부에서 비롯하는 위험

결론: 얼마나 많은 사람이 책을 끝까지 읽을까?
====
트위터에서 추천받고 읽었습니다. 소셜 미디어와 구글링, 빅데이터라면 매우 좋아하는 주제라서요. 마침 근처 도서관에 대여 가능한 게 있길래 빌렸는데 이런 책은 역시 대여가 제맛인 것 같습니다. 요즘 진득하게 완독하는 게 점점 힘들어지는데, 2주일 기한을 두고 연체에 쫄려가면서 읽는 게 제맛...(네 그리고 역시나 사흘 연체 ㅋㅋㅋ)

책은 저자의 아마도 영원한 평생 울궈먹을 사골, 미국의...아니 전 세계에 충격과 공포의 깽판을 선사했던 트럼프 대통령 당선부터 시작합니다. 아니, 정확하게 말하면 오바마 당선부터겠네요. 오바마 당선때부터 그에 대해 긍정적인 검색어 뿐 아니라 '깜둥이 대통령' 등 인종주의 반감은 점점 커져가고 있었습니다. 그리고 트럼프 선거 캠페인 내내 '도널드 트럼프'는 우세였으며, '깜둥이'등 인종차별적 단어 검색이 두드러지는 주에서는 검색 우위가 훨씬 높았어요. 그리고 그들은 여론조사와는 달리 조용히 트럼프를 대통령으로 만들었습니다 ㅋㅋㅋ

저자인 세스 다비도위츠(...이름도 그렇고 외모도 그렇고 모든 것이 똑똑한 유대인 너드 스테레오 타입입니다;ㅁ;)는 하버드 경제학과 대학원생일 때부터 트럼프 대통령 구글링 논문을 가지고 전 세계적 주목을 받았습니다. 그리고 이걸 특유의 관종적 기질로 마케팅하여 구글에서 수년간 여러 사회 문제에 대한 빅데이터 분석 프로젝트를 진행하였고, 지금도 뉴욕 타임즈에서 관련 칼럼을 연재하면서 저작 활동을 진행하고 있습니다.

http://sethsd.com/

저자 양반 홈페이지. 리서치/데이터 섹션에 들어가면 지금까지 진행했던 프로젝트 다수와 방법론, 데이터에 대해 공개하고 있습니다.

저자 양반은 본질적으로 관종적이고 입을 잘 터는 성격인 듯 합니다. 일단 빅데이터에 대해 사람들의 진입 장벽을 줄이기 위해, 빅데이터가 자기 할머니가 밥상머리에서 '세스는 이러이러한 성격이니까 저러저러한 여자가 잘 어울려...'하고 직관하는 것과 비슷하다고 합니다.(아니 글치만 책 중간중간에 자기의 망한 연애 에피소드를 털어놓는 걸 볼 때마다 저러저러한 여자는 뭔 죄길래...하는 생각이 들던데요 할머님;) 하지만 직관은 여러가지 한계가 있습니다. 첫번째로, 직관은 자기 주변의 경험에 지나친 가중치를 둘 수 있습니다. 또한 직관은 극적인 경험을 과장하거나 왜곡할 수 있어요. 그래서 직관으로는 한계가 있는 분석에 대해 데이터 과학은 끊임없이 수정하고 방법론을 제공합니다.

빅데이터는 이전의 소규모 여론조사와 같은 전통적인 데이터 과학과 다른 점이 많습니다. 우선, 구글 검색어나 소셜 미디어 트렌딩과 같은 전혀 새로운 유형의 데이터를 분석할 수 있게 됐습니다. 그리고 익명성을 보장한 인터넷 공간에서는 검색으로 어디가선 말 못하는 솔직한 데이터를 자발적으로 제공해 주죠. 여기 저자의 심플한 도식에 따르면 이렇습니다

디지털 진실: 검색/조회수/클릭수/결제
디지털 거짓: 소셜미디어 포스팅/소셜미디어 '좋아요'/데이트 프로필

소셜미디어 포스팅이 왜 '거짓'일수 있냐고 하면...사람들은 남이 굳이 안 그래도 된다고 해도 '내가 되어야 할 것 같은 내 자아'로 보이고 싶어하기 때문이죠. 저자의 예 중에서 아주 심플하면서도 직관적이었던 게, 예전에 넷플릭스에선 '나중에 볼 목록'에 저장한 걸(2차 세계대전 다큐멘터리나 뭐;;) 위주로 알고리즘을 짜서 추천해줬을 때보다, 실제로 본 거 위주(제가 최근에 본 투핫이라거나 뭐;;;)로 추천을 해 줄 때 뷰 수가 폭발적으로 증가했다고 합니다.

그리고 빅데이터는 데이터가 많기 때문에 아주 작은 집단, 예를 들어서 한 카운티의 소수 인종 학력의 유의미한 정보까지 존재해서 이를 클로즈업해서 볼 수 있습니다. 그리고 마지막으로 가장 강력한 것은 상관관계 뿐 아니라 인과관계까지 분석하고, 이를 실험으로 행할 수 있습니다. 여기서부터 저자가 엄청나게 흥분하는 게 보이는데 ㅋㅋㅋ 어쩔 수 없는 경제학 빌런이더라구요. 학계에서는 무작위 대조실험이라고 하고 보통 A/B테스트라고 하는 거 있잖습니까. 실험군에는 어떤 변수를 주고, 대조군에는 아무것도 하지 않고 둘의 차이를 분석하는 거 말이죠. 구글이나 페이스북에서는 거의 0에 가까운 비용을 들여가면서 할 수 있습니다. 단지 코드만 추가하면 접속자들이 실험군/대조군이 되어 어떤 화면이 클릭률이 높은지 알아서 데이터를 제공해 주니까요. 이미 오바마 선거 캠페인부터 선거 기부금 사이트 첫화면이 이를 엄청나게 실험한 끝에 기부율을 60%나 끌어올렸다고 합니다. 여기서 전 쫌 불쾌해진 게 있잖아요...어떤 기사 헤드라인이 클릭률이 더 높은지에 대해서도 이 테스트는 끊임없이 돌아갑니다. 제가 보고 있는 "XX녀, 이것먹고 10억 벌어? 충격!!!'이런 게 결국...에휴.

아, 쫌 흥미로웠던 건 다른 실험 중에서 '회귀 불연속 설계(regression discontinuity design)이라는 건데, 아슬아슬한 차이로 어떤 변수를 겪은 그룹과 겪지 못한 그룹이 결과적으로 어떤 차이가 오는가 하는 겁니다. 여기에선 미국 최고 공립고로 꼽히는 스타이버선트(저는 우리 팀 로빈스 할배;가 다닌 곳이라 알고 있었습니다;ㅁ;)에 커트라인에 걸려서 떨어진 사람들과 아슬아슬하게 붙은 사람들의 인생 궤적에 대해서 비교해 봅니다(그 사람들이 겪었던 상실감이나 성취감과 상관없이, 연봉이나 커리어가 유의할 만한 차이는 없었습니다;ㅁ;) 이런 거 재미있어 하다니...수치스럽다;;;

물론 빅데이터는 좋은 점만 있는 것은 아닙니다. 사생활 침해나 차원의 저주라고 하는 복잡성 등등 여러 문제가 있지요. 하지만 데이터 과학자 답게 저자 양반은 여전히 빅데이터의 유용성을 설파합니다. 불안하고 당혹스러운 행동을 하는 게 자신뿐만 아니라는 것을 알고 위안과 대안을 구할 수 있고, 소수자 등 어려움에 처한 사람들을 민감하게 알아챌 수 있으며, 가장 중요한 효용으로 혐오와 분열 등 점점 심해지는 세계 문제에 대해서 상관관계와 인과 관계를 실험하면서 점점 해답으로 이끌어 갈 수 있다는 겁니다. 저자는 오바마 대통령이 이슬람에 대해서 포용과 사랑을 호소했을 때(아 이 양반 뜬구름 잡기는 1인자야 아주...)는 이슬람 혐오적인 검색어가 급증했는데, 이슬람 계통의 운동 선수에 대해 언급했을 때는 혐오가 줄어들고 긍정적인 게 올라갔다고 합니다. 그들이 다르지 않다는 것, 호기심과 동질감으로 이끄는 방법으로 가야 한다는 거죠.

끝까지 재밌게 읽긴 했습니다. 다만 궁금했던 건 이 책의 구성이 상당히 난삽한 편인데(사실 일본-한국 책이 지나치게 잘 정리되고, 영미 계열의 교양서들이 이 얘기 했다 지 자랑했다 널뛰는 구석이 있긴 합니다) 이게 마지막 장의 '이 책을 끝까지 읽을 사람이 얼마나 될까?'와 어느 정도 관련이 있을까 하는 겁니다. 저자는 먹물 답게; '대체로 이런 책들은 50페이지 앞에서 요점만 읽고 만다고 한다 이거 얼마나 읽을까? ㅋㅋㅋ 나 이거 되게 열심히 썼는데 아니 근데 모두다 거짓말을 하잖아 그니까 내가 하는 말도 거짓말이야 여러분 어느 게 사실이게요? ㅋㅋㅋ 나 술 마시러 간다 안녕' 이러고 마무리를 합니다. 설마 끝까지 읽게 하려고 요점들을 여기저기 흩뿌려놓은 건가...

재밌는데 재수없네요 ㅎ

덧. 이 책은 처음부터 끝까지 흥미롭고 자극적인 인간의 욕망 사례들이 많습니다만, 저자는 재수없지만 그의 권리는 소중하니까 따로 적지 않겠습니다. 그러나 하나만 말하자면...

남자들은 '자기 자신한테 구강성교하는 법'을 많이 검색한다고 합니다. 얼마나 많이 검색하는지 '파트너에게 오르가즘 느끼게 하는 법'만큼 많이 검색한다네요.

요가를 하세요...

+ Recent posts