數據、謊言與真相:Google資料分析師用大數據揭露人們的真面目
出版資訊
簡介
人們謊報在回家途中喝了多少酒,
謊稱自己多常上健身房和新鞋子買多少錢,
就連沒看過的書也說自己有看過。
沒生病卻打電話請病假,說再聯絡卻不再聯絡。
人們說事情跟你無關,但其實就跟你有關。
明明不愛你,卻騙你說愛你。
心情不好時卻說自己很開心,
明明喜歡男人,卻說自己喜歡女人。
人們對朋友說謊、對老闆說謊、對子女說謊、對父母說謊、
對醫生說謊、對老公說謊、對老婆說謊,也對自己說謊。
作者證明大數據提供一種前所未有的方式,
讓我們窺探人們的內心世界,
因為人們透過鍵盤才會在無意中私密地坦承千奇百怪的事情。
歐巴馬當選表示美國的種族歧視緩解了?錯!
黑人球員進入職業運動殿堂是貧困孩子奮發向上的勵志故事?大部分不是!
挑選賽馬最重要的參考依據是血統?不!
父母對待兒子和女兒的態度不一樣嗎?不一樣!
佛洛伊德說夢境中的事物都有性意涵,這是對的嗎?很可能不對!
回答問卷、民意調查、接受採訪、臉書貼文
──我們都有可能說謊;
但是你的搜尋行為可不會說謊!
大數據,呈現我們每個人、每秒鐘無意識的反射!
無論是嚴肅或日常的議題,如今我們已有途徑能解答不久之前因種種原因(例如缺乏數據,或單純不敢提問)還未能解答的問題。
四年前,作者還是哈佛經濟系博士班學生,正努力找尋論文題目。有天早上,他發現 Google 基本上已為所有研究者備好所需的資料,也就是說,Google 是全球人類興趣資料庫的集中地,這些資料簡直就是任何對人類行為感興趣的人夢寐以求的:從我們每個人每天的網路搜尋中找到行為模式。然而,這些資料早已存在好些時日,卻從未有任何報章雜誌對其有過深刻的報導與研究。
作者深入研究 Google、推特(Twitter)、臉書(Facebook)、警察局紀錄、電影票收據、維基百科、色情網站、棒球球員個人成績表,和你想像不到的數位與傳統資料來源之後,發現這些資料來源有個共通的特點:他們提供的是大數據,亦即我們每個人每秒鐘無意識的反射,而非根據民意調查而來的一小部分民眾的意見樣本。
網路上的新數據,也就是數十億人在 Google、社群媒體、約會網站,甚至色情網站留下的數位足跡,最後會揭穿事實真相。這些不僅是新類型的數據,更有些是「誠實」的數據,在匿名機制下,彷彿四下無人時,人們才會吐露自己最真實的想法,以及真正想問的尷尬問題。這類數據就像數位版的「誠實豆沙包」,讓人們表達出自己的無性婚姻、個人精神健康問題、不安全感、受虐,以及對黑人或穆斯林的憎惡。透過分析這座數字金礦,我們現在可以了解人們真正在想什麼,真正想要什麼,以及真正做了什麼。
作者在本書中展示,要從數據中獲得寶貴資訊,最關鍵的一點是:你必須問對問題。而大數據有四大關鍵力量可以協助:
⒈大數據能讓你將數據切割分解,讓你見微知著及獲得具體的見解。
⒉新的資料來源通常包括新類型的變數,比現存變數更能幫助我們了解複雜關係,並充分利用。
⒊新的數位資訊能提供我們生活的真實樣貌,而非我們希望自己呈現給外人的形象。
⒋大數據易於與實驗結合,使我們能測試因果關係,而非僅是相關性。
進入網路新時代的這幾十年以來,我們在健康、道德、勞動市場、商業、恐怖主義、性別,以及種族等議題上有長足的認識。我們的數位足跡已把整個世界變成一個實驗室,本書將呈現出這場數位革命如何為我們每個人打開找尋隱藏真理的大門,一窺人們的內心世界,提出大數據時代真正的洞見。
本書以極具啟發性的觀點解讀大數據,並以各式各樣有趣的案例忠實呈現網路世界與當代社會的現況,讓我們得以重新認識自己與這個世界。
作者簡介
賽斯‧史蒂芬斯—大衛德維茲Seth Stephens-Davidowitz
《紐約時報》撰稿人暨華頓商學院客座講師,曾為Google數據科學家。史丹佛大學哲學系畢,哈佛大學優等生榮譽學會(Phi Beta Kappa)成員暨經濟學博士,目前定居紐約市。史蒂芬斯—大衛德維茲的研究使用新的大數據來源,揭露人們潛藏的行為和態度,並已刊登在《公共經濟學期刊》(Journal of Public Economics)等聲望卓著的出版物。
譯者簡介
陳琇玲Joyce Chen
美國密蘇里大學工管碩士,曾任大學講師、軟體中文化及影片翻譯譯者、Alcatel Telecom主任稽核師。已出版譯作百餘冊並多次獲得金書獎殊榮,現以翻譯為樂並習畫自娛。重要譯作包括:《搜尋未來》《2017-2019投資大進擊》《物聯網革命》《引爆會員經濟》《精準預測時代》《人工智慧的未來》等。
相關著作:《2017-2019投資大進擊:全球趨勢專家首次揭露一輩子一次的投資良機》《OQ:哈佛商學院最有成效的經營課》《不必多花錢,也有超強競爭力!》《別再拚命討好顧客——專心替顧客省麻煩,回購比例就能輕鬆提高94%!》《川普、清崎點石成金》《用十張地圖看懂全球政經局勢》
目錄
前言 川普勝選讓你跌破眼鏡?那是你沒看懂數據 ——歐巴馬勝選代表種族歧視已經好轉?看看「黑鬼」的搜尋次數好嗎?
第一篇 管他大數據還是小數據
第一章 別讓直覺扯你後腿 ——是什麼造就了NBA球星
第二篇 大數據的驚人力量
第二章 佛洛伊德說的正確嗎? ——拼錯字背後隱藏的慾望
第三章 怎樣的數據算是大數據? ——每個年代都可以算出「平均長相」
第四章 躲在線上的真相 ——你永遠問不出來的同志比例、仇恨言論、性隱私和顧客的腦袋
第五章 我們周遭發生了什麼事? ——逃稅最嚴重的城市
第六章 整個世界,都是我的實驗室 ——怎樣的頭條標題吸引人?
第三篇 小心面對大數據!
第七章 大數據,大垃圾? ——大數據看起來很萬能,但別拿它來算明牌!
第八章 愈多數據,愈多問題? ——我可能因大數據而無法借款?
結論 大數據告訴我,很少人看到最後一頁
謝詞