loading
cover

因果革命:人工智慧的大未來

點閱數

作者
朱迪亞・珀爾, 達納・麥肯錫

出版社
讀書共和國/行路

格式
EPUB

大數據為什麼不夠聰明?
比機率更強大的思考工具又是什麼?

  電腦科學界諾貝爾獎「圖靈獎」得主暨貝氏網路研發先驅Judea Pearl總結畢生研究成果,聯手獲獎的統計學家Dana Mackenzie,提出改變人工智慧及科學界的重要工具!《快思慢想》作者暨諾貝爾獎得主康納曼、《大演算》作者多明哥斯、谷歌網路推廣長文特‧瑟夫、微軟研究實驗室主任艾瑞克‧霍爾維茲等人重磅推薦!

  ▎大數據看似厲害,其實有很大的侷限
  近幾年大數據當紅,加上它在許多領域的成功運用,其地位與能力備受追捧。與大數據密切相關的統計學,是法蘭西斯・高爾頓與卡爾・皮爾森解答對於遺傳的疑問未果,而開發出來的學科,這門學科創立後興盛數十載,其名言「相關不是因果」影響科學界經常止步於探究「關聯」而非「因果」,並且長期受資料本位的歷史所影響,認為資料無所不能,但是朱迪亞・珀爾希望藉此書告訴讀者,資料本身一點也不智慧。

  ▎要發展出「強AI」,機率思考仍遠遠不夠
  一九八○年代初,朱迪亞・珀爾認為不確定性是AI所欠缺的最重要的能力,於是運用機率開發出強大的推理工具——貝氏網路,因而獲得有電腦科學界諾貝爾獎之稱的「圖靈獎」。貝氏網路是首先讓電腦以灰階方式思考的工具,至今仍極受人工智慧界倚重,然而到了一九八○年代末,珀爾認為貝氏網路仍沒有填補人工智慧和人類智慧的差距,於是他轉而研究如何教AI學會「因果推論」,本書便是整理了歷代科學家推展因果革命的努力與成果。

  ▎從「求得相關性」的舊階段,邁入「釐清因果關係」的新時代
  本書最初幾章是有趣的科學史,探討科學家追求因果解釋的過程如何受挫,以致發展出統計學,並讓統計學方法長期引領學界研究。接著書中有大約一半篇幅,作者以實例示範因果語言(圖示模型)如何解決傳統統計學認為無解的難題,逐一揭示「因果階梯」三大分層的能力(越高的層級,認知挑戰越高,越難理出因果關係),並讓讀者了解因果革命路上諸人的努力與進展,以及這些進展的重要性。本書末尾回頭說明因果革命相對於人工智慧各重要發展面向(比如大數據、深度學習、資料探勘、機器學習等),有何勝出之處、能對它們起什麼正面影響,以及最重要的——「因果革命」將會如何改變人工智慧。

  ▎「因果革命」不只影響人工智慧,還影響各研究領域
  現今機器學習運作時仰賴的是「相關性」,而不是「因果」,如果能成功將因果思考導入電腦,將使電腦變成真正的科學家,使它們成為我們的得力伙伴,提供我們更合理的洞見。由於因果思考可以呈現罪責,電腦能因而具備道德感——「具備道德感的強AI」是因果革命在人工智慧領域的終極追求,作者形容這「是人工智慧給人類的第一個、也是最好的禮物」。
  因果性研究還釐清了我們多年來對許多知識本質的不解,改變我們對於眾多問題的認識,這些問題牽涉的層面無所不包,舉凡涉及解讀資料以及根據解釋而採取的作法(像是致病因素、醫療資源分配、公共政策擬定等),都能受益。集結眾多領域學人之力才有如今成果的因果革命,亦將回頭影響整個科學界,珀爾形容它「將使科學的體質更加健全,是人工智慧給人類的第二個禮物」。在美國,因果科學已經開始被大學列入課程……

  ▎我們強烈建議這些人士閱讀這本書:
  (1)資料科學家與大數據研究者,以及對大數據深感興趣的人
  (2)統計學家、數學家,電腦科學相關從業人員與學習者
  (3)對經濟趨勢與科研發展有興趣的一般大眾
  (4)希望培養科學素養,了解最新科學方法的學子

  ▎各章內容簡介請參閱〈目錄〉的引文。

各界盛讚

  ◎谷歌網路推廣長文特‧瑟夫:
  珀爾近三十年來的學術成就,為人工智慧發展提供堅實的理論基礎……同時把「思考機器」提升到另一個境界。

  ◎《大演算》作者佩德羅‧多明哥斯:
  因果如果不是相關,那又是什麼?拜朱迪亞‧珀爾的劃時代研究之賜,現在我們已能精確回答這個問題。想理解世界如何運行,這本引人入勝且讀來愉快的書是理想的起點。

  ◎微軟研究實驗室科技研究員及主任艾瑞克‧霍爾維茲:
  朱迪亞‧珀爾是人工智慧領域、甚至整個電腦科學界革命的核心人物。

  ◎諾貝爾經濟學獎得主及《快思慢想》作者丹尼爾‧康納曼 :
  各位是否曾疑惑「相關」和「因果」究竟是什麼關係?這本精彩著作深入淺出地說明了答案。

  ◎《紐約時報》喬納山‧尼伊:解說十分詳盡……本書不僅詳盡介紹概念的發展史,也提供概念工具,讓讀者理解大數據的優勢與不足之處。

  ◎《自然》雜誌:「相關不是因果」這句科學俗語已在社會上造成影響……朱迪亞‧珀爾提出嶄新的數學解決方案……現在已在生物、醫學、社會科學和人工智慧領域開花結果。

  ◎《猶太日報》:深入淺出……珀爾是有遠見的因果革命領袖,這本書則是他最大的成就。

讀者好評

  ◎對電腦科學、統計學或人工智慧當今發展有興趣的人都應該讀讀。這本書如同康納曼的《快思慢想》,是作者畢生科學研究的總結,不僅對同領域科學家而言價值非凡,也是全人類的瑰寶。(讀者阿蘭‧約瑟夫‧坎恩)

  ◎朱迪亞‧珀爾的貝氏網路和因果圖以十分優雅的方式結合統計學、流行病學、決策和電腦科學等領域。他的研究成果賦予並擴大了大數據的潛力。這本書是市面上第一本為一般大眾介紹這主題的書籍,其影響將無以估計。(讀者湯瑪斯 J. 阿拉岡,流行病學家)

  ◎知名商學研究所都應該用這本書當成教材。我送了一本給我念大學時的院長。為了現在和未來的學生著想,我希望它能成為一門課。(讀者喬治‧莫札奇斯)
朱迪亞・珀爾Judea Pearl

  因為研發貝氏網路,而獲得有「電腦科學界諾貝爾獎」之稱的圖靈獎,著有三本極具影響力的科普書籍。珀爾是美國國家科學院院士,也是首先進入IEEE智慧系統名人堂的十名科學家之一,獲得的獎項與榮譽博士學位多不勝數,包括盧梅哈特獎(認知科學學會)、富蘭克林獎章(富蘭克林研究所)以及拉克托斯獎(倫敦經濟學院)。他目前擔任加州大學洛杉磯分校電腦科學教授,同時是丹尼爾‧珀爾基金會創辦人及執行長,目前住在洛杉磯。

達納‧麥肯錫Dana Mackenzie

  數學博士,現為科普作家,經常為《科學》、《新科學家》、《科學美國人》、《史密森尼》、《鸚鵡螺》和《發現》等雜誌撰稿。他寫的書《大碰撞:月球是怎麼形成的?》(The Big Splat, or How Our Moon Came to Be)曾經獲選為Audible.com網站2010年最佳有聲書。麥肯錫曾獲2012年傳播獎(美國數學聯合政策委員會)與2015年查文尼特數學解說獎(美國數學學會),他現在住在加州聖克魯茲。

譯者簡介

甘錫安

  學業結束後由科學界踏入「譯界」,現為專職譯者。曾擔任Discovery頻道與資訊雜誌編譯,現仍定期為《科學人》及《BBC知識》等雜誌翻譯。書籍譯作包括《決斷的演算:預測、分析與好決策的11堂邏輯課》、《勝算:賭的科學與決策智慧》、《愛因斯坦1905》、《氣候創造歷史》、《現代主義烹調》等。目前住在有山有海有美食的台灣頭基隆,熱愛吸收各類知識,正努力朝「全方位譯人」的目標邁進。
▎自序
這本書的目標有三個:一是以非數學語言讓讀者理解因果革命的詳細內涵,以及它將如何影響我們的生活和未來。二是為讀者介紹科學家遭遇及挑戰關鍵因果問題時,英勇解決的歷程。最後,則是把因果革命帶回人工智慧的最初本源,介紹如何讓機器人學習以我們的母語(即因果語言)溝通。

▎前言:思想勝過資料
法蘭西斯・高爾頓與卡爾・皮爾森運用跨世代資料解答他們對於遺傳的疑問,可惜沒有成功,於是他們開發出「統計」這門爾後興盛數十載的學科。從事研究的人都聽過「相關不是因果」這句統計學名言,該觀念影響學界長期探究「關聯」而不問「因果」。在資料本位的歷史影響下,今日我們甚至認為大數據可解答所有問題,但是朱迪亞・珀爾希望藉此書告訴讀者,資料本身一點也不智慧。1980年代末,研究人工智慧的珀爾發現,「機器無法理解因果關係」可能是它們無法具備人類智慧的關鍵原因,於是他轉而投身因果科學陣營,多年後他藉由這本書,總結了各路科學家推動因果革命的成果。

▎第一章 因果階梯
因果的三個層級/迷你圖靈測驗/機率與因果
珀爾研究機器學習時了解到,因果學習者至少必須掌握三個層級的認知能力,分別是:(一)觀看與觀察,以探知環境中的規律;(二)實行,亦即預測刻意改變環境的效果,並選擇適當改變以獲得想要的結果;以及(三)想像——因果階梯的三個層級「觀察」、「介入」和「反事實」便是由此而來,數學能證明這三個層級有根本上的不同,每個層級都具備前一層級缺少的能力。本章將介紹以因果圖進行推理的基礎概念、主要的建模工具,讓讀者慢慢見識因果推論模型詮釋資料、解答疑問的強大能力。

▎第二章 從海盜到天竺鼠:因果推論的創生
法蘭西斯‧高爾頓捨「因果」而擁抱「相關」/卡爾‧皮爾森把「因果」掃出統計學/萊特、天竺鼠和路徑圖/E PUR SI MUOVE(但地球依然在轉動)/貝氏連結將主觀機率帶進統計學界
十九世紀末,法蘭西斯・高爾頓想將《物種原始》的理論架構數學化,他花了八年嘗試解答族群遺傳特質維持恆定的原因,但是始終無解,最後放棄研究,轉而注意統計「相關」。高爾頓的門徒卡爾・皮爾森後來提出「相關係數」,直到現在,所有統計學家想知道資料組中兩個變項的關聯程度時,總是最先計算這個數字。第二章講述統計學如何忽視因果性,並且對各種資料導向的科學造成深遠影響。此外還將介紹對本書而言十分重要的遺傳學家西瓦爾‧萊特的故事;萊特於1920年代首先繪製因果圖,多年來一直是少數認真看待因果性的科學家。

▎第三章從證據到原因:當貝斯遇見福爾摩斯
電腦偵探波拿巴(Bonaparte)/貝斯牧師與逆機率問題/從貝氏法則到貝氏網路/貝氏網路:原因透露了哪些關於資料的線索?/我的行李在哪裡?從亞琛到尚吉巴島/真實世界中的貝氏網路/從貝氏網路到因果圖
1980年代初,珀爾認為不確定性是AI所欠缺的最重要的能力,於是運用機率,開發出處理不確定性推理的強大工具——貝氏網路,這是首先讓電腦以「灰階」方式思考的工具,至今仍被視為人工智慧頂尖典範。然而到了1980年代末,珀爾開始覺得自己錯了,他認為貝氏網路仍沒有填補人工智慧和人類智慧的差距。在這一章,他談了自己從貝氏網路忠實信徒變節,轉入因果性陣營的心路歷程。儘管如此,貝氏網路依然是今日人工智慧界極為倚重的工具,而且具備因果圖的許多數學基礎,因此這章以因果性簡略介紹貝氏法則和貝氏推理方法,並為讀者舉出幾個在實際生活中運用貝氏網路的範例。

▎第四章 干擾與去干擾:或說剷除潛在變項
干擾導致強烈恐懼/大自然的巧妙質問:隨機對照試驗為何有效用?/干擾的新典範/do運算子和後門準則
隨機對照試驗(RCT)是統計學對因果推論的重大貢獻,它的主要目標,是把要探討的變項與可能影響它們的其他變項分開。如何去除這些潛在變項造成的失真或「干擾」,是已經存在一世紀的難題,但科學家直到最近才體認到,解決這問題需要的不是統計學方法,而是因果方法。這章要從因果圖的觀點說明,RCT為何能協助估計兩變項之間的因果效應,而且不受干擾偏差影響,從中我們會了解RCT其實源自更基本的原理,其他方法未必都要奉它為圭臬。這一章還將說明因果圖如何讓我們把焦點從「干擾因子」轉移到「去干擾因子」,並且帶領讀者以出奇簡單的方式解決一般干擾問題。

▎第五章 煙霧瀰漫的爭議:除去迷霧
菸草:人為流行病/衛生總署委員會和希爾準則/吸菸對新生兒的影響/激烈爭議:科學與文化
十八世紀詹姆斯.林德發現柑橘類水果能預防壞血病,十九世紀約翰.史諾發現遭排泄物汙染的水會導致霍亂,這些偵察工作很幸運的一點是:原因與結果之間是一對一關係。二十世紀時「吸菸是否會致癌」爭議挑戰了單一因果關係概念,而且由於無法隨機指定某些人冒著健康風險吸菸數十年以進行對照,統計學家不只對答案難有共識,連如何理解問題都有不同看法。後來美國衛生總署委員會採用一連串非正式指導方針「希爾準則」,終於得出「吸菸會導致癌症」這結論,但這花了近十五年時間。這爭議讓許多人看清因果性的重要——如果科學家有適合的語言或方法來解答因果問題,得出結論將不再曠日廢時。

▎第六章破解悖論!
令人費解的蒙提霍爾問題/更多衝突偏差:柏克森悖論/辛普森悖論/以圖畫說明辛普森悖論
這章要讓讀者輕鬆一點,做一些有趣的動腦遊戲,談談蒙提霍爾悖論、辛普森悖論與柏克森悖論等知名的古典矛盾問題。其實這些悖論問題有嚴肅的一面——它們幾乎都與因果直覺抵觸,因此能讓我們深入分析這類直覺。悖論和視錯覺一樣,能夠揭露大腦的運作方式、大腦愛走的捷徑,以及大腦覺得矛盾的事物。因果悖論凸顯出與機率和統計邏輯衝突的直覺式因果推理型態,看看統計學家對它們有多麼頭痛,就能知道不用因果性眼鏡看世界往往容易出現誤判。這些問題提醒著科學家,人類直覺是以因果為基礎,而不是統計和邏輯。一起來看看這些經典悖論問題的新解吧!

▎第七章 超越調整:征服介入山
最簡單的路線:後門調整公式/前門準則/Do計算法——精神高於物質/科學的織錦,或是do管弦樂團的隱形樂手/史諾博士的詭異案例/好膽固醇和壞膽固醇
第七章到第九章將帶領讀者一步步登上因果階梯。本章要登上階梯的第二層——介入層,其重點是預測以往未曾嘗試的行動和策略可能產生什麼效果。除了說明可產出「是或否」答案的因果推論發動機的內在結構,還要教讀者尋找因果圖中的特定型態,像是後門調整、前門調整及工具變項等,它們在因果推論中扮演極吃重的角色。作者將示範這些工具如何解答以往困住科學家的難題,例如以「前門準則」釐清因果圖尚未誕生時的「吸菸致癌爭議」,用約翰.史諾的霍亂成因調查示範因果圖如何讓工具變項發揮作用。作者也將介紹他的學生在因果革命中扮演的角色。

▎第八章 反事實:發掘可能成真的世界
從修昔底德和亞伯拉罕,到休謨和路易斯/潛在結果、結構方程式,以及反事實的演算法化/了解自己的假設是好習慣/反事實與定律/必要原因、充分原因和氣候變遷/反事實的世界
人類是在五、六百萬年間由猿猴類演化而來,但在近五萬年間發生了一些獨特狀況,從此能更快速地改變自身能力與環境,例如發明許多神奇物品。為什麼?人類突然獲得其他動物沒有的什麼運算能力?對此有許多人提出理論,但其中只有一種與因果關係有關——歷史學家哈拉瑞在《人類大歷史》中推測,人類祖先能設想「不存在的事物」(反事實),讓人得以溝通得更順暢,是其中最重要的關鍵。本章要帶各位登上因果階梯的頂層,探討反事實,照例會有許多因果圖示範釐清常見爭議的實情(例如學經歷對薪水的影響,以及量化氣候變遷的效果等),體會將「反事實」納入因果查詢時,解答事情的面向如何更加豐富多變。

▎第九章 中介:找尋機制
壞血病:錯誤的中介變項/自然與養育:芭芭拉‧布克斯的悲劇人生/尋找語言(柏克萊錄取率悖論)/黛西、小貓和間接效應/線性理想世界裡的中介/接納「應該會」/中介案例分析——吸菸基因:中介和交互作用;止血帶:隱形的謬誤
「反事實」目前在科學界中最風行的應用是中介分析,中介(或中介變項)是把處理效應傳遞給結果的變項,中介分析的目的是釐清直接效應和間接效應。這類問題不僅在科學上相當重要,也有實際的影響,書中舉了駭人的一例:詹姆斯.林德船長的壞血病研究是史上極早的對照實驗,其結果在1747年發表。但一個世紀之後,英國遠征隊開始探察極地時,這種完全可以預防的疾病出乎意料地捲土重來,原因就在於當時尚未發現真正的中介變項(維生素C),使得「柑橘類水果可預防壞血病」這理論被棄之如敝屣。本章介紹科學家如何找出表達「中介」的方法,以補傳統統計學的不足,另外也有數例中介案例分析。

▎第十章 大數據、人工智慧與大問題
因果模型與大數據/強AI和自由意志
怎樣打造智慧與人類相當且能分辨善惡的機器?——珀爾相信,因果推理是讓機器能以人類語言與我們溝通,談論政治、實驗、解釋、理論、遺憾、責任、自由意志與義務等話題,乃至自己做出道德決策的關鍵,因此發展因果語言與工具之重要性不可言喻。在研發過程中他廣泛接觸各領域人士,一起點燃因果革命的火花,火花從一個學科擴散到另一學科,催生了新典範,他認為這個轉變將使科學的體質更加健全,這是「人工智慧給人類的第二個禮物」。而因果革命在AI界的終極產物——具道德感的強AI,不只會成為我們的好伙伴,還能成為我們師法的對象,教導我們更明晰、因果上更合理的正義感,這則是人工智慧給人類的第一個、也是最好的禮物。

▎致謝

其他人也在看