怎樣的數據具備說服力?揭開改變醫療、科學與決策的統計思維轉折點

歷史上稱呼為「幾乎獨自建立現代統計科學的天才」──羅納德·費雪(Sir Ronald Aylmer Fisher,1890—1962),英國統計學家、演化生物學家與遺傳學家,是現代統計學與現代演化論的奠基者之一。他如何追求嚴謹,實踐科學實驗的統計革命?《數據與權力》將帶領讀者理解數據發展的起源,並思考數據在歷史中的地位。
文/克里斯.威金斯、馬修.瓊斯
數據的數學洗禮 - 費雪:尋求真理的測試
1925年,羅納德.費雪毫不留情地譴責當時統計學的實用性:「傳統機械式的統計處理過程,完全不適合實際研究的需求。這不僅像是用一門大炮來射擊麻雀,而且還射不中麻雀!」這門大炮對小樣本數據來說並不適用:「建立在無限大樣本理論上的精細機制,對於簡單的實驗室數據來說並不夠準確。」簡單的實驗室數據需要更新的技術,例如,高斯特的技術。這些技術基於更好的數學和對科學實驗本身更好的理解。「唯有系統地依據小樣本問題本身的特性來處理,似乎才能對實際數據進行準確的測試。」
從費雪發展的假設測試形式中,誕生了無數的「p值」(p values,譯注:亦稱機率值,用來判斷實驗數據與原假設的相符程度,p值越低越具有統計顯著性),這些p值從廿世紀中期至今,主導了大量科學研究。在許多醫療和製藥治療相關的有效性評估中,都是法律規定要求的。費雪為統計學奠定了新的數學基礎,取代了過去對科學組成的理解。
就像高斯特一樣,費雪也是在實際的農業背景中發展他的工具,他的地點是洛桑實驗站Rothamsted Experimental Station,現為英國洛桑研究中心)。1922年時,高斯特曾經在實驗站見過費雪。而且跟高斯特一樣,費雪也為一個舊的實驗計畫帶來了新的數學複雜度。
費雪在洛桑實驗站面對幾代農業實驗累積的數據,並擁有協助指導實驗設計的自由。他的女兒兼傳記作家寫道:「洛桑實驗站的活動、工作人員的興趣和問題、杯盞間的討論等,大幅激發了費雪的創造力和發明力。」因此他在跟應用農業問題相關的新數學方法上,很快就寫出了論文,也立刻成為了首次集中觀察變異「顯著性」問題的論文。這些問題解決起來,往往相當困難。「我們經常假設,」一篇論文開頭寫道,「栽培作物的差異,不僅在適應不同氣候和土壤條件上有所不同,對不同肥料的反應上也有所不同。」基本問題是,如何從「經驗證據」轉向對不同肥料相對價值的更具「結論性證據」。
答案來自統計檢定(statistic testing),也就是高斯特開發的那種檢定方法。費雪利用他的數學技能和在農業實驗站的經驗,將高斯特的方法轉化為對科學實驗本身的新理解。
1925年,費雪將他的方法整合到一本教科書《研究工作者的統計方法》(Statistical Methods for Research Workers)中,他的實驗方法也藉由此書廣為傳播。「實驗室工作者日常接觸到的統計問題,激發了基於這些方法的純數學研究。」該書極具決定性地將舊有的統計學,從關注「總體或平均值」轉向「研究任何變量現象的變異原因,包括從小麥的產量到人的智力等」,一切都需要「檢查和測量呈現出來的變異」。
創建實驗會涉及到假設的提出,並與虛無假設(譯注:前面提過的兩者之間無關聯)進行比較。支持假設的顯著結果,意味著我們相信僅從虛無假設中獲得這些數據的機率非常小,例如,1/20,或5%。雖然費雪否認了任何普遍設定的門檻,但他認為「實驗者通常把5%做為顯著性的標準,亦即他們打算忽略所有未達到此一標準的結果。」
費雪學說嚴謹的設計目的是用來排除那些影響數據判斷的偏見、期望和夢想。如何排除所有可能的干擾因素,不論顯而易見或隱藏的,讓我們能專注於某個潛在原因的調查?
為了避免科學家在選擇比較時,出現潛在的無意間偏倚,以及排除可能干擾調查的無數其他原因,費雪堅持在實驗創建過程中必須「隨機化」。他主張對待測試的事物進行隨機化,以確保「顯著性檢定不會因為未被排除的干擾因素而受到影響。」費雪解釋隨機化「讓實驗者不必焦慮於考量和估計無數可能擾亂數據的原因。」為了避免在實驗後操縱數據的危險,費雪要求在數據收集開始之前,先將資料分析計畫和待測假設鎖定。舉例來說,在進行藥物試驗時,我們必須使用的通常是預先登記某種程序,隨機選擇哪些患者將接受我們正在測試的藥物,哪些患者將接受安慰劑。
儘管費雪的許多要求至今仍被視為良好科學實踐的核心,但他的某些要求仍然引起了爭議。自費雪時代以來,批評者對隨機化表示不滿,認為它最好的情況下是浪費,最糟糕的情況下則是不道德和致命的。就製藥領域而言,隨機對照試驗(randomized controlled trials, RCTs)這一黃金標準,無疑保護了消費者免受負面副作用和無效藥物的影響,但這也導致了藥物批准的緩慢和對治療有效性的認定標準變窄。實驗性治療(experimental treatments)上市的延遲,長期以來被製藥業界所詬病,也成為1980到90年代推動識別和治療HIV感染運動的號召點。然而早在此前,高斯特便曾徒勞地試圖讓費雪承認隨機試驗所導致的低效率。
數據的數學洗禮-自由、優生學與種族的提升
高斯特希望找出更好的流程以測試製作啤酒的原料,而費雪則追求更遠大的目標:透過實驗所獲得的知識來提升人類的自由。他認為:「如果人類智慧只能在規定的教條性資料下推導出結果,無法獲得唯有直接觀察才能給予的未知真理,那麼人類智慧的解放就必然是不完全的。」費雪主張,唯有經驗性的知識才能戰勝教條。這種實驗程序的辯護,長久以來困擾著哲學家:我們如何能從個別經驗推導出普遍性的結論?在法西斯主義橫行歐洲之時,費雪認為人類的自由必須依賴實驗:「實驗設計的技巧和對實驗結果的有效解釋,在技術上得到完善的範圍內,必須成為實現充分智識自由的核心主張。」
作者:克里斯.威金斯、馬修.瓊斯
出版社:臺灣商務印書館
出版時間:2025年6月1日
對於費雪來說,科學不只是提高利潤的機械事業。就他而言,人類進步所涉及的,「不只是生產一個高效的工業機器,或是一種『消極美德』(negative virtues,譯注:例如,謹慎、節制和忍耐這類美德)的典範,而是激發所有特別的人性特質,所有在我們的理解裡,可能有的顯而易見、有的無比微妙等,具有卓越人性的不同特質。」他的觀點更像是強調人類不同種族之間的衝突對比,而非人性的普遍提升。在一篇比較年輕時的作品中,費雪曾經解釋:「未來會廣泛分布、極富成果且成功的種族,屬於當前的主導國家;而國家之所以成為主導國家,主要是因為其組成人民的忠誠、進取心和合作能力。」
費雪看到了國家種族之間的衝突加劇,但他並未以工業發展的角度來描述人類進步。他的優生學觀點是一種複雜的融合體,將達爾文、尼采和聖公會思想,不可思議地混合在一起。儘管種族戰爭正在進行,但他認為這不是一場企業化的種族戰爭。
偉大文明衰退的幽靈,糾纏著費雪的生物學工作。如同其他優生學家一樣,他也感受到人類在生育力方面的顯著倒置。因為在經濟發達、市場驅動的文明中,最成功的人在生育上卻是最不成功的。因此他認為,社會中的菁英無法充分生育,最終將被較低劣的人所淹沒。文明社會的經濟關係,從羅馬到當代英國,都是退化性的。最優秀的人群逐漸被淘汰,最終導致文明及其創造者的衰退。換句話說,讓經濟邏輯位居主導的觀點,就是人類中最優秀部分的消逝,其中包括科學在內的最高文化形式,以及最具遺傳優勢的人。從他的優生學框架來看,費雪對於那些「以經濟效率為基礎,設計了假設檢定」的統計學競爭者們感到憤怒,這種反應毫不奇怪,因為他們把抵制教條主義的堡壘,變成了更低的文化形式。
●本文摘自臺灣商務印書館出版之《數據與權力:控制世界的數據科學、資料分析與AI演算法,如何影響我們下決定》。
加入 琅琅悅讀 Google News 按下追蹤,精選好文不漏接!
📰 想減重提升代謝,與其每天走一萬步,不如思考如何動更多!
📰 「空氣跳繩」減重又健身!沒有繩子照樣跳,宅在家好好運動
📰 中年發福別怪代謝差!名醫教你如何平小腹,遠離慢性病
📰 如何單靠「吃」誕生美肌、成功減重?三餐攝取醣、細細咀嚼
📰 「減重60kg」網紅歐娜:餓的時候告訴自己「都是以前太飽換來的」
📰 飲食習慣改變就能迎戰內臟脂肪 減重須根據不同目標逐步限醣
逛書店
延伸閱讀
猜你喜歡
贊助廣告
商品推薦
udn討論區
- 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
- 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
- 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
- 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
FB留言