达莱尔·哈夫:统计数字会撒谎
達萊爾·哈夫的經典著作《統計數字會撒謊》深刻地揭示了統計學在現代社會中被濫用和操縱的現象。書中核心論點在於:統計數字作為一種看似客觀且科學的語言,在傳播事實、提供資訊的同時,也極易被用於誤導、誇大甚至欺騙大眾。這種誤導可能源於無知,但更多時候是出於特定的目的——無論是商業廣告、政治宣傳、新聞報導還是學術發表,利用統計數字創造有利於自身的印象,已成為一種普遍且有效的手段。
譯者在序言中引用的芬蘭生育研究、安然公司的財報操縱、中國的經濟指標比較以及旅遊習慣調查等案例,都旨在強調一個核心觀念:在資訊爆炸的時代,我們必須具備一雙「慧眼」,對接收到的統計資訊進行批判性思考和驗證。這些案例生動地說明,即使數字本身可能是基於某種計算方法的「真實」結果,但透過選擇性的呈現、定義的模糊或比較基準的偷換,其傳達的意義可能與實際情況大相徑庭,甚至完全相反。
本書的核心目的是教會讀者如何辨識這些統計騙術,從而避免被誤導。作者將各種統計操縱技巧一一剖析,彷彿是向讀者傳授「行騙指南」,但其真實意圖是讓「誠實的人」學會自衛。以下是書中揭示的主要統計陷阱及其詳盡解釋:
-
內在有偏的樣本 (Biased Sample):
- 這是最根本的操縱手段之一。一個有偏的樣本無法代表總體,基於這樣的樣本得出的結論自然也就不可靠。
- 解釋: 樣本的偏差可能來自於多種原因。例如,抽樣方法本身存在缺陷,如只調查特定群體(像耶魯畢業生收入只調查能聯繫到且願意回覆的人,忽略了低收入或失聯者;心理醫生只研究自己的病人)。自願參與的調查也容易產生偏差,因為願意回覆的人可能與不願回覆的人在某些特徵上存在根本差異(如雜誌讀者調查中,受訪者可能傾向於報告自己閱讀「高雅」雜誌)。樣本容量過小也是一種缺陷,小樣本受偶然因素影響大,任何微小差異都可能被放大(如聲稱牙膏減少蛀牙比例的廣告,基於極小樣本)。即使是看似合理的抽樣方法,如分層抽樣,也可能因執行過程中的人為因素(如訪員對受訪者的選擇偏好)或對總體分佈資訊的不準確掌握而產生偏差。譯者提及的芬蘭生育研究、美國宗教皈依調查、耶魯校友收入調查、雜誌閱讀量調查、以及民意測驗中的访员影响等,都體現了樣本偏差如何導致誤導性結論。無法確定樣本是否具有代表性,或者樣本的選擇過程不透明,都應引起讀者的警覺。
-
精心挑選的平均數 (The Well-Chosen Average):
- 「平均數」並非單一概念,它可能指均值 (Mean)、中位數 (Median) 或眾數 (Mode)。在資料分佈不對稱(偏態分佈)的情況下,這三種平均數可能相差很大,選擇使用哪一種,會極大地影響人們對數據的印象。
- 解釋: 均值是所有數值加總後除以個數,容易受極端值的影響。中位數是將所有數值排序後位於中間的數值,它不受極端值影響,更能代表「典型」情況。眾數是出現頻率最高的數值。在收入分佈等常見的偏態分佈中,少數高收入者會顯著拉高均值,使得均值遠高於大多數人的收入水平,而中位數或眾數更能反映大多數人的收入狀況。書中以房地產經紀人為了吸引買家而使用高均值收入,卻在呼籲減稅時使用低中位數收入為例,生動說明了這一點。公司報告「平均工資」時也常用均值來掩蓋大多數員工收入較低而少數高層收入極高的事實。未經定義的「平均數」是模糊且具有欺騙性的。
-
沒有披露的數據 (The Little Arrows):
- 統計數字往往只呈現最終結果,而省略了理解這些結果所需的關鍵背景資訊,如數據的變異性、可靠性水平、或完整的數據分佈。
- 解釋: 例如,只給出平均值而不說明數據的分散程度(全距、標準差),會讓人誤以為所有個體都接近平均值。書中提到平均家庭人口數(3.6人)並不能反映大多數家庭的實際人數(可能是1-2人或4人以上),平均氣溫(61華氏度)掩蓋了極大的溫度波動範圍(15-104華氏度),導致人們對實際情況產生錯誤判斷。此外,報告結果時省略樣本容量(小樣本的差異可能只是偶然),省略可靠性指標(如可能誤差或顯著性水平),或者省略完整的數據序列(只展示有利的趨勢部分),都會使數據看似確鑿,實則毫無意義或具有誤導性。遺漏比較基準(如牙膏宣稱提升26%功能,但未說明是與何物比較)也是常見手法。
-
毫無意義的工作 (Much Ado About Nothing):
- 將微不足道、可能僅因偶然因素產生的統計差異,誇大為具有重要意義的結論。
- 解釋: 這通常發生在對比兩個數值時,忽視了數據本身固有的誤差範圍。例如,聲稱一個智商101的孩子比智商98的孩子聰明,如果考慮到智力測驗的可能誤差(如±3),這兩個數字的差異可能毫無意義。同樣,雜誌讀者調查中,40%和35%的讀者喜好差異,在小樣本下可能只是偶然波動。廣告商常利用這種「顯微鏡下的差異」來宣傳產品優勢(如聲稱某品牌香煙不良物質「排名最後」,即使差異微乎其微且不顯著)。這種手法藉由賦予數據虛假的精確性(使用多位小數),使讀者誤認為差異是真實且重要的。
-
驚人的統計圖形 (The Startling Graph):
- 透過扭曲圖形的刻度或比例,製造視覺上的戲劇性效果,使實際變化看起來比數據本身顯示的要大得多或小得多。
- 解釋: 最常見的技巧是截斷縱軸,不從零開始,只顯示數據變化範圍較大的部分,這樣微小的變化在視覺上也會顯得非常陡峭(如國民收入增長10%被畫得像100%)。另一種手法是改變橫軸和縱軸的比例關係,使得曲線更加陡峭或平坦。書中舉例了國民收入、股票指數、汽油成本、政府支出、鋼鐵產量等圖表如何透過這些手法產生誤導性。這種視覺操縱比數字本身更具影響力,因為讀者往往只掃一眼圖形趨勢,而不仔細查看刻度細節。
-
平面圖形 (The One-Dimensional Picture):
- 在圖像化圖形中,使用物體(如錢袋、人、牛)的面積或體積來代表數量,而不是僅用高度或長度。由於面積隨邊長平方增長,體積隨邊長立方增長,這會導致視覺上的差異遠大於實際數量的比例。
- 解釋: 例如,用錢袋的高度表示工資水平,如果美國木匠工資是羅坦提亞木匠的兩倍(60 vs 30),錢袋畫成兩倍高。但為了視覺效果,同時也會畫成兩倍寬,這樣面積就是原來的四倍。如果考慮三維,體積就是原來的八倍。儘管數字比例是1:2,眼睛看到的比例卻是1:4或1:8,極大地誇大了差異。這種手法常見於商業廣告和新聞雜誌,利用直觀圖像來影響讀者的判斷。
-
相匹配的資料 (The Well-Meaning but Misleading):
- 使用與聲稱要證明的觀點並非直接相關或無法進行有效比較的數據,暗示二者之間存在關係。
- 解釋: 例如,用抗菌劑在試管中殺滅細菌的數據來宣傳其治療感冒的功效,這忽略了試管環境與人體喉嚨環境的巨大差異。比較不同群體的死亡率(如海軍與城市居民)而不考慮兩者在年齡、健康狀況等方面的差異,得出片面的結論。將員工對工會的普遍抱怨(可能只是瑣事)說成是反對工會的證據。混淆公司的「銷售利潤率」和「投資回收率」,或偷換百分比計算的基數,來掩飾或誇大盈利狀況。交通事故數據如果不考慮總的出行量或特定交通工具的使用人數,也容易產生誤導(如飛機失事總數增加不代表飛行更危險)。這種手法往往是「答非所問」,用一個事實來支持一個不相關的論點。
-
相關關係與因果關係 (Correlation and Causation):
- 統計上顯示兩件事物「相關」(共同變動),就錯誤地推論其中一個是另一個的「原因」。
- 解釋: 相關不等於因果。兩件事物同時發生或變動,可能因為:1. A導致B;2. B導致A;3. 存在第三方因素C同時影響A和B;4. 只是偶然巧合。書中以吸煙與低成績為例,可能是吸煙導致低成績,也可能是低成績導致焦慮而吸煙,更可能是外向、不注重學習等性格特質同時導致吸煙和低成績。牧師收入與朗姆酒價格的正相關,很可能只是受物價普遍上漲這個第三方因素的影響。牛奶消費量高的地區癌症發病率高,可能是因為這些地區人們壽命更長,而癌症是與年齡相關的疾病。本書強調,即使相關性顯著,也必須警惕混淆因果的謬誤,尤其當存在其他合理的解釋時。單憑相關數據,無法確定因果方向或排除第三方因素的影響。
-
如何進行統計操縱 (How to Statistically Manipulate):
- 本章彙整前述技巧,並補充了一些進一步的操縱手法,指出統計操縱可能出於故意或無知,但結果都是扭曲事實。
- 解釋: 補充的例子包括:利用地圖的面積大小來誇大數據(如用面積廣闊但人口稀少的州來代表政府支出比例);創造虛假的「平均」概念(如將總收入除以總人數,再乘以平均家庭人口數,得出一個實際上不存在的「平均家庭收入」);濫用小數點和百分數,賦予不可靠數據虛假的精確性;混淆百分比和百分點,或偷換百分比計算的基數(如工資下降20%後再上升5%,實際補償遠非四分之一);將不可直接相加的百分比或數據相加(如將不同項目的成本上升百分比簡單相加);利用文字遊戲或術語模糊概念(如用「留存利潤」代替「盈餘」)。本質上,這些都是前面技巧的組合或變體,目的是讓數據服務於特定的議程。
綜合以上分析,本書的主要論點可以歸納為:統計數字並非絕對的真相,它只是現實世界的一種抽象描述,而這種描述極易受到操縱和誤解。這些操縱可能源於:
- 數據的來源和收集過程(樣本): 樣本是否具有代表性、是否足夠大、收集過程是否公正。
- 數據的處理和計算(平均數、變異性、指數): 選用哪種平均數、是否呈現數據的變異性、計算方法是否恰當、基準選擇是否公平。
- 數據的呈現方式(圖形、精度): 圖形是否扭曲比例、是否使用虛假的精度、百分數是否計算正確或基數是否一致。
- 數據的解釋和推論(相關與因果、概念偷換): 是否將相關誤認為因果、是否將一個概念測量結果說成另一個概念、是否忽略了影響結果的其他因素。
- 數據的完整性(遺漏資訊): 是否遺漏了關鍵的背景資訊,使得數據失去意義或產生誤導。
為了對抗這些統計陷阱,本書在最後一章提出了五個關鍵問題作為讀者的防身術:
- 誰說的? 質疑資訊的來源,考慮其可能的偏見或利益。
- 如何知道的? 探究數據的收集和處理方法,評估其可靠性。
- 是否遺漏了什麼? 檢查是否有關鍵資訊被省略,如樣本大小、變異性、比較基準等。
- 是否偷換了概念? 確認所討論的概念與實際測量或比較的內容是否一致。
- 資料是否有意義? 思考數據在實際情境中是否具有真正的意義或價值,是否能支撐所提出的結論。
總而言之,《統計數字會撒謊》一書的核心論點是呼籲讀者對統計數字保持警惕和批判性思維。它不是要讓人們完全否定統計學的價值,而是要認識到其固有的局限性和被操縱的可能性。透過學習書中揭示的各種手法,讀者可以更好地辨識那些看似科學實則充滿陷阱的統計資訊,在資訊洪流中保持清醒,做出更明智的判斷。正如譯者所言,掌握這些「工具」是防止受騙的可行方法,它鼓勵我們「抱着懷疑的態度開始」,最終「獲得肯定的結論」,即對統計數字的真實性和可靠性做出有根據的判斷。
comments
comments for this post are closed