基思·斯坦诺维奇:how To Think Straight About Psychology (第9版)

《如何清晰思考心理學》旨在教授批判性思考技能,以便評估有關心理學的主張,特別是那些在媒體和偽科學中常見的主張。資料指出,心理學作為一門學科,常被誤解和曲解,其嚴謹的科學本質往往被流行文化和偽科學的說法所掩蓋。

心理學的科學本質及其定義

心理學與其他行為領域的根本區別在於它是一門以科學方法研究行為的學科。科學不應由研究對象(宇宙的任何方面,包括人類行為,都可以是科學研究的對象)或特定儀器定義,而是由其思考和觀察宇宙的方法定義。科學方法有三個關鍵特徵:

  1. 系統經驗主義 (Systematic Empiricism):科學知識源於觀察,但不是隨意、非結構化的觀察。科學觀察是系統性的,其結構能揭示世界潛在的本質。科學觀察通常由理論驅動,旨在檢驗關於世界本質的不同解釋。透過這種結構化的觀察,某些理論會得到支持,而另一些則會被駁斥,從而推動知識進步。
  2. 公開可驗證的知識 (Publicly Verifiable Knowledge):科學知識不是個人獨有的,必須提交給科學共同體進行批判和實證檢驗。這通過兩種機制實現:
    • 可複製性 (Replication):研究發現必須以他人可以嘗試相同實驗並獲得相同結果的方式呈現。這確保了特定發現不是由於個別研究者的錯誤或偏差。可複製性是公開知識的基礎。
    • 同儕審查 (Peer Review):提交給科學期刊的研究論文會由該領域的多位科學家進行評審。這是一個批判和篩選的過程,確保發表的研究符合最低科學標準。缺乏同儕審查的出版物(如許多大眾心理學書籍或網站)往往是偽科學主張的溫床。公開性使得科學知識能夠累積和發展。
  3. 可解決的問題 (Empirically Solvable Problems):科學處理可以通過當前可用的實證技術回答的問題。科學通過提出解釋現象的理論、從理論中推導預測、通過實證檢驗這些預測,並根據檢驗結果修改理論來進步。可解決問題的核心在於理論必須是「可檢驗的」。

可證偽性 (Falsifiability)

「可解決的問題」這一特徵與科學理論的「可證偽性」準則緊密相關。可證偽性是指,一個科學理論所衍生的預測,必須有可能在實證檢驗中被證明是錯誤的。如果一個理論能解釋所有可能的觀察結果(如資料中提到的「敲門節奏理論」或班傑明·拉什的放血療法理論),那麼它就無法被證偽,也因此缺乏預測力,對科學進步沒有助益。弗洛伊德的一些理論被批評為不可證偽,因為它們能事後解釋一切,但無法事先做出具體預測。不可證偽的理論看似解釋力強,實際上卻阻礙了知識進步,如同資料中提及的偽科學(如某些特異功能說法,在仔細觀察時就會「消失」)。好的理論會做出具體、精確的預測,這些預測若被證實,能提供更有力的支持。科學中的錯誤(即預測被證偽)並非失敗,而是推動理論調整和接近真相的關鍵。

操作主義與本質主義 (Operationism and Essentialism)

科學研究概念的方式不同於日常思維中的「本質主義」。本質主義者追求概念的「終極」、「真實」意義。然而,科學並不宣稱能揭示事物的終極本質,而是採用「操作主義」:科學理論中的概念必須與可觀察、可測量的事件相連結。這種連結(稱為操作型定義)使得概念公開化,任何人只要具備適當訓練和工具,都能以相同的方式進行測量。

操作型定義需要具備「信度」(Reliability)(測量的一致性)和「效度」(Validity)(測量是否準確反映概念)。僅有信度而無效度的操作型定義是無用的(如用鞋碼測量智力)。科學概念的定義並非一成不變,而是在研究過程中不斷演進和豐富,透過與觀察結果及其他理論概念的關聯來獲得意義。

心理學常使用日常詞彙(如智力、焦慮、攻擊性)作為技術概念,這導致公眾誤解,以為可以用日常意義或「個人心理學」來理解這些概念。但科學心理學必須對這些概念進行操作型定義,使其具備公開性,能被共同體檢驗。操作主義是科學的共通特徵,而非心理學獨有。對心理學概念的本質主義追問(如「智力到底是什麼?」)往往是源於對科學本質的誤解,科學追求的是解釋現象,而非詞語的終極意義。

個案研究與證言的局限性 (Testimonials and Case Study Evidence)

個案研究(對單一或極少數個體進行深入研究)和個人證言在科學探究的早期階段可能有用,可以啟發假設和指明研究方向。然而,在理論檢驗的成熟階段,個案研究和證言作為證實或反駁理論的證據,其價值非常有限,甚至幾乎為零。

原因在於:
1. 缺乏比較性資訊:個案研究和證言是孤立的觀察,缺乏必要的比較組(對照組)來排除其他解釋。科學進步需要資料能夠排除某些替代解釋。
2. 安慰劑效應 (Placebo Effects):僅憑證言無法證明治療的有效性,因為安慰劑效應廣泛存在——人們僅僅因為接受了治療(無論是否實際有效)就感覺好轉的傾向。許多無效的治療都能產生正面的證言。
3. 生動性效應 (Vividness Effect):生動的個案或個人證言(如媒體報導)對人類判斷有壓倒性的影響,即使存在更可靠、基於大量資料的統計資訊,人們也傾向於過度重視生動的個別案例。這也是偽科學宣傳常用的策略。
4. 容易產生:由於安慰劑效應和生動性偏見,為任何治療或主張(無論多荒謬)收集證言都相對容易。

過度依賴證言和個案研究會為偽科學打開大門,導致資源浪費、誤導公眾、甚至造成實際傷害(如延誤真正有效的治療)。科學結論必須基於受控觀察的證據,而非個人故事。

相關不蘊含因果 (Correlation and Causation)

兩個變數之間存在相關性(變化趨勢一致)並不必然意味著其中一個變數導致另一個變數的變化。這是理解心理學發現的關鍵點之一。從相關推斷因果關係存在兩個主要問題:
1. 第三變數問題 (Third-Variable Problem):兩個變數(A和B)之間的相關可能並非直接因果關係,而是因為它們都與未測量的第三個變數(C)相關。例如,電器數量與避孕措施使用率的相關可能源於社會經濟地位的影響。選擇偏差(Selection Bias) 經常導致虛假相關,即具有某些特徵的人選擇特定環境,從而導致該特徵與環境特徵之間的相關。
2. 方向性問題 (Directionality Problem):即使A和B之間存在直接因果關係,單憑相關性無法確定是A導致B還是B導致A。例如,糟糕的閱讀能力與眼球運動模式的相關,實際上是閱讀困難導致眼球運動問題,而非反之。

科學方法中的實驗控制(操縱自變數和控制無關變數)是解決這些問題、確立因果關係的必要手段。

實驗控制與操縱 (Experimental Control and Manipulation)

科學實驗的核心在於操縱和控制。科學家通過比較在不同(但受控)條件下獲得的結果,來排除某些解釋並證實其他解釋。實驗設計的目標是隔離變數的影響。這通常需要創造特殊條件,而這些條件在自然世界中可能不常發生,甚至根本不存在。科學實驗的「人工性」並非缺點,恰恰是其力量所在,因為它允許科學家將自然界中普遍共存的變數「拆解」開來,以確定單一變數的因果影響。

「真實驗」的定義特徵是結合了對自變數的操縱和「隨機分派」(Random Assignment)。隨機分派是將被試分配到實驗組和對照組的方法,確保每個被試被分配到任一組的機率相等。這有助於在實驗開始前,使各組在所有(已知和未知)無關變數上大致相等,從而排除因被試個體特徵差異造成的替代解釋。隨機分派與「隨機抽樣」(Random Sampling) 不同;隨機抽樣是為了使研究結果能推廣到更廣泛的人群(總體),而隨機分派是為了在實驗內部建立因果關係的推論。

對照組至關重要,沒有對照組,任何結果都難以解釋(如安慰劑效應)。忽略對照組資訊是人類判斷的一個常見缺陷。克利弗·漢斯(一匹據稱會算術的馬)的例子生動地說明了實驗控制的重要性——通過操縱提問者是否知道答案,揭示了馬實際上是對微小行為線索而非數學問題做出反應。近期「促進溝通」的爭議也再次印證了缺乏控制的風險,以及將隨機或無關的行為誤認為特定能力的危險。

多重因果與交互作用 (Multiple Causation and Interaction)

行為通常是多重決定的,即由眾多變數共同影響。單一變數往往不足以完全解釋某種行為,許多複雜行為是由多個因素共同作用的結果。科學家不尋求單一的「魔術子彈」式的解釋,而是研究不同變數的影響並整合結果。即使一個變數只解釋了行為變異的一小部分,如果該行為很重要且該變數可控,那麼認識到這種因果關係仍然非常有價值。

更複雜的是,變數之間可能存在「交互作用」(Interaction):一個變數的效應大小可能取決於另一個變數的水平。例如,某些風險因子單獨存在時影響不大,但當多個風險因子結合時,風險可能會呈指數級增加。生物學、環境和心理因素經常以交互作用的方式共同影響行為結果。然而,人類傾向於尋求單一因果解釋,尤其是在涉及情緒或社會爭議的議題時,這會導致對複雜現象的簡化和誤解。

機率思維與機會的作用 (Probabilistic Reasoning and the Role of Chance)

心理學研究的結論,與許多其他科學一樣,通常是機率性的——它們描述的是趨勢,而非在每個單一案例中都成立的絕對確定性。例如,「男性傾向比女性高」是一個機率性陳述,並不意味著所有男性都比所有女性高。機率性預測即使無法在個體層面做到百分之百準確,但在群體層面(總體)仍然非常有價值和具預測力。

然而,人類在機率思維方面存在普遍困難,這常常導致對心理學發現的誤解:
1. 「某某人」統計 (Person-Who Statistics):人們傾向於用單一反例來駁斥已確定的機率性趨勢,未能理解機率性陳述允許例外的存在。
2. 未能充分利用機率資訊:具體的單一案例資訊(如個人證言)往往壓倒抽象的機率資訊。
3. 未能利用樣本大小資訊:人們不總能理解較大的樣本更穩定、更能準確反映總體特徵。
4. 賭徒謬誤 (Gambler’s Fallacy):認為獨立事件之間存在關聯,試圖在隨機序列中尋找模式,並錯誤地認為過去的結果會影響未來獨立事件的機率。

人類大腦渴望尋找模式和解釋,即使在完全隨機的事件中也是如此,這導致「虛假相關」(Illusory Correlation) 和「控制錯覺」(Illusion of Control) 的產生。人們難以接受某些事件僅僅是由於偶然。在臨床實踐中,這種對機率的誤解體現在對「臨床預測」(Clinical Prediction) 的偏好上,即認為個人的臨床經驗能提供比統計預測(精算預測 Actuarial Prediction)更準確的個別案例預測。然而,大量研究表明,基於群體趨勢和統計模型的精算預測在各種領域都優於臨床預測。這反映了「接受錯誤以減少錯誤」的原則——承認預測不可能百分之百準確,但通過依賴統計趨勢可以達到更高的整體準確性。

心理學的形象問題

儘管心理學學科內容吸引人,但其公眾形象普遍負面,常被視為「不被尊重」。這有多重原因:
1. 弗洛伊德問題與偽科學:弗洛伊德在公眾心中的過大影響,以及書店和媒體中大量偽科學(如特異功能、不科學的自助療法)的存在,使得心理學與不科學、甚至荒謬的觀念混為一談。實際上,心理學界普遍不認可特異功能,且心理學家積極參與揭露偽科學。
2. 自助文學與食譜知識:大眾自助書籍常基於證言和個人經驗,推廣未經證實的「療法」,並暗示心理學只提供關於如何「做」某事而無須理解其原理的「食譜知識」。這與心理學作為一門科學追求基本原理的目標不符。
3. 貢獻被其他學科蠶食:心理學家的研究貢獻常被歸功於其他相關領域(如認知心理學家的工作被歸為神經科學或計算機科學),導致心理學作為學科的成就被低估。
4. 心理學家自身的責任:一些心理學家表現不專業、推廣或默許偽科學的實踐(尤其在臨床領域),以及一些學派抵制科學評估,都損害了學科的聲譽。特別是對「臨床直覺」的過度依賴和辯護,忽視了統計預測的優越性,這與心理學的科學基礎相悖。

最終,資料指出,心理學作為一門科學,其力量在於能夠通過科學方法駁斥關於人類行為的錯誤主張。然而,這種科學的嚴謹性挑戰了許多人習慣的「個人心理學」和「凡事皆可」的觀念,這正是其面臨阻力和誤解的根源。心理學需要更好地向公眾傳達其科學本質、方法和成就,以獲得應有的理解和尊重。