一位耶魯大學教授的統計箴言
(政治大學傳播統計系指定用書)
(台大心理系教授推薦)
(北京大學圖書館收錄)
回想35年來,在耶魯大學心理系教授研一生統計學的點點滴滴,最讓我感到印象深刻的是統計教學的改變與不變。
最明顯的變革來自於電腦的使用。在1950年代,電腦實驗室就是一種塞滿各種計算機械的龐然巨獸。在深夜,一定距離之內,你能從咔嗒咔嗒的操作聲音,判斷還有多少位學生在實驗室裡工作。其實,還蠻懷念過去這種吃苦當作吃補的歲月,但我也想到,在過去的日子裡,統計分析不僅僅充滿噪音,還充滿了錯誤。現今,個人電腦與統計套裝軟體的發明,使得統計分析變得又快又準確。這對於大數據庫、反覆計算、多因子或多變項技術,更是如虎添翼。此外,1992年計算與圖形統計期刊(Journal of Computational and Graphical Statistics)的創建,把電腦、圖形和統計連結了起來(也參看Cleveland, 1993; Schmid, 1983; Wainer&Thissen, 1993)。我並不是說電腦剷除了愚笨--事實上,或許鼓勵了它。我主要是指,精細構思的分析,能夠以極大的效率與細節來完成,而這是幾十年前做不到的。
另一些值得重視的發展是:探索式數據分析(Hoaglin, Mosteller, &Tukey, 1983, 1985, 1991; Tukey, 1977),從強調統計顯著性檢定轉彎至隨心所欲地尋找數據所浮現的模式;對數線性模式(Goodman, 1970; Wickens, 1989),分析多向列聯表的細格次數;
結構方程與驗證式因素分析以及LISREL程式(Jöreskog, 1978);處理抽樣變異的自助抽樣法技術(Efron, 1992);以及使用後設分析(Glass, 1978; Hedges&Olkin, 1985; Mullen, 1989; Rosenthal, 1991; Wachter&Straf, 1990)來統合研究並下結論的爆炸性興趣。
儘管各大學裡,有許多新發展的統計學科系以及相關訓練課程,一般而言,學生們還是對統計困惑不已。長期觀察學生們對於學習統計的無助掙扎,我總結,問題不全然是計算這方面。對許多學生而言,統計是一座孤島,與他們的研究事業處於分離的狀態。統計被視為令人不悅的義務,最好盡快從他們的生活中消失。此外,處理不確定性是很困難的,不論是日常生活或是小小的推論統計學世界。許多學生天真地以為,只要緊緊抓住摸得到看得見的計算值,用電腦輸出堆疊成山的數據來增加數值的份量,就能避免模稜兩可的情形。學生們變得死板板的,把統計實作視為一種醫學或宗教規則。他們常常從病人或教徒的角度,以焦慮和不安的態度詢問這樣的問題:「我被允許使用這個方法來分析我的數據嗎?」好像做錯就會病情加重或犯罪一樣,而他們似乎也想要獲得處方式的答案,像是「依照電腦統計套裝軟體的指示,跑變異數分析,好好睡一覺,明早再把我叫醒。」
多年來,對於學生的問題:「我可以這樣做嗎?」我總是回答:「你可以做任何你想做的,但如果你用方法M,就要有得到批評Z的準備。如果你使用程序P並且夠幸運得到結果R,那麼你能夠進行有效的主張,如果你沒有得到結果R,那麼恐怕你必須謙虛一點。」
慢慢地,我開始意識到我回答的言下之意:亦即,陳述統計分析的推論結果與雄辯息息相關。當你做研究時,會有人批評你對結果的詮釋,而你最好準備說服他們。(這些批評也許不會成為現實,但對批評的預期心態,對於做好研究與數據分析是必要的。事實上,想像遭遇充滿敵意的批評者,會讓我們在一開始的研究設計就很小心。)統計分析工作與律師的工作有點像--案例具有說服力,或證據薄弱(甚至可疑),或是推論方式嚴謹或鬆散,以及慣例與規則可能被援引或無視等等。
一直以來,我總是想寫一本饒富趣味、忠告與智慧的統計書籍,讀者群為研一生和大學主修心理學或其他社會科學進階統計課程的學生。標題自嘲是「許多你應該知道的統計大小事,但卻困惑到不知如何提問」,但又不想寫成像是一本烹飪書。當統計即有原則的論據在我腦海出現時,我知道我有一個統一的主題了。
除了辯論之外,統計分析也具有敘事功能。有意義的研究就像是說故事,而統計能夠使故事變得更好,學生通常沒有注意到這一點。隨口問一位學生:「如果你的研究要被刊登在報紙上,標題會是?」得到的回答通常是喃喃自語不知所云,好像這個問題從來就沒有被考慮過。
藉由拋出這個問題,我不得不想想,要如何陳述統計故事的主張,怎麼樣讓這個主張變得令人感興趣。藉由清晰的論據,讓顯而易見的解釋潰敗,使得一般大眾對於重要關係的信念產生改變,是令人感興趣的。因此,我理想中的統計學家,必須集律師、說書人以及偵探的角色於一身。這三種角色可以是有趣的,並且有開放的心胸,預期沒有意料到的線索和關係出現。
把這些都考慮進去,構成一個圖像。那就是,統計之目標是把量化證據組織起來,使用有原則的措詞,形成有用的論據。有原則(principled)是很重要的點,這意味著你不應該在統計報告裡恣意而為。我並不完全是在提倡統計領域的相對主義(relativism),或解構主義(deconstructionism)。只是,主張應該很清楚地奠基於證據。當我說「論據」,我並不是鼓勵研究者應該為反對而反對。只是,對數據所引起的議題,要有論辯精神。
我的主題無法不包含技術上的東西。特定的統計方法必定會被討論,但是我已經最小化數學公式與複雜數據的使用。本書大部分的觀念圍繞著基礎機率理論、t-檢定、變異數分析以及研究設計。因此,讀者需要具備一些基礎統計學的知識,像是大學統計課所學的東西。第一章至第五章,重新探討與詮釋基本素材。第六章以後,轉向沒有受到足夠關注的統計與研究設計大小事。
我已經努力使本書內容清楚且易讀,但有些讀者可能還是會認為,少數段落令人費解(尤其是第六與第七章),請自行判斷哪些是你可以略過的。如果你跟不上偶爾出現的公式,儘管讀文字內容即可。如果還是不理解,先去放鬆聽個音樂,稍後再繼續閱讀。
書裡範例的作用,並非像是食譜裡的圖解功能,而是為了解釋統計與真實世界之間的連結。大部分的範例,來自於我所熟悉的實驗社會心理學領域。(許多範例有點年紀,就跟我一樣。)其他範例散見於各實證研究領域。我希望,所有想要磨練其統計論辯理解力的讀者,都能感到被鼓舞。我也希望,統計與研究專家,能夠容忍我過度簡化的技術性議題,而在本書裡發現許多的精煉思想。
教師與研究者可能會發現,本書的價值在於所討論的內容,超越一般統計學教科書會探討的範圍。學生可以把本書當作標準統計學教科書的輔助教財,或者僅僅是獨立閱讀。研究團體可能會發現,本書所探討的議題非常有價值,因為這些議題時不時會出現在他們的研究領域裡。我觀察到一個現象,大部分學生並不真正了解統計,除非他們經歷三個階段--首先是接觸,再來是實作,最後才能產生真正的洞見。本書為這第三個階段而設計。我希望,讀者能把在本書所學到的東西帶入其研究計畫中。
最後,感謝對本書草稿提供意見的許多夥伴。如果讀者發現本書的任何不經意的瑕疵,請使用這個金律:Mea culpa(我有罪)。
譯者序
與本書結緣大約在十年前。如今,可能由於人類集體潛意識對統計知識的渴望,所以在因緣際會之下,透過我,把本書翻譯出來,以饗廣大的中文讀者。
翻譯已逝作者的大作有兩點好處。第一,不會有改版的問題;第二,內容扎實,經得起時間的考驗,因此才能一再地出版,即使作者已不在人世。這讓我想起了當年在美國留學時,我的指導教授喜歡帶我到校內的一間二手書店喝咖啡,恩師會順道挑選一本二手詩集。端詳著他把二手書看得比新書還要珍貴的模樣,不禁令我這個慣於採購新書的東方學生,起了好奇心。
的確,老書自有其魅力。例如,1963年出版的實驗與類實驗設計(作者為Campbell與Stanley),是我讀過最精彩的研究設計類書籍,因為內容精粹,敘述清楚,舉例引人入勝。把它從美國亞馬遜網路書店購買回來的時候,發現內文有前人的重點註記,還有疑似圖書館藏書的編號,這真的讓我有種新書不如老書的感覺,因為每一位讀過本書的人,都賦予了它新的生命。所以,老書的魅力,來自於內容與痕跡。
這本書的確不年輕了。它在1995年出版,於2009年--作者去世幾年後--又再度重印問世。在這個鼓吹汰舊換新的年代,也許本書早已被圖書館給隨意丟入了資源回收桶,取而代之的是最新出版,但卻真的值得資源回收的新書。我為什麼這麼說?因為本書內容能夠啟迪讀者的統計與研究智慧。
經驗貧乏的研究者,喜歡堆砌統計文字,彷彿這就代表了自己的學術成就。然而,一堆令人摸不著頭緒的統計段落,加上不知所云的內文,再配合上一點也不令人感興趣的標題,只會讓人望而生畏,不想閱讀。一篇沒人想閱讀的研究報告,遑論能增進什麼人類福祉了。本書內容能幫助讀者消弭這種弊病。
閱讀本書需要具備一些基礎統計學知識,如果有一點點的實務經驗,讀起來會更有體悟。學造句就是要學寫作文;學統計就是要學會作研究。要很有效率且充滿自信地,寫出一篇能應用至日常生活當中的研究報告,而且還能得意洋洋地解讀與評論他人的研究,一本基礎與一本進階統計類教科書必不可少,本書可以幫助你達到這個理想。
書中引用的幾乎都是重量級的真實研究。其中,Milgram(1963)著名的服從研究,甚至在2015年被拍成了電影(Experimenter)。本書的大量引用特色,是一般統計學教科書所缺乏的,因為你不會在一般統計學教科書裡,看見如此詳盡的引用資訊。據此,閱讀本書不但能增進讀者的論文寫作能力,還能精進讀者的統計論述智力。可以想見,本書含金量之高。
除了重量級的引用訊息與範例之外,有的實例來自於耶魯大學的學生作業。閱讀這些例子,可以一窺耶魯大學教授是怎麼培育學生的,這也彷彿得到了耶魯大學教授的指導。所以,就算讀者不是就讀於名牌大學,只要熟稔本書內容,躬身實踐,那麼一些外在的環境影響,對讀者而言,也就不再具有任何的意義了。
市面上有許多如何使用統計軟體的書籍。初學統計的學生,通常也會先從這一部分著手,這並沒有錯。但是,輸出的數值意義何在?這是許多統計學教科書所沒有深入探討的。對我而言,統計軟體的標準化操作,在網路世界輕易就可以搜尋得到,似乎連參考書都不必了。然而,個人一生的統計教學精華,卻是"網搜"不到的。
我很欣慰能把本書翻譯出版。英文原版索價將近40美元,現在你只需要付出極低的代價,就能得到幾乎是原汁原味的東西了。這也是我從事統計教科書翻譯工作的初衷--讓知識產權降價,造福廣大的中文讀者。願展讀愉快!
序言
譯者序
艾貝爾森的八條金律
第一章 以統計發聲
第一節 對於統計的誤解
第二節 以統計來主張:比較與解釋
第三節 虛無假設檢定的語言與限制性
第四節 有說服力的爭論:MAGIC標準
第五節 風格與慣例
第六節 底線
第二章 基本論辯與機率的角色
第一節 隨機生成過程
第二節 隨機抽樣過程
第三節 總結
第三章 效力的大小
第一節 機率測量值
第二節 效力量
第三節 信賴區間
第四章 論辯的風格
第一節 狂妄、古板、自由、以及保守風格
第二節 單尾、雙尾、以及不對稱檢定
第三節 應用於同一組數據的替代檢定
第四節 有缺陷的觀察值
第五節 同組數據裡的多重檢定
第六節 陳述與詮釋p-值
第七節 最後的分析
第五章 察覺可疑之處
第一節 怪異的觀察值分配
第二節 發生不可能的分數
第三節 奇怪的檢定統計值
第四節 類比統計值之間的不一致
第五節 類比統計值有著過多的一致性
第六節 覺察可疑的警示
第六章 結果的清晰度:作用與限制
第一節 作用與限制
第二節 作用與知識的演化
第三節 平均數的比較
第四節 重構結果以獲得更好的清晰度
第五節 多重比較
第六節 對照比較
第七節 不只一個依變項
第八節 進一步的評論
第七章 效果的普遍性
第一節 普遍性的性質
第二節 研究內的處置-背景交互作用
第三節 跨研究的普遍性:後設分析
第四節 研究內與研究間普遍性的比較
第五節 最後的警示
第八章 爭論的關注性
第一節 統計可以是有趣的嗎?
第二節 理論關注性
第三節 驚奇性
第四節 重要性
第九章 論據的可靠性
第一節 為何研究主張不可信
第二節 論辯的結構
第三節 方法學上的人為因素
第四節 對方法學的批評所帶來的影響
文章定位: