把統計學剝光光：用直覺就能理解的12個統計原理，揭穿資料操弄的假象【試閱】

好書試閱

把統計學剝光光：用直覺就能理解的12個統計原理，揭穿資料操弄的假象

79折特價356元

加入購物車

第一章
學統計的重點：從統計分析結論，辨別真實或謊言

統計幫助我們處理數據，而數據實質上只是一個比較炫麗的名詞，本質上是資訊。有時候，數據只是通盤大局裡的瑣碎細節，比如運動統計數字就是這樣；或有時候，數據可讓我們看透人類生活的特質，比如吉尼指數。
但統計可以幫忙，或是希望統計能幫上忙的問題還包括：

• 如何抓到在標準化考試上作弊的學校？
• Netﬂix怎知你喜歡哪一種電影？
• 如果不做人體致癌實驗，如何找出哪些物質或行為會致癌？
• 替手術病患禱告會讓他們的術後結果變得比較好嗎？
• 拿到菁英大學的學位，真的可以帶來任何經濟上的益處嗎？
• 是什麼因素導致自閉症的病例大增？

事實上，這個世界正在製造愈來愈多的數據，且速度愈來愈快。但，就如《紐約時報》所言：「數據只是知識的原物料。」（Data is merely the raw material of knowledge. ）當我們要用資訊來達成某些有意義的目的，比如欲找出實力被低估的棒球員或是如何支付更合理的薪資給教師等，統計無疑都是最強的輔助工具。以下說明統計如何賦予原始數據更多「形式上」的意義。

1.描述與比較：容易過於簡化而誤導結論
保齡球得幾分是一種描述性的統計量，打擊率也是，多數5 歲以上的美國運動迷都已經很熟悉運動場上的描述性統計。無論是體育還是生活等面向，我們使用數字來摘要資訊。比如米奇．曼托（Mickey Mantle）算是好球員嗎？他整個職業生涯裡的打擊率是0.298。在棒球迷眼中，這是很有意義的一句話，而且很了不起，因為此數字濃縮他長達18個賽季的職業生涯表現，即便用一個數字總括一個人畢生的事業成就有些傷感。當然，棒球迷也都知道，除了打擊率外，還有其他描述性統計量更適合總結球員在場上的價值。
我們可以用學科平均（grade point average，簡稱GPA）來衡量高中生與大學生的學術表現，成績單上的考評會對應一個數值，通常A代表4分，B代表3分，C代表2分，依此類推。高中生畢業要申請大學、大學生畢業要應徵工作時，學科平均都是評估此人學術潛力的便利工具。學科平均3.7的人，明顯比同一間學校裡拿到2.5分的人要強。這個指標也成為很好的描述性統計，因為容易評估且容易理解，也很容易對不同學生做出比較。
但這不完美。學科平均無法反映出不同學生選修的課程，可能存在不同的難易度。專挑相對沒有挑戰性的課而拿到3.4分的學生，與修了微積分、物理與其他艱澀科目拿到2.9分的學生，如何比較？
我就讀的高中就試著解決這個問題：校方給相對困難的課程比較高的權重：「菁英」班（honors class）裡拿到A的對應分數是5分，而不是一般的4分。然而，這又製造出問題。我母親很快就發現這套「修正」學科平均的方法造成新的扭曲。比如像我這般修了很多菁英班課程的學生，如果在非菁英班課程（如體育或健康教育）拿到A，反而會拉低整體學科平均，但這些課裡拿A已經是最高分了。因為這樣，我爸媽不准我高中時去上駕駛課，以免就算我的表現無懈可擊，仍會拉低我進入競爭激烈大學並繼續寫作暢銷書的機會。他們寧可反向操作，花錢讓我在夏日晚間自費上駕訓班。
這種作法很神經嗎？對。但，這就是本書要說明的主題之一，也就是過度仰賴任何描述性統計數值就可能出現誤導的結論，或引發不樂見的行為。描述性統計的存在就是為了簡化，勢必會犧牲細微之處或細節，任何要處理數字的人都必須理解這一點。

2.推論：從抽樣母體做縝密推估
有多少遊民生活在芝加哥街頭？已婚人士性行為的頻率有多少？這些問題看起來八竿子打不著，但事實上，兩個問題都可以利用基本統計工具來回答，即使無法盡善盡美。統計的重要功能之一，就是善用目前手上的數據，針對仍舊無法掌握全部資訊的更大問題做出縝密的推估。
簡言之，我們可以使用「已知世界」裡的知識，對「未知世界」做出縝密的推論。我們先從遊民問題開始。要計算大型都會區裡有多少遊民，成本很高且後勤支援工作的難度也大。然而，為了能提供社會服務、確定領取各州與聯邦政府相關所得的資格，以及在國會獲得代表權等等，估計出這群人的數量非常重要。
有一種重要的統計方法稱之為「抽樣」（sample），亦即在小區域（例如人口普查區）收集數據，接著用這些數據對整個城市裡的遊民人口做出縝密的判斷或推論。比起點算所有遊民，抽樣所需的資源較少；如果做的方式正確，推斷同樣很精準。
政治民意調查就是一種抽樣。研究機構會嘗試聯繫一群大致上代表大母體的家庭，詢問他們對特定議題或候選人的看法。這顯然比聯絡全州或全國每一個家庭便宜許多，且速度也較快。民意調查與研究機構蓋洛普認為，調查1,000個家庭的意見在方法學上就已經很扎實，可以和嘗試調查美國每一個家庭的意見得出大致相同的結果。
我們就是用這套方法得出美國人多久上一次床、跟誰以及是哪種類型的性愛。1990 年代中期，芝加哥大學（University of Chicago）的全國意見研究中心（National Opinion Research Center）做了一項雄心萬丈的研究，調查美國人的性行為，針對具有代表性的大量美國成年人樣本進行面對面的詳細訪談，之後得出結論。如果你繼續讀下去，第10章就會揭示答案。

3.評估風險以及其他與機率有關的事件
賭場長期會賺錢，這是一定的，但未必表示無時無刻都賺錢。如果把周邊附加的花俏東西拿掉，某些一擲千金的大賭客可能也才贏幾千美元。整個博弈產業的根基正是機率賽局，這表示，每一次丟出骰子或是每一輪的牌面結果都不確定。但與此同時，相關事件（比方說21點牌局裡拿到21點或是轉盤轉出紅色）的根本機率則是已知。當根本機率對賭場有利，即可確定隨著下注的數目愈來愈大，即便把附加玩意拿掉，「莊家」仍舊會勝出。
這是一種很強大的現象，可以套用到賭場以外的人生。很多企業會評估各種逆境的風險，它們無法完全消除這些風險，就像賭場不能保證不會出現你賭21點把把都贏的事件，但是，任何面對不確定性風險的企業都可以藉由設計流程來管理風險，把發生天災或是產品缺失等負面結果的機率降到可接受的程度，而任何要處理風險的模型，都必須以統計當作基礎。當個人或企業無法消除不能承受的風險，就會另尋保障。
整個保險業的根基，就是向客戶收費，以便在車禍或住宅火災等負面事件發生時提供保障。保險業的賺錢之道不是靠消除這些事件，畢竟車禍和房子失火是天天都有的事，有時候車子甚至會撞進房子裡，引發大火。保險業的賺錢之道是靠著收取保費，確保其收到的保費總額，遠高於發生車禍與失火時預期得支付的理賠金額。當然，保險公司也會試圖降低預期要支付的理賠金額，比如鼓勵保戶要安全駕駛、在游泳池畔裝設圍欄、在每間臥室安裝煙霧偵測器等。
機率在某些時候也可以用來抓作弊。卡維隆考試保全公司（Caveon Test Security）專攻他們所謂的「數據犯罪學」，找出指向可能作弊的模式。舉例來說，當這家公司發現學校或試場裡舉辦的考試，出現一模一樣錯誤答案的情形高到根本不可能的地步時，就是一項警示，畢竟在完全巧合之下出現此種模式的機率不到百萬分之一。背後的數學邏輯來自於，當一大群學生都能答對題目時，無法從中得到太多資訊，畢竟他們之所以答對，有可能是因為他們很聰明，但也有可能是因為作弊的結果。
然而，當同一群考生答錯，不應該一直都寫出相同的錯誤答案，如果發生此種情況，代表他們抄來抄去或是透過簡訊互傳答案。故而這家公司試圖找出考生答對高難度問題比答對基本問題更多的考試（這代表考生事前拿到答案），以及「從錯的改成對的」的塗改次數遠遠高於「從對的改成錯的」的考試（這表示老師或行政人員在考試之後改答案）。
當然，使用機率也有侷限。事情偏偏這麼巧，一大群考生連錯都錯的一模一樣；事實上，評估的學校愈多，愈有可能僅因為機緣巧合而出現這種情況。一次統計上的異常，不能證明行為不當。
55歲的達爾瑪‧金尼（Delma Kinney）是亞特蘭大人，2008年時在樂透彩刮刮樂刮中百萬美元，之後又在2011年贏得百萬美元的刮刮樂獎金。同一個人中2次刮刮樂百萬獎金的機率，大約是25兆分之一，但警方能因此機率就逮捕金尼先生嗎？當然不能，不過或許可以問問他是否有任何親戚任職於該州的樂透業務單位。
機率是火藥庫裡的武器之一，一定要搭配良好的判斷來使用。

4.找出重要的關係（統計偵查工作）
抽菸會致癌嗎？這個問題我們已經有答案了，但是得出答案的過程並不如一般人想的那麼直接了當。科學方法要求，如果我們要檢定某一項科學假說，應該要執行對照實驗，實驗組與對照組的唯一差異只有相關變項（例如抽菸）。如果我們觀察到兩群人之間出現某些明顯不同的結果（例如罹患肺炎的情況），我們就可以充分推論相關變項就是導致結果的因素。
我們不能在人身上做這種實驗。如果我們的暫定假說（working hypothesis）是抽菸致癌，把一大群大學畢業生分成兩小群：吸菸者和不吸菸者，然後在20年後的同學會上看誰罹癌，是很不道德的作法，畢竟預期會出現負面效果時，不能故意讓人體受試者暴露在危險中。
現在，你可以說我們不用進行道德上有疑慮的實驗，也能觀察到抽菸的影響。我們是否可以跳過整套花俏的方法論，直接在20年後的同學會上，比較畢業後有吸菸與沒吸菸者的罹癌率？
不行。除了是否吸菸外，兩者在其他方面很可能也有差異。舉例來說，吸菸者很可能也有其他習慣，比方說大量飲酒或飲食習慣不良，這些都對健康不利。如果20年後的同學會上吸菸的那一群明顯不健康，我們不知道要把結果歸因於吸菸這件事，還是很多吸菸者剛好也有的其他不健康因素上。我們用來當作分析根據的數據，也有很嚴重的問題：罹癌病得很重的吸菸者，不太可能參加20年同學會，畢竟已經身故的吸菸者不可能會出現。因此，在20年後同學會上分析與會人員健康情形，都會因為班上最健康的人最可能出席這一點而發生嚴重的缺陷。倘若該班同學畢業的時間愈久，比如40年或50年，那麼偏差愈大。
我們不能把人當成實驗室裡的白老鼠，因此，統計就會變得很像是好警探要做的事。統計是數據呈現出的雜亂線索，統計分析則是偵查工作，透過統計分析，把原始數據變成有意義的結論。

謊言、爛謊言和統計
就算在最好的條件之下，統計分析也罕能揭露「真相」。我們通常都是以不完美的數據為基礎提出間接論點，因此，在理智面追求真誠坦白的人，大有理由不認同統計結果或其隱含的意義。在最根本的層次，我們可能連統計回答的問題都不認同。運動狂熱分子永遠都會爭論誰是「有史以來最出色的棒球員」，因為「最出色」並沒有客觀定義。花俏的描述性統計可以為這個問題提供資訊，但永遠都無法得出肯定的答案。
誰說每一個會用統計的人都是明智又誠實？我之前提過，這本書的緣起是要向《別讓統計數字騙了你》致敬，後者最初於1954年出版，暢銷量超過百萬本。現實就是，你可以用統計騙人，或者，你也可能犯下無心之過。無論哪一種，統計分析上隨附的數學精準度，可以掩飾一些很嚴重的胡說八道。這本書要詳細談一談很多常見的統計錯誤與誤讀，但目的是讓你可以辨別，而非拿來使用。

讓我們回到章名，學統計的重點是什麼？
• 為了摘要大量的數據。
• 為了做出更好的決策。
• 為了回答重要的社會議題。
• 為了找到行為模式，讓我們從賣尿布到抓犯人都可以做到更精益求精。
• 為了抓到作弊的人與起訴罪犯。
• 為了評估警政、方案、藥物、療程和其他創新效果。

如果以上這些你都做得到，而且穿上德國時尚品牌雨果博斯的西裝或黑色短裙很上相，你或許也能成為《CSI：迴歸分析》節目的明日之星。

回商品頁