好書試閱

第一章 打擊率:棒球比賽中最沒用的數據

這段歷史讀來或許讓人嘖嘖稱奇,但我們真正該聚焦的是打擊率究竟告訴了我們什麼東西。打擊率是國小三年級水準的數學,把打者的安打數調出來,除以該打者的打數,然後四捨五入到小數點後面三位數,這就是打擊率。而雖然在小樣本裡打擊率可以低到0.000,高到1.000,但在現代棒球裡,典型的打擊率一般會落在0.200到0.400區間。在從二○一一到二○一五的五年當中,沒有哪個有資格獲得打擊王的球員打擊率高過三成五,甚至突破三成四的人也只有兩個(荷西.奧圖維﹝Jose Altuve﹞一回,米格爾.卡布雷拉﹝Miguel Cabrera﹞兩回)。

你是否注意到了上面這句話裡,有個地方怪怪的─什麼叫「有資格」獲得打擊王?這話要從打擊率是一種比率說起,比率的意思就是要有分子跟分母(以打擊率而言分子是安打數,分母則是打數),大聯盟為個人獎項的得獎者都設定了競爭資格的門檻,以打擊率而言,門檻就是所屬球隊出賽一場,你平均要獲得算是很合理的三.一個打席數。由於大部分球隊整季都會打一百六十二場比賽,所以打者必須累積到五百零三個打席數,才能在打擊王競逐中榜上有名,不管是不是第一名。

好喔,但我們剛剛一直聊的不是打數嗎?怎麼這會兒又冒出來一個打席數?的確,這種掛羊頭賣狗肉的做法暴露出了打擊率的第一個重大瑕疵。打擊率無法告訴你打者多久能打出一支安打,它只能告訴你打者在排除掉他「選到保送、挨觸身球、打出高飛犧牲打、犧牲觸擊成功,或是因為捕手妨礙打擊而上壘」以外的時候,多久能打出一支安打。以上這些狀況都不計打數,但要計打席數。(其中前三樣會納入上壘率的計算,而上壘率作為一項極具價值的數據,本書會在後頭專章討論。)

所以打擊率為什麼要無視這些不是安打或不是單純出局的事件呢?要知道在極端的狀況下,這些事件可以占到一名選手超過三分之一的打席數。(貝瑞.邦茲﹝Barry Bonds﹞就曾兩度締造這種紀錄,二○○二到二○○四年各一次,同時他也是史上唯一一個打席數比打數高出過百分之五十以上的大聯盟球員。)關於這個問題的答案……嗯,滿分的解釋還真不存在。我前面已經提到過了最可能的理論,那就是當查德維克創造出打擊率的時候,這些被排除的事件都還非常罕見,或是單純不被認為會涉及打者的技術或努力,所以查德維克便索性選擇忽視這些事件。光是這點,就可以讓你了解何以純用打擊率,或甚至以打擊率為主去評估打者的表現,會疏漏太多關鍵的資訊。把打者用重要的選球能力拗到的保送排除在分子外(讓分子只有安打數),也排除在分母外(讓分母只有打數),將讓你看不到打者全季表現的完整面貌。

不過打擊率的罪過還不只是選擇性忽視而已。打擊率的分子部分還有你所不知的缺陷,主要是這個完全由安打數構成的分子對所有的安打都一視同仁,不論你是一壘安打還是全壘打,在打擊率的計算中都有著一樣的權重,即使我們都知道一壘安打跟全壘打在比賽中的分量有多麼不同。

所以關於打者在某段時間內的表現,打擊率實際上告訴了我們什麼?它告訴了我們打者在沒被四壞保送、沒被觸身保送、沒打出高飛犧牲打或犧牲短打,乃至於沒發生其他不計打數的罕見狀況時,其剩下的打席數有多常打出安打;它只告訴了我們打者打出了一些安打,但沒告訴我們他都打了些什麼樣的安打。(所以才會有那句,當打者靠著軟弱內野安打上到一壘後聽到的棒球金句:「鳥安也是安打。」)這明明是個不好的傳統,但卻在糾纏我們長達一百多年後,仍舊在我們討論跟評價打者時帶有其不該帶有的重要性,尤其是我們會因此高估聯盟打擊率的領先者,只因為我們會說他們「贏得了」某種頭銜。我們容易受到混淆,是因為高打擊率的打者普遍來講也是好打者,這點無庸置疑;我們從打擊率處獲得的並不都是假訊息,但我們會受到打擊率之假精度的誤導,我們會以為打擊率精準到小數點後面三位數,就足以讓我們總結出對某個球員的判斷。而想完整了解打擊率的缺陷大到什麼程度,我們可以將之拿來跟其他更完備的數據比較。

我會常在這本書裡用上的一個基本統計工具,名為相關分析(correlation analysis),意思是我會把兩欄資料放在一起對比,然後得出一個數字在零與一之間,重點是這個數字會讓我們知道這兩欄資料的相關性強弱,而讀者可以將之理解為這兩欄資料亦步亦趨的程度高低,零代表兩欄資料毫無相關性,一則代表兩欄資料完美相關。基本上這個數字愈大,兩組數據的相關性就愈強,意即當A數據變動時,B數據也會跟著變動。但這並不代表A造成了B或B引發了A;你應該聽人說過「相關性並不能證明因果關係」,因為相關分析能夠告訴我們的,只是兩組統計數據間看不看得出某種關係。兩組數據之間的相關性背後可能是直接的因果,也可能純屬巧合,但總之這項工具能讓我們知道的,就只有兩個數據亦步亦趨的程度高低。在本書裡,我會經常在提及兩組數據的相關性時表示是其中一個數據「預測」了另外一個。

在下表中,我使用了大聯盟球隊在二○一一到二○一五年這五個球季中的統計數據來展示兩樣東西的相關性,一樣是整隊的四種常用打者比率數據,另一樣則是這些球隊的單場平均得分。

與團隊單場平均得分的相關性
打擊率(0.749)
上壘率(0.833)
長打率(0.903)
整體攻擊指數(0.936)

打擊率與團隊得分的相關性不算低,大概有0.750。雖然這不能顯示因果關係,但我們仍可以合理期待當一支球隊在其(沒什麼邏輯的狹義)打數中累積愈多安打,其團隊得分就會愈高。但凡事都是相對的,打擊率並不算差的表現還是輸給了另外兩種常用的打者評價數據:上壘率與長打率。

上壘率(On-base percentage,簡稱OBP),顧名思義地採計了打者安全上壘的次數,然後將之除以犧牲觸擊與妨礙打擊上壘以外的所有打席數,藉此給出了打者能夠成功上壘的頻率。一個上壘率四成的打者除了代表他可以在聯盟裡傲視群雄,也代表他有四成的打席數可以上壘,其他六成的打席數會出局。放眼所有基本的打擊數據,也就是那些你可以在棒球卡背面或比賽秩序冊裡看到的數據,上壘率應該會是裡頭最重要的一個,因為它最可以告訴你一個打者的產出能力。

長打率(Slugging percentage,簡稱SLG)的計算近似打擊率,但它不以齊頭式的平等去對待每支安打。長打率的分母(就是下面那個)仍舊是打數,但分子從安打數變成了壘打數。壘打數的計算很簡單,一壘安打就是一,二壘安打是二,三壘安打是三,全壘打是四。這倒也沒辦法百分之百地反映每一支安打的相對價值;對於攻方而言,一支全壘打並不等於四支一壘安打,而是約當於兩支,但這確實在某種程度上滿足了我們把各種安打區分開的需求,而你也可以看出長打率確實與團隊得分能力有著非常好的相關性。你追求長打,你就能拿到更多分數。(事實上在這個樣本裡,光是每打席平均全壘打數本身與團隊得分的相關係數,就有0.623。即便完全不看球隊所做的其他任何事情,全壘打還是能為團隊貢獻一大塊的得分能力。)

整體攻擊指數的縮寫是OPS,展開就是On-base Plus Slugging,也就是把上壘率加上長打率,是個湊出來的數據。像這樣簡單粗暴地把上壘率與長打率送作堆,就數學論數學其實有不小的問題,但它卻在近年來的棒球圈內,不斷地累積著討論者間的人氣,連帶著媒體報導也愈來愈多,主要是這東西,好像還挺好用的。你可以看到整體攻擊指數與團隊得分能力的相關性左打上壘率,右踢長打率。整體攻擊指數不論是受歡迎的地方,還是有問題的地方,都多到我們得在這本書的後面另外開個房間詳談,但在此它可以先秀一手,讓我們看到打擊率少告訴了我們多少事。如果這些其他的比率都可以提供與團隊得分更好的相關性,而且又都輕輕鬆鬆就可以在個別球員的層次上取得,那打擊率跟它們比起來究竟有什麼競爭力呢?

 

金石堂門市 全家便利商店 ok便利商店 萊爾富便利商店 7-11便利商店
World wide
活動ing