好書試閱

◎分析必須符合目的,否則再厲害都沒意義

整理以假設為前題的思考模式優點:

(1)省略不必要的分析

如果一開始就想好「該調查哪些資料」,就會知道需要什麼樣的資料、該如何取得資料,並減少摸索的時間。同時也能省略修正、無謂的分析等步驟,縮短作業時間。如此一來,就能利用多餘的時間進行多面相的分析,完成更加精準(品質更優)的報告。

(2)確認分析目的

即便是多麼明確與精準的分析結果,如果不符合目的,將毫無意義。被一堆數字包圍,終日埋頭於分析作業,等回過神時,才發現根本忘了「因為想知道什麼而調查」的原始目的,只是一味追求分析結果而已。不知在什麼時候,已忘了「分析目的」是什麼。

假設要找出營業額變少的原因,辛苦調查某商品的銷售資料,發現三十歲世代男性消費者,與二十歲世代女性消費者的消費行為趨勢類似。如果以此為依據進行分析,搞不好會出現好結果,可是對於當初所設定「找出營業額減少原因」的目的,將成效不彰。

(3)從大局著想,利於制定論述

假設也可以說是為了達到目的所使用的手段。譬如,以「調查營業額下滑原因」為目的時,可以透過假設,針對商品、店鋪、整個市場等幾個線索(觀點)架構假設理論。將多項假設的分析結果予以組合,就能針對目的提出多面相、多方位的觀點,導出更具說服力的答案(論述)。

•2個重點,做出完美假設

看似完美的假設方法,也有必須注意的重點:

(1)錯失課題的風險

假設方法的第一步是設定目的或課題。換句話說,如果是相同的資料,當其中隱藏著更重要或更有利的情報時,可能會在最初階段就忘了要成立假設,因而沒找出其他重要的情報。

「假設方法」與「網羅方法」是對立的概念。網羅方法不會限定目的或課題,而是從片面,開始針對蒐集到的情報進行網羅式分析。相較於假設方法,需要花費更多時間與心力,但是能意外發現答案的可能性更高。

假設方法的焦點只鎖定於與目的有關的事物(只是假設的理論),這些事物就是分析範圍。因為方向明確,很可能會有錯過遺落於路邊的寶貴情報之風險。

(2)偏差風險

假設不過是檢證前的「想法念頭」而已。這樣的假設多少會夾雜個人的主觀想法,難免會有受到當事者成見或偏見所影響的風險。
譬如,現在要找出營業額下滑的原因,如果只針對商品問題或賣場問題等,只限「自家公司」問題範圍設立假設,而忽略了競爭商品的影響及整個產業動向,可能會遺漏了根本重點。

如圖0-2所示,就算已經學會好幾項分析技巧,如果在前面階段的假設失敗,蒐集到的資料及分析方法都會變成不適合(有時候會變成錯誤資料),最後變成最差勁的報告(圖0-2的「結果說明」部分),品質大幅降低。

尤其分析者對自己的假設有強烈成見或過度自信時,分析結果會有所偏頗,變成只是為了「證明該假設是正確」而分析。也就是說,完全無視於資料不適合該假設的現實。如果沒有找出符合假設的結論,就會一再分析、舉例,結果卻告訴你,資料蒐集的方向根本是錯的。

更糟糕的狀況是,本人完全沒有察覺方向已經偏頗。這是容易犯錯的陷阱之一,心理學稱為「確認偏誤」。

不過,如果能知道確認偏誤的存在,提醒自己養成自我檢視的習慣,就能避免這項風險。從資料蒐集階段到分析階段、結論成立的最後階段,都可能發生確認偏誤,所以一定要養成經常檢視的習慣。

◎資料蒐集重點④

出現「離群值」,不代表錯誤結果

所有數據當中,有一個擁有異常數值,明顯與其他數據不同的數據點,稱為「離群值」(outlier)(如圖1-9)。

一個離群值會因它的異常方式,對分析結果造成巨大影響。有時候會讓你得不到原本想要的結果,所以不能輕忽離群值的影響力。

譬如,現在要算出在某日、某個時段藥妝店來客數五十人的平均營業額,結果算出的數字是2,640日圓。假設在同一時段,只有一人的消費額是20,000日圓。結果因為這個人,讓平均營業額變成3,040日圓。比較兩者結果,一人平均消費額有了400日圓的差距。

如果只問結果,一人平均消費額的數據可能會有400日圓的差距(風險)。這純粹是一名特定顧客造成的影響,如果拿這個結果去捕捉其他顧客的消費行為特徵,一定會得到錯誤的訊息。

不過也要牢記這一點:「出現離群值,不見得就是錯誤的結果。」分析作業時最重要的就是知道「離群值是存在的」這件事。如果沒有任何正當理由,卻出現離群值的話,在分析資料前,必須把出現離群值的資料移除。
•視覺化資料,就不易錯過離群值

雖然也可以透過資料數尋找離群值,可是若只是瀏覽原始資料,有時候會錯過離群值的存在。最好將資料製成分布圖之類的曲線圖,予以視覺化,才能有效率地找出離群值。關於不自然的偏離部分,要確認其之所以存在的理由。

舉之前的藥妝店為例,將資料圖表化後,注意到突出點。假設將焦點鎖定在兩萬日圓的購買者,調查了這個人的購買物品內容,假設其購買的商品是好幾年才賣出一個的,售價兩萬日圓的健康器材。而我們的目的是「推算一般的平均購買額度」,如此一來,便無從判斷這樣的資料是否妥當。

重複分析好幾次,卻仍然得不到想要的結果時,就代表有被遺漏的離群值在擾亂結果。通常這時候才會察覺到離群值的存在。不過只要有意識可能會有「離群值」存在,就很容易找到離群值。

此外,關於離群值還有一件事務必要提高警覺:絕對不能為了得到「更完美」的分析結果,無條件地或有意圖地將離群值排外(實際上這樣的誘惑比想像中大)。

◎風險有多大?離散程度會告訴你

標準差和標準化係數都不是只要算出數字是多少就好,要用於實務上,才能成為真正有價值的情報(在解說統計學時,常常只是算出指標數據就結束了,不會想該如何運用於實務上)。

那麼讓我們從風險觀念,挑戰以下兩種應用方法。

(1)相對評價:比較其他資料,看哪一方風險大

與其他資料的離差做比較,進行「大」、「小」的「相對性」評價。如果要以商業語言解釋離差,「風險」二字是最恰當的解釋,可以說「離差大=高風險」。

一般說來,風險二字常被視為負面字彙,因此多數人總認為風險低比較好。可是在商業領域裡,風險不是只有負面涵義,也有正面意義(因為「離差」是正負兩邊都有)。也會有高風險、高報酬的時候,所以風險未必是不好的象徵。

(2)風險衝擊程度的推估:將可能會發生的離差影響予以數據化

推估離差會造成什麼樣的影響?譬如,透過售價的離散狀況,能計算總營業額會出現什麼樣的差異。

首先,使用A先生的例子,進行相對評價。

圖3-10是競爭對手在B國賣出五百臺旋風吸塵器的售價實錄資料,依據這份資料算出平均售價及標準差。使用先前介紹的STDEV函數(81頁),輕鬆算出標準差8,937日圓,平均數依舊是42,948日圓。

因為自家公司產品沒有進入B國市場銷售,A先生想使用,有銷售自家公司旋風式吸塵器產品的D國資料。因為是以D國資料取代B國資料,為了安全起見,至少必須事前確認售價是一樣,而且風險相近。

因此,也一樣準備了其他競爭公司在D國的同期銷售業績資料,總共五百份,得出如下一頁圖3-11的結果。雖然這是概略的競爭企業售價資料,但至少看不出來兩國之間的售價有太大的差異,而且風險也相近,沒有太大的落差。

如果認為這個結論自家公司也適用,A先生就可以稍微安心地使用自家公司所蒐集到的D國資料。假設B國與D國的平均售價一樣,如果標準差(=售價的離差)有明顯差距,表示這兩個市場的風險性大不相同,一方的市場資料就無法適用於另一方。

•定量化離散程度,模擬最壞狀況

到目前為止,都是使用標準差計算離差,雖然標準差是離差的指標,但也必須清楚瞭解這個結果對於業務會造成多大的影響。就經營者立場來看,要知道最糟的狀況是賠一百萬日圓,還是一億日圓。如果不知道影響有多大,就無法判斷風險狀況。

因此,如果要知道標準差對離差造成多大影響,一定要予以定量化。所以,如果能掌握離散範圍,就可以合理假設最壞的狀況與平均狀況,並且進行模擬。作法就是下一個直方圖單元的風險評估第二項應用:(2)風險衝擊程度推估。

◎相關係數:決定資料的強弱關聯

那麼,試著具體分析「相關性」吧!說的更嚴謹一點,兩項資料的相關性,指的就是比例關係。請各位回想國中的數學,如果以公式表示,資料X與資料Y的比例關係就是Y=aX+b(a、b是常數)。資料X和資料Y的關係會因為常數a正數或負數而有所不同。如果常數a是正數,當X增加,Y也會增加;當a是負數時,X增加,Y就會減少。相關性程度有強與弱。強弱程度是以當一方的資料到達什麼程度時,會連帶影響其他資料的動向來決定。資料之間的相關性強弱度,是以名為「相關係數」的指標來表示。相關係數會因相關性的強弱程度,和兩項資料的增減方向相同或相反,數值介於-1至+1之間。如果相關係數是正數,就表示是正的相關性(兩項資料的增減方向相同),數值愈接近1,相關性愈強。+1的話,就是完全比例關係;如果是0,表示完全沒有相關性(請見圖4-3)。

相反地,當兩項資料的增減方向相反,呈現負數相關性,就是負數的相關係數,數值愈接近-1,負向相關性愈強。

•相關程度無關數值大小

舉個具體例子。假設每週記錄某間小兒科診所在流感盛行期間的平均等待看診時間。等待看診時間應該會隨季節或疾病的流行而有所變動(當然與星期幾和時間也有關係)。

另一方面,政府機構會發表流感的盛行情況,盛行情況與小兒科的等待看診時間有一定的關聯性。雖然未必是完全的比例關係,但如果有「某方增加(減少),另一方也隨之增加(減少)」的關係,(正數)相關性便成立。如果計算這個例子的相關係數,數值應該是在0以上、1以下(可能更接近1)吧。

相關分析不在意兩項資料的單位或數值大小的差異,就像這個例子,任何方式的資料組合都是可行的,因為只會顯示數據比例關係的強弱程度而已。我認為這就是相關分析的魅力,其應用範圍無限寬廣。因為只要準備兩項資料,就理論而言,不管如何組合都可以進行相關分析。
金石堂門市 全家便利商店 ok便利商店 萊爾富便利商店 7-11便利商店
World wide
活動ing