3.2 標準差的說明-平均值、變異數、標準差的細節-
前面的漫畫雖然說明了標準差的概要,但標準差實在太重要,所以要用文章再說明一次。教了很久的統計之後,我發現不擅長統計的人,似乎一遇到公式或是計算,就大喊「我不懂啦!」然後想避開。
但其實只要先學會平均值、變異數、標準差這三個概念,後續的分析就簡單得多。標準差是變異數的平方根,所以基本上只須要了解平均值與標準差即可。
筆者覺得,一開始就從算式、公式說明統計,會嚇跑不擅長數學的學生,所以才希望學習者能自己動手操作Excel,體會統計的意義,克服認為自己不擅長統計的想法。
如果面對的是連續尺度的變數,標準差就是相當重要的指標。只要了解這點,就能相對輕鬆地了解平均值的比較。本書介紹了了解平方根的讀者,一定能輕鬆算出標準差的方法,還請大家務必掌握這個方法。一開始先解說四個重要的用語。
① 平均值:就是加總目標資料再除以資料的個數。
② 離差:這是各測量值與平均值的差距,有些是正數,有些是負數。可以直接當成與「平均的差距」。
③ 變異數:用來描述資料分散程度的名詞。雖然有點複雜,但可以透過下列三個步驟算出。
1. 算出各筆資料的離差的平方。
2. 加總所有算出來的平方。也稱為離差平方和。
3. 以資料筆數除以剛剛算出的總和,求出某種平均值(離差平方和的平均值)。這就是所謂的變異數。後續提到的不偏變異數則是基於各種條件改以(n-1)的值除以離差平方和。
④ 標準差:變異數開根號的結果。標準差越大,代表每個值越分散,也代表每個值的離差更大。
前面的漫畫雖然說明了標準差的概要,但標準差實在太重要,所以要用文章再說明一次。教了很久的統計之後,我發現不擅長統計的人,似乎一遇到公式或是計算,就大喊「我不懂啦!」然後想避開。
但其實只要先學會平均值、變異數、標準差這三個概念,後續的分析就簡單得多。標準差是變異數的平方根,所以基本上只須要了解平均值與標準差即可。
筆者覺得,一開始就從算式、公式說明統計,會嚇跑不擅長數學的學生,所以才希望學習者能自己動手操作Excel,體會統計的意義,克服認為自己不擅長統計的想法。
如果面對的是連續尺度的變數,標準差就是相當重要的指標。只要了解這點,就能相對輕鬆地了解平均值的比較。本書介紹了了解平方根的讀者,一定能輕鬆算出標準差的方法,還請大家務必掌握這個方法。一開始先解說四個重要的用語。
① 平均值:就是加總目標資料再除以資料的個數。
② 離差:這是各測量值與平均值的差距,有些是正數,有些是負數。可以直接當成與「平均的差距」。
③ 變異數:用來描述資料分散程度的名詞。雖然有點複雜,但可以透過下列三個步驟算出。
1. 算出各筆資料的離差的平方。
2. 加總所有算出來的平方。也稱為離差平方和。
3. 以資料筆數除以剛剛算出的總和,求出某種平均值(離差平方和的平均值)。這就是所謂的變異數。後續提到的不偏變異數則是基於各種條件改以(n-1)的值除以離差平方和。
④ 標準差:變異數開根號的結果。標準差越大,代表每個值越分散,也代表每個值的離差更大。