1-1 環境統計學
現代的人,不管在日常生活或專業領域上,都會用到統計學。例如每次選舉都有預測候選人的得票率與誤差,因此從小學、國中到高中的數學課都有統計學的教材, 進入大學的工程與環境領域裏,很多決策是靠經驗法則來決定的,經驗法則就靠統計。一個工程師規劃工程容量的過程,必須先估計未來使用量,再收集相關資料做統計分析,建立預測模式後預估未來需要量,再決定工程容量。下面舉一個環工問題,說明統計決策的過程。
1. 待決問題:河川涵容能力。
水污染法規定:河水水質低於水質標準時必須實施污染「總量管制」,但排入河段的總量不能超過河川的「涵容能力」,所以實施總量管制必須先求涵容能力。涵容能力又靠流量模式和水質模式的演算求解,所以先假設流量和水質模式,而兩個模式有關的因子,如河川流量、流速、水溫和水質等,是決定這項工作的因子, 除了靠水污染專業知識外,也需要具備統計觀念。
2. 資料收集與整理:上網收集或現場調查這些因子的資料,經過整理、分類和儲存; 有些資料可能缺漏或不足,需要修正或補遺。
3. 資料分析:通常會收集到很多資料,不容易看出資料的特性,可以畫成各種圖形、求各種統計量和分佈情形等,這些工作屬於統計學裡敘述統計;有時也需要建立水質與流量之關係,這個工作屬於相關和迴歸分析;再來需要選擇適當的流量模式推估低流量發生的頻率;此外,水質模式大部分採用確立模式,是質量不減原理推導出來的。但不管是流量模式或水質模式選擇完後,模式裡有很多參數,須經過檢定與驗證,這些工作都靠統計分析。
4. 決策:環保人員再依據模式求「涵容能力」和「容許排入河川的污染量」,再進一步管制污染源的污染量。最後的「決策」再由水污染專家決定。
上面流程,第2、3屬於統計領域,第1、4屬於環境專業但也需要統計觀念, 才能做出最好的決策。從圖1.1 之流程可了解統計學是一門收集過去的資料加以整理,然後做統計分析所得到結果做決策之用。
1-2 統計在大數據時代的地位
現在已經進入大數據時代,以計算機及其軟體為工具,應用於數學與統計之原理與方法,分析大量數據,建立模型(式) 預測未來,供決策之用。大數據科學家、工程師或分析師,應具備下面知識:對比分析法、分組分析法、交叉分析法、結構分析法、漏斗圖分析法、綜合評價分析法、因素分析法、矩陣關聯分析法、相關分析法、迴歸分析法、聚類分析法、判別分析法、主成分分析法、因子分析法、對應分析法、時間序列等,其中統計學是最基本的知識。而本書所涉及的是屬於初等統計學,內容包括數據整理與分析、敘述統計、相關與迴歸分析以及時間數列分析。
現代的人,不管在日常生活或專業領域上,都會用到統計學。例如每次選舉都有預測候選人的得票率與誤差,因此從小學、國中到高中的數學課都有統計學的教材, 進入大學的工程與環境領域裏,很多決策是靠經驗法則來決定的,經驗法則就靠統計。一個工程師規劃工程容量的過程,必須先估計未來使用量,再收集相關資料做統計分析,建立預測模式後預估未來需要量,再決定工程容量。下面舉一個環工問題,說明統計決策的過程。
1. 待決問題:河川涵容能力。
水污染法規定:河水水質低於水質標準時必須實施污染「總量管制」,但排入河段的總量不能超過河川的「涵容能力」,所以實施總量管制必須先求涵容能力。涵容能力又靠流量模式和水質模式的演算求解,所以先假設流量和水質模式,而兩個模式有關的因子,如河川流量、流速、水溫和水質等,是決定這項工作的因子, 除了靠水污染專業知識外,也需要具備統計觀念。
2. 資料收集與整理:上網收集或現場調查這些因子的資料,經過整理、分類和儲存; 有些資料可能缺漏或不足,需要修正或補遺。
3. 資料分析:通常會收集到很多資料,不容易看出資料的特性,可以畫成各種圖形、求各種統計量和分佈情形等,這些工作屬於統計學裡敘述統計;有時也需要建立水質與流量之關係,這個工作屬於相關和迴歸分析;再來需要選擇適當的流量模式推估低流量發生的頻率;此外,水質模式大部分採用確立模式,是質量不減原理推導出來的。但不管是流量模式或水質模式選擇完後,模式裡有很多參數,須經過檢定與驗證,這些工作都靠統計分析。
4. 決策:環保人員再依據模式求「涵容能力」和「容許排入河川的污染量」,再進一步管制污染源的污染量。最後的「決策」再由水污染專家決定。
上面流程,第2、3屬於統計領域,第1、4屬於環境專業但也需要統計觀念, 才能做出最好的決策。從圖1.1 之流程可了解統計學是一門收集過去的資料加以整理,然後做統計分析所得到結果做決策之用。
1-2 統計在大數據時代的地位
現在已經進入大數據時代,以計算機及其軟體為工具,應用於數學與統計之原理與方法,分析大量數據,建立模型(式) 預測未來,供決策之用。大數據科學家、工程師或分析師,應具備下面知識:對比分析法、分組分析法、交叉分析法、結構分析法、漏斗圖分析法、綜合評價分析法、因素分析法、矩陣關聯分析法、相關分析法、迴歸分析法、聚類分析法、判別分析法、主成分分析法、因子分析法、對應分析法、時間序列等,其中統計學是最基本的知識。而本書所涉及的是屬於初等統計學,內容包括數據整理與分析、敘述統計、相關與迴歸分析以及時間數列分析。