紗耶香的房間① 紗耶香與女高中生小愛
紗:好久不見,小愛。上次碰面是在爺爺家吧?
愛:對啊,那個時候表姊妹都在嘛。
話說回來,紗耶姊,今天怎麼了嗎?
紗:今天……大學的學弟來請教機器學習,我就幫他稍微上了一下課,但不曉得他是不是真的聽懂……
我記得小愛在高中選擇理工組,所以想聽聽妳的看法。
愛:機器學習是指AI嗎?機器的智能,感覺好像很難。
紗:不過,機器學習的本質是根據資料建立數學模型,再由電腦來驅動這個模型唷。這個數學模型的基礎部分,大概高中生應該理解才對。
愛:我是有在天文部編寫過觀測用的程式,數學也是喜歡的科目,只有這些知識能夠理解嗎?
紗:小愛的話,沒問題的。
第一次上課講了迴歸問題,妳能聽聽看嗎?
愛:好吧。我就來聽聽這個困難的東西!
紗耶香的房間② 數學的複習①
紗:小愛到哪邊能夠聽懂?
愛:出現好多向量、矩陣耶。向量是用括號括住一排數字,二維向量是(a,b)、三維向量是(a,b,c),但 維向量我就不太清楚了……
紗: 在4以上後,無法想像該空間,的確會覺得比較難懂。不過,我們不用勉強想像空間,可簡單看作是許多數字排在一塊就行了。
愛:數字縱向排成的列向量有什麼意義嗎?
紗:沒有特別的意義,但這邊在排列複數特徵時,約定俗成會排成縱方向。機器學習會很常遇到矩陣和向量的乘法計算,矩陣從左側乘上列向量時,可用矩陣的積來表示矩陣的合成,相當便利。
愛:高中沒有教矩陣……。譯注
紗:嗯……矩陣可以想成是數字排成四角型。
紗:雖然行列的定義在有些國家相反,但日本數學的定義是橫方向為行、縱方向為列。我是以行列漢字「右半部」兩條線的方向來記憶唷。譯注
愛:原來如此!
紗:舉例來說,行方向有兩個數字、列方向有兩個數字,會稱為2行2列的矩陣。矩陣的加法是相加相同位置的數字,但乘法就比較麻煩了。
紗:相乘後矩陣第 行第 列的數值,是取出前面矩陣的第 行和後面矩陣的第 列,依行列數字出現的先後順序相乘,再把各乘積相加起來求得。
愛:這樣的話,如果前面矩陣的列數和後面矩陣的行數不同,就沒有辦法做乘法。
紗:是的。妳很清楚嘛。事先理解矩陣乘法的定義是 行 列的矩陣乘上 行 列的矩陣,計算結果為 行 列矩陣的話,就能夠輕鬆讀懂式子。
紗:接著,再了解轉置和反矩陣就沒問題了。矩陣 的轉置矩陣記作 ,只是將矩陣的行列對調而已。
愛:可是,在式(1.1)是轉置向量 。
紗:向量可想成是矩陣的特殊情況,比如 維列向量可看作是 行 列的矩陣。
愛:啊,對唷。因為 是 行 列, 會是 行 列,而 是 列 行,所以能夠計算 的乘法,結果為 行 列的矩陣……。
哎! 行 列的矩陣,不就是普通的數字?
紗:是的。普通的數字稱為純量, 是純量、 也是純量,兩者相加起來的 當然也會是純量。
愛:哼嗯哼嗯。
紗:然後,比較複雜的是式(1.8)出現的反矩陣(日文:逆行列)。矩陣 的反矩陣記作 。對了,小愛知道5的倒數(日文:逆數)嗎?
愛:倒數,是乘上該數結果為1的數,所以5的倒數是 嘛。
紗:是的。基本上,反矩陣也是相同的思維。在矩陣世界中,相當於1的矩陣稱為單位矩陣。單位矩陣是行數和列數相同的正方矩陣,一般記作 。矩陣裡面右斜對角線的元素為1,其餘的元素皆為0。
愛:為什麼單位矩陣相當於1呢?
紗:妳隨便找一個正方矩陣乘上單位矩陣看看。
結果是不是沒有改變呢?
愛:對唷。數字1也是任何數字乘上它不改變嘛。
紗: 行 列矩陣 的反矩陣 ,可用下面的計算公式求得。而 行 列的反矩陣,通常會交由電腦來計算。
紗:這邊只要知道反矩陣 從左邊乘上原矩陣 ,會變成單位矩陣 就行了。
紗:還有其他不懂的地方嗎?
愛:這個記號(Σ)。
紗:這是唸作Sigma的希臘文字,表示總和的記號。
可用Σ簡記為 。
愛:還有用向量對函數微分的地方不懂。
紗:嗚。這個……
下次再來說明,妳先把向量當作是普通的變數來微分。
愛:這樣的話就沒有了。我記得權重是用式(1.8)來求嘛。
紗耶香的房間③ 數學的複習②
愛:嗯……51頁的 是什麼?
紗: ?
啊啊,S型函數中出現的 啊。這是自然對數的底數,稱為尤拉數(Euler’s Number)。 是無限循環的無理數。
愛:對數是用來求以某數為底數的幾次方嘛。底數為2的話,就像決策樹的說明,表示該數轉為二進位數時的位數,但為什麼需要以奇怪的 為底數的「自然」對數呢?
紗:這個 具有非常方便的性質,比如微分 後還是 、 的微分會是 等等。實際上,當我們反過來求具有這樣性質的數時,就會使用 唷。
愛:然後,53頁的向量微分。
紗:嗚嗚,不能再矇混過去了啊。那麼,我就認真講吧。
紗:這邊出現的誤差函數 ,如果改變模型的權重 值,最後的數值也會出現變化。誤差函數有複數個權重,所以是多變數函數。然後,將權重的集合表作向量後,誤差函數就是以向量為參數的函數。
愛:嗯。到這邊我還明白。
紗:在這邊會這樣定義函數的向量微分。
是偏微分的記號,意為除了指定的變數之外,其餘皆視為常數來微分。 多讀為round d(在台灣較常唸作partial)。舉例來說, 是指在 的式子中,僅視 為變數來微分。
愛:微分的對象變成向量。
紗:是的。這也稱為梯度向量。
愛:原來如此。單一變數函數的微分表示切線斜率,而多變數函數的微分表示斜面的梯度。
紗:是的。如同54頁的圖,這邊的權重表作斜面上的一點,稍微往斜面梯度的反方向(向斜面下方)移動的話,就會慢慢接近誤差函數的底部。
紗:好久不見,小愛。上次碰面是在爺爺家吧?
愛:對啊,那個時候表姊妹都在嘛。
話說回來,紗耶姊,今天怎麼了嗎?
紗:今天……大學的學弟來請教機器學習,我就幫他稍微上了一下課,但不曉得他是不是真的聽懂……
我記得小愛在高中選擇理工組,所以想聽聽妳的看法。
愛:機器學習是指AI嗎?機器的智能,感覺好像很難。
紗:不過,機器學習的本質是根據資料建立數學模型,再由電腦來驅動這個模型唷。這個數學模型的基礎部分,大概高中生應該理解才對。
愛:我是有在天文部編寫過觀測用的程式,數學也是喜歡的科目,只有這些知識能夠理解嗎?
紗:小愛的話,沒問題的。
第一次上課講了迴歸問題,妳能聽聽看嗎?
愛:好吧。我就來聽聽這個困難的東西!
紗耶香的房間② 數學的複習①
紗:小愛到哪邊能夠聽懂?
愛:出現好多向量、矩陣耶。向量是用括號括住一排數字,二維向量是(a,b)、三維向量是(a,b,c),但 維向量我就不太清楚了……
紗: 在4以上後,無法想像該空間,的確會覺得比較難懂。不過,我們不用勉強想像空間,可簡單看作是許多數字排在一塊就行了。
愛:數字縱向排成的列向量有什麼意義嗎?
紗:沒有特別的意義,但這邊在排列複數特徵時,約定俗成會排成縱方向。機器學習會很常遇到矩陣和向量的乘法計算,矩陣從左側乘上列向量時,可用矩陣的積來表示矩陣的合成,相當便利。
愛:高中沒有教矩陣……。譯注
紗:嗯……矩陣可以想成是數字排成四角型。
紗:雖然行列的定義在有些國家相反,但日本數學的定義是橫方向為行、縱方向為列。我是以行列漢字「右半部」兩條線的方向來記憶唷。譯注
愛:原來如此!
紗:舉例來說,行方向有兩個數字、列方向有兩個數字,會稱為2行2列的矩陣。矩陣的加法是相加相同位置的數字,但乘法就比較麻煩了。
紗:相乘後矩陣第 行第 列的數值,是取出前面矩陣的第 行和後面矩陣的第 列,依行列數字出現的先後順序相乘,再把各乘積相加起來求得。
愛:這樣的話,如果前面矩陣的列數和後面矩陣的行數不同,就沒有辦法做乘法。
紗:是的。妳很清楚嘛。事先理解矩陣乘法的定義是 行 列的矩陣乘上 行 列的矩陣,計算結果為 行 列矩陣的話,就能夠輕鬆讀懂式子。
紗:接著,再了解轉置和反矩陣就沒問題了。矩陣 的轉置矩陣記作 ,只是將矩陣的行列對調而已。
愛:可是,在式(1.1)是轉置向量 。
紗:向量可想成是矩陣的特殊情況,比如 維列向量可看作是 行 列的矩陣。
愛:啊,對唷。因為 是 行 列, 會是 行 列,而 是 列 行,所以能夠計算 的乘法,結果為 行 列的矩陣……。
哎! 行 列的矩陣,不就是普通的數字?
紗:是的。普通的數字稱為純量, 是純量、 也是純量,兩者相加起來的 當然也會是純量。
愛:哼嗯哼嗯。
紗:然後,比較複雜的是式(1.8)出現的反矩陣(日文:逆行列)。矩陣 的反矩陣記作 。對了,小愛知道5的倒數(日文:逆數)嗎?
愛:倒數,是乘上該數結果為1的數,所以5的倒數是 嘛。
紗:是的。基本上,反矩陣也是相同的思維。在矩陣世界中,相當於1的矩陣稱為單位矩陣。單位矩陣是行數和列數相同的正方矩陣,一般記作 。矩陣裡面右斜對角線的元素為1,其餘的元素皆為0。
愛:為什麼單位矩陣相當於1呢?
紗:妳隨便找一個正方矩陣乘上單位矩陣看看。
結果是不是沒有改變呢?
愛:對唷。數字1也是任何數字乘上它不改變嘛。
紗: 行 列矩陣 的反矩陣 ,可用下面的計算公式求得。而 行 列的反矩陣,通常會交由電腦來計算。
紗:這邊只要知道反矩陣 從左邊乘上原矩陣 ,會變成單位矩陣 就行了。
紗:還有其他不懂的地方嗎?
愛:這個記號(Σ)。
紗:這是唸作Sigma的希臘文字,表示總和的記號。
可用Σ簡記為 。
愛:還有用向量對函數微分的地方不懂。
紗:嗚。這個……
下次再來說明,妳先把向量當作是普通的變數來微分。
愛:這樣的話就沒有了。我記得權重是用式(1.8)來求嘛。
紗耶香的房間③ 數學的複習②
愛:嗯……51頁的 是什麼?
紗: ?
啊啊,S型函數中出現的 啊。這是自然對數的底數,稱為尤拉數(Euler’s Number)。 是無限循環的無理數。
愛:對數是用來求以某數為底數的幾次方嘛。底數為2的話,就像決策樹的說明,表示該數轉為二進位數時的位數,但為什麼需要以奇怪的 為底數的「自然」對數呢?
紗:這個 具有非常方便的性質,比如微分 後還是 、 的微分會是 等等。實際上,當我們反過來求具有這樣性質的數時,就會使用 唷。
愛:然後,53頁的向量微分。
紗:嗚嗚,不能再矇混過去了啊。那麼,我就認真講吧。
紗:這邊出現的誤差函數 ,如果改變模型的權重 值,最後的數值也會出現變化。誤差函數有複數個權重,所以是多變數函數。然後,將權重的集合表作向量後,誤差函數就是以向量為參數的函數。
愛:嗯。到這邊我還明白。
紗:在這邊會這樣定義函數的向量微分。
是偏微分的記號,意為除了指定的變數之外,其餘皆視為常數來微分。 多讀為round d(在台灣較常唸作partial)。舉例來說, 是指在 的式子中,僅視 為變數來微分。
愛:微分的對象變成向量。
紗:是的。這也稱為梯度向量。
愛:原來如此。單一變數函數的微分表示切線斜率,而多變數函數的微分表示斜面的梯度。
紗:是的。如同54頁的圖,這邊的權重表作斜面上的一點,稍微往斜面梯度的反方向(向斜面下方)移動的話,就會慢慢接近誤差函數的底部。