摘自第一章「橫空出世—暗知識的發現」
正當人類自以為掌握了關於這個世界的海量知識時,一種能夠自我學習的機器給了我們當頭一棒:機器發現了一類人類既無法感受,也不能理解的知識。這類知識的發現,逼迫我們重新審視過去所有關於知識的觀念。我們回顧了2500 年來在這個問題上的爭論:知識是通過經驗得到的還是通過推理得到的? 直到大約70 年前人們才注意到那些「只可意會,不可言傳」的默知識的重要性。但這些爭論在最新的腦科學研究結果面前都顯得膚淺和蒼白。最近幾十年的科學研究確認了認知的基礎是大腦神經元之間的連接。有了這個基礎,我們就很容易理解為什麼有些知識無法表達,也才能明白為什麼人類無法理解機器剛剛發現的這些暗知識。在此基礎上,我們終於可以清晰地區分這樣三類知識:人類能掌握的明知識和默知識以及只有機器才能掌握的暗知識。
驕傲的人類
也許是由於幾十萬年前人類遠古祖先某個基因的突變,人們開始可以把一些有固定意思的發音片段組裝成一個能表達更複雜意思的發音序列。這些發音片段今天我們叫作「單詞」,這個表達特定內容的發音序列今天我們叫作「句子」。這種「組裝」能力使人類用有限的單詞可以表達幾乎無窮多種意思,語言誕生了。有了語言的複雜表達能力,人類的協作能力開始迅速提高,可以幾十人一起圍獵大型動物,很快人類就上升到地球生物鏈的頂端。作為記錄語言的符號文字的發明可以讓人類更方便地傳播、記錄和積累經驗。任何一個地方的人類偶然發現的關於生存的知識都會慢慢傳播開來。一萬年前,農業起源於今天的埃及、敘利亞和伊拉克的肥沃新月帶,這些種植經驗在幾千年中傳遍全世界,隨之而來的是人類迅速在地球所有適宜農耕的角落定居繁衍。
隨著定居的人類數量的增加,人類的組織開始變得更大更複雜,從親緣家族到部落,到城邦,再到國家。大規模的複雜組織可以開展大規模的複雜工程,如建設城市、廟宇和大規模灌溉系統。這些大規模工程需要更多的天文和數學知識。世界上幾乎所有的古老文明都積累了許多天文知識,但只在希臘半島誕生了現代科學的奠基石數學。歐幾里得(Euclid,西元前330 ∼前275)在西元前300年總結了他前面100 年中希臘先哲的數學成果,寫出了人類歷史上最偉大的書之一《幾何原本》(Elements)。這本書在中世紀由波斯裔的伊斯蘭學者翻譯成阿拉伯文,又從阿拉伯傳回文藝復興前的歐洲,直接影響了從哥白尼(Nicolaus Copernicus, 1473~1543) 到牛頓(Isaac Newton, 1643~1727)的科學革命。
發軔於16 世紀的科學革命的本質是什麼? 是發現更多的知識嗎? 是創造出更多的工具嗎? 都不是。科學革命的本質是找到了一個可靠的驗證知識的方法。最能體現科學革命本質的就是天文學家開普勒(Johannes Kepler, 1571~1630)發現三定律的過程。最初,在作為主流的托勒密(Ptolemy, 90~168)地心說越來越無法解釋天體觀測數據時,哥白尼提出了日心說,用新的模型解釋了大部分過去無法解釋的資料。與伽利略(Galileo Galilei, 1564~1642)同時代的天文學家第谷.布拉赫(Tycho Brahe, 1546~1601)沒有接受哥白尼的日心說,他提出了「月亮和行星繞著太陽轉,太陽帶著它們繞地球轉」的「日心—地不動」說。遺憾的是,他傾盡畢生心血觀察了20年的天文資料,直到去世都始終無法讓觀測到的資料與自己的模型相吻合。
在第谷去世後,第谷的助手開普勒拿到了他的全部資料,開普勒完全接受了哥白尼的日心說。他為了讓資料與日心說完全吻合,把哥白尼的地球公轉的圓形軌道修正為橢圓軌道,太陽在橢圓的一個焦點上。這就是開普勒第一定律。他用相同的方法發現了其他兩個定律。開普勒三定_律不僅完滿解釋了第谷的所有觀測資料,並且能夠解釋任何新觀測到的資料。這個發現過程有三個步驟:
第一,積累足夠的觀測資料(第谷20 年的觀測資料);
第二,提出一個先驗的世界模型(哥白尼的日心說);
第三,調整模型的參數直至能夠完美擬合已有的資料及新增資料(把圓周軌道調整為橢圓軌道,再調整橢圓軸距以擬合數據)。
驗證了這個模型有什麼用? 最大的用處就是可以解釋新的資料或做出預測。在這裡開普勒三定律就是新發現的知識。發現知識的可靠方法就是不斷修改模型使模型與觀測資料完全吻合。
上面這三個步驟奠定了現代科學的基本原則,正式吹響了科學革命的號角,直接導致了後來的牛頓萬有引力的發現,一直影響到今天。
過去500 年中人類對世界的認識突飛猛進,今天大到宇宙,小到夸克(夸克是一種基本粒子,也是構成物質的基本單位)都似乎盡在人類的掌握之中。人類可以上天、入地、下海,似乎無所不能。人類有了「千里眼」「順風耳」,甚至開始像「上帝」一樣設計新的物種,並企圖改變人類進化的進程。人類有理由相信沒有什麼知識是不能理解的,也沒有什麼知識是不能被發現的……直到2016 年3 月15 日。
天才的哽咽
2016 年3 月15 日, 美國谷歌公司的圍棋對弈程式Alpha Go 以五局四勝的成績戰勝世界圍棋冠軍韓國選手李世石。一時間這個消息轟動世界,全世界有28 億人在關注這場比賽,在中國更是引起極大的轟動。人們感覺AlphaGo 就像從石頭縫裡蹦出來的孫悟空一樣,完全無法理解一台機器如何能夠打敗世界圍棋冠軍。圍棋歷來被認為是人類最複雜的遊戲之一。圍棋每一步的可能的走法大約有250 種,下完一盤棋平均要走150 步,這樣可能的走法有250150=10360 種,而宇宙從誕生到現在才1017 秒,即使是現在世界上最快的超級電腦,要想把所有走法走一遍,計算時間也要比宇宙年齡都長。即使排除了大部分不可能的走法也是大到無法計算。機器是怎樣學會這麼複雜的棋藝的?
這場比賽後,世界排名第一的棋手柯潔在網上說:「AlphaGo 勝得了李世石,勝不了我」。而2017 年5 月28日,棋手柯潔以0:3 完敗AlphaGo,徹底擊碎了人類在這種複雜遊戲中的尊嚴。賽後,這位天才少年一度哽咽,在接受採訪時柯潔感歎,AlphaGo 太完美,看不到任何勝利的希望。他流著眼淚說:「我們人類下了2000 年圍棋,連門都沒入」。中國棋聖聶衛平更是把AlphaGo 尊稱為「阿老師」,他說:「AlphaGo 的著數讓我看得如醉如癡,圍棋是何等的深奧和神秘。AlphaGo 走的順序、時機掌握得非常好。它這個水準完全超越了人類,跟它挑戰下棋,只能是找死。我們應該讓阿老師來教我們下棋」。他還說:「阿老師至少是20 段,簡直是圍棋上帝」。
當人們以為這是對弈類程式的高峰時,AlphaGo 的研發團隊Deep Mind(谷歌收購的人工智慧企業,位於倫敦)團隊再度打破了人類的認知。2017 年12 月,Deep Mind 團隊發佈了AlphaGo Zero。AlphaGo Zero 使用了一種叫作「強化學習」的機器學習技術,它只使用了圍棋的基本規則,沒有使用人類的任何棋譜經驗,從零開始通過自我對弈,不斷地迭代升級,僅僅自我對弈3 天后,AlphaGo Zero 就以100:0 完勝了此前擊敗世界冠軍李世石的AlphaGo Lee版本。自我對弈40 天後,AlphaGo Zero 變得更為強大,超過了此前擊敗當今圍棋第一人柯潔的AlphaGo Master(大師版),這台機器和訓練程式可以橫掃其他棋類。經過4 個小時的訓練,打敗了最強國際象棋AI Stockfish,2 個小時打敗了最強將棋(又稱為日本象棋)AI Elmo。
AlphaGo Zero 證明了即使在最具有挑戰性的某些領域,沒有人類以往的經驗或指導,不提供基本規則以外的任何領域的知識,僅使用強化學習,僅花費很少的訓練時間機器就能夠遠遠超越人類的水準。
機器發現了人類無法理解的知識
AlphaGo Zero 給我們的震撼在於人類2000 多年來一代代人積累的一項技藝在機器眼裡瞬間變得一文不值! 為什麼會這樣? 圍棋中的可能走法比宇宙中的原子數都多,而人類2000 多年中高水準對弈非常有限,留下記錄的只有幾萬盤。這個數字和所有可能走法比,就像太平洋裡的一個水分子。而AlphaGo Zero 以強大的計算能力,在很短的時間裡探索了大量的人類未曾探索過的走法。人類下棋的路徑依賴性很強,人生有限,想成為高手最穩妥的辦法是研究前人的殘局,而不是自己瞎摸索。但AlphaGo Zero 在下棋時,不僅一開始的決策是隨機的,即使到了大師級後,也故意隨機挑選一些決策,跳出當前思路去探索更好的走法,新發現的許多制勝走法都是人類從未探索過的,這就是很多走法讓聶衛平大呼「看不懂」的原因。
AlphaGo Zero 給我們的震撼在於三個方面:首先,人類能發現的知識和機器能發現的知識相比,就像幾個小腳老太太走過的山路和幾百萬輛越野車開過的山路。越野車的速度就是電腦和AI 晶片處理速度,目前繼續以指數速度在提高。其次,和機器可能發現的知識相比,人類知識太簡單、太幼稚,機器談笑風生,比人不知道高到哪裡去了。最後,機器發現的知識不僅完全超出了人類的經驗,也超出了人類的理性,成為人類完全無法理解的知識。
2500 年前最有智慧的希臘哲人蘇格拉底(Socrates, 西元前469~ 前399)終其一生得出一個結論:「我唯一知道的是我什麼都不知道」。他的學生柏拉圖(Plato,西元前427 ∼前347)認為我們感官觀察到的世界只是真正世界的影子而已。18 世紀偉大的哲學家康德也仰望星空,發出了「我們到底能知道什麼」的千古之問。但古代哲人只能模糊地感覺到人類認識的局限。今天,AlphaGo Zero 不僅清晰、具體地把他們的疑慮變成了鐵的事實,而且先哲怎麼也想不到人類的認識能力是如此有限!