好書試閱

1.駕馭 AI,謀其利而遠其害

  聊天機器人 ChatGPT-3 在二○二二年底上線後,五天內就突破百萬用戶,兩個月內經常性用戶就達到一億,成為全球最矚目的話題。緊接著,ChatGPT-4 在二○二三年的一項律師考題測試中打敗 90%的應考者,並且在美國大學入學測驗 SAT 中以一三○○分的成績打敗 91%考生,一副即將取代人類無數工作的姿態。有鑑於人工智慧對於科技的發展與人類社會潛在的龐大貢獻,二○二四年的諾貝爾物理獎和化學獎都授予對人工智慧有重大貢獻的專家、學者。在二○二五年的一場會議中,三位諾貝爾化學獎得主和三位中青代的頂尖化學家一致同意,人工智慧與機械學習將會在未來大幅加速新藥物與新材料的開發。
  然而聊天機器人對使用者的負面影響也開始浮上媒體版面。美國一位十四歲少年因為聊天機器人的誤導而在二○二四年自殺(參見第 3 章與第 8 章),也有研究發現聊天機器人所給的錯誤資訊有 77%會混入使用者的記憶 [注 1-1]。聊天機器人還會不時出現「幻覺」,以極端自信的口吻輸出捏造的事實,使人分不清楚它何時可信,何時不可信。然而不信邪的大學生與研究生照樣用它寫報告和學位論文,因而被以「抄襲」為由取消獎學金和口試資格。
  科技通常是可以載舟也可以覆舟,沒有必然的利與弊,端視使用者是否有駕馭它所需要的知識、能力和態度。
  根據《自然》雜誌二○二三年的一篇報導,雖然有很多軟體工程師用聊天機器人寫程式而大幅提升工作效率,然而他們都是資深工程師,可以輕易地從聊天機器人撰寫的程式中找出錯誤並予以訂正。反之,如果沒有能力識別聊天機器人產出程式的良窳和錯誤,就會誤信聊天機器人而貽誤自己和社會。譬如,全球著名的軟體技術問答平台 Stack Overflow 就曾在二○二三年一度禁止張貼聊天機器人所產出的所有程式,因為其中含有太多錯誤的程式碼。其次,雖然有學者宣稱聊天機器人已經是他們撰寫論文時不可或缺的幫手,然而他們也都有能力潤飾聊天機器人產出的論文,訂正其中錯誤,修正含糊、不精準之處,使它吻合學術界的嚴格要求。反之,假如沒有能力訂正聊天機器人所產出的報告或論文,就會「未蒙其利,先受其害」[注 1-2]。
  即便到了二○二五年,一份研究顯示聊天機器人產出的程式碼需要人工的偵錯與修改,而偵錯與訂正所花的時間有時候還超過完成初稿時所省下來的時間,最終得不償失 [注 1-3]。同樣是在二○二五年發表的一項大型研究也獲得類似的結論(詳見第 4 章),使得矽谷想要「在二○二五年底前悉數取代中低階程式設計師」的豪言成為一廂情願的痴想。
  此外,國外的法律學者已經多次警告:聊天機器人所產出的文章和圖片有時候高度近似有版權的原作,因而涉及侵權。社會科學的研究者也紛紛警告,聊天機器人有可能會讓使用者產生成癮症和情感上的倚賴,以致於人際互動能力退化或逐漸脫離現實。
  鑑往知來,社群媒體背後的老闆們把牟利看得遠比人命重要,不惜通過演算法操縱使用者,以延長他們使用的頻率和時間,卻同時造成使用者(尤其是青少年)的焦慮、憂鬱與各種精神疾病,乃至於自殺(詳見第 8 章)。令人憂心的是,我們明知社群媒體是什麼,卻還沒能預見它對社會的可能傷害,而且至今沒能建立有效的監管機制來遏阻。對比下,聊天機器人的龐大投資必然會使科技大老們更加無所不用其極地牟利,偏偏絕大多數人根本不瞭解聊天機器人的原理和運作機制,也不知道它什麼時候會給出錯誤或有害的資訊,這就更難以預知它可能會如何誤導使用者(尤其是青少年),以及會對社會造成哪些失業之外的傷害。
  有鑑於聊天機器人對社會大眾、教育體系以及職場的影響勢必越演越烈,與其鴕鳥般地遠離,或成為鄉民般地任其愚弄,不如設法瞭解它的原理和運作機制,以及適切的使用態度、方法和時機,以便先能自保而不受其害,繼而有效駕馭它以獲取最大的便利。
  可惜的是,市面上的相關書籍與開放課程都不吻合高中生與一般社會人士的需要。以程式語言為基礎的專業書籍不適合常人的需要,而國內外的開放課程,則夾帶太多高中生與一般社會人士用不著的基礎學理和艱澀難懂的術語,徒增理解上的困難。絕大多數科普著作只考慮通俗易讀而罔顧失真,各種擬人化的解釋更頻繁地誤導聽眾和讀者,使他們產生不實的想像,以致於所造成的誤解和迷思遠勝於對事實的傳播與釐清(詳見第 4 章)。
  因以上事實,本書從「蒙利而免受害」的雙重角度出發,精選高中生與一般社會人士最需要的知識與議題,力求以「精準科普」的方式解釋聊天機器人的運作機制與原理,以及有效駕馭聊天機器人並防範受害所需的知識和態度,寫成這本《全民版 AI 識讀:原理、應用、幻覺與誤區》。
  這一章將先粗略介紹從高中生到一般社會人士最需要的能力與知識,後續各章再針對每個議題由淺入深地逐一闡述。

莫測高深的 AI,紛雜而矛盾的傳聞,困惑驚恐的學生與社會大眾
  有鑑於人工智慧似乎已經開始超越人類,部分學者預言人工智慧將會取代人類,而且斷言「會使用人工智慧的人將很快地取代不會使用人工智慧的人」。
  於是,聊天機器人變成很多人心目中的「必修課」。二○二四年美國境內的調查顯示,75%的學者認為大學生必須在校內學會有效使用這項工具,才能在專業領域成功;65%的大學生希望學校開授人工智慧相關課程,以便學習相關技能;至於中小學生,52%會用聊天機器人幫他們準備考試,56%的人會在聊天機器人的協助下完成作業。此外,針對全球十六個國家中將近四千名大學生和研究生的調查發現,有 86%的人會在課業上使用聊天機器人,有 56%是每週都會用到。
  證諸事實,儘管二○二四年的調查中有 37%的受訪者因使用聊天機器人而將每週工作時數減少五至十小時,學術界的某些個案研究也顯示聊天機器人有機會將工作效率提升 15%至 50%,然而二○二五年發表的一項大型研究卻顯示實際影響甚微:在丹麥十一種職業別的七千個工作場所中,兩萬五千名員工使用人工智慧的結果只減少 3%的平均工時 [注 1-4]。此外,談到人工智慧在未來十年內對全球經濟總產值的可能影響時,經濟學界的研究結果也相當分歧。有些學者的推估說它可以提升 7%,有些推估高達 26%,然而聯手撰寫《國家為什麼會失敗》的諾貝爾獎得主戴倫.艾塞默魯(Daron Acemoglu)卻在二○二五年發表論文指出,未來十年內人工智慧對全球經濟的影響不會超過 1%,被取代的工作也不會超過 5% [注 1-5]。
  談到人工智慧在產業界推廣的困難時,一位資深記者指出許多產業主管的共同疑慮:就算人工智慧 90%的產出都令人驚豔,然而只要另外 10%產出中還隱藏著難以預料且不易察覺的錯誤,這樣的人工智慧在產業界就很難推廣。
  許多高中生也有類似的困惑。他們說:聊天機器人好像很厲害,卻又會突然出現離奇的錯誤,使他們不敢用它幫助自己溫習功課。譬如,它可以解出很刁鑽的數學應用題,並且寫出正確的解題過程,讓人恍然大悟;但是若連續問它三次「523,654,123 和 7,652,432,852,136 的精確和是多少?」ChatGPT-3.5 在第一次答對之後會接著連續兩次答錯,有些聊天機器人則連續三次都答錯。為什麼可以答對艱難的題目,卻反而在最簡單的問題上答錯?為什麼第一次答對,接著又連續兩次答錯?這種表現完全違背電腦的特性,更像是完全隨機的錯誤,讓人難以捉摸也不敢放心使用。《自然》期刊旗下的《自然機器智慧》因而在二○二三年一月號的編輯前言說:「無法相信這個工具可以正確陳述事實或產出可靠的參考文獻。」

難以根除的「幻覺」,與生俱來的頑疾
  為了贏得使用者的信心,科技巨頭們紛紛想盡辦法在改善聊天機器人的性能,因此許多被報導過的「幻覺」(hallucination)都已消失。譬如,以往被問到「跨越英倫海峽的最佳長跑紀錄」時,它會像爛醉般地捏造不存在的事實,現在則已能正確地回答。
  二○二五年八月上線的 GPT-5 更號稱已經將幻覺出現機率降到 9.6%,然而這是內部的測試,我們不確知在實際應用時幻覺的出現率會高到什麼程度。此外 GPT-5 還是有機會在對話中出現歧視與偏見,以及品質粗劣的回答(詳見第 4 章與第 5 章)。因此,適切地瞭解聊天機器人的特性,以及潛在的缺陷,依舊是值得各種使用者共同關注的課題。
  聊天機器人的性能一再提升,關鍵原因之一是它被附加了網路搜尋的功能,可以在回答提問前先上網搜尋相關資訊,再將內容摘要統整後輸出,同時還附上參考文件的網址。然而它所參考的文件和網站往往不夠嚴謹,因此依舊不時夾帶著品質低劣的訊息與偏見(詳見第 3 章)。性能遜於 GPT-5 的聊天機器人更是頻繁出現「幻覺」,尤其是它在提供參考文獻來源時,更是經常給出錯誤的網址或捏造不存在的文獻。根據一個數位新聞研究中心在二○二五年三月發布的實測報告,市面上最流行的八款聊天機器人在引述文獻時的平均錯誤率高達六成。
  聊天機器人都是用大型語言模型(Large language model,LLM)來產生對話,再利用搜尋引擎和圖形識別等工具強化其多樣性的功能。然而大型語言模型本身有其與生俱來的「缺陷基因」,讓它始終擺脫不了幻覺(即捏造不存在的事實)與潛在的偏見、歧視、品質粗劣的回答等。以二○二二年年底推出的大型語言模型「銀河系(Galactica)」為例,它使用四千八百萬筆科學文獻進行訓練,旨在攻占學術市場。有些試用者對其表現感到驚豔,但是它依舊不時夾雜著明顯和不易覺察的錯誤資訊,因而在試用三天後就迅速下架。德國普朗克研究所的智能系統研究中心主任評論說:「我問銀河系一些我知道的事,然而我感到憂慮。它給的回答都是錯誤或夾帶偏見,卻又都看似正確而可靠。這是很危險的。」 [注 1-6]
  即便近年來大型語言模型在推理能力方面的表現似乎進展迅速,然而一篇二○二五年發表的論文在回顧其近況與未來發展時,依舊把「幻覺」當作一個有機會持續改善卻無法根除的難題 [注 1-7]。
  法國科學家楊立昆(Yann LeCun)在一九九三年首創用類神經網路準確辨識手寫字跡,因而驚豔全世界。後來他在電腦圖形辨識技術上一直開創新河,因而跟後來的諾貝爾獎得主傑佛瑞.辛頓(Geoffrey Hinton)一起獲得二○一八年電腦科學界最高榮譽的圖靈獎。二○一八年起他也同時擔任臉書和 Meta 的副總裁兼首席科學家。在「銀河系」公開的前夕他曾信心滿滿地說:「輸入文字,『銀河系』就會產出一篇論文,同時附上相關的參考文獻、公式和一切。」[注 1-5] 但是隨著「銀河系」的下架,他對大型語言模型的信心也開始從動搖到崩解,一再公開表示大型語言模型永遠不可能達到人類的智力水準。
  然而若使用得當,大型語言模型和聊天機器人已經可以在許多情境下替代人類較低階、繁瑣而重複的工作,使我們可以有較多的休閒時間,或聚焦於較高階的思考與創意。
  從興利的角度看,「使用得當」的首要關鍵是掌握它們的核心原理,知道它們為何會犯錯,什麼時候容易犯錯,以及如何減少其犯錯的機率。其次是學會各種查證事實的方法,從簡便而不費力的方法,到嚴謹、可靠而較費時的進階方法(參見下一節)。有趣的是,社群媒體早已成為各種假消息的主要來源與傳播管道;如果善用大型語言模型和查證的方法,反而可以有效釐清事實,破解社群媒體裡的假消息。其次,從防弊的角度看,必須先扼要了解智慧財產權與學術倫理的相關規定,才能避免不慎觸犯法律與學術規範;還要從社群媒體的經驗鑑往知來,對於潛藏在聊天機器人裡的偏見與歧視等提高警覺,同時避免成癮或陷入情感倚賴。有鑑於此,本書針對一般人的需要而規劃與撰就下述各章。

本書架構與各章重點
  其實,對於高中生和一般社會大眾而言,要精準地掌握聊天機器人和大型語言模型的核心原理並不難,他們所欠缺的只是一本以精準科普寫就的入門書。
  譬如本書第 2 章只用到最簡單的國中數學,就可以勾勒大型語言模型的五、六成核心原理,也可以進而解釋聊天機器人為何會有幻覺,什麼時候容易犯錯,以及如何減少其犯錯的機率。第 3 章幾乎沒有使用數學式,就可以扼要勾勒大型語言模型的訓練過程,訓練時所使用的資料,以及模型的參數如何影響聊天機器人的輸出品質。還進一步解釋過去這兩年來為何聊天機器人的性能可以突飛猛進,卻又為何永遠達不到人類的表現水準,也無法在職場上完全取代人類。至於剩下的兩、三成核心原理和技術細節,幾乎都是程式設計師和人工智慧的專家、學者才需要知道的,與一般使用者關係較遠,因而被安排在本書的第 11 章至第 13 章。
  有了這些瞭解,就可以進一步釐清許多迷思、訛傳與捕風捉影的猜測和誇染,有憑有據地解釋大型語言模型可能會如何影響新世代的就業(詳見第 7 章與第 9 章),並借鏡過去數位科技對教育的影響,來討論中小學教育該如何因應人工智慧的可能衝擊(詳見第 10 章)。
  本書刻意徹底擺脫擬人化的解釋,並且以最簡單的國中數學去闡述聊天機器人的構造和核心原理,以期讀者能徹底擺脫各種擬人化解說所造成的迷思與錯覺,避免陷入情感倚賴。
  聊天機器人始終無法徹底免除幻覺、歧視、偏見與錯誤的資訊,因此使用聊天機器人時最好也學會查證事實。一個最簡便的方法就是用同一個問題去問三、四個聊天機器人。由於科技巨頭都像軍備競賽般地在急速改善聊天機器人的性能與知識,使得它們犯錯的機率大幅下降;此外,聊天機器人出現幻覺的時機跟它所使用的大型語言模型有關,也跟它的訓練過程有關,並且帶著隨機性(詳見第 2 章與第 3 章),所以不同的聊天機器人鮮少會在同一個問題上出現完全一樣的幻覺。緣此,當數個聊天機器人的回答都一致時,可靠性就很高;三個聊天機器人的回答都一致而有一個回答跟前三者矛盾或差異懸殊時,應該是前三個聊天機器人的回答較可靠,而最後那個回答很可能是幻覺。當四個機器人的回答都有相當差異時,就必須小心地進一步查證。至於具體的查證方法,可以參考第 6 章。
  只要讀者能掌握住前面這兩項「防弊」的要領,聊天機器人在某些時候是比既有的搜尋引擎好用,也有機會比既有的搜尋引擎更能免除偏見、歧視與假消息。關鍵原因是,社群媒體已經讓很多人陷入同溫層與資訊濾泡中而不自知,搜尋引擎也會為了廣告商機而在搜尋結果的前十項裡摻雜一些鄉民們熱愛的網頁。對比下,聊天機器人給的資訊是龐大訊息的綜合表現,甚至被訓練成如同英文版的維基百科在回答中兩面並呈,因而無意中將最極端的意見給大量消除,且比社群媒體和個人網頁的意見更接近「中立」。
  其次,繁體中文版的網頁資訊嚴重不足且品質偏低。以維基百科為例,其資訊的量與質遠遜於英文版。然而聊天機器人的訓練過程包含大量英文與兩岸的中文資訊,在適當提示下還會先搜尋可靠的學術文獻,之後再彙整成中文的摘要當輸出。雖然其中還會夾雜著一些錯誤,但是只要比較四個聊天機器人的回答,即便沒有進一步去查證,所獲得的資訊在品質與面向的完整度上往往超過繁體中文網頁的資訊。
  尤其是當使用者懂得提問的技巧與進一步查證的方法後,就可以在陌生的領域和問題上迅速地掌握到重要的資訊,通常還算堪用且不太偏頗的答案,以及初步的參考文獻。以此為據,再經簡易的篩選後將關鍵字輸入搜尋引擎,就可以遠比只仰賴搜尋引擎還更快速、精準地找到相當完整、精確的報導、抽樣調查與學術論文等(詳見第 5 章與第 6 章)。
  關於教育界長期以來夢想的適性教育與個人化教育,研究顯示聊天機器人仍非國中小學童的理想工具,高中與大學的學生則比較適合在老師的有效引導下探索它的能與不能,以免墮入「弊遠大於利」的後果(詳見第 8 章至第 10 章)。
  二○一三年的諾貝爾化學獎得主麥可.李維特(Michael Levitt)曾在二○二五年的一場會議上鼓勵年輕人:不要因為聊天機器人會犯錯就排斥它,也不要因為沒有它照樣能過活而輕忽它,積極地問它生活上的每一件事,從穿著、髮型到量子物理,搞清楚它的能與不能,以便充分瞭解這一項科技能如何提升自己、造福人類。
  對於大腦發育與情感、思想都較成熟的大學生而言,積極而審慎地瞭解它的利與弊或許值得;然而對於大腦發育與情感、思想都還未成熟的國中小學生而言,防弊的需要很可能遠大於興利。
金石堂門市 全家便利商店 萊爾富便利商店 7-11便利商店
World wide
活動ing