第一章 經濟學與賽局理論
賽局理論又被稱為博弈理論,是一種研究「互動決策」的理論。在經濟互動中,其中每一人的決策都相互影響——也就是說,在決策時,也必須將他人的決策納入自己的決策考慮中,當然也需要把別人對於自己的考慮,納入考慮中……如此重複斟酌後,最後選擇最有利的策略。
相互背叛的囚徒:囚徒困境
一九五〇年,數學家塔克任史丹佛大學客座教授時,為一些心理學家演講,說了兩個囚犯的故事——
有兩個小偷甲、乙聯合犯案,私入民宅被警察抓住,警方將兩人置於不同的房間內審訊,對每一個犯罪嫌疑人,警方給出的選擇是:
A:如果一個犯罪嫌疑人坦白罪行,交出了贓物,因證據確鑿,兩人都被判有罪。如果另一個犯罪嫌疑人也坦白,則兩人各被判刑八年。
B:如果另一個犯罪嫌疑人沒有坦白而是抵賴,則以妨礙公務罪(因已有證據表明其有罪)再加刑兩年,而坦白者有功被減刑八年,會被立即釋放。
C:如果兩人都抵賴,警方會因證據不足無法判兩人的偷竊罪,但可以私闖民宅的罪名各判入獄一年。
三種可能,三個選擇,足以讓身在其中的囚徒絞盡腦汁,寢食難安。
如同經濟學的其他例證,我們需要假設兩人都是理性的經濟人,他們都尋求自身最大的利益,而不關心另一個參與者的利益。
現在,這兩個囚犯該怎麼辦呢?是選擇相互合作還是相互背叛?從表面上看,他們應該相互合作,保持沉默,因為這樣他們將得到對雙方來說最好的結果——只判刑一年;但由於資訊被封閉,兩人無法交流,他們不得不考慮對方可能採取的選擇。由於甲、乙兩個人都尋求自身最大利益,所以他們都會優先考慮如何才能減少自己的刑期,至於同伙被判多少年,早已經顧不上。
甲會這樣推理:假如乙不招,我只要一招供,馬上就可以獲得自由,而不招卻要坐牢一年,顯然招比不招好;假如乙招了,我若不招,則要坐牢十年,他卻獲得了自由,而我招了也只坐八年,顯然還是招了好。可見無論乙招與不招,甲的最佳選擇都是招供。所以甲最終決定:還是招了吧。
甲知道該怎樣做了,而相同邏輯對另一個人同樣適用,因此乙也會毫不猶豫地選擇背叛——也就是招供。
這樣一來,甲、乙兩人都選擇招供,這對他們個人來說都是最佳的決定,即最符合他們個體理性的選擇。而他們各自最理性的選擇,給他們帶來的並非最佳結果(自由),也非較佳結果(一年刑期),而是比最壞結果(十年)要略好的結果(八年刑期)。
順便提一下,這兩人都選擇坦白的策略,因此被判八年的結局,被稱作是「納許均衡」(也叫非合作均衡)。所謂納許均衡,指的是參與人的一種策略組合,在該策略組合上,任何參與人單獨改變策略都不會得到好處;換句話說,如果在一個策略組合上,所有人都不會改變策略時,該策略組合就是一個納許均衡。納許均衡是賽局理論中一個重要的概念,以普林斯頓大學數學博士生約翰·納許命名。
並非要觸犯刑法,才會深陷極為被動的囚徒困境中;事實上,在我們工作與生活中,類似的囚徒困境並不少,人為製造囚徒困境(而自己充當警察)來保證自己利益也屢見不鮮。哈佛大學巴蘇教授著名的「旅行者困境」,可以提供一個視角——
兩個旅行者從一個以出產細瓷花瓶著稱的地方旅行返鄉,且他們都買了花瓶。但在提取行李時,他們卻發現花瓶被摔壞了,於是向航空公司索賠。航空公司知道花瓶的價格大概在八、九十元的價位浮動,但不知道兩位旅客購買的確切價格。於是,航空公司請兩位旅客在一百元內寫下花瓶的價格,如果兩人寫的一樣,航空公司就認為是實話,就按照他們寫的數額賠償;如果兩人寫的不一樣,航空公司就認定寫得低的旅客講的是真話,並原則上以這個低的價格賠償。同時,航空公司會對誠實的旅客獎勵兩元,對說謊的旅客罰款兩元。
就為了獲取最大賠償而言,本來甲乙雙方最好的策略,就是都寫一百元,這樣兩人都能夠獲賠一百元;可是,甲聰明的想:如果我少寫一元變成九十九元,乙會寫一百元,這樣我將得到一百〇一元,何樂而不為?所以他準備寫九十九元。
可是乙更加聰明,他算計到甲要寫九十九元,於是他準備寫九十八元;但想不到甲又更聰明,估計到乙要寫九十八元坑他,於是準備寫九十七元——就像下棋,都說要多「看」幾步,「看」得越遠,勝算越大。
你多看兩步,我比你更強,多看三步;你多看四步,我仍比你老謀深算,多看五步。在花瓶索賠的例子中,如果兩個人都「徹底理性」,都能看透十幾步,甚至幾十步、上百步,那麼「精明比賽」的結果,最後會落到每個人都只寫一兩元的地步。事實上,在徹底理性的假設之下,這個賽局的結果是:兩人都寫〇元。
是的,在賽局中,最好就是讓自己當制定規則的人;如果不幸淪為「囚徒」,就努力互通資訊,建立信任——唯有如此,才能讓自己利益最大化。比如三、四個扒手公然在巴士上行竊,一車人卻都不敢做聲。本來如果一車人群起攻之,就可以輕鬆制服幾個毛賊,但卻因為彼此不熟悉,擔心自己一出頭就挨打——最後雖然沒有挨打,但還是損失了財物。類比囚徒困境中的囚徒,等於大家都被判了「八年」,比挨打的「十年」略好,卻錯失了被「釋放」的機會。
最後,編者想要說的是:一個畫地為牢、只考慮自身利益的人,遲早會落入囚徒困境,左右為難。唯有加強合作與溝通,建立充分的信任,才能創造出雙贏乃至多贏的局面。
制約對手的硬招:重複賽局
一個孩子,每天在固定的街角乞討。有個路人偶然出於好玩,拿出一張十元紙鈔和一元硬幣,讓這個小孩選擇,出人意料的是:小孩只要一元硬幣,不拿那十元紙鈔。
這個有趣的現象傳開了,並引起許多的人的興趣。各式各樣的人,懷著或同情、或取樂、或驗證、或獵奇的心態,紛紛掏出一元硬幣與十元紙鈔讓小孩選擇,而這個看上去並不愚笨的小孩從來沒有讓大家失望:不拿十元,只要一元。據說還有人拿出過一元和一百元供小孩選擇,但小孩仍對一元硬幣情有獨鍾。
一次,一個好心的老奶奶忍不住抱住這個可憐的小孩,輕聲低問:「你難道不知道十元比一元有價值得多嗎?」小孩輕聲回答:「奶奶,我可不能因為一張十元紙鈔,而丟失掉無數枚一元硬幣。」
表面上看,是小孩主動選擇了一元;但細究起來,其實是小孩「被選擇」。因為這個小孩是長期乞討,不非一次性的買賣。在經濟學裡,這叫「重複賽局」,顧名思義,是指同樣結構的賽局重複許多次。若賽局只進行一次時,每個參與人只會關心一次性的支付;但如果賽局會重複多次,參與人可能會為了更長遠的利益而犧牲眼前的利益,從而選擇不同的均衡策略。因此,小孩為了能細水長流,只選擇小的利益。對這個結果,經濟學的表達是:重複賽局的次數,會影響到賽局均衡的結果。
舉一個生活中常見的例子:在大部分的火車站附近,餐廳的菜色都又難吃又貴。且這不是一個車站的問題,而幾乎所有車站都是如此,原因何在?
因為,這是一次性買賣。對商販來說,火車站來來往往的都是過客,這些陌生人不會因為美味的飯菜,專程回來做「回頭客」;同樣,如果過客覺得飯菜噁心,也不會花費時間精力來追究。因此對火車站的商販們來說,賣次品要合算得多,可以獲得最大的利潤;然而社區路口的店家就不同了,他們希望的是你經常光顧,因此在食物品質與價位上,多少會為食客著想。
重複賽局說明,人們的行為將直接受到預期的影響,這種預期可分為兩種:第一種是預期收益,即如果我現在這樣做,將來能得到什麼好處;第二種是預期風險,即如果我現在這樣做,將來可能會遇到什麼風險。正是某種預期的存在,影響個人或者組織的策略選擇。
而若還有下一次賽局,就不能只想到自己,還得站在對方的立場思考,才會有「吃虧就是占便宜」的古訓。當然,這個吃虧,常常是吃小虧;甚至大多數時候,並沒有真正虧損:如本來可以賺十元的,只賺一元,也叫「吃虧」。為什麼提倡吃虧?就是因為這次吃了小虧,在下次、下下次賽局中才能賺回來,就會聚少成多。
值得注意的是,事情總是會不斷變化,一次性賽局可以演變成重複賽局,重複賽局也可以演變成一次性賽局。
有一顧客去理髮店理髮,理髮師看著陌生,以為是過路客,就敷衍了事,快速給這個人理了一個很難看的髮型——他以為是一次性賽局。但這個顧客也沒有生氣,甚至付了定價兩倍的錢。
過了半個月,這個顧客又來理髮。理髮師覺得這個顧客一則大方,二則服務好了會成為常客,因此絲毫不敢怠慢,精心給這人理了髮。理完之後,顧客照照鏡子很滿意,理髮師也在盤算:這次他會付多少錢呢?雙倍還是四倍?
結果,顧客只付了半價。理髮師非常驚訝,忍不住問:為什麼上次我敷衍了事你付了雙倍,這次如此精心你反而只給半價?
顧客回答:我上次支付的是這次的理髮費,這次支付的是上次的理髮費。
顯然,在第一次理髮的賽局中,理髮師用的是一次性賽局策略,所以他在賽局中占了上風;而在第二次理髮時,顧客給了理髮師重複賽局的期望,等理髮師運用重複賽局策略時,顧客用的卻是一次性賽局,因而在第二次賽局中,顧客完勝。而理髮師要是知道這次顧客用的是一次性賽局,也就不會「輸」了。
可見,在任何賽局中,如果能預先獲知對方的策略,就能適時調整策略,保證自身利益最大化。如果已認定雙方是「一次性賽局」,那麼不妨給對方一個重複賽局的預期,再選擇適度背叛,就能博取到自身最大的利益;而如果和對方還會碰面很多次,或有長期合作的可能,最好採用重複賽局的方式,為對方思考一番。
最後還要提醒讀者:作為理性的經濟人,即便面對重複賽局也不要放鬆警惕,因為對方沒有背叛,常常只是誘惑不夠。以開頭的小孩為例,十元不要,那麼一百元,一千元,一萬元呢?只要開出足夠的價碼,就能摧毀他的心理防線。因此,古人既有「吃虧就是占便宜」的名訓,也有「防人之心不可無」的告誡。
賽局理論又被稱為博弈理論,是一種研究「互動決策」的理論。在經濟互動中,其中每一人的決策都相互影響——也就是說,在決策時,也必須將他人的決策納入自己的決策考慮中,當然也需要把別人對於自己的考慮,納入考慮中……如此重複斟酌後,最後選擇最有利的策略。
相互背叛的囚徒:囚徒困境
一九五〇年,數學家塔克任史丹佛大學客座教授時,為一些心理學家演講,說了兩個囚犯的故事——
有兩個小偷甲、乙聯合犯案,私入民宅被警察抓住,警方將兩人置於不同的房間內審訊,對每一個犯罪嫌疑人,警方給出的選擇是:
A:如果一個犯罪嫌疑人坦白罪行,交出了贓物,因證據確鑿,兩人都被判有罪。如果另一個犯罪嫌疑人也坦白,則兩人各被判刑八年。
B:如果另一個犯罪嫌疑人沒有坦白而是抵賴,則以妨礙公務罪(因已有證據表明其有罪)再加刑兩年,而坦白者有功被減刑八年,會被立即釋放。
C:如果兩人都抵賴,警方會因證據不足無法判兩人的偷竊罪,但可以私闖民宅的罪名各判入獄一年。
三種可能,三個選擇,足以讓身在其中的囚徒絞盡腦汁,寢食難安。
如同經濟學的其他例證,我們需要假設兩人都是理性的經濟人,他們都尋求自身最大的利益,而不關心另一個參與者的利益。
現在,這兩個囚犯該怎麼辦呢?是選擇相互合作還是相互背叛?從表面上看,他們應該相互合作,保持沉默,因為這樣他們將得到對雙方來說最好的結果——只判刑一年;但由於資訊被封閉,兩人無法交流,他們不得不考慮對方可能採取的選擇。由於甲、乙兩個人都尋求自身最大利益,所以他們都會優先考慮如何才能減少自己的刑期,至於同伙被判多少年,早已經顧不上。
甲會這樣推理:假如乙不招,我只要一招供,馬上就可以獲得自由,而不招卻要坐牢一年,顯然招比不招好;假如乙招了,我若不招,則要坐牢十年,他卻獲得了自由,而我招了也只坐八年,顯然還是招了好。可見無論乙招與不招,甲的最佳選擇都是招供。所以甲最終決定:還是招了吧。
甲知道該怎樣做了,而相同邏輯對另一個人同樣適用,因此乙也會毫不猶豫地選擇背叛——也就是招供。
這樣一來,甲、乙兩人都選擇招供,這對他們個人來說都是最佳的決定,即最符合他們個體理性的選擇。而他們各自最理性的選擇,給他們帶來的並非最佳結果(自由),也非較佳結果(一年刑期),而是比最壞結果(十年)要略好的結果(八年刑期)。
順便提一下,這兩人都選擇坦白的策略,因此被判八年的結局,被稱作是「納許均衡」(也叫非合作均衡)。所謂納許均衡,指的是參與人的一種策略組合,在該策略組合上,任何參與人單獨改變策略都不會得到好處;換句話說,如果在一個策略組合上,所有人都不會改變策略時,該策略組合就是一個納許均衡。納許均衡是賽局理論中一個重要的概念,以普林斯頓大學數學博士生約翰·納許命名。
並非要觸犯刑法,才會深陷極為被動的囚徒困境中;事實上,在我們工作與生活中,類似的囚徒困境並不少,人為製造囚徒困境(而自己充當警察)來保證自己利益也屢見不鮮。哈佛大學巴蘇教授著名的「旅行者困境」,可以提供一個視角——
兩個旅行者從一個以出產細瓷花瓶著稱的地方旅行返鄉,且他們都買了花瓶。但在提取行李時,他們卻發現花瓶被摔壞了,於是向航空公司索賠。航空公司知道花瓶的價格大概在八、九十元的價位浮動,但不知道兩位旅客購買的確切價格。於是,航空公司請兩位旅客在一百元內寫下花瓶的價格,如果兩人寫的一樣,航空公司就認為是實話,就按照他們寫的數額賠償;如果兩人寫的不一樣,航空公司就認定寫得低的旅客講的是真話,並原則上以這個低的價格賠償。同時,航空公司會對誠實的旅客獎勵兩元,對說謊的旅客罰款兩元。
就為了獲取最大賠償而言,本來甲乙雙方最好的策略,就是都寫一百元,這樣兩人都能夠獲賠一百元;可是,甲聰明的想:如果我少寫一元變成九十九元,乙會寫一百元,這樣我將得到一百〇一元,何樂而不為?所以他準備寫九十九元。
可是乙更加聰明,他算計到甲要寫九十九元,於是他準備寫九十八元;但想不到甲又更聰明,估計到乙要寫九十八元坑他,於是準備寫九十七元——就像下棋,都說要多「看」幾步,「看」得越遠,勝算越大。
你多看兩步,我比你更強,多看三步;你多看四步,我仍比你老謀深算,多看五步。在花瓶索賠的例子中,如果兩個人都「徹底理性」,都能看透十幾步,甚至幾十步、上百步,那麼「精明比賽」的結果,最後會落到每個人都只寫一兩元的地步。事實上,在徹底理性的假設之下,這個賽局的結果是:兩人都寫〇元。
是的,在賽局中,最好就是讓自己當制定規則的人;如果不幸淪為「囚徒」,就努力互通資訊,建立信任——唯有如此,才能讓自己利益最大化。比如三、四個扒手公然在巴士上行竊,一車人卻都不敢做聲。本來如果一車人群起攻之,就可以輕鬆制服幾個毛賊,但卻因為彼此不熟悉,擔心自己一出頭就挨打——最後雖然沒有挨打,但還是損失了財物。類比囚徒困境中的囚徒,等於大家都被判了「八年」,比挨打的「十年」略好,卻錯失了被「釋放」的機會。
最後,編者想要說的是:一個畫地為牢、只考慮自身利益的人,遲早會落入囚徒困境,左右為難。唯有加強合作與溝通,建立充分的信任,才能創造出雙贏乃至多贏的局面。
制約對手的硬招:重複賽局
一個孩子,每天在固定的街角乞討。有個路人偶然出於好玩,拿出一張十元紙鈔和一元硬幣,讓這個小孩選擇,出人意料的是:小孩只要一元硬幣,不拿那十元紙鈔。
這個有趣的現象傳開了,並引起許多的人的興趣。各式各樣的人,懷著或同情、或取樂、或驗證、或獵奇的心態,紛紛掏出一元硬幣與十元紙鈔讓小孩選擇,而這個看上去並不愚笨的小孩從來沒有讓大家失望:不拿十元,只要一元。據說還有人拿出過一元和一百元供小孩選擇,但小孩仍對一元硬幣情有獨鍾。
一次,一個好心的老奶奶忍不住抱住這個可憐的小孩,輕聲低問:「你難道不知道十元比一元有價值得多嗎?」小孩輕聲回答:「奶奶,我可不能因為一張十元紙鈔,而丟失掉無數枚一元硬幣。」
表面上看,是小孩主動選擇了一元;但細究起來,其實是小孩「被選擇」。因為這個小孩是長期乞討,不非一次性的買賣。在經濟學裡,這叫「重複賽局」,顧名思義,是指同樣結構的賽局重複許多次。若賽局只進行一次時,每個參與人只會關心一次性的支付;但如果賽局會重複多次,參與人可能會為了更長遠的利益而犧牲眼前的利益,從而選擇不同的均衡策略。因此,小孩為了能細水長流,只選擇小的利益。對這個結果,經濟學的表達是:重複賽局的次數,會影響到賽局均衡的結果。
舉一個生活中常見的例子:在大部分的火車站附近,餐廳的菜色都又難吃又貴。且這不是一個車站的問題,而幾乎所有車站都是如此,原因何在?
因為,這是一次性買賣。對商販來說,火車站來來往往的都是過客,這些陌生人不會因為美味的飯菜,專程回來做「回頭客」;同樣,如果過客覺得飯菜噁心,也不會花費時間精力來追究。因此對火車站的商販們來說,賣次品要合算得多,可以獲得最大的利潤;然而社區路口的店家就不同了,他們希望的是你經常光顧,因此在食物品質與價位上,多少會為食客著想。
重複賽局說明,人們的行為將直接受到預期的影響,這種預期可分為兩種:第一種是預期收益,即如果我現在這樣做,將來能得到什麼好處;第二種是預期風險,即如果我現在這樣做,將來可能會遇到什麼風險。正是某種預期的存在,影響個人或者組織的策略選擇。
而若還有下一次賽局,就不能只想到自己,還得站在對方的立場思考,才會有「吃虧就是占便宜」的古訓。當然,這個吃虧,常常是吃小虧;甚至大多數時候,並沒有真正虧損:如本來可以賺十元的,只賺一元,也叫「吃虧」。為什麼提倡吃虧?就是因為這次吃了小虧,在下次、下下次賽局中才能賺回來,就會聚少成多。
值得注意的是,事情總是會不斷變化,一次性賽局可以演變成重複賽局,重複賽局也可以演變成一次性賽局。
有一顧客去理髮店理髮,理髮師看著陌生,以為是過路客,就敷衍了事,快速給這個人理了一個很難看的髮型——他以為是一次性賽局。但這個顧客也沒有生氣,甚至付了定價兩倍的錢。
過了半個月,這個顧客又來理髮。理髮師覺得這個顧客一則大方,二則服務好了會成為常客,因此絲毫不敢怠慢,精心給這人理了髮。理完之後,顧客照照鏡子很滿意,理髮師也在盤算:這次他會付多少錢呢?雙倍還是四倍?
結果,顧客只付了半價。理髮師非常驚訝,忍不住問:為什麼上次我敷衍了事你付了雙倍,這次如此精心你反而只給半價?
顧客回答:我上次支付的是這次的理髮費,這次支付的是上次的理髮費。
顯然,在第一次理髮的賽局中,理髮師用的是一次性賽局策略,所以他在賽局中占了上風;而在第二次理髮時,顧客給了理髮師重複賽局的期望,等理髮師運用重複賽局策略時,顧客用的卻是一次性賽局,因而在第二次賽局中,顧客完勝。而理髮師要是知道這次顧客用的是一次性賽局,也就不會「輸」了。
可見,在任何賽局中,如果能預先獲知對方的策略,就能適時調整策略,保證自身利益最大化。如果已認定雙方是「一次性賽局」,那麼不妨給對方一個重複賽局的預期,再選擇適度背叛,就能博取到自身最大的利益;而如果和對方還會碰面很多次,或有長期合作的可能,最好採用重複賽局的方式,為對方思考一番。
最後還要提醒讀者:作為理性的經濟人,即便面對重複賽局也不要放鬆警惕,因為對方沒有背叛,常常只是誘惑不夠。以開頭的小孩為例,十元不要,那麼一百元,一千元,一萬元呢?只要開出足夠的價碼,就能摧毀他的心理防線。因此,古人既有「吃虧就是占便宜」的名訓,也有「防人之心不可無」的告誡。