海盜分金

海盜分金

經濟學上有個“海盜分金”模型,是說5個海盜搶得100枚金幣,他們按抽籤的順序依次提方案:首先由1號提出分配方案,然後5人表決,超過半數同意方案才被通過,否則他將被扔入大海餵鯊魚,依此類推。假定“每人海盜都是絕頂聰明且很理智”,那么“第一個海盜提出怎樣的分配方案才能夠使自己的收益最大化。

基本信息

經濟學上的“海盜分金”模型

推理過程是這樣的:

海盜分金海盜分金

從後向前推,如果1至3號強盜都餵了鯊魚,只剩4號和5號的話,5號一定投反對票讓4號餵鯊魚,以獨吞全部金幣。所以,4號惟有支持3號才能保命。
3號知道這一點,就會提出“100,0,0”的分配方案,對4號、5號一毛不拔而將全部金幣歸為已有,因為他知道4號一無所獲但還是會投贊成票,再加上自己一票,他的方案即可通過。
不過,2號推知3號的方案,就會提出“98,0,1,1”的方案,即放棄3號,而給予4號和5號各一枚金幣。由於該方案對於4號和5號來說比在3號分配時更為有利,他們將支持他而不希望他出局而由3號來分配。這樣,2號將拿走98枚金幣
同樣,2號的方案也會被1號所洞悉,1號並將提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放棄2號,而給3號一枚金幣,同時給4號(或5號)2枚金幣。由於1號的這一方案對於3號和4號(或5號)來說,相比2號分配時更優,他們將投1號的贊成票,再加上1號自己的票,1號的方案可獲通過,97枚金幣可輕鬆落入囊中。這無疑是1號能夠獲取最大收益的方案了!答案是:1號強盜分給3號1枚金幣,分給4號或5號強盜2枚,自己獨得97枚。分配方案可寫成(97,0,1,2,0)或(97,0,1,0,2)。

“海盜分金”其實是一個高度簡化和抽象的模型,體現了博弈的思想。在“海盜分金”模型中,任何“分配者”想讓自己的方案獲得通過的關鍵是事先考慮清楚“挑戰者”的分配方案是什麼,並用最小的代價獲取最大收益,拉攏“挑戰者”分配方案中最不得意的人們。企業中的一把手,在搞內部人控制時,經常是拋開二號人物,而與會計和出納們打得火熱,就是因為公司里的小人物好收買。
1號看起來最有可能餵鯊魚,但他牢牢地把握住先發優勢,結果不但消除了死亡威脅,還收益最大。這不正是全球化過程中先進國家的先發優勢嗎?而5號,看起來最安全,沒有死亡的威脅,甚至還能坐收漁人之利,卻因不得不看別人臉色行事而只能分得一小杯羹。
不過,模型任意改變一個假設條件,最終結果都不一樣。而現實世界遠比模型複雜。
首先,現實中肯定不會是人人都“絕對理性”。回到“海盜分金”的模型中,只要3號、4號或5號中有一個人偏離了絕對聰明的假設,海盜1號無論怎么分都可能會被扔到海里去了。所以,1號首先要考慮的就是他的海盜兄弟們的聰明和理性究竟靠得住靠不住,否則先分者倒霉。
如果某人偏好看同夥被扔進海里餵鯊魚。果真如此,1號自以為得意的方案豈不成了自掘墳墓!
再就是俗話所說的“人心隔肚皮”。由於信息不對稱,謊言和虛假承諾就大有用武之地,而陰謀也會像雜草般瘋長,並藉機獲益。如果2號對3、4、5號大放煙幕彈,宣稱對於1號所提出任何分配方案,他一定會再多加上一個金幣給他們。這樣,結果又當如何?
通常,現實中人人都有自認的公平標準,因而時常會嘟嚷:“誰動了我的乳酪?”可以料想,一旦1號所提方案和其所想的不符,就會有人大鬧……當大家都鬧起來的時候,1號能拿著97枚金幣毫髮無損、鎮定自若地走出去嗎?最大的可能就是,海盜們會要求修改規則,然後重新分配。想一想二戰前的希特勒德國吧!
而假如由一次博弈變成重複博弈呢?比如,大家講清楚下次再得100枚金幣時,先由2號海盜來分……然後是3號……這頗有點像美國總統選舉,輪流主政。說白了,其實是民主形式下的分贓制。
最可怕的是其他四人形成一個反1號的大聯盟並制定出新規則:四人平分金幣,將1號扔進大海……這就是阿Q式的革命理想:高舉平均主義的旗幟,將富人扔進死亡深淵……
制度規範行為,理性戰勝愚昧!
如果假設變為,是10人分100枚金幣,投票50%或以上才能通過,否則他將被扔入大海餵鯊魚,依此類推。50%是問題的關鍵,海盜可以投自己的票。因此如果剩下兩個人,無論什麼方案都會被通過,即100,0。
往上推一步,3個人時,倒數第三個人知道如果出現兩個人的情況,因此它會團結第一個人,給他一個金幣
“往前推一步。現在加一個更兇猛的海盜P3。P1知道———P3知道他知道———如果P3的方案被否決了,遊戲就會只由P1和P2來繼續,而P1就一枚金幣也得不到。所以P3知道,只要給P1一枚金幣,P1就會同意他的方案(當然,如果不給P1一枚金幣,P1反正什麼也得不到,寧可投票讓P3去餵魚)。所以P3的最佳策略是:P1得1枚,P2什麼也得不到,P3得99枚。
P4的情況差不多。他只要得兩票就可以了,給P2一枚金幣就可以讓他投票贊同這個方案,因為在接下來P3的方案中P2什麼也得不到。P5也是相同的推理方法只不過他要說服他的兩個同伴,於是他給每一個在P4方案中什麼也得不到的P1和P3一枚金幣,自己留下98枚。
依此類推,最終P10的最佳方案是:他自己得96枚,給每一個在P9方案中什麼也得不到的P2、P4、P6和P8一枚金幣。
結果,“海盜分金”最後的結果是P1、P2、P3、P4、P5、P6、P7、P8、P9、P10各可以獲得0、1、0、1、0、1、0、1、0、96枚金幣。
在“海盜分金”中,任何“分配者”想讓自己的方案獲得通過的關鍵是,事先考慮清楚“挑戰者”的分配方案是什麼,並用最小的代價獲取最大收益,拉攏“挑戰者”分配方案中最不得意的人們。
真地是難以置信。P10看起來最有可能餵鯊魚,但他牢牢地把握住先發優勢,結果不但消除了死亡威脅,還獲得了最大收益。而P1,看起來最安全,沒有死亡的威脅,甚至還能坐收漁人之利,但卻因不得不看別人臉色行事,結果連一小杯羹都無法分到,卻只能夠保住性命而已。

最一般性、可隨意更改數據的解釋

問題的提出

5個海盜搶到了100顆寶石,每一顆都一樣的大小和價值連城。
他們決定這么分:
1 抽籤決定自己的號碼(1,2,3,4,5)
2 首先,由1號提出分配方案,然後大家5人進行表決,若且唯若半數和超過半數的人同意時,按照他的提案進行分配,否則將被扔入大海餵鯊魚。
3 如果1號死後,再由2號提出分配方案,然後大家4人進行表決,若且唯若半數和超過半數的人同意時,按照他的提案進行分配,否則將被扔入大海餵鯊魚。
4 以次類推......
條件:
每個海盜都是很聰明的人,都能很理智的判斷得失,從而做出選擇。
問題:
第一個海盜提出怎樣的分配方案才能夠使自己的收益最大化
(如果在規則中加上下面一條會更加完善:海盜在自己的收益最大化的前提下樂意看到其他海盜被扔入大海餵鯊魚)

討論

使用倒推法:
一、假設1、2、3號已被扔入海中,則4號的方案必為100、0,且必定通過。故5號在得到3號1個寶石的情況下會堅決支持3號的方案。
二、3號的方案必為99、0、1,且必定通過。故4號在得到2號1個寶石的情況下會堅決支持2號的方案。
三、2號的方案必為99、0、1、0,且必定通過。2號不能把給4號的1個寶石給5號,5號未必堅定地支持2號的方案,因為3號必定通過的方案也能讓他得到1個寶石。為了萬無一失的保命,2號必須選4號,且必定通過。故3號、5號在各得到1號1個寶石的情況下會堅決支持1號的方案。
四、1號的方案必為98、0、1、0、1,且必定通過。
故答案是:98,0,1,0,1。

推廣

有X(1=<X=<202)個海盜,100顆寶石,其它規則同上。
則1號海盜的最大化收益 Y =101-((X+1)/2所得數取整)。
(當X=201及X=202時,1號海盜的最大化收益為0,但可保命。)
Z(2=<Z=<X)號海盜的收益:Z為奇數時收益為 1, Z為偶數時收益為 0 。
對於X>202時情況,可先在X=500個的情況下進行討論,然後再作推廣。
依然是使用倒推法。
203號海盜必須獲得102張贊成票,但他無法用100個寶石收買到101名同夥的支持。因此,無論203號提出什麼樣的分配方案,他都注定會被扔到海里去餵魚。
204號海盜必須獲得102張贊成票,203號為了能保住性命,就必須讓204號的方案通過,避免由203號自己來提出分配方案,所以無論204號海盜提出什麼樣的方案,都可以得到203號的堅定支持。這樣204號海盜就可以保命:他可以得到他自己的1票、203號的1票、以及用100個寶石收買到的100名同夥的贊成票,剛好達到所需的半數支持。能從204號那裡獲得1個寶石的海盜,必屬於按照202號海盜的方案將一無所獲的那102名海盜之列。
205號海盜必須獲得103張贊成票,但他無法用100個寶石收買到102名同夥的支持。因此,無論205提出什麼樣的分配方案,他都注定會被扔到海里去餵魚。
206號海盜必須獲得103張贊成票,他可以得到205號的堅定支持,但他無法用100個寶石收買到101名同夥的支持。因此,無論206號提出什麼樣的分配方案,他都注定會被扔到海里去餵魚。
207號海盜必須獲得104張贊成票,他可以得到205號和206號的堅定支持,但他無法用100個寶石收買到101名同夥的支持。因此,無論207號提出什麼樣的分配方案,他都注定會被扔到海里去餵魚。
208號海盜必須獲得104張贊成票,他可以得到205號、206號、207號的堅定支持,加上他自己1票以及收買的100票,使他得以保命。從208號那裡獲得1個寶石的海盜,必屬於那些按照204號方案將一無所獲的那104名海盜之列。
現在可以看出一條新的、此後將一直有效的規律:那些方案能通過的海盜(他們的分配方案全都是把寶石用來收買100名同夥,自己連1個寶石都得不到)相隔的距離越來越遠,而在他們之間的海盜則無論提出什麼樣的方案都會被扔進海里。因此,為了保命,他們必會投票支持排在他們前面的海盜提出的任何分配方案。得以避免葬身魚腹的海盜包括201、202、204、208、216、232、264、328、456號,
即200+1、200+2、200+4、200+8、200+16、200+32、200+64、200+128、200+256。即
200+2的0次冪,200+2的1次冪,200+2的2次冪,200+2的3次冪,200+2的4次冪,200+2的5次冪,200+2的6次冪,200+2的7次冪,200+2的8次冪,
即其號碼等於200加2的某次冪。

發展

著名數學家和經濟學家,加利福尼亞州 帕洛阿爾托 的 Stephen M. Omohundro 在1998年對此類問題進行了解答。
本題是該類問題的一個具體題目:
微軟經典面試題------海盜分寶石,20分鐘給出答案即可獲得年薪8萬美金的職位:
5個海盜搶到了100顆寶石,即 X=5,A=100。
此類問題體現出的多方博弈情況下的生存哲學:
1、沒有永恆的朋友,只有永恆的利益。
2、在臨界點之下,以決策者的身份出場,冒最大的風險,得到最大的利益。
3、在接近臨界點的地方,是收益分配最接近公平的地方。半數的人均勻地受益,另半數的人均勻地不受益。
4、越過臨界點之後,以決策者的身份出場,風險極大,甚至會將老本賠進去,而收益卻為零,這是最糟的情況,因為大家的收益都不高。這是一種不穩定的狀態,系統會通過自我調整向臨界點靠攏。
5、永遠都不可能發生所有人都有收益的情況,任何時候都有至少 一半或者接近一半 人無收益,除非只有1個人。
另外,如果邏輯推理沒有漏洞,那么結論就必定站得住腳,即使它與你的直覺矛盾。

相關詞條

相關搜尋

熱門詞條

聯絡我們