重複博弈

重複博弈

重複博弈是一種特殊的博弈,在博弈中,相同結構的博弈重複多次,甚至無限次。其中,每次博弈稱為“階段博弈”。在每個階段博弈中,參與人可能同時行動,也可能不同時行動。因為其他參與人過去的行動的歷史是可以觀測的,因此在重複博弈中,每個參與人可以使自己在每個階段選擇的策略依賴於其他參與人過去的行為。

特徵

重複博弈重複博弈

重複博弈具有三個基本特徵:

A、重複博弈的階段,博弈之間沒有“物質”上的聯繫,即前一個階段博弈並不改變後一個階段的博弈的結構;

B、在重複博弈的每一個階段,所有參與人都觀測到該博弈過去的歷史;

C、參與人的總收益是所有階段博弈的收益的貼現值之和或加權平均數。

影響因素

重複博弈重複博弈

影響重複博弈均衡結果的主要因素是博弈重複的次數和信息的完備性。再重複博弈中,參與人存在著短期利益和長遠利益的均衡,有可能為了長遠利益犧牲短期利益而選擇不同的均衡策略。重複博弈的這個結果,為現實中的許多合作行為和社會規範提供了解釋。信息的完備性之所以影響均衡結果,是因為如果每一個參與人的特徵不為其他參與人所知時,該參與人就很有可能積極建立一個好聲譽,以換取長遠利益。根據重複博弈的重複次數,可以將其分為有限次重複博弈和無限次重複博弈。、

分類

無限次重複博弈

下面用一個關於產品定價博弈的例子分析重複博弈。

產品定價博弈

廠商B

低價高價

廠商A低價

高價12,1220,4

4,2015,15

是兩個廠商A和B定價的支付矩陣,從中可以看出:在一次性博弈中中,廠商A和廠商B都存在上策,上策均衡是雙方都定低價。

從參與人行為看,由於博弈可以重複無數次,博弈雙方為了長期利益有時間進行試探性出價。在第一次博弈時出高價以尋求競爭對手的合作,一旦對局人為了短期利益採取不合作行為,那么就會建立該對局人是不可信任的信念,在下一次的博弈中都採取不合作的低價行為,使對局人的長期利益受損。

可見,廠商B在第一次博弈中由於不合作策略得到的高收益會在以後博弈中因A的報復性策略而抵消,甚至在重複博弈若干次後出現損失。

假如廠商A開始制定的高價策略,從支付矩陣得到廠商B若也定高價,其每次博弈的支付分別為(15,15,15...);若廠商B制定低價,則在第一次博弈中獲得高收益,但是隨後會由於廠商A的低價行為而使其受損,各次博弈的支付分別為(20,12,12...)。廠商A的這種策略被稱為“以牙還牙”策略,這種策略是A在初始選擇合作,如果B合作,那么A也會一直合作下去;若B在某一次博弈中選擇不合作,那么A在以後博弈中都採取不合作策略。“以牙還牙”策略意味著任何一個參與人的一次性不合作將會引起永遠的不合作。所有參與人為了長期利益,使得無限次重複的非合作博弈產生合作解。

2.有限次重複博弈:假定重複有限的N次,這意味著所有參與人都能預測到最後一次(第N次)的收益。在第N次博弈中,各參與人都知道對方的“以牙還牙”,但是他也知道如果在這次博弈中自己選擇低價的上策,將使自己受益而其他參與人受損,且也不會留給對方報復的機會(博弈到第N次結束)。所有參與人都明白這一點,因此在最後一次博弈中將都採取低價策略,這與一次博弈的上策均衡結果相同。

在現實中,市場競爭者很難弄清重複博弈的結構。廠商很難預期自己在什麼時候會結束經營,也不清楚與對手的競爭何時是第N次博弈。因此,只要競爭時期足夠長,競爭的雙方都預期未來還要進行很多次博弈,那么,競爭的結構就可能近似於無限次重複博弈,使得廠商在競爭中出現相互合作的局面。

序列博弈

在實踐中,博弈者在選擇行動時可能有先後順序或某些對局者可能率先採取行動,這種博弈被稱為序列博弈。

1.先行者優勢:廠商生產甜味餅乾的收益10要高於生產脆味餅乾的收益8。假定兩個廠商同時獨立的做出生產決定,他們都願意推出甜味餅乾——結果是兩家收益都受損

廠商2

脆甜

廠商1脆

甜—3,—38,10

10,8—3,—3

可見,在序列博弈中,先行者可能占據一定的有利地位,這就是先行者優勢。廠商1為獲得更大收益,會選擇推出甜味餅乾,使得廠商2隻能選擇收益較低卻是最優的策略——推出脆味餅乾。

2.博弈的擴展形式:常用博弈的擴展形式來分析序列博弈,它用決策樹的形式表示可能的行動,並在各枝的結束處給出各行動的支付。

脆-3,-3

脆廠商2

廠商1(2)甜8,10

(1)脆10,8

甜廠商2

(3)甜3,-3

博弈的擴展形式的解一般用逆推法推導,由最後的收益逆向歸納,倒推到初始節點1處做出最後決策。

盤點各種博弈策略

博弈論聽上去很深奧,其實每時每刻就發生在我們的身邊,有時博弈論可以成為幫助我們在一些重大人生決策時提供幫助

相關詞條

相關搜尋

熱門詞條

聯絡我們