?

2×2矩陣博弈中的混合策略均衡

2017-01-19 13:27史艷維
現代營銷·學苑版 2016年11期
關鍵詞:均衡

摘要:本文分析了2×2矩陣博弈中的混合策略均衡,討論了此類博弈的嚴格優勢策略和純策略均衡,得到了在沒有嚴格優勢策略且存在唯一均衡的2×2矩陣博弈中,均衡必為混合策略均衡。

關鍵詞:矩陣博弈; 嚴格優勢策略; 均衡

博弈論是現代數學的一個新分支,也是運籌學的一個重要學科。博弈論主要研究公式化了的激勵結構間的相互作用。如今,博弈論在金融學、證券學、生物學、經濟學、國際關系、計算機科學、政治學、軍事戰略和其他很多學科都有廣泛的應用。

均衡是博弈論一個重要研究對象。均衡是一種策略組合,使得同一時間內每個參與人的策略是對其他參與人策略的最優反應。1951年納什提出著名的納什定理,即在矩陣博弈中一定存在均衡。這里的均衡可能是純策略均衡,也可能是混合策略均衡。

2×2矩陣博弈是一類最基本且被廣泛應用的重要博弈類型,它是指在博弈過程中只有兩個參與人(參與人1和參與人2),且每個參與人只有兩個可選策略。經典博弈諸如囚徒困境、性別戰爭、古諾雙寡頭壟斷、貝特蘭德雙寡頭壟斷等博弈都可以歸為此類博弈。

本文分析了2×2矩陣博弈中的混合策略均衡,討論了此類博弈的嚴格優勢策略和純策略均衡,得到了在沒有嚴格優勢策略且存在唯一均衡的2×2矩陣博弈中,均衡必為混合策略均衡。

考慮2×2矩陣博弈。對于參與人1和參與人2,參與人1的可選策略為U和D,參與人2的可選策略為L和R。他們的收益情況如下:

(1)當參與人1選擇策略且參與人2選則策略時,他們的收益分別為和;

(2)當參與人1選擇策略且參與人2選則策略時,他們的收益分別為和;

(3)當參與人1選擇策略且參與人2選則策略時,他們的收益分別為和;

(4)當參與人1選擇策略且參與人2選則策略時,他們的收益分別為和。

我們可以用如下的矩陣表示:

其中第一列表示參與人1的可選策略,第一行表示參與人2的可選策略,收益中前者為參與人1的收益,后者為參與人2的收益。

設參與人1選取策略的概率為,參與人2選取策略的概率為。這樣,參與人1選取策略的概率為,參與人2選取策略的概率為。

可見,對參與人1而言,選取策略的期望收益為,選取策略的期望收益為,于是參與人1選取策略和策略無差異當且僅當。令表示參與人1對參與人2隨機化概率的反應函數。則

類似地,對參與人2而言,選取策略的期望收益為,選取策略的期望收益為,于是參與人2選取策略和策略無差異當且僅當。令表示參與人2對參與人1隨機化概率的反應函數。則

在博弈中,參與人的嚴格優勢策略是使得參與人選取該策略所獲收益嚴格大于選取其他策略所獲收益。在2×2矩陣博弈中,嚴格優勢策略具有如下特征:

對參與人1而言,策略嚴格優于策略當且僅當;策略嚴格優于策略當且僅當。

對參與人2而言,策略嚴格優于策略當且僅當;策略嚴格優于策略當且僅當。

由于均衡是每個參與人對其對手策略選擇的最優反應,則在2×2矩陣博弈中,純策略均衡具有如下特征:

是均衡當且僅當且;是均衡當且僅當且;是均衡當且僅當且;是均衡當且僅當且。

定理 在2×2矩陣博弈中,如果不存在嚴格優勢策略,且存在唯一的均衡,則此均衡必為混合策略均衡。

證明 (反證法)假設此博弈中唯一的均衡是純策略組合,設為,不失一般性,取,對策略組合,和可類似地討論。由于是均衡當且僅當且。對此分情況進行討論。

(1)且。由于對參與人1而言,策略不嚴格優于策略,則,于是;對參與人2而言,策略不嚴格優于策略,則。于是策略組合是博弈中的一個均衡,這與是唯一的均衡矛盾。

(2)且。此時,則,于是存在使得,即,從而令參與人1選取策略的概率為,可見混合策略組合是博弈的一個均衡,其中表示參與人1以概率選取策略,以概率選取策略,表示參與人2選取策略。這與是唯一的均衡矛盾。

(3)且。此時,則,于是存在使得,即,從而令參與人2選取策略的概率為,可見混合策略組合是博弈的一個均衡,其中表示參與人1選取策略,表示參與人2以概率選取策略,以概率選取策略。這與是唯一的均衡矛盾。

(4)且。此時若策略組合不是均衡,則;若策略組合不是均衡,則。這樣策略組合是博弈的一個均衡,與是唯一的均衡矛盾。

綜上可知,策略組合不是此博弈的均衡,從而此2×2矩陣博弈的均衡必為混合策略組合。

參考文獻:

[1]車競,錢煒祺,和爭春.基于矩陣博弈的兩機攻防對抗空戰仿真[J].飛行力學,2015,33(2): 173-177.

[2]馬國勇,石春生.基于博弈矩陣模型的企業研發策略[J].統計與決策,2012,1: 54-55.

[3]R.Gibbons.A Primer in Game Theory[M].Prentice Hall,1994.

[4]D.Fudenberg,J.Tirole.Game Theory[M].MIT Press,1991.

[5]張維迎.博弈與社會[M].北京大學出版社,2013.

作者簡介:

史艷維(1980- ), 女, 陜西西安人, 講師, 主要從事博弈論與應用非標準分析方向的研究。

猜你喜歡
均衡
少數民族習慣法與國家法的均衡路徑探析
淺析國外基礎教育均衡發展對我國創新型人才培養的啟示
新古典主義建筑的形式法則
基于服務主導邏輯的顧客購買意愿分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合