圖1 戰略式博弈
1. 問題提出
囚徒困境(prisoner’ dilemma)——Tuncker 20世紀50年代(純戰略)
兩個小偷作案后被警察抓住,分別不同的屋子里審訊。在審訊之前,小偷從律師那里得知:如果兩個人都坦白,將被各判刑4年;如果兩個人都抵賴,將會因為證據不足而各判1年;如果其中一人坦白而另一人抵賴,坦白的將會得到寬大處理而被無罪釋放,而抵賴的將重判,判刑6年。試問兩個小偷將會如何選擇?
純戰略:參與人在給定信息下只選擇一種特定的戰略(行動)。
猜硬幣(混合戰略)
兩個參與人各握一枚硬幣,雙方同時選擇是正面向上(記作O)還是背面向上(記作R),即他們的戰略空間都是{O,R}。若兩枚硬幣是一致的(即全部背面向上或者全部正面向上),參與人2贏得參與人1的硬幣;若兩枚硬幣不一致,則參與人1贏得參與人2的硬幣。
混合戰略:參與人在給定信息下以某種概率分布隨機地選擇不同的行動(戰略空間上的概率分布)。解釋了一個參與人對其他參與人所采取行動的不確定性。
在一個給定的n人戰略式博弈
2. 問題描述——戰略式博弈
戰略式博弈(strategic form game):也稱標準式博弈,是一種相互作用的決策模型,這種模型假設每個參與人僅選擇一次行動或行動計劃(戰略),并且這些選擇是同時進行的。
適用:不需要考慮博弈過程的完全信息博弈問題(特別是完全信息靜態博弈)
戰略式博弈三要素:
有限博弈:
“囚徒困境”博弈戰略式描述:
表1 “囚徒困境”戰略式描述
“猜硬幣”戰略式描述:
表2 “猜硬幣”戰略式描述
3. 問題的解——Nash均衡(純戰略)、混合戰略Nash均衡(混合戰略)
1) 重復剔除劣戰略行為(化簡原博弈問題)
在n人博弈中,如果對于參與人i,存在戰略
參與人i將會把
注:如果每次剔除的是嚴格劣戰略,均衡結果與剔除順序無關;如果剔除的是弱劣戰略,均衡結果可能與剔除順序有關。
2) 純戰略——Nash均衡(Nash Equilibrium)——John Nash 20世紀50年代
在一個給定的n人戰略式博弈
3) 混合戰略——混合戰略Nash均衡
在一個給定的n人戰略式博弈
支撐求解法
支撐(記為
有限n人戰略式博弈的支撐求解法:
1) 構造出所有的混合戰略均衡的支撐。
2) 對于每個給定的支撐,求解如下方程組。
3) 驗證方程組的解。
b) 不存在一個不屬于支集
規劃求解法
將求解博弈的混合戰略Nash均衡轉換為對一個規劃問題進行求解。
有限n人戰略式博弈的規劃求解法:
Wilson奇數定理(oddness theorem):幾乎所有的有限戰略式博弈都有有限奇數個Nash均衡。
參考文獻:
[1] 羅云峰. 博弈論教程. 北京: 清華大學出版社, 北京交通大學出版社, 2007.