精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
博弈論——戰略式博弈 - 6DAN - 博客園

 

圖1 戰略式博弈

1. 問題提出

囚徒困境(prisoner’ dilemma)——Tuncker 20世紀50年代(純戰略)

兩個小偷作案后被警察抓住,分別不同的屋子里審訊。在審訊之前,小偷從律師那里得知:如果兩個人都坦白,將被各判刑4年;如果兩個人都抵賴,將會因為證據不足而各判1年;如果其中一人坦白而另一人抵賴,坦白的將會得到寬大處理而被無罪釋放,而抵賴的將重判,判刑6年。試問兩個小偷將會如何選擇?

純戰略:參與人在給定信息下只選擇一種特定的戰略(行動)。

猜硬幣(混合戰略)

兩個參與人各握一枚硬幣,雙方同時選擇是正面向上(記作O)還是背面向上(記作R),即他們的戰略空間都是{O,R}。若兩枚硬幣是一致的(即全部背面向上或者全部正面向上),參與人2贏得參與人1的硬幣;若兩枚硬幣不一致,則參與人1贏得參與人2的硬幣。

混合戰略:參與人在給定信息下以某種概率分布隨機地選擇不同的行動(戰略空間上的概率分布)。解釋了一個參與人對其他參與人所采取行動的不確定性

在一個給定的n人戰略式博弈

中,對于任一參與人,設
,則參與人i的一個混合戰略為定義在戰略集
上的一個概率分布
,其中
表示參與人i選擇戰略
的概率,即
滿足:

2. 問題描述——戰略式博弈

戰略式博弈(strategic form game):也稱標準式博弈,是一種相互作用的決策模型,這種模型假設每個參與人僅選擇一次行動或行動計劃(戰略),并且這些選擇是同時進行的。

適用:不需要考慮博弈過程完全信息博弈問題(特別是完全信息靜態博弈)

戰略式博弈三要素

1) 參與人集合

2) 每位參與人非空的戰略集

,即

3) 每位參與人定義在所有戰略組合

上的偏好關系
或者效用函數

有限博弈

(參與人人數有限)且
(每個參與人的戰略數有限),記為

“囚徒困境”博弈戰略式描述:

 

表1 “囚徒困境”戰略式描述

“猜硬幣”戰略式描述:

 

表2 “猜硬幣”戰略式描述

3. 問題的解——Nash均衡(純戰略)、混合戰略Nash均衡(混合戰略)

1) 重復剔除劣戰略行為(化簡原博弈問題)

在n人博弈中,如果對于參與人i,存在戰略

,對
,有
,則稱戰略
為參與人i的劣戰略(嚴格劣戰略),或者戰略
相對于
占優;有
,且
,使得
,則稱戰略
為參與人i的弱劣戰略

參與人i將會把

中剔除掉,直接從戰略集
中選擇自己的戰略。
------------------------->
,其中

注:如果每次剔除的是嚴格劣戰略,均衡結果與剔除順序無關;如果剔除的是弱劣戰略,均衡結果可能與剔除順序有關

2) 純戰略——Nash均衡(Nash Equilibrium——John Nash 20世紀50年代

在一個給定的n人戰略式博弈

中,戰略組合
是一個Nash均衡,當且僅當
時,有
或者

3) 混合戰略——混合戰略Nash均衡

在一個給定的n人戰略式博弈

中,混合戰略組合
為一個Nash均衡,當且僅當
,有

支撐求解法

支撐(記為

)是指參與人按照
選擇戰略時,純戰略組合
中以大于0的概率出現的所有純戰略組合的集合,即

有限n人戰略式博弈的支撐求解法:

1) 構造出所有的混合戰略均衡的支撐。

2) 對于每個給定的支撐,求解如下方程組。

 

3) 驗證方程組的解。

a) 解都大于0。即

b) 不存在一個不屬于支集

的戰略
,給定其他參與人的戰略
,參與人i采用
所得到的期望效用大于采用支集
中戰略的期望效用。即

規劃求解法

將求解博弈的混合戰略Nash均衡轉換為對一個規劃問題進行求解。

有限n人戰略式博弈的規劃求解法:

 

Wilson奇數定理(oddness theorem):幾乎所有的有限戰略式博弈都有有限奇數個Nash均衡。

 

參考文獻:

[1] 羅云峰. 博弈論教程. 北京: 清華大學出版社, 北京交通大學出版社, 2007.

本站僅提供存儲服務,所有內容均由用戶發布,如發現有害或侵權內容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
納什均衡
博弈論中的納什均衡——完全信息靜態博弈
囚徒困境、智豬博弈、納什均衡與一致預期(博弈論入門學習筆記二)
圍棋是有缺陷的游戲?圍棋的博弈論與納什均衡
游戲博弈論:洞悉''剪刀-石頭-布''背后的納什均衡
博弈論復習題及答案
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯系客服!

聯系客服

主站蜘蛛池模板: 文登市| 喀喇沁旗| 四子王旗| 兴安县| 江华| 德兴市| 明星| 清苑县| 乾安县| 平和县| 军事| 新沂市| 岗巴县| 平阴县| 潜江市| 汉中市| 天峻县| 乾安县| 红原县| 中阳县| 神农架林区| 牡丹江市| 浦江县| 永川市| 花莲市| 宣化县| 静海县| 阿鲁科尔沁旗| 陆丰市| 梁平县| 巩义市| 平南县| 延津县| 镇江市| 聊城市| 南安市| 建宁县| 昌黎县| 景洪市| 长武县| 镇巴县|