精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
博弈論Lecture7

知識安排:

個體理性決策(已學習)

博弈的表示理論(在學習)

博弈的解的理論(solution)

 

博弈的表示理論

1、展開型(extensive form)——強調過程

組成:(1)博弈者-即博弈者的行動順序

         (2)自然的行為選擇-由局部行動集作出行為選擇

         (3)信息集(信息完美,信息完全)

         (4)自然的行動-考慮到參與者賦予自然的先驗概率

         (5)Pay off function-即utinity function

流程:自然行動-結果-評價-Pay off function

For example:

                                      終節點- 結果-效用評價

         

       賄賂  ————被告

                                     不賄賂————70   0                  

原告

                                       賄賂————0  70

       不賄賂————被告

                                      不賄賂 ————60 40

       決策節點—自然選擇  ,節點前的虛線代表被告不知道前面發生了什么,這是一種信息不完美

 

 

被告

 

 

 

原告

30,10

70,0

 

0,70

60,40

 

是一種,理論動態(按順序行動),經驗靜態(行動者只做一次行為選擇,相當于同時行動)的博弈。

 

2.策略性(strategic form)-對一個策略互動博弈的最基本描述(用符號G代替)

G的組成:

 I :博弈者的集合——原告和被告

 A i € I: 純策略集合,行動集——原告的賄賂和不賄賂,被告的賄賂和不賄賂

 F  i € I: ×A i (i€I )R:一個pay off function 建立 在所有Ai集合的笛卡爾積。此處的笛卡爾積是所有可能結果的配對。

(笛卡兒積即笛卡爾乘積是指在數學中,兩個集合 XY的笛卡尓積(Cartesian product),又稱直積 ,表示為X × Y,第一個對象是X的成員而第二個對象是Y的所有可能有序對 的其中一個成員)

 

3.經驗意義上的靜態博弈——同時行動的博弈——games of simultaneous moves

(1)首先,沒有完全靜態的博弈

(2)定義:只做一次行動,不知道對方行動,前不知后,后不知前,可以看作同時行動

 

原告                     相當于         被告

                        

(3)靜態博弈一般是信息完全的

 

4.信息完美與信息完全

(1)從展開型看信息完美:

     接上面例子:只要你行動的時候,對過去發生的事情都了解(被告知道了原告是否賄賂)

(2)從經典博弈論看信息完全:

      在經典博弈論中,假設參與者是理性而又智能的人(即了解信息多,明白整個博弈的表示,會有不完美的信息,但他知道他不懂的地方是哪里)

      認為,博弈結構表示(比賽規則)是博弈者之間的commom konwledge,這就是信息完全的假設。所以在理論上,經典博弈論研究的都是信息完全。雖然有信息不完美,但是可以信息完全。

(3)經驗意義上的信息不完全:

      在G : I A F 中存在三種情況

I : 知人知面不知心。A:在給與不給朋友抄襲中,他選擇了告訴老師。明槍暗箭。F:面對同樣結果,對于對方的效用不了解。  

 

(4)信息不完全導致了效u的信息不完全,對于不同的博弈者會有不同的類型。經驗意義上的信息不完全會轉化為理論上的信息不完美博弈。——日后深入學習(本人沒有聽懂)

 

5.策略間的兩種關系:

知識準備:

G: I ——A(行動集)——Si(策略集)(Si>A) : 其中 Si=Δ(Ai) 即 行動所有概率分布集,分為混合策略(mixed)和純策略(pure)。

 

例如:在原告中:賄賂、不賄賂,找大官二叔,這就是一個混合策略,以正的概率使用兩個或兩個以上的行動,“0.1、0.5”——在博弈者的plan of action中,即一個人在具體的情況下,有一個可欲的行動集,在選擇規則作用下,在可欲行動集中以一個概率選擇某一行動。賄賂就是一種純策略。

保持策略的模糊性、不確定性意味著混合策略。

 

(1)同一個博弈者的不同策略間的優超關系-dominance

符號引入:i 即  myself.     Si Si'€Si,Si、Si'即同一個博弈者的不同策略

當Si dominates Si',

?S-i.€S-i. (-i除了i外的其他人,即對于對手的所有策略)  Fi(Si.S-i)>Fi(Si'.S-i)(Si應付對手S-i所帶來的支付函數)

混合策略:

舉例:2/3賄賂+1/3不賄賂——S-i.

         1/4賄賂+3/4不賄賂——Si.

則:2/3x1/4x30(賄賂,賄賂)+2/3x3/4x70(賄賂,不賄賂)+1/3x1/4x0(不賄賂,賄賂)+1/3x3/4x60(不賄賂,不賄賂)

加起來,就是原告應付被告所得到的期望效用

 

或者:

=∑Si(am)xS-i(ak)xFi(amxak)——Si(am)即am出現的概率,S-i(ak)即ak出現的概率。

am,ak)€(Ai,A-i)

以上,將期望效用 用函數建立在策略組合之下

所以:Si' dominated str——被優超或者劣次優超

如果這個對手的策略是一個無限多集合,那么這個定義可以簡化為: Fi(Si.S-i)>Fi(Si'.S-i)

 

純策略:

檢驗一個純策略優超于另外一個純策略,利用期望效用的函數的線性關系。

 

舉例:論證賄賂優超于不賄賂

1.應對對方賄賂時,(賄賂,賄賂)>(不賄賂,賄賂)

 應對對方不賄賂時,(賄賂,不賄賂)>(不賄賂,不賄賂)

2.對方采取混合策略,我方采取純策略:

1/4(賄賂,賄賂)>1/4(不賄賂,賄賂)

3/4(賄賂,不賄賂)>3/4(不賄賂,不賄賂)

推廣開來:

比較同一博弈者的不同策略

(賄賂,q賄賂+(1-q)不賄賂)>(1/2賄賂+1/2不賄賂,q賄賂+(1-q)不賄賂)

根本在于期望值的計算

注意:優超只定義在對手的行動組合上

 

劣策略:

以正的概率使用一個劣策略,這個混合策略是一個劣策略

舉例:買餃子可能買到少鹽或多鹽的,我喜歡面條

我以1/2的概率買餃子(以正的概率使用一個劣策略),我以1/2的概率買面條,這是一個劣策略

舉例:

 

 

 

 

 

3,-

0,-

 

0,-

3,-

 

1,-

1,-

中不會被上下超越,只是一個劣策略,中會被一個混合策略(1/2上,1/2下超過

 

F(中,左)=1 > F(1/2上,1/2下,左)=1/2x3+1/2x0=3/2,此時,用中應付左不如以1/2上和1/2下應付左好。

當數值改變,會發生不同后果。

占優策略-dominant stragedy

一個博弈者只有一個純策略,這個純策略優于所有行動純策略,這就是一個占優策略。

例如:原告賄賂就是一個占優策略。

在此角度下看,個體理性決策

根據效用最大化,一個理性的博弈者,有劣策略,是不會使用劣策略的;有占優策略,他應該使用占優策略。

下集預告:

劣策略的刪除

最優反應關系的納什均衡

本站僅提供存儲服務,所有內容均由用戶發布,如發現有害或侵權內容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
淺談博弈論
博弈論之總結
論靜態與動態博弈中的邏輯推理
博弈論(四)
那些悼念納什的人,你們真的懂NASH嗎
策略——博弈論導論
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯系客服!

聯系客服

主站蜘蛛池模板: 扶余县| 日喀则市| 同仁县| 德安县| 社会| 临颍县| 浦东新区| 肃宁县| 永宁县| 尤溪县| 行唐县| 离岛区| 五台县| 彩票| 津南区| 大悟县| 土默特右旗| 隆安县| 登封市| 莱州市| 青海省| 昭苏县| 获嘉县| 阿勒泰市| 长宁县| 茌平县| 茂名市| 大方县| 潞城市| 韩城市| 香格里拉县| 茂名市| 西城区| 越西县| 铁岭县| 思南县| 大邑县| 通州市| 水富县| 平阳县| 岐山县|