知識安排:
個體理性決策(已學習)
博弈的表示理論(在學習)
博弈的解的理論(solution)
博弈的表示理論
1、展開型(extensive form)——強調過程
組成:(1)博弈者-即博弈者的行動順序
(2)自然的行為選擇-由局部行動集作出行為選擇
(3)信息集(信息完美,信息完全)
(4)自然的行動-考慮到參與者賦予自然的先驗概率
(5)Pay off function-即utinity function
流程:自然行動-結果-評價-Pay off function
For example:
終節點- 結果-效用評價
賄賂 ————被告
不賄賂————70 0
原告
賄賂————0 70
不賄賂————被告
不賄賂 ————60 40
決策節點—自然選擇 ,節點前的虛線代表被告不知道前面發生了什么,這是一種信息不完美
|
| 被告 |
|
|
| 賄 | 不 |
原告 | 賄 | 30,10 | 70,0 |
| 不 | 0,70 | 60,40 |
是一種,理論動態(按順序行動),經驗靜態(行動者只做一次行為選擇,相當于同時行動)的博弈。
2.策略性(strategic form)-對一個策略互動博弈的最基本描述(用符號G代替)
G的組成:
I :博弈者的集合——原告和被告
A i € I: 純策略集合,行動集——原告的賄賂和不賄賂,被告的賄賂和不賄賂
F i € I: ×A i (i€I )→R:一個pay off function 建立 在所有Ai集合的笛卡爾積。此處的笛卡爾積是所有可能結果的配對。
(笛卡兒積即笛卡爾乘積是指在數學中,兩個集合 X和Y的笛卡尓積(Cartesian product),又稱直積 ,表示為X × Y,第一個對象是X的成員而第二個對象是Y的所有可能有序對 的其中一個成員)
3.經驗意義上的靜態博弈——同時行動的博弈——games of simultaneous moves
(1)首先,沒有完全靜態的博弈
(2)定義:只做一次行動,不知道對方行動,前不知后,后不知前,可以看作同時行動
原告 相當于 被告
(3)靜態博弈一般是信息完全的
4.信息完美與信息完全
(1)從展開型看信息完美:
接上面例子:只要你行動的時候,對過去發生的事情都了解(被告知道了原告是否賄賂)
(2)從經典博弈論看信息完全:
在經典博弈論中,假設參與者是理性而又智能的人(即了解信息多,明白整個博弈的表示,會有不完美的信息,但他知道他不懂的地方是哪里)
認為,博弈結構表示(比賽規則)是博弈者之間的commom konwledge,這就是信息完全的假設。所以在理論上,經典博弈論研究的都是信息完全。雖然有信息不完美,但是可以信息完全。
(3)經驗意義上的信息不完全:
在G : I A F 中存在三種情況
I : 知人知面不知心。A:在給與不給朋友抄襲中,他選擇了告訴老師。明槍暗箭。F:面對同樣結果,對于對方的效用不了解。
(4)信息不完全導致了效u的信息不完全,對于不同的博弈者會有不同的類型。經驗意義上的信息不完全會轉化為理論上的信息不完美博弈。——日后深入學習(本人沒有聽懂)
5.策略間的兩種關系:
知識準備:
G: I ——A(行動集)——Si(策略集)(Si>A) : 其中 Si=Δ(Ai) 即 行動所有概率分布集,分為混合策略(mixed)和純策略(pure)。
例如:在原告中:賄賂、不賄賂,找大官二叔,這就是一個混合策略,以正的概率使用兩個或兩個以上的行動,“0.1、0.5”——在博弈者的plan of action中,即一個人在具體的情況下,有一個可欲的行動集,在選擇規則作用下,在可欲行動集中以一個概率選擇某一行動。賄賂就是一種純策略。
保持策略的模糊性、不確定性意味著混合策略。
(1)同一個博弈者的不同策略間的優超關系-dominance
符號引入:i 即 myself. Si Si'€Si,Si、Si'即同一個博弈者的不同策略
當Si dominates Si',
則?S-i.€S-i. (-i除了i外的其他人,即對于對手的所有策略) Fi(Si.S-i)>Fi(Si'.S-i)(Si應付對手S-i所帶來的支付函數)
混合策略:
舉例:2/3賄賂+1/3不賄賂——S-i.
1/4賄賂+3/4不賄賂——Si.
則:2/3x1/4x30(賄賂,賄賂)+2/3x3/4x70(賄賂,不賄賂)+1/3x1/4x0(不賄賂,賄賂)+1/3x3/4x60(不賄賂,不賄賂)
加起來,就是原告應付被告所得到的期望效用
或者:
=∑Si(am)xS-i(ak)xFi(amxak)——Si(am)即am出現的概率,S-i(ak)即ak出現的概率。
(am,ak)€(Ai,A-i)
以上,將期望效用 用函數建立在策略組合之下
所以:Si' dominated str——被優超或者劣次優超
如果這個對手的策略是一個無限多集合,那么這個定義可以簡化為: Fi(Si.S-i)>Fi(Si'.S-i)
純策略:
檢驗一個純策略優超于另外一個純策略,利用期望效用的函數的線性關系。
舉例:論證賄賂優超于不賄賂
1.應對對方賄賂時,(賄賂,賄賂)>(不賄賂,賄賂)
應對對方不賄賂時,(賄賂,不賄賂)>(不賄賂,不賄賂)
2.對方采取混合策略,我方采取純策略:
1/4(賄賂,賄賂)>1/4(不賄賂,賄賂)
3/4(賄賂,不賄賂)>3/4(不賄賂,不賄賂)
推廣開來:
比較同一博弈者的不同策略
(賄賂,q賄賂+(1-q)不賄賂)>(1/2賄賂+1/2不賄賂,q賄賂+(1-q)不賄賂)
根本在于期望值的計算
注意:優超只定義在對手的行動組合上
劣策略:
以正的概率使用一個劣策略,這個混合策略是一個劣策略
舉例:買餃子可能買到少鹽或多鹽的,我喜歡面條
我以1/2的概率買餃子(以正的概率使用一個劣策略),我以1/2的概率買面條,這是一個劣策略
舉例:
|
| 乙 |
|
|
| 左 | 右 |
甲 | 上 | 3,- | 0,- |
| 下 | 0,- | 3,- |
| 中 | 1,- | 1,- |
中不會被上下超越,只是一個劣策略,中會被一個混合策略(1/2上,1/2下超過
F(中,左)=1 > F(1/2上,1/2下,左)=1/2x3+1/2x0=3/2,此時,用中應付左不如以1/2上和1/2下應付左好。
當數值改變,會發生不同后果。
占優策略-dominant stragedy
一個博弈者只有一個純策略,這個純策略優于所有行動純策略,這就是一個占優策略。
例如:原告賄賂就是一個占優策略。
在此角度下看,個體理性決策
根據效用最大化,一個理性的博弈者,有劣策略,是不會使用劣策略的;有占優策略,他應該使用占優策略。
下集預告:
劣策略的刪除
最優反應關系的納什均衡