決策需要信息,幾乎所有需要決策的場合我們都掌握著有限信息,這使得現實中往往是有限信息博弈。完全信息在這里指的是每個參與人對其他參與人的支付函數有著完全的了解。而靜態指的是同時行動的博弈,或者不同時但后行動者不知道之前行動者的決策。
在完全信息靜態博弈中的均衡是納什均衡。最典型的例子是囚徒困境與智豬博弈。下面就由這兩個例子展開,并將在博弈論中的一些知識點做出介紹。
【囚徒困境】中基于收益矩陣的模型描述如下:
【注】博弈中參與人只擁有有限個離散性的純戰略供其選擇稱為離散型策略。而在另外一些博弈中,每個參與者的純策略可以是來自連續范圍的一個數,如廠商定價,稱為連續型策略。離散型策略靜態博弈可以用支付表來表示,如上圖。
對于囚徒A與B來說,無論對方采取什么策略,自己的策略是“坦白”時總是比“抵賴”要好些,在兩人無法通信的情況下,兩人都會選擇“坦白”。
【優勢戰略均衡】在這里,無論對方選擇什么,“坦白”的收益是嚴格大于“抵賴”,所以“坦白”是一個嚴格優勢策略,對應的“抵賴”則是一個劣勢策略。所有人都有自己的優勢策略,由此產生的優勢策略組合是一個優勢戰略均衡。
但是這里需要注意的是,雙方各自的優勢策略卻導致了集體的利益最差,如果兩人都選擇“抵賴”收益將是各自-1,但是優勢策略下的收益卻是-8.囚徒困境反映了個人理性與集體理性的沖突。個人的最優選擇從社會角度看并不是最優的。社會生活中有很多例子:公共品的給予,商家的價格戰,團隊生產中的偷懶(三個和尚沒水喝),小學生減負越減越重,各國軍備競賽等。
【如何走出囚徒困境】如果有可信的承諾或者是懲罰(第三方實施),會使兩人合作,促進集體利益最高。
【智豬博弈】智豬博弈的收益矩陣模型如下:
在此處,小豬有優勢與劣勢策略,但大豬沒有,只能根據小豬的策略做出最佳應對,而小豬不會選擇劣勢策略,因此剔除小豬“按”的策略,此時,大豬的策略只能為“等”。
【重復剔除劣勢戰略均衡】嚴格劣勢策略為不管其他參與人怎樣選擇呢策略,參與人選擇策略A時的收益嚴格小于策略B時的收益。因此嚴格劣勢策略不會被選取,不斷剔除嚴格劣勢策略簡化博弈,直到沒有劣勢策略為止。如果剩下唯一的策略組合,那么該策略稱為重復剔除劣勢戰略均衡。
【弱優勢策略】若對某些參與者而言,不管其他參與者做何種決策,如果A策略至少與B策略一樣好,或者某些時候嚴格好于B策略,那么A策略就叫做弱優勢策略,相對的,B為弱劣勢策略。逐次剔除弱劣勢策略可能會去掉某些納什均衡。
【優勢戰略均衡與重復剔除劣勢戰略均衡】前者是選擇法,要求每個參與人是理性的;后者是排除法,要求“共同知識”。
【納什均衡】在其他人保持自己的策略不變的情況下,沒有人可以通過改變自己的策略獲得更高的收益。
【注】每個優勢戰略均衡或者重復剔除劣勢戰略均衡一定是納什均衡,但反之不然;納什均衡一定是在重復剔除劣勢策略中未被剔除的戰略組合,反之不然,除非是唯一組合了。
【多重均衡與協調】一般來說,博弈不一定只有一個均衡。具有多重均衡的博弈被稱為協調博弈。
本站僅提供存儲服務,所有內容均由用戶發布,如發現有害或侵權內容,請
點擊舉報。