我們在生活中經常會遇到討價還價的場景,購買東西的時候,會與老板進行討價還價,在家里與孩子相處,或者與家里其他人相處時,也會有討價還價的場景,比如小孩放假,想看動畫片,父母覺得看太久會傷眼睛,這時候小孩可能會說“今天放假,我想看三集光頭強”,父母可能會說“看太長時間會傷害眼睛,我們先看一集好不好?寶寶”,最后雙方經過幾次博弈,確定看兩集。
同樣在工作中,經常會遇到與自己的老板談漲薪資的問題,也是雙方博弈的一個問題,作為員工的我們,都希望能多漲工資,而作為老板,則希望花更少的成本,在漲薪資的問題上,雙方就會博弈。
面對生活和工作中無處不在的博弈問題,有些人掌握了一套自己的方法,從而在博弈中經常獲勝,而很多其他人總會在博弈中敗北,有沒有一些簡單易用的工具可以讓博弈問題變得簡單?
《策略思維》這本書就是圍繞這些問題展開,進而得出普通大眾都能掌握的幾個工具。
《策略思維》由耶魯大學和普林斯頓大學兩位教授聯合撰寫的一本書,該書用許多活生生的例子,向沒有經濟學基礎的讀者展示了博弈論策略思維的道理。全書共13章,整體回答了幾個方面的問題:
1、我們為什么要研究策略思維?
2、常見的博弈場景有哪些?
3、在博弈中,通常會采取哪些策略行動?
4、采取策略行動時,會遇到什么問題?
5、面對生活中經常出現的博弈場景,可以采用什么策略?
書的主旨是告訴我們在自己的工作和生活中如何使用策略思維。
以下是讀完整本書,總結的邏輯結構圖。
在分析為什么研究策略思維之前,我們可以先思考,什么是策略思維?它與博弈論有什么關系?
策略思維的科學稱為博弈論(也就是兩者本質是一回事)。我們耳熟能詳的博弈論是囚徒困境,策略思維是關于了解對手打算如何戰勝我們,然后我們采取相應的方法戰而勝之的藝術。全書開篇用了一些生活的案例來說明為什么我們要研究策略思維,這也是我們比較關心的問題。
01
我們為什么要研究策略思維
工作,即便只是社交生活,也可以看做是一個永無止息的決策過程。從事什么樣的工作,怎樣打理一宗生意,該和誰結婚,怎樣將孩子撫養成人,要不要競選總統,等等,這些都只不過是重大決策的幾個例子。上述情況存在一個共同的條件,即你不是在一個毫無干擾的真空世界里做決定。相反,你的身邊全是和你一樣主動的決策制定者,他們的選擇與你的選擇相互作用。這種互動關系將對你的思維和行動產生重要的影響。
中國的跨地區移動通訊為什么要收取漫游費?要知道,全世界只有三個國家在收取漫游費——中國、印度和日本。為什么?運營商說跨地區移動通訊會增加運營商的業務量,所以成本的增加使得它們通過收取漫游費來填補額外的成本。其實,收取的漫游費數量遠遠超出了它們購買設備處理業務的費用,這樣的理由是不成立的。
那么,是什么難言之隱讓運營商要收取漫游費呢?博弈論讓我們很容易推演出運營商難言的秘密:如果取消漫游費,那么運營商們就處于全國統一的競爭性市場中,他們之間就會打起價格戰,導致大多數運營商退出,而留下極少數幸存者壟斷市場。并不是所有的運營商都有這樣的自信:我會是最后的幸存者。所以它們之間就達成這樣的默契:通過漫游費將市場分割為各個區域性市場。漫游費是地區市場分割的壁壘,各個地區的運營商都在自己的地盤里過著壟斷帶來的好日子。
圖源:互聯網
比如,在漫游費的高墻下,你是北京的用戶,想用重慶的電話,因為重慶的話費可能要便宜一些。但是,漫游費就讓你用重慶的電話比用北京的電話還要貴。這樣,即使重慶的電話費比北京的電話費便宜,漫游費也讓你難以企及,因為加上漫游費,對你來說用重慶的電話就要比用北京的電話貴了。同樣,重慶的用戶也會只用重慶的電話,各個地區的用戶都只用本地區的電話,全國性的統一競爭性市場就被分割成各個地區的壟斷市場,而用戶們也不得不支付高額的話費。在這里,博弈論所起的作用是:它預言統一市場中會出現價格戰。競爭性市場里的企業相互殺價,進行價格戰就是“囚徒困境”,而相互出賣是它們的選擇。
另外,帆船比賽給我們提供了一個很好的機會,觀察“跟隨領頭羊”策略的一個很有意思的反例。成績領先的帆船,通常都會照搬尾隨船只的策略。一旦遇到尾隨的船只改變航向,那么成績領先的船只也會照做不誤。實際上,即便尾隨的船只采用一種顯然非常低劣的策略時,成績領先的船只也會照樣模仿。為什么?因為成績接近是沒有用的,只有最后勝出才有意義。
圖源:互聯網
跟在別人后面第二個出手有兩種辦法。一是一旦看出別人的策略,你立即模仿,好比帆船比賽的情形;二是再等一等,直到這個策略被證明成功或者失敗之后再說,好比電腦產業的情形。而在商界,等得越久越有利,這是因為,商界與體育比賽不同,這里的競爭通常不會出現贏者通吃的局面。結果是,市場上的領頭羊們,只有當它們對新生企業選擇的航向同樣充滿信心時,才會跟隨這些企業的步伐。
又比如在一個大型出租車隊里,汽車經常是由調度員派給司機的。車隊里既有好車,也有年久失修的老爺車。調度員可以利用他的調度權向每個司機收取一點賄賂。誰若是拒絕行賄,就一定會得到一部老爺車,而那些愿意合作的司機就會“抽到”上上好簽。這么一來,調度員是發達了,但司機們作為一個群體,面對的還是他們就算不賄賂調度員也能得到的同樣一些汽車。假如司機們聯合起來,也許可以結束這種被迫行賄的日子,問題在于怎樣才能組織起來采取行動。問題的關鍵不是調度員能從行賄者那里得到多少好處,而是他可以嚴厲懲罰那些不肯行賄的人。
以上的例子可以看出,策略思維在我們的生活中處處存在,因此,我們有必要對其進行研究,了解對手打算如何戰勝我們,然后找到我們自己的最優策略,來戰勝他們。
既然要研究策略思維,是否需要對每個事件都提出單獨的策略,是否有共性的部分?如果沒有共性的部分,那研究策略思維貌似也沒有意義,因為我們根本無法窮盡所有的事件。通過研究發現,博弈場景通常分為兩種。
02
常見的兩種博弈場景
作者經過大量的研究,發現無論是工作還是生活,我們所遇到的博弈,通常就分為兩種情景:一種是相繼進行的博弈,也就是會按照一個先后秩序進行,另外一種是同時行動的博弈。
針對這兩種博弈作者提出了相應的法則,相繼進行的博弈,法則為“向前展望,倒后推理”。什么意思?就是展望最初決策最后可能導致什么結果,利用這個信息確定自己的最佳選擇。
同時行動的博弈,有兩條法則:法則1---假如你有一個優勢策略,請照辦。法則2---剔除所有劣勢策略,不予考慮,如此一步一步做下去。
這些法則看起來比較難落地,是否有相關的工具能幫助分析決策?相繼進行的博弈,可以使用決策樹來幫助我們進行分析,比如從普林斯頓到紐約旅行會遇到幾次選擇。第一個決策點是選擇旅行的方式:乘公共汽車、乘火車還是自己開車。選擇自己開車的人接下來就要選擇走費拉扎諾·奈羅斯橋、荷蘭隧道、林肯隧道還是喬治·華盛頓橋。選擇搭乘火車者必須決定是在紐瓦克(Newark)換乘PATH列車還是直達紐約賓夕法尼亞車站。等到進入紐約,搭乘火車或公共汽車的人還必須決定怎樣抵達自己的最后目的地,是步行、乘地鐵 (是本地地鐵還是高速地鐵)、乘公共汽車還是乘出租車。最佳決策取決于多種因素,包括價格、速度、難以避免的交通堵塞、紐約城里的最終目的地所在以及對澤西收費公路上的空氣污染的厭惡程度,等等。使用決策樹將上述信息畫成一張圖就一目了然。
同時行動的博弈,可以使用二維的表格工具進行分析,比如《時代》與《新聞周刊》的封面之爭,假設有一個星期出了兩樁大新聞:一是眾議院和參議院就預算問題吵得不可開交;二是發布了一種據說對艾滋病有特效的新藥。《時代》與《新聞周刊》編輯們選擇封面故事的時候,首要考慮的是哪一條新聞更能吸引報攤前的買主?
在報攤前的買主當中,假設30%的人對預算問題感興趣,70%的人對艾滋病新藥感興趣。這些人只會在自己感興趣的新聞變成封面故事的時候掏錢買雜志;假如兩本雜志用了同一條新聞做封面故事,那么感興趣的買主就會平分兩組,一組買《時代》,另一組買《新聞周刊》。
《時代》的編輯可以進行如下推理:“假如《新聞周刊》采用艾滋病新藥做封面故事,那么,假如《時代》采用預算問題,《時代》就會得到整個 '預算問題市場’(即全體讀者的30%),假如《時代》采用艾滋病新藥,那么兩家就會平分 '艾滋病新藥市場’(即我得到全體讀者的35%),因此,艾滋病新藥為《時代》帶來的收入就會超過預算問題。可以借助一個簡單的表格,更加迅速而清晰地看出這番推理的邏輯性。
如下圖所示,兩列表示《新聞周刊》的對應選擇,用兩行表示《時代》的對應選擇。這時我們得到四個格子,每一個格子對應一組策略。格子里的數字代表《時代》的銷量,用購買《時代》的讀者數占全體潛在讀者數的百分比顯示。第一行顯示的是假如《時代》選擇艾滋病新藥,它在《新聞周刊》選擇艾滋病新藥或者預算問題的兩種情況下的銷量。第二行顯示的是假如《時代》選擇預算問題,它在《新聞周刊》選擇艾滋病新藥或者預算問題的兩種情況下的銷量。
這個優勢策略很容易看出來。第一行的兩個格子無一例外都比第二行對應的格子占優,因為第一行的兩個數字都比排在同一列下面的數字大。這是優勢地位的特征。
當我們使用工具幫助我們做了策略的推演,可以采取哪些行動來激發對方,最終讓我們的策略得以實現。
那么,在日常工作和生活一些常見場景中,我們可以采取哪些常用的策略行動?
03
常用的策略行動
面對不同場景,我們可以采取的策略行動包括:無條件行動,強迫性威脅,阻嚇性威脅,強迫性許諾,阻嚇性許諾,警告,保證和承諾。
無條件行動
設想美國和日本爭先恐后發展高清晰度電視。雖然美國擁有技術方面的優勢,卻由于財政赤字越積越高,可以動用的資源實在非常有限。日本抓住美國這個短處,再次擊敗了它。不過,一個乍看上去可能進一步束縛美國的策略行動其實可以扭轉整個局面。
在缺少無條件行動的前提下,華盛頓和東京同時開始選擇各自的策略。每個國家都必須決定對研究開發的投入是高還是低;投入高,會大大縮短開發時間,當然產生的成本也更高。雙方博弈會出現4種結果(下面的數字代表各自得到的利益,比如美國選擇投入低的策略得到收益為4,日本也選擇投入低得到的收益為3):
圖源:《策略思維》
日本最愿意看到的結果是自己得到收益為4,自己選擇高水平,美國卻選擇低水平;那樣的話,它取勝的機會很大,而且資源成本問題在它看來也沒那么嚴重。在美國看來,最理想的結果是雙方同時選擇低水平,那樣的話,美國很有機會以較低成本打贏這一仗。
低水平是美國的優勢策略。美國的問題在于,日本會早已料到這一點。日本的最佳對策是轉向高水平。日本還沒來得及做出決定,美國已經搶先宣布自己無條件支持這一開發項目。這就使原本同時出招的博弈變成相繼出招的博弈,而且還是美國先行。美國應該宣布選擇高水平,同時希望日本報以低水平。這就是這個相繼出招的博弈的均衡點。
這個使美國占得有利形勢的策略行動,在于單方面、無條件地宣布自己的選擇。美國的這個策略行動改變了日本的預期,進而改變了它的行動。一旦相信美國會不惜一切代價選擇高水平,日本就會選擇低水平。當然了,等到日本拿定了主意,美國最好還是改變主意,同樣回到低水平的道路上去。
強迫性威脅
比如恐怖分子劫持一架飛機,其確立的回應規則是假如他的要求不能得到滿足,全體乘客都將死于非命。強迫性威脅的目的在于促使某人采取行動。
阻嚇性威脅
比如美國威脅說,假如蘇聯出兵攻擊任何一個北約國家,它就會以核武器回敬。阻嚇性的威脅的目的在于阻止某人采取某種行動。
強迫性許諾
為尋找證人,檢察官會向一個被告許諾說,只要他愿意成為公訴方的證人,檢舉同案中的其他被告,他就會得到寬大處理。強迫性許諾的用意是促使某人采取對你有利的行動,比如讓被告搖身一變成為公訴方的證人。
阻嚇性許諾
阻嚇性許諾的目的在于阻止某人采取對你不利的行動,比如黑幫分子許諾會好好照顧證人,只要他答應保守秘密。
威脅與許諾的界限非常模糊。比如一個朋友在紐約市被搶了錢,卻得到下面這個許諾:只要你“借給”我20美元,我許諾一定不會傷害你。相比之下更加性命攸關的還是這個歹徒沒有明說的威脅:假如我們這個朋友不肯“借給”他20美元,他就一定會受到傷害。威脅與許諾的界限只取決于你怎樣稱呼當前的情形。
一切威脅與許諾的共同點在于:回應規則使你不會在沒有回應規則的前提下采取行動。假如這個規則只是泛泛地指出,無論什么時候你都會采取最佳行動,那就跟沒有規則差不多。說明什么事情會在沒有規則的情況下發生,仍然具有一種公告天下的作用,這些說明稱為警告與保證。
警告
警告就是實踐一個“威脅”對自己有利,比如假設總統警告說他會否決一個他不喜歡的法案,這只不過是表明了他自己的意圖。警告的用意在于告知其他人,他們的行動將會產生什么影響。
保證
保證就是實踐一個“許諾”對自己有利,比如孩子不理會關于爐子頂部很熱的警告,結果燙傷了,這使父母得到某種保證,知道孩子以后再也不會這么干了。
需要注意,威脅與許諾是真正的策略行動,而警告與保證更多的是起一個告知的作用。警告或者保證不會改變你為影響對方而設立的回應規則。與此截然相反,威脅或者許諾一旦時機來臨,就會改變你的回應規則,使之不再成為最佳選擇。這么做不是為了告知,而是為了操縱。
由于威脅和許諾表明你可能選擇與自身利益沖突的行動,這就出現了一個可信度的問題。等到別人出招之后,你就有動機打破自己的威脅或者許諾。這就引出了可信的承諾。
承諾
承諾是為了改變博弈的結果,通過遵守自己的承諾成為符合我們自身利益的選擇,把威脅變成警告,把許諾變成保證。
要遵守承諾,首先需要建立和利用信譽,讓雙方寫下合同。假如你在博弈當中嘗試了一個策略行動,然后反悔,你可能就會喪失可信度方面的信譽。若是遇到百年一遇、千載難逢的情況,信譽有可能顯得不那么重要,因此也沒有多大的承諾價值。不過,一般情況下,你都會在同一時間跟不同對手進行多個博弈。因此你就有建立信譽的動機,而這就相當于做出一個承諾,以使自己的策略行動顯得可信。
圖源:互聯網
要使你的承諾顯得可信,一個直截了當的辦法就是同意在你不能遵守承諾的時候接受某種懲罰。合同就是確保承諾得以遵守的手段。為使合同方式奏效,負責強迫執行承諾或者收取罰金的一方必須具備某種獨立的動機完成自己的任務。
合同方式更加適用于商業交易。違反合同一般都會造成破壞,因此,受害方一定不愿意善罷甘休。比如,一個制造商就可能要求一個沒能按時送貨的供應商支付罰金。這個制造商不會對供應商究竟有沒有送貨漠不關心。他更愿意得到的是自己訂購的貨物,而不是罰金。在這種情況下,對這份合同進行再談判將不再是雙方都覺得有意思的選擇。
以上雖然說明了在兩種常見的博弈場景下,可以采取相應的策略行動,來讓我們戰勝對手,但是使用策略仍然存在不可預知的風險。
04
不可預知的風險
網球的首要策略教訓之一,就是不到最后一瞬不要選定一個方向。設想有這么一對具備特殊技巧的網球選手。接球者的正手稍微強一些。假如他的預計正確,他的正手回球有90%的機會獲得成功,而反手回球的成功率只有60%。當然,假如他跑向一方而對方發出的球飛向另一方,那么,回球的質量就會大打折扣:假如他跑向反手一方,而對方發出的球飛向他的正手一方,他能及時轉向而成功回球的概率只有30%;反過來,他的成功率只有20%。
圖源:《策略思維》
假如發球者永遠瞄準對手的正手,接球者就會預計到球會朝自己的正手而來,從而有90%的概率回球成功。假如發球者永遠瞄準對手的反手,接球者也能預計到球會朝自己的反手而來,從而有60%的概率回球成功。
假設發球者在每次發球前都會在自己的腦子里投擲一枚假想的硬幣,根據硬幣出現正面或者反面決定自己的發球應該瞄準對手的正手還是反手。猜測準確的概率只有50%。猜測準確的時候,正手回球的成功概率是90%;而猜測出錯的時候,接球者及時轉向而成功回球的概率只有20%。因此,他的整體成功概率是55%。通過類似的計算可以知道,若是向反手方移動,他的整體成功概率是45%。
在發球者采取50∶50混合策略的前提下,接球者若是從自己的角度出發,就能選出最佳回應策略。他應該向正手方向移動,這么做,成功回球的概率達到55%。假如發球者永遠將球發向一方,分別是接球者的正手方和反手方,那么,接球者的成功回球概率分別為90%和60%。
圖源:《策略思維》
發球者瞄準對方正手方向的概率是一條從0到100%的水平線。對于所有這些混合策略,圖中有兩條線,一條顯示接球者準備向正手方移動的成功回球概率,另一條則顯示他準備向反手方移動的成功回球概率。舉個例子:假如接球者準備向正手方移動,概率為0的向正手發球的策略 (即100%地向反手發球的策略)就能使接球者的成功回球概率維持在20%的低水平,而100%地向正手發球的策略則會使接球者的成功回球概率達到90%。接球者的成功回球概率從一端直線上升到另一端。
兩條直線交于一點,在這一點上發球者只有40%的時間將球發向對方正手方。在交點的左邊,接球者若是預計對方會將球發向反手方,那么他的成功回球概率就會提高;而在右邊,他若是預計對方會將球發向正手方,成功回球概率也會提高。
向正手和向反手發球維持在40∶60的混合策略,是唯一一個不會讓接球者用上述方法占便宜的選擇。只有選擇這種混合策略,接球者無論選擇防守正手還是反手,其成功回球概率都是一樣的。兩種情況都會留給接球者48%的成功回球概率。發球者若是采取其他任何一種混合策略,只要接球者善加利用,就能使自己的成功回球概率沿著圖中的兩條直線上升到交點之上,也就是超過48%。因此,40%的時間瞄準對方的正手就是發球者的最佳策略。
假如接球者一半時間向正手方移動,一半時間向反手方移動,他的新的收益曲線就是原來兩條直線的平均值,以點線顯示。由于這條直線是向上延伸的,其最小值永遠出現在左端,該點的成功率為40%。無論接球者向兩方移動的比例是多少,這條直線一定經過成功率為48%的那一點,這是因為發球者可以選擇采用40∶60的混合策略。假如這條直線出現任何傾斜,那么,它的一端一定落在48%以下。只有在接球者的混合策略為30∶70的時候,這條直線才會變成一條水平直線,最小值變成48%。因此,最大值的最小值等于最小值的最大值——48%。
所有混合策略的均衡具有一個共同點:每個參與者并不在意自己在均衡點的任何具體策略。一旦有必要采取混合策略,找出你自己的均衡混合策略的途徑就在于使別人對他們自己的具體行動無所謂。雖然這聽上去像是一種倒退,其實不然,因為它正好符合零和博弈的隨機化動機:你想阻止別人利用你的有規則的行為占你的便宜。
圖源:互聯網
在網球比賽的例子中,當發球者采取自己的均衡策略,按照40∶60的比例選擇攻擊對方正手方和反手方時,接球者的成功率為48%。如果發球者采取其他比例,接球者的成功率就會上升。此時應該采取混合策略。
假設你是網球比賽例子里的接球者,而發球者已經選擇了他的最佳混合策略,即40∶60的混合策略。那么,無論你向正手方還是反手方移動,又或是時而正手方,時而反手方,你的成功回球率都是48%。意識到這一點,你可能打算免掉計算自己的最佳混合策略的麻煩,只隨便選定一種行動,并指望對手選擇他的最佳混合策略。問題在于,除非你選擇自己的最佳混合策略,否則你的對手就沒有動機選擇他自己的最佳混合策略。所以,你需要選擇自己的最佳混合策略,來迫使對方繼續使用他的最佳混合策略。
分析完以上內容,最后作者分幾個章節講了在幾個典型的場景中,該如何使用策略思維。
05
策略思維在幾類場景中的使用
在什么情況下使用邊緣政策?
在美國希望蘇聯從古巴撤出導彈的前提下,肯尼迪為什么不直接威脅說,假如赫魯曉夫不拆除那些導彈,他就會將莫斯科夷為平地?在實踐當中,這么一個威脅不會有人相信,赫魯曉夫不相信,其他什么人也不會相信。不錯,這個威脅中提到的行動將會引發一場全球性的核戰爭,但這個危險本身實在太夸張了,以至于讓人難以置信。假如導彈沒有在最后期限之前撤離,肯尼迪一定不愿意將整個世界夷為平地,而更加愿意考慮延長留給蘇聯的最后期限,推后一天,再推后一天,如此下去。
雖然表明戰爭必然爆發的確定性的威脅并不能讓人信服,但表明戰爭可能爆發的風險或概率卻可以變得可信。假如赫魯曉夫不肯退讓,就會出現一種風險,而不是一種確定性,表明導彈可能發射。這種不確定性降低了這個威脅的程度,從而使美國覺得這個威脅比較容易承受,因此在蘇聯看來也更加可信。
另一個提高可信度的辦法相似--小步前進,每一步都包含一定程度的風險。美國或蘇聯方面的每一次不讓步都會加大爆發世界大戰的風險;而他們的每一個小的讓步則都會減少這個風險。假如肯尼迪愿意走得比赫魯曉夫更遠,那么肯尼迪的邊緣政策就會取勝。
當一座陡峭的懸崖被一道光滑的斜坡取代時,就連肯尼迪本人也不知道安全的界線究竟在哪里。這就好比他在玩一場核戰爭的俄羅斯輪盤賭,而不是投一個骰子。有一個數字會引發大災難,但他并不知道究竟是哪個數字。假如當真出現這個數字,他不可能改變主意再投一次。在與理性的對手較量時,沒人愿意越過核戰爭的邊緣,卻有可能由于一個錯誤而滑下那道光滑的斜坡。邊緣政策創造了一種剛剛超出控制的情況,故意掩蓋了那道懸崖。
圖源:互聯網
邊緣政策的風險與混合行動的概率元素存在根本區別。邊緣政策是你愿意在事實發生前創造這個風險,卻在時機來臨時不愿意將這個風險付諸實踐。要想讓你的對手相信你威脅的后果一定會發生,你還要借助其他一些渠道。最常見的是采取超出你的控制的行動。
無論怎樣運用邊緣政策,總有一種跌落邊緣的風險。雖然策略家們回顧古巴導彈危機的時候會把它當做邊緣政策的一個成功應用,但假如超級大國之間爆發一場戰爭的風險變成現實,幸存者一定會責怪肯尼迪完全沒有考慮后果,毫無必要地就把一場危機升級為一場災難。不過,說到運用邊緣政策,跌落邊緣的風險經常會變成現實。更好的策略是遠離邊緣。
在什么情況下使用合作與協調?
20世紀50年代,美國的常春藤聯校面臨一個問題。每個學校都想派出一支戰無不勝的橄欖球隊,結果發現各個學校為了建立一支奪標球隊而過分強調體育,忽略了學術水準。不過,無論各隊怎樣勤奮訓練,各校又是怎樣慷慨資助,賽季結束的時候各隊的排名卻和以前差不多。大學體育比賽的刺激性同等地取決于兩個因素,一是競爭的接近程度以及激烈程度,二是技巧水平。
常春藤聯校的例子中可以看到,要避免過度競爭的訣竅在于建立一個卡特爾,限制競爭。高校學生面臨的問題是卡特爾不容易查出作弊行為。對于這個學生集體,作弊者就是那個花更多時間學習,企圖跑到別人前面去的學生。很難說得清誰有沒有偷偷學習,除非等到他們在測驗里“一枝獨秀”的那一天。但那時已經太晚了。很難安排一個自動執行的卡特爾協議。不過,若有一個外人專門負責執行這個限制競爭的協議,情況就會大為改觀。現在有不少國家之間的合作,以及企業之間的合作,已經在開始這樣操作。
在什么情況下使用投票的策略?
現在的總統選舉已經強調了副總統選擇的重要性。此人距離總統寶座只有一步之遙。不過,大多數總統候選人完全忽略了選票上的第二個名字,而大多數副總統看來并不喜歡自己的位置。無所事事地等上4年或8年時間,等待自己的老板駕鶴西去,這樣的事情當然不是隨便什么人都適合從事的職業。
美國憲法只有一個條款規定副總統的一切實際行動。第1章第3.4節提到:“美利堅合眾國副總統擔任參議院主席,卻不得投票,除非參議員分為勢均力敵的兩派。”這種主持工作屬于“禮節性質,無所事事的禮節性質”,而在大多數時候副總統都會將這一工作轉交由參議院多數黨領導人指定的資歷較淺的參議員輪流負責。
圖源:互聯網
關于副總統的一票只有禮節意義的描述卻有誤導的性質。副總統這一票的影響力比其使用頻率更為重要。仔細衡量一下,就會發現副總統這一票的重要性大致相當于任何一名參議員的投票。副總統的投票一般只在決定最重要和最具決定意義的議題時起作用。一張選票可能有兩種效果:一是決定結果,二是成為影響勝利或失敗比數的一種“聲音”,卻不能扭轉結果。而在一個類似參議院這樣的決策團體里,第一種效果更加重要。
缺少分界線的理論可以追溯到希臘哲學家芝諾,他提出了這個有關一次取一顆沙礫而聚沙成塔的似是而非的理論。沒有一顆沙礫可能將無塔變成有塔,這似乎不錯,然而,足夠的沙礫也可以將一個鼴鼠丘變成一座小山。一張選票好比一顆沙礫。很難想象單單這額外的一票怎么能夠扭轉別人對結果的看法。
要想避免你的選票淹沒在眾人的選票里,一個辦法就是別出心裁:選擇一個極端的立場,與眾人劃清界限。誰若是認為這個國家過分自由化,可以把票投給一個溫和保守派候選人。好比候選人做出妥協,采取中間立場那樣,使自己的選票顯得比實際意愿更極端可能符合某些選民的利益。這種戰術只在一定程度范圍內有效。假如你走過了頭,大家會認為你是一個想入非非的瘋子,結果沒人理睬你的意見。
采取中點立場的法則的優點在于,沒有一個選民愿意歪曲自己的偏好;誠實投票是每一個人的優勢策略。采取中點立場的唯一問題在于它的應用范圍非常有限。這一策略只在一切都可以簡化為一維選擇的前提下可以采用,比如對自由派和保守派的選擇。不過,并非所有情形都可以這樣簡單劃分。一旦選民的偏好超過一維,就不會再有什么中點可言。在這個時候,操縱這一體系的可能性就變成現實了。
在什么情況下使用討價還價策略?
決定如何劃分利益大餅的一個重要因素是各方的等待成本。雖然雙方可能失去同樣多的利益,一方卻可能有其他替代做法,有助于部分抵消這個損失。假定工會與管理層談判期間,工會成員可以外出打工,每天掙300美元。于是,每次輪到管理層提出反建議的時候,出價不僅不能低于工會將在次日得到的收入,同時當天的數目至少要達到300美元。
這一結果可以看做平均分配原則的一個自然修正,使雙方有可能從一開始已經處于不同地位,好比高爾夫球比賽的做法,為強手設置不利條件,為弱者設置有利條件,鋤強扶弱。工會從300美元開始,這是其成員在外打工可能掙到的數目。余下只有700美元可以談判,原則是雙方平均分配,即各得350美元。因此,工會得到650美元,而管理層只得到350美元。
圖源:互聯網
在其他情況下,管理層也有可能處于有利地位。比如,管理層一邊與工會談判,一邊發動不愿參加罷工的工人維持酒店營業。不過,由于這些工人的效率比較低或者要價更高,又或是由于某些客人不愿意穿越工會豎立的警戒線,管理層每天得到的營業收入只有500美元。假定工會成員在外面完全沒有收入。這時工會愿意盡快達成協議,根本不會當真發動一場罷工。
假如工會成員有可能外出打工,每天掙300美元,同時管理層可以在談判期間維持酒店營業,每天掙500美元,那么,余下可供討價還價的數目只有區區200美元。管理層最后得到600美元,而工會得到400美元。一個具有普遍意義的結論是,誰能在沒有協議的情況下過得越好,誰就越是能從討價還價的利益大餅中分得更大一塊。
在什么情況下使用激勵策略?
假定你自己是加利福尼亞一家高科技公司的老板,打算開發和推出一種新的電腦象棋游戲,名為“巫師1.0”。如果你成功了,你將得到20萬美元的銷售收入。如果你失敗了,你將一無所獲。成功或失敗完全取決于你的專業棋手兼程序員的工作。她要么全神貫注,全力以赴;要么敷衍了事,得過且過。假如她有高質量的工作表現,那么,你成功的機會將達到80%;假如她只是得過且過,這一比率將降到60%。
得過且過的工作表現帶來20萬美元收入的概率只有60%,結果等于平均12萬美元;減去5萬美元工資,平均利潤等于7萬美元。假如你請到的是一個具有高質量工作表現的專家,通過同樣的計算,得到平均利潤等于9萬美元 (即20萬美元×80%-7萬美元)。很顯然,你用高工資請一個有高質量工作表現的專家比較合算。
圖源:互聯網
由于你看不出工作表現的質量是高還是低,你不得不將你的回報機制建立在一個你可以看得出區別的東西的基礎之上。在我們討論的這個例子中,這個東西可能是最后結果,即整個程序編制工作的成功或失敗。這當然與工作表現有關,雖然這一關聯并不完美,但是,工作表現的質量越高,意味著成功的概率也越高。這一關聯可以用于創造一個激勵機制。
罰金/獎金機制或股份平分方案的另一個難處在于風險問題。工人一旦參加這個10萬美元的博弈,她的激勵就會提高。但是,這個重大風險可能無法通過最后結果的統計平均值進行評估。遇到這種情況,工人因同時提供高質量工作表現和承擔風險,應該得到補償。風險越大,補償越高。
許多制造或供應合同,尤其是來自政府方面的合同,有時也有私營公司的合同,是通過密封投標的招標決定判給哪一家。每一家公司提交一個密封的信封,里面開出它愿意接受這項工程的價碼。然后,所有標書放在一起進行比較,開價最低的公司勝出,同時得到它所要求的價碼。
假定現在有這么一份合同,比方說是建設一段高速公路,而你是一個投標者。你的成本 (包括正常情況下你希望投資能夠獲得的回報)是1000萬美元。你并不知道你的競爭者的成本,可能甚至不曉得他們究竟都是些什么人。不過,你有理由相信,他們的成本應該介于500萬美元到1500萬美元之間。他們當中,最佳投標者的開價落在兩個極端之間任意一個數目的概率均等,也就是說,以這一范圍為橫軸,以每百萬美元為一點,那么,落在任意一點的概率都是1/10。
你永遠不會開出一個低于你的成本的價碼。比如,假定你開價900萬美元。如果你沒能勝出,當然沒問題;但若是你贏了,你得到的價碼將低于你的成本。你這么做等于自掘墳墓。若最后定價是1000萬美元,這個數目只夠彌補你的成本,那么這份合同對于你則可有可無。開出一個抬高的價碼對你而言是一個好的策略;用博弈論的術語來說,這個策略優于誠實開價。其他參與者其實也在打同樣的主意,到了最后,所有開價都被抬高了。
在英式拍賣中,所有投標者聚集在同一個房間,拍賣官依次叫出越來越高的價碼。出價過程一直持續到只剩下一個投標者為止——一次,兩次,成交!倒數第二個投標者應該只在價碼超出自己估價的時候退出。于是,對該項物品估價最高者將如愿以償,而他只需支付次高開價。
一個不同尋常卻又真實可信的答案是,平均而言,兩種機制將得出完全相同的結果。在政府為一個道路工程征集標書的案例中,將合同判給出價最低者而非出價次低者的做法,表面看來似乎具有節約預算的優勢,但只要我們明白投標者有怎樣的對策,確切地說就是抬高他們的出價,這一優勢也就蕩然無存。開價最低者得到合同,同時得到他開出的價錢,但這個價碼早已被抬高了。若是對這一問題進行一個全面的數學分析,結果將顯示,這個常規做法帶來的預算影響,恰好等同于以第二開價支付勝方的做法的影響。在贏得招標拍賣的條件下,一家公司的最優化開價應該是次佳競爭者的預期成本。在使用激勵策略時,注意結合合同、拍賣、招標等方式。
06
總結
看似有很多的策略行動,比較難記住,對于我們來說,不妨記住兩個分析的工具
1、決策樹——相繼進行的博弈場景中使用;
2、二維四象限工具——同時進行的博弈場景中使用;
在相繼進行的博弈場景中使用決策樹工具,需要遵循的原則為:向前展望,倒后推理。也就是展望最初決策,最后可能導致什么結果,利用這個信息確定自己的最佳選擇。
在同時進行的博弈場景中使用二維四現象工具,需要遵循的原則為:
①假如有一個優勢策略,就執行這個優勢策略;
②假如沒有優勢策略,使用排除法,剔除所有劣勢策略,不予考慮,如此一步一步做下去,找到適合的策略。