什麼是博弈論?
2024-10-11 16:43:06
作者: 徐文
博弈論,又叫對策論,是研究兩人或多人之間競爭合作關係的一門學科。用我們日常的語言來說,博弈論就是研究在不同情境下策略選擇的一種理論。它既是經濟學的一個重要學科,也是現代數學的一個新分支。
在經濟學上,博弈論是一個非常重要的理論概念,通過使用嚴謹的數學模型來解決現實生活中的各種利害衝突問題。具體來說,博弈論是指某個人或是組織,在一定的環境條件和規則約束下,依靠所掌握的信息選擇並實施各自所傾向的行為或是策略,從中取得相應結果或收益的過程。
博弈論思想古已有之,早在2000多年前,博弈論的原始思想即已萌芽。古代文獻中不乏充滿博弈思維的案例,如《孫子兵法》《三十六計》《三國演義》,等等,不僅僅是軍事著作,而且可以算是很好的博弈論教材,只不過還沒有上升到現代博弈論的層次而已。
博弈論最初主要研究的是象棋、圍棋,以及賭博中的勝負問題。那時候,人們對博弈局勢的把握只停留在經驗層面上,並沒有向理論層面發展,其正式發展成一門學科則是在20世紀初。
1928年,美籍匈牙利數學家馮·諾伊曼提出了博弈論的基本原理,並與經濟學家莫根斯特恩合作,於1944年發表了《博弈論與經濟行為》一書,提出了合作博弈的基本模型,並將二人博弈結構推廣到多人博弈結構。自此,博弈論被引入了經濟領域,奠定了這一學科的基礎和理論體系。人們都把馮·諾伊曼和莫根斯特恩的這部巨著看作是現代博弈理論誕生的標誌。
目前,博弈論作為分析、解決衝突和合作的理論工具,已經在管理學、國際政治學、經濟學、外交學和社會學等領域得到了廣泛的應用,為解決不同實體的衝突與合作提供了寶貴的方法,並日漸發展成為一熱門學科。
◇博弈的三要素
任何一局博弈都至少包含以下三個基本要素:
——決策主體
決策主體,又譯為參與者、局中人或博弈者。在一場競賽或一局博弈中,每一個有決策權的參與者都構成一個決策主體。
決策主體的目的是通過選擇行動方案或者戰略以使自己的效用水平最大化。只有兩個決策主體的博弈稱為兩人博弈,多於兩個決策主體的博弈稱為多人博弈。一局博弈中的決策主體可以是自然人,也可以是團體:如企業、國家等。
——策略
策略,又譯為戰略,即決策主體在給定信息的情況下的行動規則,它規定了決策主體在什麼時候採取什麼行動。
一局博弈中,每個決策主體都會選擇實際可行的、完整的行動方案。一個可行的自始至終對全局進行籌劃的行動方案,稱為這個決策主體的一個策略。如果在一局博弈中決策主體的策略是有限的,就稱為有限博弈,相反則稱為無限博弈。
——效用
效用,又叫支付,是指在一個特定的策略組合下,決策主體得到的確定效用水平,或者說是期望效用水平。簡單來說,效用就是指進行博弈後的收益。
效用是所有決策主體真正關心的東西,每個決策主體在一局博弈結束時得到的效用,不僅與該決策主體自身所選擇的策略有關,而且與全部決策主體所制定的一組策略有關。一局博弈結束時每個決策主體得到的效用是全體決策主體所取定的一組策略的函數,通常稱為支付函數。
◇博弈的分類
博弈可以從多個角度進行分類。
——按照博弈各方是否同時決策,博弈可以分為靜態博弈和動態博弈。
靜態博弈是指在博弈過程中,參與者同時決策或同時行動,或者儘管決策或行動有先後順序,但後行動者並不知道先行動者採取了什麼具體的決策或行動。比如說工程招標(排除標書泄密的違規行為),其截止日期是6月1日,儘管有的競標者在5月上旬就投了標,有的競標者直到5月下旬才投標,參與者的決策時間有先後之分,但效果卻與同時決策是一樣的。
動態博弈是指在博弈過程中,參與者的行動有先後順序,並且後行動者可以觀察到先行動者所採取的行動。
——按照參與者對其他參與者的了解程度,博弈可以分為完全信息博弈和不完全信息博弈。
完全信息博弈是指在博弈過程中,每一位參與者對其他參與者的策略空間、策略組合及收益信息有完全的了解。
如果參與者對其他參與者的策略空間、策略組合及收益信息了解得不夠確切,或者說並沒有掌握所有參與者的策略空間、策略組合及收益信息,在此種情況下進行的博弈就是不完全信息博弈。此時,參與者所能做的就是努力使自己的期望支付或期望效用最大化。
——按照參與者能否達成約束性的協議以便集體行動,博弈可以分為合作博弈和非合作博弈。
合作博弈是指所有參與者都從利己的角度出發,與其他參與者進行談判並達成具有約束力的協議或形成聯盟,參與者在協議範圍內進行博弈,其結果對聯盟各方均有利。合作博弈主要研究人們達成協議時,如何分配合作得到的收益,即收益分配問題。
合作博弈強調團體的理性、效率、公平和公正。典型的合作博弈是某一行業的寡頭企業之間的串謀行為,即企業之間通過公開或者私下簽訂協議,對各自的價格或產量進行限制,以達到獲取更多壟斷利潤的目的。
反之,不能使其他參與者遵守某一協議,各參與者只能選擇自己的最優戰略的行為,則屬於非合作博弈。非合作博弈主要研究人們在利益相互影響的局勢中如何選擇、決策,使自己的收益最大,即策略選擇問題。
非合作博弈強調個人理性、個人最優決策。下面將要講到的囚徒困境就是典型的非合作博弈。因為非合作是當今社會中利益博弈的常態,所以非合作博弈是博弈論探討的主要內容。
非合作博弈按照參與者對其他參與者的信息掌握程度和博弈各方採取行動是否有先後順序,可以分為四種不同的類型,即完全信息靜態博弈、完全信息動態博弈、不完全信息靜態博弈、不完全信息動態博弈。這四類博弈一個比一個精彩,也一個比一個難。
完全信息靜態博弈——是指在博弈過程中,所有參與者事先達成一項具有約束力的協議,制定每個決策主體的行為規則。如果在沒有外在強制性約束的情況下,各參與者自覺遵守該協議,沒有人違反協議規則,就構成一個納什均衡(概念見第二章)。只要有一個參與者違背協議規定,則此協議就構不成納什均衡,就不可能自動實施,不滿足納什均衡要求的協議是沒有任何意義的。
完全信息動態博弈——動態是世間萬物的基本特徵,而靜態只是一種獨特的理想狀態。在現實生活中,當一個參與者後採取行動時,自然會根據先前參與者的選擇而適時調整自己的決策,而先採取行動的參與者也會理性地預料到這一點,所以也會考慮自己的選擇對其他後行動參與者的影響。
不完全信息靜態博弈——是指參與者同時採取決策或者說決策雖然有先後順序,但後行動者並不知道先行動者的決策,也沒有機會觀察先行動者的選擇以調整自己的決策。
不完全信息動態博弈——是指各個參與者採取的決策有先後順序,且後行動者掌握了前者的選擇,獲得了其偏好、策略空間及策略組合等信息,並依此修正自己的決策;而先行動的參與者也知道自己行為的效用對後行動者的影響,也會有意識地選擇某種行動來掩蓋自己決策的真實目的。
博弈論是一門現實中非常有趣、理論上又頗有深度的學問。可以毫不誇張地說,掌握博弈論知識對每一個現代人來說實在是太重要了。因為在現實社會中,每個人都在試圖使自己的利益最大化,而在取得利益的過程中,往往會產生矛盾與衝突。利益均衡的實現主要取決於各自的策略選擇,而策略選擇問題實際上就是博弈論的本質所在。