第一章 博弈論,共贏才是硬道理 什麼是囚徒困境?
2024-10-11 04:56:25
作者: 徐文
囚徒困境是博弈論中著名的案例之一。所謂囚徒困境,大意是這個樣子的。
有一天,某富翁在家中被殺,財物被竊。警方在偵破此案的過程中,抓到了湯姆、傑克兩個犯罪嫌疑人,並從他們的住處搜出了被害富翁家中丟失的財物。面對呈現在眼前的物證,他們承認了自己的偷竊行為,但卻矢口否認殺害富翁,辯稱是先發現富翁被殺,然後他倆只是順手牽羊偷了點兒東西。
針對兩人的狡辯,警方對他們進行了隔離審訊。為了分化瓦解他們,檢察官分別對兩人說了以下一段話:
本來你們的偷盜罪證據確鑿,可以就此判你們1年刑期。但是,按照將功贖罪制度,如果你主動坦白並且揭發同夥的殺人罪行,我們將對你進行從寬發落,判你無罪釋放,但你的同夥要被判30年刑期;如果你頑抗到底,拒不坦白,而被同夥檢舉出你的殺人行為,那麼你就要受到嚴懲,將被判刑30年,你的同夥將被無罪釋放;當然,如果你們兩人都坦白,那麼你們都將只被判15年刑期。
在這裡,博弈的決策主體——湯姆和傑克各有兩個選擇,即坦白和抵賴。
這兩個嫌疑犯該怎麼辦呢?他們面臨著兩難的選擇——坦白還是抵賴。顯然,最好的選擇是兩人都選擇抵賴,都得到最好的結果——只判刑1年(殺人罪按照疑罪從無原則,證據不足無法成立,只能以偷盜罪各判每人1年刑期)。但是由於兩人處於隔離的情況下,沒有串供的條件,所以他們不得不仔細考慮對方可能採取什麼策略,以及對方採取的策略對自己有什麼影響。
本章節來源於𝒷𝒶𝓃𝓍𝒾𝒶𝒷𝒶.𝒸ℴ𝓂
心理較量就這樣開始了,湯姆和傑克都是絕對精明的人,都只在乎減少自己的刑期,並不關心自己的選擇會對對方產生什麼影響,對方因為自己的決策又將被判多少年刑期。
湯姆會這樣推理:假如傑克選擇抵賴的話,我只要坦白,馬上就可以無罪釋放,獲得自由,而我若抵賴則要坐牢1年,顯然坦白比抵賴要划算得多;假如傑克選擇坦白的話,我若抵賴,則要坐30年牢,坦白卻只坐15年牢,顯然還是坦白為上策。所以說,無論傑克選擇抵賴還是坦白,我的最佳選擇都是坦白,還是坦白交代了吧!
同樣,傑克也跟湯姆一樣會算計,也會如此推理。
囚徒困境之所以稱為困境,就是因為這局博弈的最終結果對兩個參與者來說都是最壞的,兩個嫌疑犯都選擇坦白,結果皆被判刑15年。這對他們個人來說都是從自身利益出發的最佳選擇,符合他們的個體理性選擇。因為坦白交代者可能會被無罪釋放,顯然比自己抵賴可能會獨自承受30年刑期要好。而原本對雙方都有利的策略——兩個人都抵賴,每人被判1年刑期就不會出現。
囚徒困境是典型的非合作博弈的範例,為我們探討合作是怎樣形成的提供了極為形象的解說方式,其產生不良後果的原因是兩個嫌疑犯都從利己目的出發,最終損人不利己,合作沒有實現。反過來我們就可看到:彼此達成合作是最好的利己策略,但合作必須符合以下黃金定律:「己所不欲,勿施於人。」在此基礎之上的合作才能形成一個和諧的、良好的社會環境。
在囚徒困境中,最好的策略直接取決於對方所採用的策略,取決於對方所採取的策略為雙方發展合作留出多大的餘地。獨立於對方所用策略之外的、從利己目的出發的、最好的決策是不存在的。
實際上,囚徒困境是現實生活中許多現象的一個抽象概括,有著廣泛而深刻的意義。同一行業不同企業之間激烈的價格競爭就是囚徒困境的典型現象。在價格博弈中,只要雙方都以對方為敵手,只關心自己的利益,那麼不管對方採取怎樣的決策,自己採取低價策略總會占便宜,就如同囚徒困境中的犯罪嫌疑人始終認為自己坦白為最佳決策一樣,這就促使雙方都採取低價策略。如可口可樂公司和百事可樂公司之間的價格競爭、各大航空公司之間的價格戰,等等。
如果雙方進行合作,共同制定比較高的價格,就可以避免無休止的價格大戰並獲得較高的利潤。但是這些企業往往處於利益驅動的囚徒困境之中,雙贏也就成了泡影。不同企業之間五花八門的價格聯盟總是非常短命,原因也就在這裡。