我們都知道1914年爆發了第一次世界大戰,但是這場大戰,越是臨近圣誕節,就越發詭異。原本殺紅眼的交戰雙方:英國和德國。不但停了火,還開始嘮嗑,甚至還踢了一場球賽。戰場上的這種默契是比比皆是,并不少見。
在韓國電影《高地戰》當中,南朝鮮和北朝鮮的軍隊爭奪高地,進攻方總是象征性地攻打高地,然后防守方也象征性地防守,之后高地就易主了,。這時候攻取高地的一方常常可以挖到防守方留給他們的禮物和拜托他們寄送的書信。
這樣的“合作”十分默契,在戰火紛飛的那些歲月里,已經成為了一種雙方士兵的共同認知。
(相關資料圖)
《高地戰》劇照,使用漢字其實是歷史原因,那時候確實就是漢字
在《自私的基因里》,理查德道金斯成就指出,進化論對于一些現象無力解釋,比如說:全世界一共有8000~9000種鳥類,其中有300多種能夠幫助其他動物喂食,筑巢,清理身體。要知道它們在幫助其他動物時,也會存在危險,可它們為什么會選擇這樣做呢?
再然后,我們平時旅游時,在景點常常會被宰,景點的東西貴到爆炸,但是同樣的東西在你家小區的雜貨鋪就十分便宜,這究竟又是什么呢?
其實,上述的四個例子,其實都可以用一種數學模型來解釋。今天,我們就來聊一聊:如何做出合理的決策。
囚徒困境
在聊這個問題前,我們先來講一個博弈論的經典案例。
假說警方抓住了兩名罪犯,姑且就分成甲嫌疑犯和乙嫌疑犯。但是警方并沒有證據可以指控這兩個嫌疑犯。于是,他們就把他們兩個人你分別關在兩個房間,然后分別對他們進行盤問。
接下來,就有三種情況會發生,對應三種結果:
如果,兩個人都保持沉默(也就是合作),那兩個人會背叛半年的監禁。
如果,一個人檢舉對方(也就是背叛),另一個人保持沉默(合作),那檢舉的人立即釋放,被檢舉的人則要被判10年監禁。
如果,兩個人都互相檢舉(互相“背叛”),那么這兩個人都會被判刑5年。
那這個時候,甲和乙是該合作還是該被判呢?
其實,單次的囚徒困境,選擇被判是最利于自己的選擇。
重復囚徒困境
但是,我們要知道的是,在日常生活中,其實都不是單次的囚徒困境,而是多次的。還是說到上面的例子,一戰時的英德士兵,其實理論上應該把對方消滅。但是是個人都想活下來,如果你把對方殺了,對方的戰友也不會坐視不管,他們也會對你下狠手。所以,這一來一往,循環往復,也就成了多次的囚徒困境。
那如果是多次的囚徒困境,到底是什么樣的決策才最有利于個體的發展呢?
美國科學院院士阿克塞爾·羅德教授,曾做過相關的研究和實驗,模擬真實情況下的決策以及結果。
具體來說,是這樣的,第一輪,他讓他的學生和一些心理學家,科學家設計了14種策略,然后做成計算機程序,讓每個策略對應的程序都相互對戰200回合,然后取平均成績。最后選出了最優的策略。
這個策略大概的描述是這樣的:
第一局選擇與對方合作,然后之后的每一回合都選擇對手上一會和的策略。
這種策略被阿克塞爾·羅德稱為一報還一報。
但是他覺得,僅憑14種策略就斷言“一報還一報”是最優策略有點太隨意了。于是,他決定找到更多的策略來試驗。他向全世界的科學家,心理學家以及高校的老師征集策略,前前后后找到了幾十個策略。然后,進行了第二輪和第三輪的對決。
上萬回合廝殺下來,最終“一報還一報”依舊是最終的贏家。在阿克塞爾·羅德寫的《合作的進化》當中,有非常詳細的實驗數據,感興趣的可以去查閱一下,這里就不羅列。
一報還一報的智慧
在《論語·憲問》中,曾經記載著孔子這樣的一句話:
子曰:“何以報德?以直報怨,以德報德。”
翻譯過來就是:用什么來報答恩德呢?用正直報答怨恨,用恩德報答恩德。
其實這當中就有“一報還一報”的智慧。“一報還一報”之所以可以戰勝這么多的策略,就在于它有四個有點:善良性、報復性、寬容性和清晰性。
首先,它的出發點是選擇合作,而不是選擇背叛。這就是善良性。在實驗中,那種一味選擇寬容的策略,常常都會輸的非常慘。
但同時,它不是軟蛋,只要對方敢背叛,它就會立刻讓對方嘗到背叛的代價。這就是報復性。
但它也不會一心就知道報復,而是只要對方選了合作,它就會立馬寬容對方,選擇合作。這就是寬容性。
最后,也是最重要的,他的規則很清晰,不帶任何的貓膩。對方很容易把握到它的規律,這其實是一種正值的體現,不耍任何的小聰明。這就是清晰性。那些狐貍型的策略在模擬中也常常是慘敗收場,這足以說明,小聰明和耍陰謀并不能長久。
一報還一報是人類的天性
而“一報還一報”也是人類的天性,甚至是生物的天性,開頭我們說到的案例。
一戰的英德兩軍的士兵,之所以最后會一起踢球,是因為人性中“一報還一報”特質。起初一方陣營一有炊煙,對面就往有炊煙的地方開炮,一下可以炸死人,因為這時候的人都在排隊打飯。但是你會在對方吃飯開炮,對方也可以。這樣一來二去,雙方都吃不上飯。于是,就很容易形成一個約定,吃飯的時候別開炮。接下來這種默契慢慢擴散開來,就出現了節假日不要開炮等等現象,以至于出現了圣誕節一起踢球的場景。
而高地戰的南朝鮮和北朝鮮的軍隊也是這樣,無休止地來回爭奪高地,士兵們為了保命,從真打慢慢演化成了假打,打成了默契仗,這樣大家都保住了命,也完成了任務。
而景區的商家是之所以宰你,是因為他們認定是不會再來的,這是單次的囚徒困境,不宰白不宰。而你小區的商鋪之所以便宜,就是因為你們是多次的囚徒困境,如果他要宰你,你就會理課報復他。
至于,大自然的共生關系也是可以通過“一報還一報”來解釋的。
因此,“一報還一報”不僅僅是一個最好的生存策略,而且也是刻錄在我們基因里的一種天性。
參考書目:《合作的進化》,作者:阿克塞爾·羅德。
關鍵詞: