首頁(yè)手機(jī)單機(jī)攻略→ 信任的進(jìn)化博弈論分析

信任的進(jìn)化博弈論分析

作者:佚名來(lái)源:本站整理2017/10/24 11:28:43我要評(píng)論

信任的進(jìn)化是一款很有趣的游戲,它直接探索了社會(huì)人員的構(gòu)成和之間的關(guān)系,從開(kāi)始到結(jié)束游戲設(shè)置了許多的情況,那么這些情況各有什么特點(diǎn),分別探討了什么,下面一起來(lái)分析分析游戲背后的博弈論吧。

一,囚徒困境(非零和博弈典型)

這是本游戲的基本博弈模型,對(duì)此最經(jīng)典的闡述為:

兩個(gè)嫌疑犯作案后被警察抓住,分別關(guān)在不同的屋子里接受審訊。

警察知道兩人有罪,但缺乏足夠的證據(jù)。警察告訴每個(gè)人:如果兩人都抵賴(lài),各判刑一年;如果兩人都招供,各判八年;如果兩人中一個(gè)招供而另一個(gè)抵賴(lài),坦白的放出去,抵賴(lài)的判十年。

于是,每個(gè)囚徒都面臨兩種選擇:招供或抵賴(lài)。然而,不管同伙選擇什么,每個(gè)囚徒的最優(yōu)選擇是招供:如果同伙抵賴(lài)、自己招供的話(huà)放出去,抵賴(lài)的話(huà)判一年,招供比不招供好;如果同伙招供、自己也招供的話(huà)判八年,比起抵賴(lài)的判十年,招供還是比抵賴(lài)的好。

結(jié)果,兩個(gè)嫌疑犯都選擇招供,各判刑八年。

就像這個(gè)游戲機(jī)一樣,當(dāng)你投一個(gè)硬幣進(jìn)去,對(duì)方就會(huì)得到兩枚硬幣。顯然,對(duì)于總體來(lái)說(shuō),選擇合作得到的回報(bào)最高(每人失去1個(gè),得到2個(gè),總和4,增加2個(gè)),但對(duì)個(gè)人而言風(fēng)險(xiǎn)也是最大的(對(duì)方選擇欺騙,你-1,對(duì)方3,總和2),所以在這種局面下,欺騙變成了最優(yōu)策略。這樣的局面,歸根到底,是因?yàn)殡p方缺乏溝通而導(dǎo)致的。在無(wú)法信賴(lài)對(duì)手的一局游戲中,欺詐師往往會(huì)成為最后的贏家。

有意思的是,囚徒困境推廣到確定的N局游戲中也是成立的。

原因如下:

對(duì)于第N局,由于不用擔(dān)心之后被報(bào)復(fù)(最后一局了嘛),最優(yōu)策略顯然是欺騙。

對(duì)于第N-1局,由于已經(jīng)知道了對(duì)方下一局的最優(yōu)策略是欺騙,為了防止受到更多損失,最優(yōu)策略顯然也是欺騙。

對(duì)于第N-2局,……

所以,對(duì)于確定的N局游戲,最優(yōu)策略永遠(yuǎn)是欺騙。

二,重復(fù)困境

這個(gè)升級(jí)版的囚徒困境源于一個(gè)全世界的重復(fù)囚徒困境競(jìng)賽(也是這個(gè)游戲的來(lái)源)。

在這個(gè)競(jìng)賽中,許多博弈論專(zhuān)家將自己的策略編寫(xiě)成程序,和其它程序進(jìn)行博弈(沒(méi)錯(cuò),游戲里的策略是其中的一些)

經(jīng)過(guò)很多很多輪競(jìng)賽后,出人意料的是,最佳確定性策略被認(rèn)為是“以牙還牙”,這是阿納托爾·拉波波特(Anatol Rapoport,《合作的進(jìn)化》作者,也是競(jìng)賽的發(fā)起人)開(kāi)發(fā)并運(yùn)用到錦標(biāo)賽中的方法。

這個(gè)策略只不過(guò)是在博弈的開(kāi)頭選擇合作,然后,采取對(duì)手前一回合的策略。

在完美的博弈中,Copycat(小藍(lán)人,盲從者)是最有效的。這種策略較好地規(guī)避了被欺騙的風(fēng)險(xiǎn)(被騙了還是要漲點(diǎn)記性),而對(duì)于合作者,顯然雙方都能獲得較高的利潤(rùn)。

而對(duì)于有可能失誤的博弈(玩家準(zhǔn)備合作,但是由于各種不可控因素造成背叛的結(jié)果),更好些的策略是“寬恕地以牙還牙”,即當(dāng)你的對(duì)手背叛,在下一回合中你無(wú)論如何要以小概率(大約是1%~5%)時(shí)而合作一下。這是考慮到偶爾要從循環(huán)背叛的受騙中復(fù)原。

至于更自由的博弈(可以選擇對(duì)手),比較好的策略是:前幾局選擇合作進(jìn)行試探,被多次欺騙后不再與此對(duì)手博弈(排擠掉欺詐師)

最終,博弈學(xué)家統(tǒng)計(jì)所有策略得到這樣一個(gè)結(jié)論:最好的策略滿(mǎn)足四個(gè)因素:友善,報(bào)復(fù),寬容,不嫉妒。

簡(jiǎn)單來(lái)說(shuō),表露合作的意向(讓潛在的合作者與你合作),不盲目樂(lè)觀(guān)(避免一直被欺詐師欺騙),適當(dāng)包容小的失誤(防止因誤會(huì)導(dǎo)致的互相不信任),不追求比對(duì)手更高的得分(更高意味著惡性競(jìng)爭(zhēng))。

因此,一些學(xué)者們據(jù)此得到一種給人以烏托邦印象的結(jié)論,認(rèn)為自私的個(gè)人為了其自私的利益會(huì)趨向友善、寬恕和不嫉妒,即人人為我的社會(huì)可能建立在對(duì)利益的追求上。

事實(shí)上,囚徒困境并不是那么簡(jiǎn)單,Copycat也并不總是最終的贏家。

在短期博弈上,最有效的往往是欺騙。

在背叛的回報(bào)更高時(shí),欺騙往往能獲得最終勝利。

在失誤率過(guò)高時(shí),結(jié)果趨于混沌。

根據(jù)這些理論,想要得到49分和7分只要找到針對(duì)每個(gè)人的最優(yōu)策略和最劣策略就行了。

但是,最重要的還是要明白:

所有的博弈理論都有一個(gè)共通之處:

博弈的類(lèi)型決定了玩家的策略。

現(xiàn)在,問(wèn)題不僅僅是信任的缺失,而是我們的環(huán)境影響了信任的進(jìn)化。

我們“只是”環(huán)境的產(chǎn)物,這個(gè)觀(guān)點(diǎn)可能顯得憤世嫉俗或幼稚——但正如博弈理論提醒我們的那樣,我們構(gòu)成了彼此的環(huán)境。從短期來(lái)看,游戲定義了玩家。但從長(zhǎng)遠(yuǎn)來(lái)看,是我們玩家定義了游戲。

所以,做你能做的,去創(chuàng)造必要的條件來(lái)“讓信任進(jìn)化”。建立合作。尋求共贏。清晰交流。也許那時(shí),我們可以停止互相射擊,走出我們自己的戰(zhàn)壕,穿過(guò)無(wú)人的土地,走到一起…

以上就是信任的進(jìn)化游戲分析,更多精彩手游,盡在跑跑車(chē)手游網(wǎng)。

0相關(guān)評(píng)論

發(fā)表評(píng)論

最新最熱相關(guān)資源

安卓蘋(píng)果應(yīng)用推薦