莫莫言提示您:看後求收藏(品書網www.vodtw.tw),接著再看更方便。

略納什均衡點,而有混合策略均衡點。這個混合策略均衡點下的策略選擇是每個參與人的最優(混合)策略選擇。

小偷(1)

警察

襲擊A地

襲擊B地

巡邏A地

3,0

2,1

巡邏B地

1,2

3,0 對於這個例子,警察的一個更好的策略是,警察用擲骰子的方法決定去A地還是B地。假定警察規定擲到1—4點去A地,擲到5、6兩點去B地,這樣警察有2/3的機會去A地進行巡邏,1/3的機會去B地。

而小偷的最優選擇是:以同樣擲骰子的辦法決定去A地還是去B地偷盜,如擲到1—4點去B地,擲到5、6兩點去A地,那麼,小偷有1/3的機會去A地,2/3的機會去B地。

此時警察與小偷所採取的便是混合策略。

假如按這種策略,我們看一下雙方的收益。警察的期望得益是:7/3萬大於2。警察按此辦法比只巡邏A地的收益更高。

一旦警察採取混合策略,小偷也採取混合策略,其最優混合策略下的收益為2/3萬元。小偷的收益比警察只巡邏A地的收益要低。

因為:當警察去A地巡邏時,小偷有1/3的機會去A地,2/3的機會去B地,此時警察去A地的得益為:萬元;當警察去B地時,同樣,小偷有1/3的機會去A地,2/3的機會去B地,此時警察A地的得益為:萬元。

警察總的得益為:萬元。

同理,我們可得小偷的總的得益為2/3萬元。

這裡我們“讓”警察和小偷擲骰子以確定去A地還是去B地,目的是要去A地和去B地之間確定一個機率分佈,他們當然可用其他方式來確定這個機率分佈。

宰割博弈中警察與小偷所用的混合策略,如同小孩子之間玩“剪刀—石頭—布”的遊戲時所用的策略。在“剪刀—石頭—布”這樣的遊戲中,不存在純策略均衡,對每個小孩來說,自己採取出“剪刀”、“布”還是“石頭”的策略應當是隨機的,不能讓對方知道自己的策略,哪怕是傾向性的策略。如果對方知道你出其中一個策略的可能性大,那麼你在遊戲中輸的可能性就大。因此,每個小孩的最優混合策略是採取每個策略的可能性是1/3。在這樣的博弈中,每個小孩各取三個策略的1/3是納什均衡。

由此可見:純策略是參與人一次性選取的,並且堅持他選取的策略;而混合策略是參與人在各種備選策略中採取隨機選取的。在博弈中,參與人可以改變他的策略,而使得他的策略選取滿足一定的機率分佈。

若博弈是零和博弈,即若博弈參與人為兩人,一方所得是另外一方的所失,或者若博弈是常和博弈,即若博弈參與人為兩人,一方所得的增加等於另外一方的損失,此時,對於任何一個參與人而言,都不可能有純策略的佔優策略。博弈參與人採取混合策略是合適的,均衡為混合策略均衡。如在當前的“反恐”博弈中,由於力量的有限,反恐方往往“更多地”將力量放在重點區域,如人口密集的大城市,“一定程度地”關注不太危險的區域,如人口稀疏的農村。這就是混合策略。而恐怖分子同樣在玩混合策略:對攻擊物件的選擇是隨機的,對攻擊方式的選擇也是隨機的。

在競爭性的博弈中,該採取混合策略而不採取混合策略將會帶來失敗。田忌賽馬是人人熟悉的故事。齊王與田忌賽馬,但齊王的馬平均來說要比田忌的馬要跑得快,但田忌採納了孫臏的策略,田忌用下等馬對齊王的上等馬,上等馬對齊王的中等馬,中等馬對齊王的下等馬。田忌以三比二獲勝,贏了齊王。賽馬是零和博弈,齊王的失敗在於他使用了純策略;若齊王使用混合策

遊戲競技推薦閱讀 More+
你的小說裡有沒有我這樣的男主

你的小說裡有沒有我這樣的男主

插翅難飛
遊戲 完結 54萬字
冷酷總裁的豢養情人

冷酷總裁的豢養情人

片片
遊戲 完結 2萬字
隱寵盛愛影后嬌妻

隱寵盛愛影后嬌妻

指點迷津
遊戲 完結 11萬字
金寶年年春

金寶年年春

絕對零度
遊戲 完結 9萬字
女神的愛情之旅

女神的愛情之旅

遊戲 完結 7萬字
第一美人婚戀史(娛樂圈)

第一美人婚戀史(娛樂圈)

負債賭博
遊戲 完結 64萬字