173毫米的塑料刮板:谁是博弈高手?

来源:百度文库 编辑:高考问答 时间:2024/04/29 04:31:10
谁知道“蜈蚣博弈”和“知猪博弈”或“斗鸡博弈”?

蜈蚣博弈是由罗森塞尔(Rosenthal)提出的。它是这样一个博弈:两个参与者A、B轮流进行策略选择,可供选择的策略有“合作”和“背叛”(“不合作”)两种。假定A先选,然后是B,接着是A,如此交替进行。A、B之间的博弈次数为有限次,比如100次。假定这个博弈各自的支付给定如下:
合作 合作 合作 合作...合作 合作
A B A B …… A B (100,100)
合作 合作 合作 合作...合作 背叛
A B A B …… A B (98,101)
现在的问题是:A、B是如何进行策略选择的?
这个博弈因形状像一只蜈蚣,而被命名成蜈蚣博弈。
这个博弈的奇特之处是:当A决策时,他考虑博弈的最后一步即第100步;B在“合作”和“背叛”之间作出选择时,因“合作”给B带来100的收益,而“不合作”带来101的收益,根据理性人的假定,B会选择“背叛”。但是,要经过第99步才到第100步,在99步,A考虑到B在100步时会选择“背叛”——此时A的收益是98,小于B合作时的100,那么在第99步时,他的最优策略是“背叛”——因为“背叛”的收益99大于“合作”的收益98……如此推论下去,最后的结论是:在第一步A将选择“不合作”,此时各自的收益为1,远远小于大家都采取“合作”策略时的收益:A:100,B:100-99。
根据倒推法,结果是令人悲伤的。从逻辑推理来看,倒推法是严密的,但结论是违反直觉的。直觉告诉我们,一开始就采取不合作的策略获取的收益只能为1,而采取合作性策略有可能获取的收益为100。当然,A一开始采取合作性策略的收益有可能为0,但1或者0与100相比实在是太小了。直觉告诉我们采取合作策略是好的。而从逻辑的角度看,一开始A应取不合作的策略。我们不禁要问:是倒推法错了,还是直觉错了?
这就是蜈蚣博弈的悖论。

在经济学中,“智猪博弈”(Pigs’payoffs)是一个著名博弈论例子。
这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲历亲为了。
“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。
如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。
改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。
如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。
改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。
对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。
改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。
对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。
原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。

“斗鸡博弈”取材于一种青少年车赛,两人沿一条公路迎面高速驾驶,谁先掉头谁就是“小鸡”。当然,很难对这种比赛进行量化分析,因为其选择结果涉及到“荣誉”及死亡这种不可估量的概念。但是仍可用抽象的价值来表现代价和收益进行分析。如果两位参赛者都掉头,那么他们就打成了平手,没得到也没失去什么。如果都不掉头,就都失去了一切(负500分)。如果只有一人掉头,那么他(或她)就失去了“荣誉”50分,被另一人获得。 这个比赛没有稳定的均衡位置,即参赛者的选择发生交汇,因为两人都想取得右上方或左下方方框的结果。但从另一方向讲,都掉头才是两人明智的选择,而这样做要求有一定程度的默契。间题是这种选择是不稳定的,因为两人都想使对方相信自己是不理智的,会进行疯狂的冒险,从而赢得比赛。为了“比赢”,参赛者可能装作醉醺醺的样子或是满口大话,可能把前车窗涂上油漆挡住视线,或是把方向盘扔到窗外,迫使可能更理智些的对手承担选择的责任。这就是“非理性的理性”。

蜈蚣博弈是由罗森塞尔(Rosenthal)提出的。它是这样一个博弈:两个参与者A、B轮流进行策略选择,可供选择的策略有“合作”和“背叛”(“不合作”)两种。假定A先选,然后
是B,接着是A,如此交替进行。A、B之间的博弈次数为有限次,比如100次。假定这个博弈各自的支付给定如下:

合作合作合作合作

A B A …… A B (100,100)

背叛 背叛 背叛背叛

(1,1)(0,3)(2,2)(99,99)(98,101)

现在的问题是:A、B是如何进行策略选择的?

这个博弈因形状像一只蜈蚣,而被命名成蜈蚣博弈。

这个博弈的奇特之处是:当A决策时,他考虑博弈的最后一步即第100步;B在“合作”和“背叛”之间作出选择时,因“合作”给B带来100的收益,而“不合作”带来101的收益,根据理性人的假定,B会选择“背叛”。但是,要经过第99步才到第100步,在99步,A考虑到B在100步时会选择“背叛”——此时A的收益是98,小于B合作时的100,那么在第99步时,他的最优策略是“背叛”——因为“背叛”的收益99大于“合作”的收益98……如此推论下去,最后的结论是:在第一步A将选择“不合作”,此时各自的收益为1,远远小于大家都采取“合作”策略时的收益:A:100,B:100-99。

根据倒推法,结果是令人悲伤的。从逻辑推理来看,倒推法是严密的,但结论是违反直觉的。直觉告诉我们,一开始就采取不合作的策略获取的收益只能为1,而采取合作性策略有可能获取的收益为100。当然,A一开始采取合作性策略的收益有可能为0,但1或者0与100相比实在是太小了。直觉告诉我们采取合作策略是好的。而从逻辑的角度看,一开始A应取不合作的策略。我们不禁要问:是倒推法错了,还是直觉错了?

这就是蜈蚣博弈的悖论。

在经济学中,“智猪博弈”(Pigs’payoffs)是一个著名博弈论例子。

这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。

那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲历亲为了。

“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。
博弈论中有一种模型叫“斗鸡模型”,有四种决策及相应的结果:鸡A选择进攻,鸡B选择防守,鸡A得1,鸡B得0;两者进攻,两者得-1;鸡B选择进攻,鸡A选择防守,鸡B得1,鸡A得0;两者防守,两者得0;这个模型的纳什均衡是其中一只鸡进攻,另一只鸡防守。