经济学原理

首页 » 常识 » 问答 » 生活中的经济学什么是无限重复博弈
TUhjnbcbe - 2022/12/27 18:58:00

生活中的经济学:什么是无限重复博弈?无限重复博弈最大的特点就是不存在最后一次的(子)博弈。这样一来,参与者就可以从自己不喜欢的占优策略中摆脱出来。在这种情况下要想维持合作关系,“报复威胁”必须长期具有可信性。因此,通过某种行动来使策略发生永久性转变的“触发策略”十分有效。

案例一:大甩卖策略。Y服装店和Z服装店都是位于郊外X町站前商店街的两家服装店。Y服装店的老板横山需要在五月末的商店街协会议上宣布自己是否参加夏季大甩卖活动。根据协会的规定,一旦商家决定进行甩卖就不能取消。横山四处收集信息,但直到会议召开一周前仍然没有决定是否应该参加甩卖活动。就在这个时候,商店街协会委托管理顾问进行的市场调查终于得出了结果。这是商店街协会自己出资在半年前下达的委托,目的是给商店街的店家提供一些关于促销活动的参考,只不过出结果的时间比预定晚了许多。

这份调查的数据证明Y服装店和Z服装店之前的预测都基本准确,只有一点,那就是在两家同时进行甩卖的情况下,期待收益比之前双方各自预测的收益更高。具体来说就是当两家店铺都进行甩卖的时候,因为前来购买的顾客会比平时增加很多,所以双方都能够获得万日元的收益,而非之前预测的出现万日元的亏损。Z服装店的老板钱川也拿到了这份市场调查的结果。

那么,对于这个“好消息”,横山又是怎么看的呢?他再次用和之前相同的分析方法对新的期待收益进行了分析。而且这次他将分析更进一步,以甩卖活动在今后一直持续为前提进行思考。我将和大家一起思考当博弈变成无限重复的时候,其性质都会发生哪些改变。比如企业间的交易,一般情况下来说都是长期持续的情况比较多,而非只进行两三次就结束(有限次数)。像这种一直持续下去的博弈被称为“无限重复博弈”。无限重复博弈的特点就是不存在最后一次的(子)博弈。这也就意味着之前我们在对序贯博弈和有限重复博弈进行分析时使用的逆向归纳法无法用在无限重复博弈上。那么,无限重复博弈和有限重复博弈之间有哪些异同,以及我们应该用什么方法对其进行分析呢?

二、有限(案例二)与无限(案例一)的比较如果将本章开头案例一中的市场调查结果代入到案例二之中,博弈会发生怎样的变化呢?首先我们将案例二和案例一都只进行一次博弈情况下的收益矩阵进行一下比较(图表1)。按照惯例,收益数字下的直线代表这是对各参与者来说最有利的选择。因为两家都进行甩卖时的收益从亏损变成得利,因此这个博弈的性质发生了明显的变化。

通过收益数值的下划线就能看出来,在本节的博弈之中,两家服装店都应该选择甩卖,在这种情况下不管对方如何选择,自身都处于有利位置。也就是说,在这个博弈之中(甩卖,甩卖)是占优策略。这就和“囚徒困境”一模一样。因此,两家店铺即便在选择(不甩卖,不甩卖)的时候能够获得更高的收益,也仍然会选择(甩卖,甩卖)的策略。只要博弈的次数有限,那么不管重复多少次,双方都会选择(甩卖,甩卖)的占优策略。

图表1:案例二与案例一的收益矩阵

在这个新的博弈之中,在三次的重复中不可能出现合作关系。就算双方事先商量好在后两次之中各自进行一次甩卖,也很有可能出现背叛的情况。因为自己不甩卖的时候收益为零,如果背叛进行甩卖的话则能够获得+万日元的收益。这个诱惑是难以抗拒的。像这样只有一个均衡策略的博弈重复进行有限次数的情况下,基于逆向归纳法每次都选择均衡策略是唯一满足子博弈精炼均衡的策略。这就是“逆向归纳悖论”。

三、无限重复囚徒困境

接下来让我们思考一下这个博弈无限重复的情况。很显然在这种情况下,“从最初到最后永远选择甩卖”的策略组合满足子博弈精炼均衡的条件(在所有子博弈之中各参与者都选择纳什均衡策略)。但在无限重复博弈之中,由于没有最后一次子博弈的存在,因此无法使用逆向归纳法。在这个策略组合之中,两家店铺都会永远选择甩卖,而不会选择可能获得更多收益的(不甩卖,不甩卖)。但是,在无限重复囚徒困境之中还存在别的策略。

当博弈变为无限重复的时候,以下的策略也满足子博弈精炼均衡的条件。Y服装店:第一次选择甩卖,之后在对手选择甩卖之前自身都选择不甩卖。当对手选择甩卖后自身也永远选择甩卖。Z服装店:第一次选择甩卖,之后在对手选择甩卖之前自身都选择不甩卖。当对手选择甩卖后自身也永远选择甩卖。在这个博弈中,如果一家服装店选择甩卖,另一家也选择甩卖进行对抗的话就能够获得更高的收益。

以此为前提,让我们思考一下双方选择上述策略的情况下,各“子博弈”的收益情况。双方都不甩卖:每次两家店铺都+万日元的收益。任何一方(背叛)选择甩卖——甩卖方:+万日元的收益。不甩卖方:零收益。任何一方(背叛)选择甩卖之后:每次两家店铺都+万日元的收益。在这个策略之中,选择背叛的店铺只有在当次的子博弈中能够获得更多的收益,即万日元,而从今往后的所有子博弈中都只能获得万日元,与选择(不甩卖,不甩卖)时相比收益减少了万日元。

也就是说,如果只为了眼前的收益选择“背叛”的话,显然是非常不划算的。综上所述,在这个博弈之中,不仅当任何一方选择甩卖之后的子博弈中各参与者都选择纳什均衡(这也是占优策略),而且在以“两者都不甩卖”期间的分歧点为起点的子博弈中,各参与者也选择纳什均衡(因此满足子博弈精炼均衡的条件)。而且在选择这个策略组合的情况下,两家服装店(只要其中一方不犯错或者背叛选择“甩卖”)一直选择“不甩卖”的可能性非常高。触发策略在无限重复博弈之中,因为“报复威胁”的存在,各参与者可能会采取合作的策略。

在案例中,任何一方参与者采取“甩卖”的行动之后,都会遭到另一方的报复性甩卖,结果两家店铺就会陷入甩卖的竞争之中。对于“背叛的参与者”来说,未来减少的收益要远远大于眼前的收益,这就是“遭到背叛的参与者”所采取的报复行动。而这个“报复威胁”就是迫使两名参与者不敢背叛保持合作的保险。此外,类似这种“以某种行动为契机永久转变策略”的策略被称为“触发策略”。

需要注意的是,这个策略与另一个子博弈精炼均衡策略“两者每次都选择甩卖”相比期待收益更高。至少在两者都不进行甩卖的期间要比两者都选择甩卖的情况下多万日元的收益。当类似这样的“囚徒困境”重复无限次的时候,各参与者就可以从被迫选择(甩卖,甩卖)这一占优策略中摆脱出来,选择收益更高的(不甩卖,不甩卖)策略组合。如果换到商业活动的环境之中,无限重复可以看作对当事人来说“不知道何时结束”的交易。

总之,只要是不知道哪次是最后一次,无法通过“逆向归纳法”进行分析的状况就都可以看作是无限重复博弈。不过,要想维持合作关系,“报复威胁”必须长期具有可信性。比如在甩卖竞争的过程中,如果其中一方的资金链出现问题导致无法继续竞争,那么另一方肯定会抓住这个机会用“逆向归纳法”进行分析,继而不再采取合作的行动。

1
查看完整版本: 生活中的经济学什么是无限重复博弈