登陆注册
4201600000015

第15章 合作之道——合作中的惩罚与宽容(2)

威胁与承诺的共同点在于使博弈参与者不会在没有回应规则的前提下采取行动。由于别人对参与者以后的行动的预期毫无影响,这个规则也就产生不了什么变化。不过,说明什么事情会在没有规则的情况下发生,仍然具有一种公示的作用,这些说明称为警告与保证。

欧佩克如何达成合作?

欧佩克(OPEC,即石油输出国组织)控制着世界上绝大部分的石油供给——只有北海和前苏联系统的石油不在欧佩克控制范围内。

它是由世界产油大国所组成的联合机构,一度曾是最成功的价格联盟。

欧佩克之所以比较成功,很大的原因在于它的最大的成员国沙特阿拉伯“自律”较严。石油产量最大的沙特阿拉伯自律严了,在一段时间内就可以避免其他成员违反协议,造成危害卡特尔的结果。

然而,欧佩克一样被私下行动所害,势力才会大不如前。

石油输出国组织的国家会共同限制本身的产油量,以提高石油输出的利润总额。像科威特这样的石油输出国组织成员该不该限制本身的石油产量?要是减少产量,科威特显然得少卖好几桶油。供给和需求决定了全球的油价:油的供给愈少,油价就愈高。

假如科威特减少它的石油产量,全球的油量供给就会减少,油价也会因此而上涨。

但是无论科威特或沙特阿拉伯有没有跟着减产,油价要是跌了就是跌了,因此当石油输出国组织的其他成员都减产时,科威特理论上会想要大幅提高油产量,尽管石油输出国组织的所有成员都希望别的国家减少产油量。

当石油输出国组织的国家发现它们的困境后,便会达成一致的协议说,大家都应该减少油的产量。

不过,石油输出国组织的每个成员却是各怀私心。假如其他国家都降低本身的产油量,那么作弊的国家,便能得到全球油价上涨的好处。当然,假如每个国家都作弊,那么油价就会暴跌。

在这种情况下,石油输出国组织的成员便形成了没有明显最后一次的重复囚徒困境博弈。

无论就哪一次来说,作弊都符合各个国家的利益。某个国家这次之所以没有作弊,是因为假如它被抓到,以后其他国家就会接二连三地作弊。被抓到的机会愈低,作弊的动机就愈强。

由于石油输出国组织的国家无法完全掌握彼此的产量,因此经常会不按照协议的额度生产。

在重复的囚徒困境博弈中,参与者可能有办法靠合作而得到理想的结局。不过,私下行动、短期暴利和最后一次的问题还是可能使合作破裂。

在海湾战争中,伊拉克入侵科威特的其中一个理由就是,科威特没有遵守石油输出国组织所规定的产油额度。当石油输出国组织的成员作弊时,像美国这样的石油进口国当然就会得到好处。

一个一次性博弈没有办法达成互惠合作。

只有在一种持续的关系中才能够体现惩罚的力度,并因此成为督促合作的大棒。合作破裂自然就会付出代价,这一代价会以日后利润损失的形成出现。假如这个代价足够大,作弊就会受阻,合作就会继续。

依存策略和触发策略

在重复博弈中,互动关系具有序贯性,这意味着局中人可以根据先前双方的博弈行为,决定自己下一阶段的策略选择。具体来说,就是根据先前双方是否合作,决定自己下一阶段的策略是选择合作还是选择背叛等等。

这类策略在博弈论上被笼而统之地称为依存策略或者相机策略,后面一种翻译取自汉语“相机行事”的说法。

大多数依存策略都是所谓触发策略。一个局中人使用触发策略,意味着只要他的对手在博弈中一直采取合作策略,则该局中人也会在博弈中继续采取合作策略;但是,一旦对手在某一个阶段采取背叛策略,将会触发该局中人在往后的一段时期内采取不合作策略,甚至永远采取不合作策略,从而对对手实施惩罚。

两个最着名的触发策略分别是冷酷策略和“一报还一报”策略。

冷酷策略

冷酷策略,也称好战策略,它是无限重复博弈中的一种策略,是指双方一开始的时候选择合作,然后继续选择合作,直到有一方选择背叛,对手从此将永远选择背叛。

这个策略之所以冷酷,是因为任何局中人的一次性不合作将触发永远的不合作。

《君子》与《好逑》是两家男性时尚杂志,都有两种定价策略选择,即定高价与定低价。

如果两个参与者都定低价,则每个参与者的收益均为10;如果两人都定高价,则每人的收益均为20。

如果其中某一参与者定低价,而另一参与者定高价,那么定低价的参与者会占有更多的市场份额,获得30的收益,定高价的参与者由于失去一部分市场份额而只获得5的收益。

假设这是个一次性完全信息静态博弈,那么两个参与者均有优势策略,优势策略均衡为《君子》、《好逑》双方都定低价。

如果《君子》、《好逑》之间的定价博弈是多次进行的,那么问题就不会这么简单。这里分析一下博弈重复次数为无限的情况。

如果《君子》、《好逑》双方都选择合作,都保持定高价,则双方在每个阶段的收益均为20,记为(20,20,20,…)。

如果《君子》、《好逑》中有一方,比如《君子》采取投机行为,在实际定价中选择不与对方合作,在第一阶段就通过选择定价策略使得选择高价策略的对手《好逑》受损,则受损的一方《好逑》一定会在第二阶段及其以后的定价中也选择低价策略,加以报复。

这样一来,首先选择不合作的一方《君子》在每个阶段的收益为(30,10,10,…),显然其总收益远远小于合作、维持高价情况下的总收益。因为首先选择不合作的一方《君子》只是在第一阶段获得了“额外”收益,但在以后每个阶段的收益将因为对手《好逑》的报复性选择而减少,而且重复若干次之后,先选择不合作的一方《君子》将得不偿失。

在这里,《好逑》选择的策略就是冷酷策略,即重复博弈中的任何参与者的一次性不合作,将引起其他参与者的永远不合作,从而导致所有参与者的收益减少。因此,所有参与者具有维持合作的积极性。

“一报还一报”策略

所谓“一报还一报”策略,开始的时候和冷酷策略一样,即双方从合作开始,在以后的每个阶段,如果你的对手在最近的一次博弈中采取合作策略或者在最近连续N次博弈中采取合作的策略,则你继续跟他合作;如果你的对手在上一阶段的博弈中采取背叛策略,则你在下次的博弈中采取背叛策略报复他,或者在下面连续N次博弈中采取背叛策略报复他。

这里,自然数N,即被背叛以后,究竟连续惩罚或者报复几次,是策略本身的规定。为说话方便,我们把规定被背叛以后连续惩罚或者报复N次的“一报还一报”策略,叫做惩罚N次的“一报还一报”策略。惩罚1次的“一报还一报”策略,特别叫做严格的“一报还一报”策略。请注意,这里的“严格”,指的是严格于“一报还一报”的字面意思:你这次对我不好,下次我马上对你不好;你这次“改邪归正”了,下次我马上与你“和好如初”。

罗伯特·阿克塞尔罗德是密歇根大学的政治学教授,他曾邀请学者们为一个重复囚徒困境游戏设计策略。然后把所有人设计的策略输入电脑,每个人的策略分别和其余各人的策略博弈,重复300次。

他要求每个参赛者把追求得分最多的策略写成电脑程序,然后用单循环赛的方式将参赛程序两个一对进行博弈,以找出什么样的策略得分最高,而什么时候结束游戏是未知的。

这次博弈有14个程序参加,再加上罗伯特自己的一个随机程序即以50%的概率选取合作或者不合作,运转了300次。结果得分最高的程序是加拿大学者罗伯布写的“一报还一报”(TitforTat)。

这个程序的特点是,第一次对局采用合作的策略,以后每一步都跟随对方上一步的策略,你上一次合作,我这一次就合作;你上一次不合作,我这一次就不合作。罗伯特还发现,得分排在前面的程序有三个特点:第一,从不首先背叛,即“善良的”;第二,对于对方的背叛行为一定要报复,不能总是合作,即“可激怒的”;第三,不能人家一次背叛,你就没完没了地报复,以后人家只要改为合作,你也要合作,即“宽容性”。

为了进一步验证上述结论,罗伯特决定邀请更多的人再做一次游戏,并把第一次的结果公开发表。第二次征集到了62个程序,加上他自己的随机程序,又进行了一次竞赛。结果,第一名的仍是“一报还一报”。

“一报还一报”策略相比冷酷策略要温和许多,“一报还一报”

策略既可以让重复的囚徒困境博弈“走出囚徒困境”,又无须借助于“永久受罚,不可挽回”的惩罚机制。

就博弈的对抗性而言,严格的“一报还一报”比非严格的“一报还一报”宽容得多,严格的“一报还一报”策略是最不严厉的“一报还一报”策略。

可以说,严格的“一报还一报”策略是一种“不记仇”的“一报还一报”策略。

相应地,冷酷策略也可以被叫做“记仇”的“一报还一报”

策略。

“一报还一报”策略也被翻译为“以牙还牙策略”或“针锋相对策略”,但严格说来,这种译法并不准确,以牙还牙、针锋相对只反映了惩罚的一面,没有体现宽容的一面。

以前面两家杂志的价格策略为例,严格的“一报还一报”策略是这样的:一开始,《君子》收缩产量,维持高价以便双方都得到较高的利润;如果《好逑》也这么“善意”,下次《君子》继续“善意”。

如果《好逑》这次以“恶意”把《君子》的“善意”当愚蠢,下次《君子》也就不用客气了。但是,如果《好逑》下次又重新表达“善意”,那么《君子》在再下次也会重新用“善意”对《好逑》

的“善意”。也就是说,只有当对手继续采取背叛策略的时候,惩罚才会继续下去。

“一报还一报”策略的优点

“一报还一报”策略具有较高的清晰性,能够让对方很快发现规律,从而不得不采取合作的态度进行博弈。

“一报还一报”策略还有一个非常引人注目的特征在于,虽然它在整个博弈取得突出的成绩,但是它实际上并没有(也不能)在一场正面较量中击败对手。因此,最好的结果是跟对手打成平局。

罗伯特·阿克塞尔罗德没有按照“赢者通吃”的原则给结对比赛的选手打分,只有比赛最后结束才打点总的得数。

假如当初阿克塞尔罗德是按照“赢者通吃”的原则打分,“一报还一报”策略怎么也不可能取得最后的胜利。

“一报还一报”策略的一大优点在于,它最坏的结果一直遭到背叛。在这种情况下,对方占了一次便宜,从此打成平局,重复次数越多,双方的得分越接近。

“一报还一报”策略之所以在两次游戏中都获胜,理由是它通常都能够十分有效地促成合作,同时避免相互背叛。

“一报还一报”策略的缺陷

但是,“一报还一报”策略并不是一个十全十美的策略,往往只要有一丁点儿的发生误解的可能性,“一报还一报”策略的优势就会土崩瓦解。这个缺陷在人工设计的电脑锦标赛并不明显,因为电脑按照程序“照章办事”,根本不会出现误解。

但是,人是会犯错误的,任何具体的人都不是完美的人。一旦人们将“一报还一报”策略用于解决现实世界的问题,误解就难以避免,结局可能变成一场灾难。

1987年,美国就前苏联侦察和窃听设在莫斯科的美国大使馆一事做出回应,宣布缩小在美国工作的前苏联外交官的人数。前苏联的回应是调走设在莫斯科美国大使馆的后勤人员,同时对美国外交使团的规模设置更加严格限制。结果,双方都难以开展各自的外交工作。另一个引发一系列针锋相对行动的例子出现在1988年,当时加拿大发现前来访问的前苏联外交官从事侦察活动,当即宣布缩小前苏联外交使团的规模,而前苏联则以缩小加拿大设在莫斯科的外交使团的规模作为回应。到了最后,两个国家关系恶化,以后的外交合作也就更难上加难了。

“一报还一报”策略的问题在于,任何一个错误都会反复出现,犹如回声振荡。只要一次出错,一方惩罚另一方的背叛行为,从而引发连锁反应。对手受到惩罚之后,不甘示弱,进行反击。这一反击招致第二次惩罚。事实上,按照这个策略,无论什么时候都不会接受惩罚而不作任何反击。以色列由于巴勒斯坦发动袭击而进行惩罚,巴勒斯坦拒绝忍气吞声,采取报复行动。由此形成中东地区数十年时间的恶性循环,惩罚与报复就这样“自动”地永久持续下去。

以德报德,以直报怨在生活中,人们选择策略竞争的结果,往往是“善良”的“以合作为主”的策略大获全胜,“邪恶”的“以占便宜为主”的策略则成绩不佳。

人生博弈的最佳策略是“善良”加“一报还一报”。这个策略稳定成功的原因是它综合了善良性、惩罚性、宽容性、透明性,它的善良性防止其陷入不必要的麻烦,它的惩罚性使对方试着背叛一次以后就不敢再背叛,它的宽容性有助于重新恢复合作,它的透明性使它容易被对方理解,从而能够形成长期的合作,多方的共赢。

可见,良好的博弈策略往往总是以合作开局,但从此以后就采取以其人之道还治其人之身的策略,即实行“胡萝卜加大棒”的原则。这种人应具备善意、宽容、强硬、简明的特征,这种人往往是消解生存博弈困境的赢者。

其实,罗伯特的一些结论,在传统文化中也可以找到对应表达,比如“春秋大义”、“投桃报李”、“人不犯我,我不犯人”、“以眼还眼,以牙还牙”,就体现了“TitforTat”的思想。

但这些策略并不总是优势的,因为“真实的社会生活里总是充满了不确定性”。

孔子在几千年前就说出了“以德报德,以直报怨”这样精彩的修正策略,“直”就是公正,以公正来回报对方的背叛,这是一种修正了的“一报还一报”,修正的是报复的程度,本来可以给你10个单位的惩罚,现在只给你6个单位的惩罚。这样有利于结束没完没了的报复,进而形成人类文明。

同类推荐
  • 引爆网上创业

    引爆网上创业

    本书既可作为网上创业人士的业务读物、培训用书,也可以作为电子商务相关专业的辅助教材。本书主要阐述以下7部分内容:1、网创导入:网上创业的基本概念;选择网络创业项目方法;网上创业的商业模式。2、网店商城模式:淘宝C店开设和运营的;B2C购物网站;宣传推广网店的方法。3、线上线下模式:O2O商业模式;选择合作的商家。4、网上技术创业模式:威客网站创业;网商提供服务创业;开发软件创业。5、移动互联创业模式:移动互联网领域创业方向;开发和推广移动互联网应用软件。6、自媒体创业模式:自媒体的概念和意义;几种典型的自媒体及创业模式。7、自营网站创业模式:网站运营项目,自营网站盈利模式,自营网站宣传与推广。本书既可作为网上创业人士的业务读物、培训用书,也可以作为电子商务相关专业的辅助教材。本书主要阐述以下7部分内容: 1、网创导入:网上创业的基本概念;选择网络创业项目方法;网上创业的商业模式 。 2、网店商城模式:淘宝C店开设和运营的;B2C购物网站;宣传推广网店的方法。 3、线上线下模式:O2O商业模式;选择合作的商家。 4、网上技术创业模式:威客网站创业;网商提供服务创业;开发软件创业。 5、移动互联创业模式:移动互联网领域创业方向;开发和推广移动互联网应用软件。 6、自媒体创业模式:自媒体的概念和意义;几种典型的自媒体及创业模式 7、自营网站创业模式:网站运营项目,自营网站盈利模式,自营网站宣传与推广。 本书既可作为网上创业人士的业务读物、培训用书,也可以作为电子商务相关专业的辅助教材。本书主要阐述以下7部分内容: 1、网创导入:网上创业的基本概念;选择网络创业项
  • 跟总理学经济:读懂中国经济未来走向

    跟总理学经济:读懂中国经济未来走向

    “李克强经济学”不是封闭在实验室里的数据计算和报告,不是静态的学说,更不是在瓶子里养鹅;它是一个开放的、动态的、弹性的、不断成长和完善的中国新社会进步运动。或许,10年、20年后,甚至30年后,从大历史角度回头来看,我们的理解会更完整、更深刻、更准确。
  • 沃野拾穗

    沃野拾穗

    本书收录了《他就像一棵胡杨树》、《童心一片重如山》、《农村呼唤机械化》、《我能告诉你》、《播雨记》、《大连城市建设与管理对我们的启示》等文章。
  • 基础设施领域的特殊法人与公企业

    基础设施领域的特殊法人与公企业

    本书主要研究基础设施领域公企业产生、发展的内在规律,揭示我国基础设施领域国有企业改革的路径。
  • 渝怀壮歌

    渝怀壮歌

    本书记述了重庆渝怀铁路建设的全过程。渝怀铁路是我国西部大开发首批十大建设项目之一。它的建成,使得川渝地区与东南沿海地区的客货运输途径缩短270~550公里,对于加强西南与中东部地区的经济、文化交流,促进各民族之间的团结,加速资源开发利用,推动武陵山区脱贫致富和西南地区发展都将起到极其重要的作用。
热门推荐
  • 只因我是你夫君

    只因我是你夫君

    罗倾桦作为堂堂罗家三小姐,却处处不受人待见,纵然拥有倾国倾城的容貌,但摊上这么样个倒霉体质也就变成没办法的事,有罗倾桦之地必无好事。某天,一位不知死活的王爷来提亲,然后罗倾桦就莫名其妙被嫁过去了,成为正王妃,稀里糊涂的还没弄清楚什么情况,就被眼前的王爷告知他有改变罗倾桦的倒霉体质的方法,相对的罗倾桦要成为他的娱乐工具,好!为了改变这体质,所以在他说出方法之前,都忍了吧。罗倾桦为了光明美好的未来,前进前进前进,吼吼。
  • 摘星之王

    摘星之王

    有谁知道,黑夜的星虽然绚丽灿烂,但它们要是亮得太久,就会颤抖。黄昏的云壮丽浪漫,又有谁知道,它们的身体里,存的都是眼泪。至尊帝王,万人之上,岂非又是最孤独的那一个。(谨以此书,向那个将孤独演绎成伟大的人致敬。)
  • 魅惑混世王妃

    魅惑混世王妃

    喜从天降就是如此,一瞬间令人唾弃的陈家小小姐名扬全城,当然不是正面消息,和太子成亲?对众人而言陈紫玥简直是癞蛤蟆想吃天鹅肉。她,陈紫玥从见到太子的第一面就暗暗倾心,就算被人欺被人唾。那一刹那,陈紫玥像是清醒了,心中没来由的涌上了邪气。背井离乡,只为有朝一日能够报这一句之仇。
  • 相思谋:妃常难娶

    相思谋:妃常难娶

    某日某王府张灯结彩,婚礼进行时,突然不知从哪冒出来一个小孩,对着新郎道:“爹爹,今天您的大婚之喜,娘亲让我来还一样东西。”说完提着手中的玉佩在新郎面前晃悠。此话一出,一府宾客哗然,然当大家看清这小孩与新郎如一个模子刻出来的面容时,顿时石化。此时某屋顶,一个绝色女子不耐烦的声音响起:“儿子,事情办完了我们走,别在那磨矶,耽误时间。”新郎一看屋顶上的女子,当下怒火攻心,扔下新娘就往女子所在的方向扑去,吼道:“女人,你给本王站住。”一场爱与被爱的追逐正式开始、、、、、、、
  • 叶夏的二次元

    叶夏的二次元

    叶夏,原是职场精英的他,来到了二次元位面,木御桐乃;椎名真白;乾纱凪;夏川真凉……一系列人物的出现让他的生活发生了翻天覆地的变化
  • 柳清清传

    柳清清传

    清城驱魔柳门传人柳清清,二姐一枚,半调子驱魔功夫走天涯。身负家族复兴重任、抵御强敌维护宇宙平衡的责任、求取真心人之己任。宇宙主宰清问神魔帝轩辕无邪,喜怒无常,心狠手辣,嗜血成性,以毁灭杀戮为乐,发誓摧毁世间一切美好,建立暗能魔域。
  • 英雄联盟之重生召唤

    英雄联盟之重生召唤

    宿舍五人LOL,居然穿越了,屌丝也能穿越?被邪恶小法师诅咒被易大师悉心教诲卡尔玛是我的灵魂导师锐雯是我的女朋友最想不到的是蒸汽机器人布里茨居然是我的私人爱情顾问……(努力码字中,目前每天两更,一般都在晚上,喜欢请收藏推荐,谢谢大家)注:本书以英雄联盟英雄背景故事、正义周刊、游戏彩蛋等为基础,并配合情节需要进行适当的改编,立求为读者朋友们还原出一个真实的瓦罗兰世界。
  • 君上墨

    君上墨

    三千年的守护,三千年的期盼,换来的终究不过一场梦。三千年之前的我们为何拥有一份执着的爱,为何过了三千年,我们的爱却已经不在。
  • 木香花

    木香花

    天河落,云仙绕,地火焰烧寒潭冰,是人是鬼一念间。水氏,最古老而神秘的家族。她,是水氏族长的二女儿,也是令人闻风丧胆的七色杀手之一,她古灵精怪,聪颖善良。他,是武器世家唐府的大公子,他天赋超群,追求自由。他,是武林盟主的大儿子,他精于谋略,英俊冰冷。他,是她的大师兄,他几乎无所不能,却不能娶她。他,是太子府的秘密武器,他洒脱不羁,心底柔软。水氏族人水曦晗携一封拜帖入住武林盟主云玥琅的府邸。随后,十五年前覆灭的烟云涧重现江湖,“冷若秋风寒霜夜,摄入心魂追梦香”的摄魂令不再只存在于传说中。烟云涧的圣物能够蛊惑人心、号令天下,让无数人动心。明远王府、太子府、各座山庄府邸等势力蠢蠢欲动,江湖再掀风雨。
  • 天纵神武:李渊

    天纵神武:李渊

    李渊是中国封建制时期功业卓著的有为帝王,同时也是中国历史上最具争议、毁誉参半的帝王之一。他奠定了彪炳千秋的二百九十余年的盛唐霸业,并因之得到了后人的褒扬;他也因无力阻止亲生骨肉的相互残杀,无奈地被其子李世民“请”下了丹墀,而令后人悲叹与哂笑。李渊是唐朝开国创业的军事统帅,善于决断、既富远见、又善施行的政治家和军事家。纵观李渊的一生,他有着因势借力、先取关中、后图天下的兴兵起事思想;军政兼施、各个歼灭群雄、统一全国的战略指导思想;正确料敌、集智用长、先胜后战的作战指导思想;因势定制、严明赏罚、用人所长的建军思想。