博弈论 —— 纳什均衡与囚徒困境

 

博弈论创立于1944年,是用来研究行为互动局势的一种通用的分析方法,数学方法是它的基础和支撑。在过去的几十年...



博弈论创立于1944年,是用来研究行为互动局势的一种通用的分析方法,数学方法是它的基础和支撑。在过去的几十年中,博弈论取得了很大的发展,广泛地应用于各种社会科学研究,尤其在经济学领域,博弈论已经成为现代经济学的重要分支。接触了几个学经济学的硕士研究生,在毕业论文中,言必谈“囚徒困境”和“纳什均衡”,对于这种具有博弈论的思维既是发展也是时尚。

在企业、居民、政府或其他部门内,经济生活包含了许多策略上相互作用的情况。博弈论所研究的这样一种方法:两个或更多的参与者,在类似于市场这样的竞技场上相互作用,选择对每一方都产生共同影响的行动或策略。简单地说,当你开始考虑他人会如何对你的行动进行反应时,你便进入了博弈论的领域.

一、博弈论的发展与基本思路博弈论的开创和发展应主要归功于两个名叫约翰的数学天才。美籍匈牙利的数学天才约翰•.冯•诺依曼是20世纪最杰出的数学家,众所周知,他在1946年发明的电子计算机,大大促进了科学技术的进步,大大促进了社会生活的进步.鉴于冯•诺依曼在发明电子计算机中所起到关键性作用,他被西方人誉为"计算机之父".而在经济学方面,他也有突破性成就,被誉为“博弈论之父”。在物理领域,冯•诺依曼在30年代撰写的《量子力学的数学基础》已经被证明对原子物理学的发展有极其重要的价值。在化学方面也有相当的造诣,曾获苏黎世高等技术学院化学系大学学位。与同为犹太人的哈耶克一样,他无愧是上世纪最伟大的全才之一。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。冯•诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。



(约翰.冯.诺依曼)

约翰•纳什(John•Nash),主要贡献是1950至1951年在普林斯顿读博士学位时做出的,当时他才21岁。他的天才发现———非合作博弈的均衡,即“纳什均衡”,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。然而,纳什天才的发现却遭到冯•诺依曼的断然否定,在此之前他还受到爱因斯坦的冷遇,但是骨子里挑战权威、藐视权威的本性,使纳什坚持了自己的观点,终成一代大师。尽管他身体不好,近三十年的精神分裂,但还是在1994年和约翰•海萨尼、莱因哈德•泽尔腾三人共同分享了诺贝尔经济学奖。



2002年纳什在北京演讲,介绍自己的理论

2005年的诺贝尔经济学奖授予具有美国和以色列双重国籍的罗伯特•奥曼和美国人托马斯•谢林,以表彰他们“通过博弈论分析改变了我们对冲突与合作的理解”。这再一次表明博弈论在现代经济学中的重要位置。

博弈论的基本结构包括:具有不同策略、行动的竞争者,他们的支付和分配情况以及在每一种结果下博弈者得到的其他利益。关键的新概念就是博弈里的支付矩阵,它支出了对弈者的策略、利润的分配和不同博弈者的利益;

在经济学中,我们一般都假定企业要使利润最大化,而消费者要使效用最大化。博弈论中的一个新的要素就是根据你的对手的目标和行动去进行思考,并且在分析你的对手的目标和行动的基础上进行决策。“但是,你必须始终记住,你的对手也始终在分析你的战略”。

博弈论的指导思想是:假设你的对手在研究你的策略,并采取追求自身最大利益的时候,你如何选择最有效的策略。

二、纳什均衡

无论其他博弈者采用何种战略,该博弈者的策略总是最好的;在两个博弈者都采用占优策略时,我们称其结果是一种占优均衡(dominant equilibrium),这是特殊情况,博弈论更多研究的不是这种情况。



如图,在对抗博弈中,每个企业按正常价格都可盈利10万元,如果双方抬高价格以达到垄断水平,则共同利润最大。然而,由于每一企业都想欺骗对手并通过降价获取更多利润,因而确保了在没有合谋的情况下,纳什均衡(Nash

equilibrium)成为一个普遍的事实。

纳什均衡:在对抗性博弈中,体现了博弈论的一条基本原则:把自己的战略建立在假定对手会按其最佳利益行动的基础上。纳什均衡是一个在其他博弈者的策略给定时,没有一方还能改善自己的获利的境况。即,当企业B选择策略Sb时,假定企业A选择策略Sa,如果博弈的任何一方在对方坚持其最初的策略不变的条件下都无法找到一种更好的策略,那么这个策略组合(Sa,Sb)就是一种纳什均衡。也称非合作均衡,因为每一方选择策略时,都没有共谋。

纳什均衡可以归结为“由策略变量控制的行为函数”,这个看起来似乎非常简洁的研究背后,有纳什建造数学模型、控制实验和归纳结果的天才思路。

三、囚徒困境

纳什均衡具有非合作性,因此,这种均衡在博弈双方收益相对较少的时候存在。(做相同生意的人是很少相聚的,在一些人想努力提价时,谈话终止了----亚当.斯密)合谋可以使价格提高,从而获得垄断利润。即博弈的双方结成联盟,以实现总利润最大化的策略。但是,合谋不会长久,因为反垄断在市场经济国家的逐步实施,将合谋认定为非法;另外,合谋的双方也经常欺骗对方,修改价格以实现自身利益最大化,因此,合谋很快瓦解,双方价格逐步降低到正常水平。这也是为什么卡特尔组织经常解体的原因。

所以,我们可以推理到完全竞争市场,可以认为一个完全竞争均衡是一个纳什均衡或非合作均衡,每个企业和消费者都在考虑其他各方的价格策略后做出决定。

囚徒困境(Prisoner‘s dilemma)是博弈论中最著名的例子。两个同案犯被分别关押,律师分别会见二人,他说:“我有足够的把握让你们俩都在监狱里只关一年。但是,我要告诉你们:如果你们中间有一个人坦白的话,则坦白者只被判3个月徒刑,而你的同伙却将被判10年,而如果你们俩都坦白,则你们将都会被判5年。”最后的结果是两个囚徒都选择坦白,从而每人被判5年。只有当他们都选择不坦白或都选择舍己为人的策略时,他们才能获得坐一年牢的最好结果。

无论从心理学角度还是从概率来说,各判五年的糟糕结果都具有必然性,很难摆脱,因此这个博弈被称为"囚徒困境"。

可以用囚徒的困境反映个体理性和集体理性的矛盾,个体效用最大化并不能导致社会福利最大化,当合作的时候达到社会福利最大话的时候,个体有面临着巨大的背叛的诱惑。我们需要创建一中机制,提高背叛的成本,鼓励合作,因为我们知道,人是利己的,在利己的驱动下,可以做出有利社会的事,也有可能作出有害社会的事,所以利己并没有错,这就需要我们用制度引导人们的行为。这是对经济学基础的重大挑战,因而倍受关注。

很多经济问题,都可以用囚徒困境来描述,比如电解铝行业产能过剩,几乎全行业亏损,可是投资还在不断增加,全行业都在拼亏;又如,不断上涨的房价,似乎将绝大多数住房需求者带入了囚徒困境,现在购房,嫌房价太高,现在不买,明年更高,现在去购买,自然推动房价,最后的结果就是,大家都在相对较高的价格买了房子。

经过近30年的改革开放,我国的外汇储备超过日本成为世界上第一号储备大国,储备一万多亿美元,且增长速度还在加快。但是美元在不断贬值,我们和其他储备大国都面临着一个困境:如何处置手中大量的美元,使损失能达到最小?

从目前的世界经济形势看,在可预见的将来,中国在这个问题上不发生损失已经是不可能的了。事实上,我们已经陷入关于美元的"囚徒困境"中了:如果我们和其他国家都继续持有美元而不抛售,甚至增持美元,阻止美元贬值,这样大家的损失最小,就如同囚徒都不坦白只会被各判一年一样;如果一家能够悄悄地大量抛售美元,转成欧元或其他外汇,或者黄金,又不引起其他经济体的注意,而且其他经济体也不抛售的话,他就可能在美元大跌之前脱身,从而损失最小,而其他经济体则遭受惨重损失。这就如同囚徒一人坦白就会被从宽判三个月,而另一人被重判十年一样;第三种情况是,大家都抛售,结果都损失惨重。就像囚徒两个人都坦白并都被判五年一样。

在国际金融市场上,前两种策略可能性很小,最有可能的就是第三种——大家共同损失,抛开博弈论的角度,还有一个美国自身的原因,想要避免储备的损失是很难的了,是摆在政府和央行面前的重大难题。

还有更好的解决办法吗?让我们一起寻找吧。

除了囚徒困境以外,还有污染博弈和军备竞赛等重要的例子说明了博弈论的广泛用途。污染博弈是指当存在类似污染这样的外部性时,任何企业都不再有可能通过减少污染而增加利润。在这种情况下,纳什均衡是无效率的。(看不见的手不能正常发挥作用的另一种论证方式)这个时候,就需要政府介入,通过设置有效的规章制度,实施污染排放收费,或明确产权,政府可以诱导企业“低污染”的策略移动。

军备竞赛是一个非常危险的非效率的纳什均衡。美国和前苏联在近半个世纪的时间里开展的军备竞赛,导致了大规模的武力扩张。如果双方都采取合作性的态度,就可以大大地减少战争的威胁。

论文来源:长行的博客


    关注 清河县大学生村官


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册