演化博弈论----gyy参考总结

生物学家认为，进化就是剔除无效战略的过程，因此博弈论可以预测进化的结果。

演进稳定战略（evolutionarily stable strategyy,ESS）

人的理性是有限的，由于受认知能力的限制，有限理性的人类通常是根据习惯、常规以及经验法则行事，人类不可能如博弈论所描述的那样，通过复杂的计算来获得最佳反应战略。人类懂得学习，具有有限理性。人类的学习和生物的进化史没有本质区别的，演进稳定战略适用于有限理性学习的人类。

ESS隐含着复制动态博弈的动态思想。动态学中的研究结果和演进稳定战略的研究结果是一致的。

结论

（1）ESS是一个纳什均衡。在种群生活在演进稳定战略中时，每种生物所采取的都是最优反应战略。

（2）由于并非所有的纳什均衡在复制动态博弈研究中都是稳定的，所以并非所有的纳什均衡都是都是稳定战略。

博弈论可以有效地运用至非人类领域的研究中。博弈论在生物学应用中的两个关键性概念------演进稳定战略以及复制动态博弈，同样也可以研究人类及其战略的演化过程。

模仿者动态=复制动态=replicator dynamic

演化博弈论

演化博弈论（evolutionary stable strategy）整合了理性经济学与演化生物学的思想，不再将人模型化为超级理性的博弈方，认为人类通常是通过试错的方法达到博弈均衡的，与生物演化具有共性，所选择的均衡是达到均衡的均衡过程的函数，因而历史、制度因素以及均衡过程的某些细节均会对博弈的多重均衡的选择产生影响。

演化博弈理论最早源于Fisher，Hamilton，Tfive~等遗传生态学家对动物和植物的冲突与合作行为的博弈分析，他们研究发现动植物演化结果在多数情况下都可以在不依赖任何理性假设的前提下用博弈论方法来解释。但直到Smith and Price(1973)在他们发表的创造性论文中首次提出演化稳定策略(evolutionary stable strategy)概念以后，才标志着演化博弈理论的正式诞生。

生态学家Taylor and Jonker(1978)在考察生态演化现象时首次提出了演化博弈理论的基本动态概念——模仿者动态(replicator dynamic)，这是演化博弈理论的又一次突破性发展。模仿者动态与演化稳定策略(RD&ESS)一起构成了演化博弈理论最核心的一对基本概念，它们分别表征演化博弈的稳定状态和向这种稳定状态的动态收敛过程，ESS概念的拓展和动态化构成了演化博弈论发展的主要内容。

基于经典博弈论，演化博弈论为研究自然界及人类社会经济系统中的合作行为提供了一个方便的数学框架。

演化博弈论放弃了经典博弈中 Nash均衡的概念，而引入了演化稳定策略（Evolutionarily Stable Strategy, ESS）的概念。

假设策略I 为 ESS，则必须满足条件：如几乎所有的个体（Population）都采取策略I，那么所有采用策略I的个体的适应度要比任何可能的变异策略要大。如不满足这些条件，变异策略可以入侵种群，那么I将会消减，即变得不稳定。

有了ESS的概念，就可以判断策略的稳定性。

与传统的 Nash 均衡相比，ESS 这个概念要更加严格一些，因此可用于平衡点选择。

因为所有的 ESS 必定是 Nash 均衡，但只有严格对称的 Nash均衡才有可能是 ESS。

值得一提的是，这里的ESS是一个“静态”的概念，其假设只要求表现更好的策略具有更快的复制（增长）速率，并不涉及具体的博弈动力学。

引入了复制动力学的概念（Replicator Dynamics），进一步拓展了演化动力学的研究。

复制动力学的主要假设为给定的策略类型的单位复制率正比于适应度之差。

复制动力学是关于博弈动力学（策略更新）的连续确定性方程，从而可以赋予前面介绍的ESS这一静态的概念以动力学含义。复制方程在不动点附近的稳定性将对应于策略的演化稳定性（ESS）。

演化博弈论

-------------------------------------------------------------------------------------------------------------------------------

Smith and Price(1973)在他们发表的创造性论文中首次提出演化稳定策略(evolutionary stable strategy)概念以后，才标志着演化博弈理论的正式诞生。

生态学家Taylor and Jonker(1978)在考察生态演化现象时首次提出了演化博弈理论的基本动态概念——模仿者动态(replicator dy—namic)，这是演化博弈理论的又一次突破性发展。模仿者动态与演化稳定策略(RD&ESS)一起构成了演化博弈理论最核心的一对基本概念，它们分别表征演化博弈的稳定状态和向这种稳定状态的动态收敛过程，ESS概念的拓展和动态化构成了演化博弈论发展的主要内容。

演化博弈论与传统博弈理论不同，演化博弈理论并不要求参与人是完全理性的，也不要求完全信息的条件。

演化博弈论是把博弈理论分析和动态演化过程分析结合起来的一种理论。在方法论上，它不同于博弈论将重点放在静态均衡和比较静态均衡上，强调的是一种动态的均衡。演化博弈理论源于生物进化论，它曾相当成功地解释了生物进化过程中的某些现象。

对演化博弈论的特征以及基本概念不够清晰，演化博弈并不是演化的观点和博弈的思想简单相加，动态演化的博弈模型也不一定就是演化博弈模型；

理论渊源

阿尔钦（Alchian，1950）认为，在选择机制下，即使不把行为主体看作是理性的，但来自社会的演化压力（优胜劣汰）也将促使每个行为主体采取最适合自身生存的行动，从而使得达到的演化均衡为纳什均衡。

纳什认为，不需要假设参加者有关于总体博弈结构的充分知识，也不要求参加者有进行任何复杂推理的愿望和能力，只需假定参加者能够积累关于各种纯策略被采用时的相对优势的实证信息，纳什均衡仍可达到。

基本特征

演化博弈论一般的演化博弈理论具有如下特征：它的研究对象是随着时间变化的某一群体，理论探索的目的是为了理解群体演化的动态过程，并解释说明为何群体将达到的这一状态以及如何达到。影响群体变化的因素既具有一定的随机性和扰动现象（突变），又有通过演化过程中的选择机制而呈现出来的规律性。大部分演化博弈理论的预测或解释能力在于群体的选择过程，通常群体的选择过程具有一定的惯性，同时这个过程也潜伏着突变的动力，从而不断地产生新变种或新特征。

尼尔森-温特给出了个体在演化过程中的几个重要特征，我把他们列在下面

1、个体永远不会完美信息（局部知识或吉尔兹的地方性知识，而不是全局性知识）
2、个体行为受制度（正式和非正式），规范，习俗，意识系统等条件约束
3、个体（或者企业）可以模仿对手
4、开发和模仿（也就是R&D）既有“积聚效应”（可以参考Becker关于“上瘾”以及孩子教育的论文）和路径依赖的效果，又与原创性科学研究相关。
5、个体竞争的结果往往是非均衡的－即败者出局（被淘汰）
6、个体的特征是非决定性的――这里他们是在反驳“决定论”的批评。同时，演进的结果通常是不可逆的。
7、主流经济学喜欢讨论“潜在的”均衡（也就是往往达不到的，但理论上可能的均衡），而对非均衡状态的分析要远比那些均衡来的重要。

--------------摘自演化博弈论简介

演化博弈论在经济学领域的应用与运用演化博弈理论解释生物进化现象有所不同，演化博弈论中的一些生物进化的概念在经济学领域中无法应用。演化博弈论在经济学领域的应用主要是考虑微观个体在演化的过程中可以学习和模仿其他个体的行为。

一般的演化博弈模型的建立主要基于两个方面：选择（Selection）和突变（Mutation）。选择是指能够获得较高支付的策略在以后将被更多的参与者采用；突变是指部分个体以随机的方式选择不同于群体的策略（可能是能够获得高支付的策略，也可能是获得较低支付的策略）。突变其实也是一种选择，但只有好的策略才能生存下来。突变是一种不断试错的过程，也是一种学习与模仿的过程，这个过程是适应性且是不断改进的。不具备这两个方面的模型不能称为演化博弈模型。

演化理论中有两条最重要的机制。一个叫自然选择，即不是每种生物都有相同的概率在下一期存活。在这个世界上，有些生物个体（或者人）特别幸运，他们能活下去，但还有些个体就倒霉了，他们会被淘汰。我们今天都活着，可见我们的祖先都还是幸运的，他们有后代继承了他们的基因。我特别要强调自然选择，对于我们来说是被选择(be selected)，我们能决定我们的行为和策略，但不能决定我们是否被选择，那是上帝的事情。严复说物竞天择，就是这个意思。

另一种机制叫突变机制(mutant),这保证了种群的变化。如果没有突变，那么这个世界上存活下来的物种就会越来越少，最后只剩下一种。对于突变机制，我也要强调它是没有方向性的，可能会提高个体的适应性，但更有可能降低个体的适应性。突变同样是上帝的选择，微观个体无能为力。--------------摘自演化博弈论简介

比如，艾格则等（Agiza，Hegazi&Elsadany，2001）提出了一个动态演化的博弈模型，它在有限理性的企业都采取一定的行为规则（产量调整机制）下研究企业重复博弈是否可以达到纳什均衡。这个模型虽然研究的是有限理性个体和动态演化过程，但不属于演化博弈模型，因为没有包含选择和突变的过程。如果把这个模型作如下修改，便可以看作演化博弈模型：假设企业有许多不同的行为规则，而采用某些行为规则的企业比那些不采用这些行为规则的企业获益更大；随着时间的推移，采用这些行为规则的企业生存下来，而不采用这些行为规则的企业被淘汰。这样修改后的模型既有选择过程又有突变过程，便成为一个演化博弈模型。

总之，演化博弈模型有如下几个特征：第一，以参与人群体为研究对象，分析动态的演化过程，解释群体为何达到以及如何达到这一状态；第二，群体的演化既有选择过程也有突变过程；第三，经群体选择下来的行为具有一定的惯性。

应用优势

方法论

演化博弈论摒弃了完全理性的假设，以达尔文生物进化论和拉马克的遗传基因理论为思想基础，从系统论出发，把群体行为的调整过程看作为一个动态系统，在其中每个个体的行为及其与群体之间的关系得到了单独的刻画。

认识论

演化博弈论对于行为主体采取的是有限理性假设，因此，这些个体不具备博弈论中行为主体的“全知全能”，无法在经济活动中瞬间能够获得最优的结果。

时间的不可逆性

博弈论注重均衡状态的研究，忽视达到均衡的过程。在博弈论中，行为主体能够立即对外部环境作出完美判断，达到均衡状态。博弈论忽视时间问题，强调行为主体瞬问的均衡，即使考虑时间问题，也把时间看作对称或可逆的。

在演化博弈论中，时间占有非常重要的地位。行为主体在演化过程中不断修正和改进自己的行为，模仿成功的策略等等。

随机因素

在演化博弈模型中，随机（突变）因素起着关键的作用。

选择机制及均衡

传统的博弈理论中的行为主体是完全理性的，通常，在完全理性的假设下，如果纳什均衡存在，那么博弈双方博弈一次就可直接达到纳什均衡。这个结果不依赖于市场的初始状态，所以不需要任何的动态调整过程。

而演化博弈论认为，纳什均衡的达到应当是在多次博弈后才能达到的，需要有一个动态的调整过程，均衡的达到依赖于初始状态，是路径依赖的。

当博弈存在多个纳什均衡时，即使假设博弈方都是完全理性的，也无法预测博弈的结果是什么。当存在多个纳什均衡时，可以利用后向归纳法来实现对纳什均衡的精炼，但这种方法的前提条件是参与人需要满足一个比完全理性更强的理性假定——序贯理性。（序贯理性是在每个信息集上都必须采取最佳策略，以解决相机行为中的不可信威胁-----动态博弈）。

而在演化博弈理论中，均衡的精炼通过前向归纳法来实现，即参与人根据博弈的历史来选择其未来的行为策略，是一个动态的选择及调整过程。因此，尽管参与人都是有限理性的，但动态的选择机制将使得在有多个纳什均衡存在的情形下达到其中的某一个纳什均衡，实现纳什均衡的精练。

复制动力学是选择过程的显性模型，它说明种群是如何分配博弈中有联系的不同纯策略随时间而演化的。

复制动态方程——一种学习机制--------------------------------选自《博弈论与诚信机制》

博弈方学习模仿的速度取决于两个因素：

一是模仿对象的数量大小（可用相应类型博弈方的比例表示），这关系到观察和模仿的难易程度；

二是模仿对象的成功程度（可用模仿对象得益超过平均得益的幅度表示），这关系到判断差异的难易程度和对模仿激励的大小。

最常见的选择机制动态方程有三类：第一类为正支付动态方程，在这类动态方程中，所有获得的支付大于群体的平均支付的纯策略都有正增长率，所有获得的支付小于群体的平均支付的纯策略都有负增长率；第二类为单调动态方程，在这类动态方程中，若一个纯策略或混合策略获得的支付大于另一个纯策略所获得的支付，则前者的增长率大于后者；第三类为弱正支付动态方程，在这类动态方程中，至少有某些获得支付比群体的平均支付高的纯策略（若存在）有正的增长率。显然，弱正支付动态方程包含了正支付动态方程和单调动态方程。

在演化博弈理论中运用最为广泛的选择机制动态方程是泰勒和朱克（Taylor&Jonker，1978）提出的复制者动态方程。在复制者动态方程中，纯策略的增长率与相对支付或适应度（纯策略所获得的支付与群体的平均支付之差）成正比。显然，复制者动态方程包括在前三类选择机制动态方程中。复制者动态方程在经济领域的应用最为广泛，学者们运用复制者动态方程对社会习俗、制度、行为规范等一系列社会经济问题进行了成功的研究。

怎样把演化博弈论的基本概念——演化稳定策略与选择机制动态方程联系起来呢？是否通过选择机制所获得的均衡的精练就是演化稳定策略？从直观看来，演化稳定策略似乎可以保证均衡是稳定的。但正式的稳定性的定义针对的是动态系统，而不是博弈的支付或适应度函数，并且演化稳定策略只能描述系统的局部动态性质，它不能够表现均衡与动态的选择过程之间的关系。因此，演化稳定策略与选择机制动态方程所达到的动态均衡并不一定是同一个概念。因此，为了更好地描述动态的演化过程，把演化博弈理论中的静态概念与动态过程统一起来，荷什勒佛（Hirshleifer，1982）提出了演化均衡的概念。按照荷什勒佛的概念，若从使得动态系统的某平衡点的任意小邻域内出发的轨线最终都演化趋向于该平衡点，则称该平衡点是局部渐近稳定的，这样的动态稳定平衡点就是演化均衡（Evolutionary Equilibrium）。

演化稳定策略是纳什均衡的精炼。

演化均衡与演化稳定策略、纳什均衡之间的关系是怎样的呢？弗里德曼（Friedman，1998）指出：

（1）每一个纳什均衡都是动态系统的平衡点；

（2）演化均衡一定是纳什均衡；

（3）演化稳定策略不一定是演化均衡。

复制者动态方程可以保证演化稳定策略为演化均衡，但在一般的动态方程中演化稳定策略却既不是演化均衡的充分条件也不是演化均衡的必要条件。弗里德曼还认为，演化博弈论中最为有用、运用最为广泛的均衡概念并不是演化稳定策略，而是演化均衡。因为行为按照某种动态随时间变化的假设是合乎情理的。

理论评述

演化博弈论摒弃了完全理性的假设以达尔文生物进化论和拉马克的遗传基因理论为思想基础，从系统论出发，把群体行为的调整过程看作为一个动态系统，在其中每个个体的行为及其与群体之间的关系得到了单独的刻画，可以把从个人行为到群体行为的形成机制以及其中涉及到的各种因素都纳入到演化博弈模型中去，构成一个具微观基础的宏观模型，因此能够更真实地反映行为主体的多样性和复杂性，并且可以为宏观调控群体行为提供理论依据。

在演化博弈论中，行为主体被假设为程序化地采用某一既定行为，它对于经济规律或某种成功的行为规则、行为策略的认识是在演化的过程中得到不断的修正和改进的，成功的策略被模仿，进而产生出一些一般的“规则”和“制度”作为行为主体的行动标准。在这些一般的规则下，行为主体获得“满意”的收益。

行为主体在演化过程中不断修正和改进自己的行为，模成功的策略等等，都需要一个相对较长的时间。演化博弈论认为，时间是不可逆的，过去时间内的状态与未来时间的状态是不对称的，因而，行为主体状态的演化跟初始的时间状态息息相关。在演化博弈模型中，随机(突变)因素起着关键的作用，演化过程常被看成是一种试错的过程。行为人会尝试各种不同的行为策略，并且每一次都将发生部分替代。

演化博弈论的理论研究以及演化博弈论在经济学的应用研究，成为国外学术界最热门的研究领域之一。演化博牟论还是经济学尤其是博弈论中的一个新领域，可以预见，在未来相长的时期内，演化博弃沧仍将是经济研究中最具发展潜力的前沿领域之一。

参考

《百度文库》

《网络、群体与市场》