Fudenberg和Maskin(1986)证明,只要一方相信另一方具有正概率的“非理性”的可能,且博弈期限足够长和参与人有足够的耐心,则任何结果都有可能作为不完全信息博弈的纳什均衡出现。多重均衡的存在性及其选择问题成为后来大多数博弈论专家进一步研究的课题,这种研究主要有两条思路,一是关于在实践中可能出现“非理性”类型的合理假设(Fudenberg and Levin, 1987);二是利用新古典的利润最大化假定来对手,但是无法知晓对手的一些确切参数,如边际成本等(Tirole, 1988)
4.3合作机制的演进 重复博弈的合作均衡形成为我们理解市场交易中信用机制的形成提供了理论基石,但是,上述的合作均衡主要是针对特定个体间的交互关系所达成的合作,对于整个社会中普遍信用机制和信用文化甚至信用偏好的形成或建立则必须将这一合作机制置于社会演进的框架内予以讨论。合作机制形成和演化的研究主要归功于演化理论(evolutionary theory)的成果,社会演化理论主要来源与生物演化论的思想,这一思想的精髓是,在所有面临竞争的环境下,只有那些能更多的获得资源的生物才能存活下来。生物为了能获取更多的资源会演发出一系列的机制,比如对自身功能的变异以求生存等。生物的演化过程中形成了许多类似于信用的机制有助于解释和理解人类社会信用与合作的形成与演化。
关于信用与合作机制演化具有启发性的研究主要来自于Alchian(1950), Hayek(1988),Axelrod(1980a, 1980b, 1984),Axelrod和Hamilton(1981),Nelson和Winter(1982),Nelson(1995),以及一些生物学领域的富有启发性的研究,如Smith(1974,1978)和Dawkins(1989)等。
Axelrod(1980a, 1980b,)对于合作机制演化的研究为连接博弈论关于个体间的合作机制向群体合作机制的过渡奠定了基石。在他的计算机程序模拟比赛中,合作者的胜利不仅证明了合作与信用在个体博弈中作为占优均衡出现的可能,而且还为这种均衡的演化过程提供了新的研究起点。Axelrod在比赛中还发现,凡是具有善良性(即从来不首先背叛)和宽容性(即在对方背叛以后仍具有合作的倾向)的程序都得分较高 。而“针锋相对”的则集中了善良和宽容的特征,而且思路非常清晰,从不首先背叛,然后采取与对方的上一次行为相同的行动。对此,Axelrod的解释是,针锋相对的善良性防止他陷入非合作的麻烦中,对对方背叛的报复则保证了对方背叛行为的谨慎性,宽容性则有助于在对方背叛后重新开始合作,而简单清晰的规则则易于被人理解,从而导出长期的合作(Axelrod,1984)。套用信用机制的语言,则Axelrod研究的意味着,信任别人,不首先欺骗别人,对别人的欺骗进行必要的处罚之后在宽容的原谅对方,并继续施信任于起身,这种信用关系对于主体的在长期的社会交互中的收益是最大的。
例如,最近的一项实验研究 也显示,大部分主体在开始都选择信任和互惠的行为,且在与新的主体博弈中,信任和和互惠都会重置于一个较高的水平(Engle-Warnick and Slonim, 2002)。该项研究并且发现,一些背叛的行为在短期内对于参与人的关系产生冲击,但长期来看,这种影响几乎可以忽略。这再一次证明,人类在与他人关系的行动选择重也显示出对信任与合作的偏好和对背叛的容忍。而Fehr和Schmidt(1999)则从重复博弈的稳定性角度研究了进化的合作与竞争过程中公平规则和观念的形成。
为什么没有理由采取其他的策略和获得成功呢?这个问题的回答实际上涉及到生物演化的理论。Smith(1974, 1978)提出了一个集体稳定策略(CSS, collective stable strategy) ,这个理论是说,假设存在一个全部采取某一个特定策略的群体和一个采用不同策略的变异个体。如果这个变异个体能得到比群个体中的个体更多的收益,则这个变异策略就能入侵这个群体。而如果一个群体的策略是不能被入侵的,则就是一个集体稳定的策略。信任与合作的战略只有在长期的交互关系中才成为集体稳定策略。如果一个社会形成了这样一种信用机制,则任何对信用的背叛的变异策略都时无法入侵,也就是说不可能扩散的。(Axelrod, 1984)。Axelrod在他的计算机竞赛中也发现,那些“自私”的程序起初表现都相当不错,而且他们相遇时也表现良好,但是经历了一段时间之后,就走向了自我毁灭的道路,从而摧毁了他赖以成功的基础。因此,在社会的演进过程中,信任与合作作为集体稳定的策略必然要灌输于整个群体内的某种载体和机制上,文化,组织,制度以及宗教,伦理道德等便是这种维护集体合作用的载体(Wilson,E.,1998) 。例如Wilson认为,两个囚徒实际上往往并不会招供,“因为他们事先已经约定好,一旦被捕就保持沉默。通过这样做,两人都希望获得较轻的惩罚或者一同逃脱惩罚。犯罪分子于是把这种计算原则演变为伦理约定:永远不能背叛对方;要做个好样的。这些盗贼之间并不存在荣誉。暴徒也是某种社会;它的准则就如同战争时期被捕的士兵那样,只能交待姓名、军衔和编号。”(Wilson,E.,1998)
但是,集体稳定策略的一个假定前提是已经存在一个采取某一特定策略的前提,它忽视了纳什均衡的多重性问题。对此的一个改进是Smith后来(1982)提出了“进化稳定策略(ESS, evolutionarily stable strategy)”,进化稳定策略的重要之处在于为描述不同群体间的共生关系提供了解释。因为社会并不是都受到一种策略的支配(生物界更加如此),而关键是在生存斗争中哪些生存下来,不断繁衍后代,而哪些会消失掉。例如,可以证明在Axelrod的计算机程序竞赛中,“总是不信任他人”在博弈中永远都是集体稳定策略。但是问题是在一个群体演化过程中,我们更关心的是这种类型个体的后代是增多了还是减少了。