最优战略: 善意加模仿
来源:《太极进化主义》第6篇 | 作者:段勇 | 发布时间: 2021-10-14 | 284 次浏览 | 分享到:

  仁爱虽然有强大的力量,但不能完全代替其他手段,要控制他人的行为还需要暴力、交换、语言和规则,最优战略是这些手段的综合运用。综合运用的方法很复杂,但有一种综合运用很简单。动态博弈的计算机实验结果证明,善意加模仿是最优战略1979年美国政治学家罗伯特·阿克塞尔罗德设计了一个游戏锦标赛,最终获胜的程序“tit-for-tat”既简单又漂亮,它只是拷贝竞争对手的设计方案而已。

人们长期的生活实践也得出了同样的结果,所以人们会以直报怨,以德报德,同时以兼爱、仁义为作人的信条。当对方奉行模仿战略时,主体主动释放善意必然得到善意的回报。多数人都不会恩将仇报,所以多数情况下,主动释放善意都是最优战略,如果对方不友善,那么以直报怨会给他教训。这个结论是很多思想家的共同结论,但缺少一个严格的表述。

定理: 在动态博弈中,善意加模仿是最优战略。

很多动物之间有共生现象,共生动物之间有很多互利的行为,这些行为都是为了培育资源。培育资源是动物的本能,也是人的本能。人类在进化过程中,模仿的功能越来越强,成为人的最重要的功能之一。知恩图报和以牙还牙都是模仿,这两种行为是人类社会最常见的行为。见贤思齐是人的本能,因此榜样的力量是无穷的。他人对我的恩赐可能是为了他自己,但知恩图报是利人的行为。这个利人的行为又会引发他人的模仿,有可能形成正反馈。所以报恩可以培育资源。

在围棋中有一种走法叫模仿棋。黑棋第一步走天元(棋盘正中央),从第二步开始模仿白棋,总在与白棋对称的位置行棋。这样,黑子由于占有天元,会有极大胜算。

另一方面,我们必须注意,善意加模仿在理论上是最优战略,在实践中不一定是最优的。这有一个前提:完全信息,善意的质和量被双方完全了解,整个博弈过程中双方的行为都被双方和局外人完全了解。这个前提在实践中一般是不具备的,总有各种误会,而且每个人都会自觉不自觉地高估自己的善,低估自己的恶。模仿导致的正反馈使误会和报复恶性循环

那么什么才是生活中的最优战略呢?应该适度增加善意,适度以德报怨。那么增加多少才适度呢?很难确定,为了让大家充分认识你的善意,宁多勿少。这样是亏了,但比报复的正反馈带来的损失小得多,小不忍则乱大谋。而且在模仿开始后,每隔一段时间都应该主动表示善意,以避免进入恶意的正反馈。

二战前英法的绥靖政策遭到了普遍的批评。其实,正是这些绥靖政策让全世界人民彻底看清了法西斯的本质。于是全世界人民万众一心,士气高昂,与法西斯阵营进行了毫不妥协的斗争,取得了二战的彻底胜利。与此形成鲜明对照的是第一次世界大战,正义与邪恶的界线模糊,于是欧洲战场长期拉锯,形成绞肉机。而且战胜者没有彻底胜利,为二战埋下祸根。如果没有绥靖政策,德国被打败了,也不会彻底服输,这又会为第三次世界大战埋下祸根。所以二战的胜利不仅归功于罗斯福、斯大林和丘吉尔,也归功于A.N.张伯伦等贯彻绥靖政策的政治家

2012年开始,中日因钓鱼岛争端双边关系跌入冰点。双方不仅唇枪舌剑,而且展开军备竞赛,不断进行大规模军事演习,在钓鱼岛周围剑拔弩张,一触即发。两国民众怒目相对,中国人抵制日货,发动反日游行,并发生骚乱。日本民意则明显右转,多数人支持政府争夺钓鱼岛。一开始,中国并不占优势,后来习近平在坚持对抗政策的同时,多次释放善意,对日本的倒行逆施一忍再忍,终于赢得了主动2015年日本民众倒戈,反对安保法,要求安倍下台。如果没有习近平的一系列善意,日本民众不可能有这样大的转变。

  佛教和基督教都倡导以德报怨,禅师会把衣服送给小偷。圣经说,人家打你的左脸,就把右脸也给他。孔子并不提倡以德报怨,而是提倡以直报怨。那么孔子会怎么对待那个小偷呢?是不是应该抓住他,至少应该斥责他呢?不一定。如果孔子认为他是因为生活所迫才行窃,孔子可能会把衣服送给他,但是如果孔子知道此人作恶成性,就会斥责他了。禅师与孔子的区别在于,禅师送衣服是没有条件的,不管此人是否作恶成性,都会送给他衣服,禅师没有以直报怨的观念,佛教提倡无条件的忍让、怜悯和慈爱。以直报怨和以德报怨这两种态度哪种更好呢?应该说见仁见智。