导言
一、失火了,你往哪个门跑?
一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?
你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。你和这群人构成一个博弈(game)。
这就是博弈论(game theory)——对这一类多人互动决策进行研究的理论。
上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型,被学界称之为少数者博弈或少数派博弈(Minority Game)。当然,原来的博弈形式不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个模型。
生活中博弈的案例很多,你会见到很多例子。只要涉及到人群的互动(interaction),就有博弈。
什么叫博弈?博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game表示人们遵循一定规则下的活动,进行活动的目的是使自己“赢”。如:Olympic Games翻译成奥林匹克运动会而不是奥林匹克游戏大会。在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于game的理论,即game theory翻译成博弈论或者对策论,是恰当的。本书下面统称game theory为博弈论。
博弈论作为一门学科的出现有60多年的历史。博弈论的开创者为诺意曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》,该书的出版被公认为博弈论这门学科诞生的标志。诺意曼是著名的数学家,他同时对计算机的发明作出了巨大贡献,他去世时博弈论还未对经济学产生广泛影响,否则经济学的诺贝尔奖的获得者中必定有他的名字,因为诺贝尔奖有规定,只颁发给在世的学者。谈到博弈论,不能忽略博弈论天才纳什(John Nash)。纳什的开创性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951),给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。
博弈论对于社会科学有着重要的意义,它正成为社会科学研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是“关于社会的数学”。从理论上讲,博弈论是研究理性的行动者(agents)相互作用的形式理论,而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。诺贝尔经济学奖已两度授予博弈论专家:2005年颁发给罗伯特·奥曼(R.Aumann)、托马斯·谢林(T.Schelling),1994年颁发给纳什(J.Nash)、塞尔屯(R.Selten)、哈桑尼(J.Harsanyi)。而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1995年获得诺贝尔奖的理性主义学派的领袖卢卡斯(Lukas),其理论与博弈论都有着较深的联系。现在博弈论正渗透到各门社会科学,成为这些学科的通用工具,更重要的是它正深刻地改变着人们的思维。
二、博弈论能解释所有社会现象吗?
社会由不同的人群的集合体所构成。不同的人群集合体形成不同的结构,一个结构中的群体之间的相互作用(interaction)就构成一个博弈。这个博弈是广义上的。社会中有不同的文化,人类有文明、道德,如果说文明、文化、道德等是宏观的社会现象,那么还存在微观的社会现象,如:群体为什么有合作又有不合作?为什么人群之间或集团之间有“威胁”或“承诺”?这些都是博弈论研究的对象。本书下面将努力用博弈论的基本思想来解释社会中的这些现象。
博弈论对人的基本假定是:人是理性的(rational)。所谓理性的人是指行动者具有推理能力,在具体策略选择时其目的是使自己的利益最大化。博弈论研究的是理性的人之间如何进行策略选择的。
博弈论力图在这个最简单的假定下得到丰富的结论,正如我们下面所看到的,它确实做到了。博弈论专家的这种做法如同物理学家对自然的假定一样。大家知道,物理学家往往给出几个最基本的假设,这最基本的假设构成公设,其余的结论由它们推得,如爱因斯坦的狭义相对论只有两条公设:(1)物理定律在所有参考系中不变;(2)在所有参考系中光速保持常数。多么简单的公设!在这两个公设下得出了惊奇的结论,如运动的参照系中尺子收缩,
时钟变慢,等等。相对论的这两条公设改变了物理学的整个构架,也改变了人们对自然的整
个看法!博弈论当然不是关于自然的,它是关于社会的,它不能构成人们对自然看法的革命。博弈论的假定是非常简单的,它能得出令人惊奇的结论吗?它能改变人们关于社会的看法吗?——这些是伟大科学的要求!我们将发现,博弈论确实如此!
本书力图用“科学的”方法来解读社会现象。经济学是对社会现象进行研究的科学,社会学、政治学等等也都是社会科学。然而今天经济学已成了帝国主义,它的领域没有疆界。不仅仅经济行为是它的研究领域,它的研究范围是“经济的”行为,在经济学家看来人类的几乎所有的行为都是“经济的”,即在经济学家看来,其他社会科学无存在的必要。这里我们看到“经济的”等同于“理性的”。由此可见,研究互动中的理性人行为的博弈论在经济学家看来可解释几乎一切社会现象。
本书的写作方式是科普式的(popular science)。本书没有对博弈论作系统的论述,提到的理论有时缺少来龙去脉的交代。若读者对所涉及的理论感兴趣,请查找有关的书籍或资料。
这里讲一个小小的插曲。在与朋友聊博弈论时,他随意说了一句话给我启发很深。他说,中国人研究其他学问难说,但研究博弈论是有优势的。这句话是褒义,也是贬义。说它是褒义,是因为中国古代有很多这方面的著述与实践,春秋战国时期诸侯争雄,其实是谋士之间的谋略较量,而罗贯中的《三国演义》在今天看来就是一部博弈论教材!无论是兵书如《孙子兵法》、《三十六计》,还是现代流行的所谓“商战策略”、“公共关系”以及所谓“厚黑学”,都是关于如何赢得与人交往的胜利的,或者说关于在与他人的竞争或合作中如何获取成功的。说它是贬义,是因为,中国人走关系、相互算计是出了名的,中国人对博弈论有突然的悟性。我们常说的“世事洞明皆学问,人情练达即文章”:人与人之间的关系、社会交往均是学问,是实用的博弈学问。而中国很多“做人”的道理,道出了如何在人与人的博弈中获取成功,如:在任何场合下都不要得罪人,不要锋芒毕露(如“枪打出头鸟”),等等。不过,在中国文化传统中,人与人之间的所谓关系之学并不像西方那样是科学,而更像一门艺术。
本书下面将尝试着用博弈论解读人类的社会行动或集体行动——这里的社会行动或集体行动意指互动的人群集合体。读者将发现,原本复杂的人类社会的行动是容易得到理解的,并且会发现其中蕴藏着的一些道理。本书是解释社会现象的,其中的方法、理论与事例许多是经济学中的,然而本书不完全是经济学的。如果是经济学的,必须用完善的经济学理论来阐述和分析确定的研究对象,必须讲“供给”、“需求”、“价格”、“效用”、“边际”等概念及相应的原理,否则是对读者是不负责的。本书所做的是,力图用科学的方法对各种社会现象作出解释。当然经济学也是科学的,但是经济学已经形成固定的研究程式。我们这里只是告诉读者许多现象背后的东西。本书有些地方是哲学的,有的地方是逻辑的。我想说的是,我们所看到的社会现象其背后有着深刻的科学道理——本人认为这些现象的背后是理性和逻辑。如果本书能给读者带来一些启发,本人就满意了。
第一章 博弈论基础知识
一、基本术语
前面已经指出,博弈论研究的对象是理性的行动者或参与人面对他人,如何选择策略或如何作出行动的决定的。理性的人是对现实的人的抽象,理性的人是指能够进行推理的人,而博弈中的理性的人是指能够运用推理能力使自己的目标最大化的人。“理性的”与“道德的”不是一回事,理性的与道德的有时会发生冲突,但是理性的人不一定是不道德的。我们在后面的章节中将阐述理性的人怎么会产生道德的行为。
博弈涉及哪些内容呢?
第一, 一个博弈涉及至少两个独立的博弈参与人(player)。
一个博弈是一个活动,该活动至少有两个参与人,下文有时将参与人称为行动者。每个参与人通过行动,努力使自己的效用或利益最大化。但是,他的行动的好处或支付取决于另外的参与人。
“囚徒博弈”或“囚徒困境”是一个被广泛谈及和研究的博弈。两个共同作案偷窃的小偷被警察抓住,被带进警察局单独关押。他们面临的“政策”是“坦白从宽,抗拒从严”,具体的政策是:如果一方与警方合作,招认并供出自己与对方以前所做违法之事,而对方不招认,招认方无罪释放,不招认的另一方则会被判重刑10年;如果双方都与警方合作共同招认,各被判刑5年;而如果双方均不承认有罪,因警察找不到他们以前违法的证据,只能对他们的小偷行为进行惩戒,各被判刑3个月。这两个小偷如何作出选择?
在这个囚徒困境中,参与人为两个小偷。每个小偷的最后结果——是当场释放还是被判刑(10年、5年、3个月),不仅取决于他自己的决定,而且还取决于另外一个小偷的决定。
买卖活动是日常生活中的常见现象。我们知道,在买卖的交换行为中,买东西的人要尽量以低的价格买到,但是他是否能买到取决于卖者是否能卖;卖东西的人想以尽量高的价格将东西卖出去,但价格太高,买者不接受,因此卖东西的人能否将物品卖出去取决于买者。
囚徒困境是一个博弈,买卖的交易活动也是博弈。我们可看到,在任何一个博弈之中,至少存在两个理性的参与人,他们的利益是相关的,即他们每个人的利益受其他人的行动影响。
第二, 博弈中行动者或参与人存在策略(strategy)选择的可能。
博弈论用策略空间来表示参与人可以选择的策略集。
赤壁一战,曹兵大败,曹操落荒而逃,在选择是走通往华容道的小路,还是选择大路时,曹操需要在两个策略之间进行选择:“走大路”还是“走小路”。曹操最终选择“走小路”。囚徒困境中的小偷面临着“不招认”还是“招认”的选择。
不同策略下的后果往往是有差异的,否则便不存在选择的必要。对每个参与人而言,如果没有不同选择的可能,理性的计算便是多余的,对自己的目标也就无能为力。从这个意义上来讲,我国改革开放走向市场经济,就是使得每个经济主体有选择的可能,这样人们才能发挥其理性的作用,使每个人的经济状况更好,而在计划经济下因没有可选择的余地,每个人的理性计算能力便无从施展。
第三,参与人在不同策略组合下会得到一定的支付(payoff)。
我们往往用支付矩阵来表示参与人在各种策略组合下的支付。[1]这个方法简单,比用函数来表示直观、易于理解,当然它的缺陷是,它只能表示两个人的博弈结构。囚徒困境的支付矩阵为:
甲
乙 |
不招认 |
招认 |
不招认 |
各被判刑3个月 |
甲:当场释放
乙:被判刑10年, |
招认 |
甲:被判刑10年
乙:当场释放 |
各被判刑5年 |
这个矩阵表示的是:若甲选择“招认”、乙选择“招认”,甲乙各被判刑5年;若甲选择“招认”、乙选择“不招认”,甲被当场释放,乙被判刑10年;若甲选择“不招认”、乙选择“招认”,甲被判刑10年,乙被当场释放;若甲选择“不招认”、乙选择“不招认”,甲乙均被判刑3个月。
我们再来刻画一交易过程的支付矩阵。在卖主甲和买主乙之间的“买—卖”博弈中——这是一讨价还价过程,通过讨价还价后一个价格被确定。在此价格下我们假定,卖者卖成后获得的效用为6,卖不成的效用为0;买者买成的效用为4,买不成的效用为0。而如果他们之间的交易不成功,无论是买主还是卖主都要等待并再次进行讨价还价,这需要成本。假定等待和讨价还价的成本均为1,则支付矩阵为:
乙
甲 |
买成 |
买不成 |
卖成 |
6,4 |
5,0 |
卖不成 |
0,3 |
0,0 |
这两个矩阵表明,在每个策略组合下参与人有一个收益值或支付值。
第四,对于博弈参与人来说,存在一个博弈结果。
所谓博弈结果是指,一个博弈中参与人最终对策略的选择而产生的确定性的支付。如在曹操败走华容道的博弈中,诸葛亮在“埋伏大路”与“埋伏通往华容道的小路”之间进行选择,而曹操需要在“走大路”与“走(通往华容道的)小路”之间进行选择。在这个博弈中,双方猜测对方的行为,看谁猜测得准。博弈的最终结果是,诸葛亮派关羽埋伏在通往华容道的小路,而曹操正好选择了走这条小路,曹操被诸葛亮抓住。这就是曹操与诸葛亮之间的博弈的结果。
第五,博弈涉及均衡。
均衡是经济学中的重要概念。什么是均衡?它的含义是什么?
均衡即是平衡的意思,在英文中是equilibrium。在经济学中,均衡意即相关量处于稳定值。在商品的供求关系中,在某一商品市场的某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能将商品卖出去,此时我们就说,该商品的供求达到了均衡,此时的价格可称之为均衡价格、产量可称之为均衡产量。均衡分析是经济学中的重要分析。
那么什么是博弈均衡呢?博弈均衡是一个稳定的博弈结果。均衡是博弈的一种结果,但不是说博弈的结果都能成为均衡。博弈的均衡是稳定的,在某种情况下是可以预测的。
纳什均衡是一种最常见的均衡。它的含义是:在对方策略确定的情况下,每个参与人的策略是最好的,此时没有人愿意先改变或主动改变自己的策略。
在上面的“买—卖”的博弈中,(卖成,买成)是一个纳什均衡,这个博弈可以解释为什么在现实中讨价还价后买卖能做成,因为这对双方来说都是最优选择。同时在“买—卖”博弈中,其均衡对双方来说是全局最优的。
第六,重要的均衡——纳什均衡
纳什均衡(Nash Equilibrium)是博弈分析中的重要概念。1950年身为研究生的纳什写了一篇论文——《n人博弈的均衡问题》,该文只有短短一页纸,可就是这短短一页纸成了博弈论的经典文献。在这篇论文中,纳什给出了博弈均衡的定义,这样的均衡被人们称之为纳什均衡。[2]
纳什均衡是博弈的“解”。我们明白数学方程的“解”的意思——某个或某些变量取某个或某组值为方程的解是指它或它们使方程两边相等;对于不同种类的方程,我们有不同的求解方法;我们也明白什么是一个定理“证明”,即,从某些公理或定理演绎地得到某个命题的过程。但对于一个博弈,我们如何下手研究呢?通过研究我们希望达到什么目的呢?
在科学上了许多伟大人物的贡献不在于解决什么重大问题,而在于他们提出了某些重要概念,这些概念为该学科的其他人所采用。纳什均衡便是博弈论中这样的概念。
那么什么是纳什均衡呢?简单说就是,在博弈的每个参与人选择一个策略而形成的一策略组合中,每个参与人面临这样的一种情况:当其他人不改变策略时,他此时的策略是最好的。也就是说,此时对每个人而言,在其他人不改变策略的情况下,若他改变策略,他的支付不会提高。在均衡点上,每一个理性的参与人都不会有单独改变策略的冲动。纳什均衡是一个稳定的点。
在囚徒困境中存在惟一的纳什均衡,该均衡为两个囚犯均选择“招认”。这是一稳定的结果。
有些博弈的纳什均衡点不止一个。如下述“夫妻博弈”(或称性别之战)中有两个明显的纳什均衡点。丈夫帕特和妻子克里斯商量晚上的活动。丈夫喜欢看拳击,而妻子喜欢欣赏歌剧。但两人都希望在一起度过夜晚,双方的支付矩阵如下:
丈夫
妻子 |
歌剧 |
拳击 |
歌剧 |
2,1 |
0,0 |
拳击 |
0,0 |
1,2 |
在这个“夫妻博弈”中有两个纳什均衡点:(歌剧,歌剧),(拳击,拳击)。读者可试着检验这两点是否符合纳什均衡的定义。
在任何一个博弈中,在有两个或两个以上纳什均衡点的博弈中,其最后的博弈结果我们难以事先预测。在“夫妻博弈”中,我们无法知道,最后结果是一同欣赏歌剧还是一起去看拳击。也许因双方都知道的性格,比如妻子扭不过有大男子主义的丈夫,每次这样的博弈其结果都是一起去看拳击;也许因夫妻长期博弈而形成的“习惯”,如“妻管严”,每次这样的博弈其结果都是一起看歌剧。
是不是所有的博弈存在至少一个纳什均衡点呢?是的。但纳什均衡点不一定是那种纯策略纳什均衡点——所谓纯策略是指参与人在他的策略空间中选取惟一确定的策略,而可能是一个混合策略(mixed strategy)均衡点——所谓混合策略是指参与人采取的不是惟一的策略,而是其策略空间上的一种概率分布。这就是纳什于1950年证明了的纳什定理。我们下面将在“警察与小偷的故事”例子中给出混合策略的说明。
在有些博弈中,纳什均衡有无穷多个。举一个例子:两人分100元钱,若两人为自己提出的钱数之和不超过100元,即小于或等于100元,则按照所提出的方案来分配,若提出的钱数总和超过100元则两人均无所得。此时的纳什均衡是:两人为自己提出的分配所得之和为100元。如:(20,80)是一个纳什均衡;(30,70)也是一个纳什均衡……这样的均衡有无穷多。之所以“两人提出的分配之和为100”构成纳什均衡,是因为一旦两人提出的方案满足这个条件(总和为100元),每个人不会单独改变方案——若某个人改变方案,他的收益会降低。其他分配方案不能是纳什均衡,因为:若分配方案之和小于100元或大于100元,两人都有单独改变方案的动机。因此,也可以说,“两人提出的分配之和为100元”构成该博弈的纳什均衡的充分必要条件。
对于纳什均衡,博弈论给出这样的结论:一个博弈若只有一个纳什均衡,那么该纳什均衡点构成该博弈的结果,若博弈是完全信息博弈,该博弈的纳什均衡能够在一次博弈中实现。这个均衡结果因而是可预测的。若不是完全信息博弈,该博弈均衡可能在参与人不断地学习中达到。这是重要的结论。当然,若博弈不止一个纳什均衡,我们无法事先预测该博弈结果,除非给出其他条件。
无论一个博弈有多少个纳什均衡,某个纳什均衡一旦达到,博弈将稳定在这个均衡之上,任何一个参与人都没有单独改变策略的动机。这是纳什均衡重要的特点。
我国研究纳什均衡的专家谢识予博士在《纳什均衡论》中用通俗的话表达了纳什均衡含义:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你最好的策略。这就是说,双方在对方的策略下自己现有的策略是最好的策略。即:此时双方在对方给定的策略下不愿意调整自己的策略。这里的策略包括混合策略。
纳什均衡是博弈论中的重要概念,同时也是经济学的重要概念。诺贝尔经济学奖获得者萨缪尔森有一句幽默的话:你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词:供给与需求。博弈论专家坎多瑞(Kandori)引申说:要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是“纳什均衡”。由此可见纳什均衡在现代经济学中的重要性。纳什均衡不仅对经济学意义重大,对其他社会科学意义同样重大。我在书后的附录中用数学语言给出了纳什均衡概念及纳什均衡存在定理。
纳什均衡被人们平凡使用,以至于普林斯顿的迪克西特(A.K.Dixit)教授在一次演讲中这样说:“假如每人写到或说到‘纳什均衡’,纳什就能得到1美元,那么纳什早就变成大富翁了”。
二、博弈的类型
根据参与人能否形成约束性的协议、以便集体行动,博弈可分合作性博弈和非合作性博弈。纳什等博弈论专家研究得更多的是非合作性博弈。
所谓合作性博弈是指参与人从自己的利益出发与其他参与人谈判达成协议或形成联盟,其结果对联盟形成方均有利;而非合作性博弈是指参与人在行动选择时无法或没有达成约束性的协议。企业的形成、政治联盟的构建等都是合作性的博弈,而囚徒困境以及本书后面所讨论的公共资源悲剧都是非合作性的博弈。
博弈又分静态博弈和动态博弈。静态博弈指参与人同时采取行动,或者尽管参与人行动的采取有先后顺序,但后行动的人在行动时不知道先采取行动的人采取的是什么行动。动态博弈指参与人的行动有先后顺序,并且后采取行动的人在行动决策时可以观察到先采取行动的人所采取的行动。
从知识的拥有程度来看,博弈分为完全信息博弈和不完全信息博弈。信息是博弈分析所要涉及到的重要的内容。完全信息博弈指参与人对所有参与人的策略空间及策略组合下的支付有“完全的了解”,否则是不完全信息博弈。严格地讲,完全信息博弈是指这样的博弈,参与人的策略空间及策略组合下的支付是博弈中所有参与人的“公共知识”,否则是不完全信息博弈。
这只是对博弈论的简单介绍。关于其中的详细内容,读者应参阅有关书籍。
三、博弈案例
1.囚徒困境博弈与我国应试教育的困境
囚徒困境可以用来说明许多现象。我国目前的应试教育就是一个囚徒困境。
囚徒博弈是完全信息下的静态博弈,两个小偷各种策略组合下的支付是他们之间的“公共知识”(“公共知识”将在下一章中专门讨论)。
我们上面已经分析了囚徒对局下各个策略下的结果或支付,以及它的均衡。它的均衡是双方均选择“招认”的策略。
可以这么说,最近10多年来,我国基础教育的问题是如何摆脱应试教育的困境问题。目前给中小学生“减负”不仅是学生家长的呼声,也是教育专家和教育管理部门的呼声,也可以说是全社会的呼声。教育管理部门这几年做了一系列的工作,但收效甚微,并没有从根本上解决问题。学校不断给学生增加负担是目前教育的实际状况。
大家普遍认为应试教育扼杀学生的创造性,无论是专家还是家长,都在呼吁改变应试教育的模式。但是无论是专家,还是意识到教育问题的普通老百姓以及没有意识到教育问题的老百姓,其小孩都在接受着这种教育。
在现有的教育体制下,学生(或学生家长)有两个可选择的策略:“减负”和“增负”。学生的精力是有限的,如果选择“减负”策略,意味着学生有更多的时间学习课本以外的东西,这样学生的素质得到提高,因此,“减负”策略往往与素质教育联系在一起;而如果选择“增负”策略,则意味着学生花大量的时间做大量的习题,以“学透”、“学精”课本规定的东西,学生没有时间学习课本以外的没有规定的内容。“减负”的结果是学生的全面发展;而“增负”的结果是学生获得更高的分数。
在这样的博弈结构下,学生(或学生家长)如何选择呢?每个学生这样想:其他人采取的是“增负”教育策略的情况下,如果我采取“减负”教育策略,我的考试分数不如他人,在求学方面我会落后,接受不了好的教育,在未来求职时我也赶不上他人。在他人采取“增负”的策略下,我也应当采取“增负”策略。
如果其他人采取的是“减负”策略,我应当采取什么策略呢?还是应当采取“增负”策略!因为,如果其他人采取的是“减负”策略的话,如果我采取的是“增负”策略,我的考试分数会比其他人高,我会上好的学校,在未来的职业竞争中我会处于优势。
因此,无论其他人采取的是什么策略,我采取“增负”策略都是最好的。当每个学生都这样想的时候,全社会便进入了应试教育这样一个囚徒困境之中。
如果我国现有的考试制度没有改变,现在假设所有的学生都选择“减负”策略,即除了做少量的巩固性的作业外,不补课、不做其他的练习题,情况会是什么样子?
假设这种状态会出现,我们说,这种状态会很快消失,而立即会出现所有学生都进入“增负”的这样一个状态之中。可以说,均选择“减负”策略的状态是不稳定的,而“增负”的状态是稳定的均衡即纳什均衡。原因就是,目前的教育的博弈结构规定了各种行动或行为的收益或好处:获得高分的会进入好的初中、高中,进入好的初中、高中的学生可以考高分进入好的大学。在这个博弈中,对于教师来说,学生的升学率高意味着其成绩大、奖金高,对自己的学生采取“增负”策略,对于自己而言是占优策略。
我国基础教育的博弈与囚徒困境有共同的结构,大家均选择“增负”策略构成基础教育博弈的纳什均衡。这是一个稳定的博弈结果。这也是为什么我国目前的应试教育难以改变的原因。
2.斗鸡博弈与古巴的导弹危机
试想有两只公鸡遇到一起,每只公鸡有两个行动选择:一是退下来,一是进攻。如果一方退下来,而对方没有退下来,对方获得胜利,这只公鸡则很丢面子;如果对方也退下来,双方则打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两只公鸡都前进,那么则两败俱伤。因此,对每只公鸡来说,最好的结果是,对方退下来,而自己不退。支付矩阵如下:
鸡乙
鸡甲 |
前进 |
后退 |
前进 |
-2,-2 |
1,-1 |
后退 |
-1,1 |
-1,-1 |
上表中的数字的意思是:两者如果均选择“前进”,结果是两败俱伤,两者均获得-2的支付;如果一方“前进”,另外一方“后退”,“前进”的公鸡获得1的支付,即赢得了面子,而后退的公鸡获得-1的支付,即输掉了面子,但没有两者均“前进”受到的损失大;两者均“后退”,两者均输掉了面子,获得-1的支付。当然表中的数字只具有相对的意义。
这个博弈有两个纳什均衡:一方前进,另一方后退。但关键是谁进谁退?一个博弈,如果有惟一的纳什均衡点,那么这个博弈是可预测的,即这个纳什均衡点就是博弈参与人事先知道的惟一的博弈结果。但是如果一博弈有两个或两个以上的纳什均衡点,则任何人无法预测博弈的结果是什么。因此,我们无法预测斗鸡博弈的结果,即我们不能预先知道谁“前进”谁“后退”。
用这个博弈模型来解释20世纪60年代初发生在美苏两个超级大国之间的一场导弹危机,是最合适不过的了。
二战结束后,形成了对峙的两个超级大国,美国和苏联。这两个超级大国是两个核心,在其周围有各自的盟友,它们一起组成了两大敌对的阵营。1962年赫鲁晓夫偷偷地将导弹运送到加勒比海上的岛国古巴,卡斯特罗政权是苏联这个超级大国的盟友,是美国的敌人。苏联的目的是将导弹部署在美国的眼皮底下,以对付美国。然而苏联的行动被美国的U-2飞机侦察到了,美国发现古巴建立了导弹发射场。此事震动美国,肯尼迪总统指责苏联,并发出严重警告,而苏联方面矢口否认。美国决定对古巴进行军事封锁,派遣了舰艇、空军及航空母舰,并集结了登陆部队。美国进入戒备状态,美苏之间的战争一触即发。
面对美国的反应,苏联面临着是将导弹撤回国还是坚持部署在古巴的选择;而对于美国,则面临着是挑起战争还是容忍苏联的挑衅行为的选择。也就是说,这两只“大公鸡”均在考虑采取进的策略还是退的策略。战争的结果当然是两败俱伤,而任何一方退下来(而对方不退)则是不光彩的事。结果是苏联将导弹从古巴撤了下来,做了丢面子的“撤退的鸡”。美国坚持了自己的策略,做了“前进的鸡”。当然,为了给苏联一点面子,同时也担心苏联坚持不退而发生美苏战争——这是美国不愿意看到的,美国象征性地从土耳其撤离了一些导弹。古巴导弹危机是冷战期间美苏两霸之间发生的最严重的一次危机。这就是美国与苏联在古巴导弹上的博弈结果。对于苏联来说,退下来的结果是丢了面子,但总比战争要好;对美国而言,既保全了面子,又没有发生战争。这就是这两只“大公鸡”博弈的最终结果。
3.骑虎难下博弈与美苏武器竞赛
我们经常碰到的一类博弈是,行动者进也不是,退也不是。笔者将这样的博弈称为骑虎难下博弈。
有一个拍卖,其规则是:两个参与人轮流出价,谁出得最高,谁就将得到该物品,但是出价少的人不仅得不到该物品,并且要按他所叫的价付给拍卖方。
假定有两人竞价争夺价值100元的物品,只要双方开始叫价,在这个博弈中双方就进入了骑虎难下的状态。因为,每个人都这样想,如果我退出,我将失去我出的钱,若不退出,我将有可能得到这价值100元的物品,但是,随着出价的增加,他可能的损失也越大。每个人面临着两难:是继续叫价还是退出?
这个博弈为耶鲁大学的舒比克教授构造出来的。
你会说,这个拍卖的规则不合理,纯粹是博弈论专家的构想,在实际中这样的拍卖不会出现。然而,它尽管只是一个模型,在实际中我们经常会看到此模型的博弈案例。[3]
在冷战期间,美苏为争夺霸权拼命发展武器,无论是原子弹、氢弹等核武器的研制,还是如隐形战斗机这样的常规武器的研制,双方均不甘落后。20世纪80年代,里根在位时准备启动“星球大战”计划,此举意味着两个超级大国的武器竞赛将进一步升级。美苏之间的武器竞赛就相当于这个骑虎难下博弈中双方轮番出价,双方均不断出更高的价,如果一方没有出最高的价钱,退了下来,即没有继续竞赛下去,那么意味着它在军备上的前期投入没有效果,打了水漂,而对方将赢得整个局面。但如果继续竞赛下去,一旦支撑不住,损失也就更大。
1991年苏联的垮台在一定程度上是军备竞赛的结果。苏联将整个力量放在军备竞赛上,而民用建设无法跟上,国力不济,最终退下阵来。里根的“星球大战”计划其目的就是要拖垮苏联。一旦进入骑虎难下的博弈,及早退出是明智之举,然而当局者往往做不到,这就是所谓当局者迷。这种骑虎难下的博弈经常出现在国家之间,也出现在企业或组织之间,当然个人之间也经常碰到。20世纪60年代,美国介入越南就是一个骑虎难下博弈。赌红了眼的赌徒输了钱还要继续赌下去以希望返本,也是骑虎难下博弈,其实,赌徒进入赌场开始赌博时,他已经进入了骑虎难下的状态,因为,赌场从概率上讲必定赢。[4]
博弈论专家将这里的骑虎难下博弈称为协和谬误。20世纪60年代,英国和法国政府联合投资开发大型超音速客机,即协和飞机。该种飞机机身大、设计豪华并且速度快。但是,英法政府发现:若继续投资开发这样的机型,花费会急剧增加,并且还不清楚这样的设计定位能否适应市场;而若停止研制,以前的投资将付诸东流。随着研制工作的深入,他们更是无法作出停止研制工作的决定。协和飞机最终研制成功,但因飞机的缺陷(如耗油大、噪音大、污染严重等等),它不适合市场,最终被市场淘汰,英法政府为此蒙受很大的损失。在这个研制过程中,如果英法政府能及早放弃飞机的开发工作,会使损失减少,但他们没能做到。
4.警察与小偷的故事——混合策略问题
纳什在《n人博弈的均衡点》这篇论文中,给出了均衡存在的简单证明,纳什说,在n个人的博弈中至少存在一个均衡,在这点上双方均不愿意先改变策略。这里的均衡点有可能是混合策略点。人们称它为纳什定理。
什么是混合策略?
我们来看一个混合策略的例子。警察部门负责一城市中某一区的治安。警察要对该区的A、B两地进行巡逻。假定该区有一群小偷,要实施偷盗。警察要防止这些小偷的偷盗,但因为设备有限,只有一部警车,警察只能一次在一个地方巡逻。而对于小偷而言,他们也只能去一个地方。假定A地需要保护的财产价值为2万元,B地的财产价值为1万元。若警察在某地进行巡逻,而小偷也选择了去该地,因警察在场,小偷无法偷盗该地的财物;若警察没有去某地巡逻而小偷选择了去该地,则小偷偷盗成功。警察怎么巡逻才能使效果最好?
一个明显的做法是,警察对A地进行巡逻,小偷去B地,这样,警察可以保住2万元的财产不被偷窃,而小偷的稳定收益为1万元。但是这种做法是警察的最好做法吗?警察有没有比这种策略更好的策略?
我们可以将警察与小偷之间的这个支付写成如下的支付矩阵。警察巡逻某地,偷盗者在该地无法实施偷盗,假定此时小偷的得益为0(没有收益),此时警察的得益为3(保住3万元)。
这个博弈也是常和博弈,它没有纯策略纳什均衡点,而有混合策略均衡点。这个混合策略均衡点下的策略选择是每个参与人的最优(混合)策略选择。
小偷
警察 |
袭击A地 |
袭击B地 |
巡逻A地 |
3,0 |
2,1 |
巡逻B地 |
1,2 |
3,0 |
对于这个例子,警察的一个更好的策略是,警察用掷骰子的方法决定去A地还是B地。假定警察规定掷到1—4点去A地,掷到5、6两点去B地,这样警察有2/3的机会去A地进行巡逻,1/3的机会去B地。
而小偷的最优选择是:以同样掷骰子的办法决定去A地还是去B地偷盗,如掷到1—4点去B地,掷到5、6两点去A地,那么,小偷有1/3的机会去A地,2/3的机会去B地。
此时警察与小偷所采取的便是混合策略。
假如按这种策略,我们看一下双方的收益。警察的期望得益是:7/3万大于2。警察按此办法比只巡逻A地的收益更高。
一旦警察采取混合策略,小偷也采取混合策略,其最优混合策略下的收益为2/3万元。小偷的收益比警察只巡逻A地的收益要低。
因为:当警察去A地巡逻时,小偷有1/3的机会去A地,2/3的机会去B地,此时警察去A地的得益为: 万元;当警察去B地时,同样,小偷有1/3的机会去A地,2/3的机会去B地,此时警察A地的得益为: 万元。
警察总的得益为: 万元。
同理,我们可得小偷的总的得益为2/3万元。
这里我们“让”警察和小偷掷骰子以确定去A地还是去B地,目的是要去A地和去B地之间确定一个概率分布,他们当然可用其他方式来确定这个概率分布。
宰割博弈中警察与小偷所用的混合策略,如同小孩子之间玩“剪刀—石头—布”的游戏时所用的策略。在“剪刀—石头—布”这样的游戏中,不存在纯策略均衡,对每个小孩来说,自己采取出“剪刀”、“布”还是“石头”的策略应当是随机的,不能让对方知道自己的策略,哪怕是倾向性的策略。如果对方知道你出其中一个策略的可能性大,那么你在游戏中输的可能性就大。因此,每个小孩的最优混合策略是采取每个策略的可能性是1/3。在这样的博弈中,每个小孩各取三个策略的1/3是纳什均衡。
由此可见:纯策略是参与人一次性选取的,并且坚持他选取的策略;而混合策略是参与人在各种备选策略中采取随机选取的。在博弈中,参与人可以改变他的策略,而使得他的策略选取满足一定的概率分布。
若博弈是零和博弈,即若博弈参与人为两人,一方所得是另外一方的所失,或者若博弈是常和博弈,即若博弈参与人为两人,一方所得的增加等于另外一方的损失,此时,对于任何一个参与人而言,都不可能有纯策略的占优策略。博弈参与人采取混合策略是合适的,均衡为混合策略均衡。如在当前的“反恐”博弈中,由于力量的有限,反恐方往往“更多地”将力量放在重点区域,如人口密集的大城市,“一定程度地”关注不太危险的区域,如人口稀疏的农村。这就是混合策略。而恐怖分子同样在玩混合策略:对攻击对象的选择是随机的,对攻击方式的选择也是随机的。
在竞争性的博弈中,该采取混合策略而不采取混合策略将会带来失败。田忌赛马是人人熟悉的故事。齐王与田忌赛马,但齐王的马平均来说要比田忌的马要跑得快,但田忌采纳了孙膑的策略,田忌用下等马对齐王的上等马,上等马对齐王的中等马,中等马对齐王的下等马。田忌以三比二获胜,赢了齐王。赛马是零和博弈,齐王的失败在于他使用了纯策略;若齐王使用混合策略,即每次比赛用马采取随机策略,不让田忌预先知晓,那么田忌获胜的机会必定大大小于齐王获胜的机会,齐王不会发生必输的结局。因此,齐王的错误在于没有使用混合策略。
应当说明的是,田忌赛马是著名的中国古代博弈故事。但其田忌获胜的博弈结果则不是博弈论所能够给出的。博弈论假定了每个参与人都是绝顶聪明的(理性的),博弈论给出的是,田忌和齐王都应采取混合策略,此时有一个混合策略均衡。田忌赛马从反面印证了纳什均衡的含义:若某个参与人主动改变均衡策略,他的收益会降低。这里,主动改变均衡策略而收益降低的参与人是齐王。
5.《三国演义》中的空城计与信息不对称的博弈
如果我们用博弈论的眼光看《三国演义》,三国演义完全是一部记载着许多博弈案例的著作。当然,罗贯中不可能用“博弈”一词。如果我们用一词来概括《三国演义》,这个词就是“计”。计,即计策或策略也。用计,即用策略赢对方。用计算敌,不仅要自己选择恰当的计策,而且要算准对方要用的计策,这不就是博弈?现在让我们看《三国演义》中著名的空城计博弈。
诸葛亮误用马谡,致使街亭失守。司马懿引大军十五万蜂拥而来。当时孔明身边别无大将,只有一班文官,五千军士,已分一半先运粮草去了,只剩二千五百军士在城中。众官听得这个消息,尽皆失色。孔明登城望之,果然尘土冲天,魏兵分两路杀来。孔明传令众将旌旗尽皆藏匿,诸军各收城铺。打开城门,每一门用二十军士,扮作百姓,洒扫街道。而孔明乃披鹤氅,戴纶巾,引二小童携琴一张,于城上敌楼前凭栏而坐,焚香操琴。司马懿自飞马上远远望之,见诸葛亮焚香操琴,笑容可掬。司马懿顿然怀疑其中有诈,立即叫后军作前军,前军作后军,急速退去。司马懿之子司马昭问:“莫非诸葛亮无军,故作此态,父亲何故便退兵?”司马懿说:“亮平生谨慎,不曾弄险。今大开城门,必有埋伏。我兵若进,中其计也。”孔明见魏军退去,抚掌而笑,众官无不骇然。诸葛亮说,司马懿“料吾生平谨慎,必不弄险;见如此模样,疑有伏兵,所以退去。吾非行险,盖因不得已而用之”,我兵只有二千五百,若弃城而去,必为之所擒。
这就是为后人广为传颂的空城计。这是一个信息不对称的博弈。
这里,司马懿不知道自己和对方在不同行动策略下的支付,而诸葛亮是知道的,他们对博弈结构的了解是不对称的,诸葛亮拥有比司马懿更多的信息。这种信息的不对称完全是诸葛亮“制造出来的”。因此这是一个信息不对称的博弈。
在这里,孔明可以选择的策略是“弃城”或“守城”。无论孔明所选择的是“弃”还是“守”,只要司马懿明确知道在各种可能的情况下他自己的支付,那么孔明均要被其所擒。孔明惟一的办法就是不让司马懿清楚地知道他自己的策略结果。孔明通过空城计,目的是降低司马懿进攻的可能收益,使得司马懿认为,后退比进攻要好。
司马懿
孔明 |
进攻 |
后退 |
守城 |
被擒;大胜 |
逃脱;不胜不败 |
弃城 |
被擒;大胜 |
逃脱;不胜不败 |
在信息不充分的情况下,理性的博弈参与人不是使自己的支付或效用最大,而是使自己的“期望支付(或效用)”最大。比如:如果让你在“有50%的可能获得100元”与“有10%的可能获得200元”两者之间进行选择,你当然选前者,因为前者的“期望所得”为:50%×100=50元,而后者为:10%×200元=20元。理性的人是选择前者的。
在孔明—司马懿的博弈中,孔明了解双方的局势,制造空城假象的目的就是让司马懿感到进攻有较大的失败的可能。如果我们用概率论的术语来说,诸葛亮的做法是加大司马懿对进攻失败的主观概率。此时,在司马懿看来,进攻失败的可能性较大,而退兵的期望效用大于进攻的期望效用。即:司马懿认为进攻的期望效用低于退兵的效用。诸葛亮惟有通过这个办法,才能让司马懿退兵。
司马懿想,诸葛亮一生谨慎,不做险事,只有设定埋伏才可能如此镇定自若,焚香操琴。此时,司马懿觉得“退”比“进攻”更合理,或者说期望效用更大。于是后军变前军,前军变后军,后退而去。结果是诸葛亮得以逃脱。司马懿对局势的判断不是没有道理的,他对诸葛亮的判断是基于以前的认识,这就是“归纳法”,我们会在第七章中讨论归纳法在博弈中的作用及其局限。
空城计博弈是不完全信息博弈,我们说过《三国演义》是一本博弈实战教材,在该书中有完全信息博弈实例吗?当然,曹操与诸葛亮的华容道博弈就是一个完全信息博弈。
曹操亲领八十万大军进攻东吴,孙权和刘备联合破曹,曹军大败。曹操引兵而逃。经过一路厮杀,来到一处,军士报:前方有两条道路,请问丞相走哪条路?曹操问:哪条路近?军士说:大路稍平,却远五十余里。小路投华容道,却近五十多里。曹操令人上山观望,回报:小路山边有数处狼烟,大路并无动静。曹操叫走华容道。诸将问:烽烟起处必有军马,何故反走这条路?曹操说:岂不闻兵书有云:“实则虚之,虚则实之”。诸葛亮多谋,故使人于山僻放烟,使我军不敢从这条路走,他却伏兵于大路等着。吾已料定,偏不教中他计。诸将皆曰:丞相妙算,人不可及。遂曹兵走华容道。但关羽依着诸葛亮的妙计在华容道等着曹操,于是关羽上演了一场“只为当初恩义重,放开金锁走蛟龙”的捉放曹的义举。逃过华容道大难,曹操只剩二十七骑!
在曹操与诸葛亮之间的这一华容道博弈中,曹操的策略是在走华容道还是走大路之间进行选择,而诸葛亮派关羽埋伏时,要在埋伏在大路还是埋伏在通往华容道的小路之间进行选择。
这个博弈如同猜硬币的游戏一样,是一个“零和博弈”[5]它没有纯策略纳什均衡点。双方对博弈有完全的信息,各种策略下的博弈支付是公共知识——我们下一章将说明什么是公共知识。但双方无法知道对方的策略选择,而只能进行猜测。曹操要选择走诸葛亮的军队不在的路,这是他的最优的结果。而诸葛亮的最优结果是埋伏在曹操要走的路上。
曹操
诸葛亮 |
华容道 |
大路 |
华容道 |
捉住曹操,被捉 |
白等,逃脱 |
大路 |
白等,逃脱 |
捉住曹操,被捉 |
诸葛亮制造埋伏在大路的假象,其实则派关羽埋伏在小路。这里关键是谁能真正猜到
对方的策略,谁就是赢家。诸葛亮胜曹操一筹。这个博弈不存在纯策略纳什均衡点,博弈结果是:曹操选择了走华容道,结果被抓;关羽在华容道守候,抓住了曹操。
6.约定与协调博弈
先看一个道路通行博弈。
道路是浪费土地的,因为它的建设需要占用土地;道路又是节约土地的,因为若没有道路的方便人们将践踏更多的土地。随着人口的增多,道路在增加,道路上行走的车辆和行人也越来越多。道路上的行人和车辆有来有往,若没有交通规则,情况会如何?
假设在某条道路上向相反方向行驶的两辆车在某处相遇。若它们均走自己的“左边”、或均走自己的“右边”,它们则能顺利通过;而如果一辆车走自己的“左边”、另外一辆车走自己的“右边”,它们均不能通过,甚至发生相撞。我们设不能通过(或相撞)的支付为0,顺利通过的支付为1,该道路通行博弈的博弈支付矩阵如下:
乙
甲 |
左 |
右 |
左 |
1,1 |
0,0 |
右 |
0,0 |
1,1 |
该博弈有两个纳什均衡是,这两辆车都走“左边”,或都走“右边”。
我们已经说过,若一个博弈只有一个纳什均衡,该均衡是可预测的。在这样的博弈中的参与人能够自动地在该纳什均衡处实现。而博弈一旦出现两个或两个以上的纳什均衡,博弈结果是什么,我们无法预测。该博弈道路通行博弈也一样,我们不能预先知道,两个司机选择的最后结果。
在这个道路通行博弈中,这两辆车的司机均希望能够顺利通过,均不希望发生堵车甚至相撞的尴尬情况出现。但是对每个司机而言,他应当选“左”还是“右”呢?若他知道对方的选择,他很容易地作出自己的选择,但对方与他处于同样的决策境地。预测对方的选择是正确决策的基础,而司机发生预测错误是可能的,因此发生不能顺利通过是可能的。[6]
在实际中人们是如何避免此尴尬情况出现的呢?其方法众所周知。那就是,确定交通规则。交通规则规定人们在交通行走中一律“靠左行”,或一律“靠右行”。是“靠右行”还是“靠左行”在不同国家有不同的规定。“靠右行”还是“靠左行”,没有优、劣之分,重要的是在一个固定的区域了必须有一致的规定。一旦在某个区域了这样的规定成为公共知识,那么,在一般情况下不会发生堵车甚至相撞的悲剧了。
该交通通行博弈的特点是,存在多个纳什均衡点,参与人希望在其中任何一个纳什均衡点上实现各自的最大收益。这样的博弈称为协调博弈。
在协调博弈中,可通过某个约定而协调参与人的行动,使博弈的某个均衡点得以实现。
再来看一个协调博弈。
有几个学生决定不参加星期一的考试。他们周末离开学校去郊区游玩,周二才回来。回来后,他们向教授解释说,在回来的路上他们汽车轮胎爆了,没有备用轮胎。他们出示了他们所住的郊区旅馆的收据,上面有日期,以证明周末他们确实在郊区。他们恳请教授给他们重新安排一次考试。我们假定有四个学生。
教授同意给他们一个补考的机会。学生们在教室的四个角落就坐,他们为他们成功欺骗暗自窃喜。教授说考试内容只需回答一个问题,教授在黑板上写下这样的问题:“你们所驾驶的车子的四个车轮的轮胎中哪一个坏了?”
这是一个协调博弈。车子有四个轮胎,因而,每个学生都有四个备选答案:前左、前右、后左、后右。若四个学生的答案一致,那么他们便通过考试,否则便没有通过考试。
若他们的故事是真实的,他们的回答将是一致的。每个学生都会指出那个爆了的轮胎。若故事是编造的,他们可以通过事先的“约定”而使答案一致,而若没有这样的约定,所有四个学生均答出同一个轮胎的概率很低,概率只有0.016,读者可以来验证这个结果。[7]教授出人意料地给出这个问题,学生很难预测到该问题而进行预先对回答进行“约定”。
在生活中这样的协调博弈随处可见。比如,儿童在商场里走失,儿童与父母相互寻找便是一个协调博弈。在商场中,父母与儿童往往有多个可能的所在地点(比如楼层)可选择,若父母与儿童所选择的是同一楼层,他们将相遇,这是他们希望的;若父母与儿童所选择了楼层不同,他们将不能相遇,这是他们努力避免的。为了防止走散而相遇不到的情况,父母与儿童可以事先进行约定,一旦走失,一起去往共同认识的某处,比如某一楼层或某一个特殊的柜台,此时便能够出现希望出现的博弈结果。对于这样的博弈,很可能的是父母与儿童事先没有进行约定。如果没有进行约定,最好的方法是双方根据双方所拥有的公共知识而选择对方最可能的地方(事先的约定也是公共知识)。比如,儿童这样想,一起来到商场是为了购买某种商品,父母最有可能在该商品所在的地方;父母也会这样想,孩子会认为我们会在购买商品的地方……这里我们假定了儿童具有一定的推理能力,否则的话,这里的分析是不合适的。
第二章 公共知识与行动均衡的打破
一、公共知识与博弈
博弈专家们发现在博弈中涉及到群体认知的刻画问题。公共知识便是一种群体认知。要弄清什么是公共知识,首先要弄清什么是知识。
知识是人的真信念。这样,我们就把知识与信念区分了开来。知识是人们对自然中某个事实的认识,我们说某人拥有某种知识,意指某人知道某个事实。人们知道的东西是以命题表达的,人们拥有某个知识是说他相信某个真命题。“地球绕着太阳转”这个命题在今天看来表达了一个真的事实,但哥白尼之前的许多人并认为它表达真的事实,而今天这个命题表达的事实已几乎被所有人熟知,并且人们相信这个命题,于是“地球绕着太阳转”构成人们的知识。
因此,知识涉及三个因素:
第一,人们所相信的命题要是真的。假的命题不能成为知识。人们可能相信虚假的东西,但它们不能构成相信它们的人的知识。在偏僻的乡村,人们相信,人的病是由鬼怪引起的,巫婆通过某些迷信活动能够驱除鬼怪从而达到治病的目的,这当然只是错误的信念,而不是知识。再比如:在古代,中国人认为雷电是由掌管雷电的雷公行云布雨的结果,这当然也不是真的事实。假的信念对信念拥有者的行为指导有时可能是有效的,但它不构成相信者的知识。知识能够经受检验,而假的信念不能。
第二,人们要“了解”这个命题。或者说,真命题必须在我们的视野之中。存在许多我们并不知道的真命题,它们不能构成我们(人类)的知识。我们常说知识如大海一样,我们知道的只是知识海洋中的一滴水。
第三,人们要相信他所知道的事实。如果某人不相信某些事实,尽管他了解,该事实不构成他的知识。哥白尼提出地球围绕太阳转的日心说观点,那时许多人了解这个事实,但并不相信,“日心说”不能构成他们的知识。
逻辑学家建立了认知逻辑,用之刻画人们对命题的认知态度如知道、相信等。知道逻辑是其中的一种。我们用K(a,p)表示某人a知道命题p,或者说p是a的知识。知道逻辑有如下的特征公理:
K:K(a, p→q) K(a,p)→K(a,q);
T:K(a,p) →p
D:~K(a,p ~P)。
4:K(a,p)→K(a,K(a,p))
E:~K(a,p)→K(a,~K(a,p))
这些知识公理是什么意思?
公理K表示的是,如果认知主体a知道p→q,并且知道p,那么他知道q。
公理T表示的是,如果主体a知道p,那么p是真的。为了将知道的东西与纯粹信念区分开来,我们假定了人们知道的东西为真,而人们的信念不必为真。
D公理表示的是,人们不知道相互矛盾的事情。即相互矛盾的事情不能构成人们的知识。该公理的另外一个形式是:K(a,p) →~K(a,~p)。若p是一个主体的知识,那么~p将不是他的知识。
公理4表示的是,如果a知道p,那么他知道他知道p。该公理又称为“正的反省公理”。我知道“”,我知道“我知道‘地球围绕太阳转’”。由该公理,我们发现,只要主体知道一个为真的事实,那么他就知道无数个为真的事实。
公理E意即:如果a不知道p,那么他知道他不知道p。该公理又称“负的反省公理”、“智慧公理”。人们对这个公理往往持有异议:不是每个人都能够像苏格拉底那样“知道自己无知”;通常是,人们既然对某个事实无知,他并不一定知道自己对该事实无知。
公共知识是一个群体人们之间的对某个事实的知识,它尽管为最近发展起来的概念,但该概念可追溯到休谟。《人性论》是一本伟大的哲学著作,休谟在27岁时将该书写成并出版(1738年)。在该书中有了公共知识这个概念的萌芽。逻辑学家刘易斯(D.Lewis)在1969年给出严格的定义,他认为公共知识就是每个人都知道,每个人知道每个人都知道……依此类推。1976年博弈论专家奥曼(R.Aumann)将公共知识引入博弈理论的研究。
奥曼在《不一致的达成》(Agreeing to disagree,1976)中对公共知识的定义如下:如果1和2两个人都知道E事件,1知道2知道E事件,2知道1知道E事件,1知道2知道1知道E事件,依此类推,那么我们就称1和2对于E事件具有公共知识。
从这个定义中可知,公共知识涉及一群体的对某个事实“知道”的结构。[8]在日常生活中,许多事实是公共知识,如:“所有人均会死”、“所有鸟均能飞(鸵鸟除外)”,对于它们,所有人均知道(智力有障碍者及婴儿除外),并且所有人知道其他人知道,当然其他人也知道别人知道他知道……
公共知识是相对于某个群体的。有些知识只属于某个人,它当然不是公共知识。科学家知道是其他人所不知道的知识,这些知识能够成为该科学家群体的公共知识,若科学家将之公布于众,该知识便成为整个社会的公共知识。
对任何一个博弈来说,“参与人是理性的”是起码的公共知识要求。对于像囚徒困境这样的完全信息博弈,双方的不同策略下的支付也是公共知识;在曹操和诸葛亮之间华容道上的博弈中,双方各种策略组合下的支付也是公共知识。
在有些博弈中,各种策略下的支付不能成为公共知识。比如在商战中,相互竞争的各方不知道其他商家在各种产量下的赢利情况,此时,策略下的支付不是公共知识。
对于不完全信息博弈,存在许多情况,在每个情况下,知识分布的不同博弈结果不一样。这里本书不分析群体行动中知识的分布,只是说明,知识分布的不同影响博弈参与人的策略选择,因而影响到博弈结果的最终形成。
任一互动的群体都存在一定的公共知识。在公共知识一定的情况下经过一段时间,群体达到了均衡。此时若公共知识发生改变,群体的均衡便发生改变。
上述分析有些抽象,读起来令人乏味,现在让我们来看看具体例子中的公共知识情况。通过这些例子,读者就能明白什么是公共知识、明白公共知识如何影响到群体的均衡,熟悉了公共知识的概念,读者就可以用它来分析身边的社会现象。
二、一个寓言——村庄里的大屠杀
在一个偏僻的山里,有一个村庄。这里是女人掌权,女人对一切事务说了算。村里有100对夫妇。
在这个村里已经形成了约定俗成的规定。如果女人发现自己的丈夫对自己不忠的话,就会毫不犹豫地将他杀死,而且就在当天执行。当然,她必须有确切的证据来证明她丈夫不忠。由于这个因素,某个女人发现某个男人不忠,她不会将之告诉那个不忠男人的妻子。但是,她会告诉其他人的妻子,并且女人们会相互传递这一信息,因此,一个男人不忠,除了其妻子不知道外,其他女人都知道。
而事实上是,村子里的这100对夫妇的男人都不忠,但由于女人不会将她知道的事实告诉不忠男人的妻子,每个女人都不知道自己的男人不忠。因此,该村子一直很稳定,而没有发生妻子杀死丈夫的行为。
村子里有一个辈份很高的老太太,她德高望重,诚实可敬。每个人都向她汇报村里的情况,因此她对村里的情况了如指掌,她知道这个村子里的所有男人都不忠,当然,其他女人不知道她所知道的东西。
一天,这位老人对这100个女人说了一句很平常的话:“你们的男人当中至少有一个是不忠的。”于是,村里发生了这样一个事情:前99天,村里风平浪静,但到了第100天,村里发生了一场大屠杀,所有的女人都杀死了她们的丈夫。
故事就是这样的。
为什么会这样?
这是一个推理和行动的过程。如果她的丈夫不忠的话,她就杀死他;如果没有证据证明她的丈夫不忠的话,她便相信他,不杀死他。
如果村里只有一个男人是不忠的话,在老太太作了宣布之后的第一天,这个男人的妻子在老太太宣布之后马上就能知道。因为,她会作这样一个推理:如果其他男人不忠的话,她应当事先知道,既然其他99个男人都没有不忠,并且至少有一个男人不忠,那么这个不忠的男人必定就是她的丈夫。因此,村里如果只有一个男人不忠的话,老太太宣布之后,当天这个男人就会被其妻子杀死。
如果村里有两个男人不忠,那么,这两个男人的妻子在老太太做了宣布的第一天都不会怀疑到自己的丈夫,因为这两个妻子的每一个知道另外一个女人的丈夫不忠。但是,当第一天过后她没有发现那个不忠诚的男人被杀死,那么她会想,必定有两个男人是不忠的,否则她知道的那个不忠的男人会被他的妻子当天杀死的。既然有两个男人不忠,但这两个不忠的男人的妻子想,她只知道一个,那么另一个不忠的男人必定是她的丈夫!
……
这个村子里的100个男人不忠,那么,上面这样推理会继续到99天。就是说,前99天每个女人都没怀疑到自己的丈夫,而当第100天的时候,每个女人都确定地推理出她的丈夫不忠,于是村子里便发生了一场大屠杀,所有的男人都被他们的妻子杀死。
推理就是这样进行的。
这里,在老太太宣布“至少一个男人是不忠的”这样一个事实时,每个女人其实都知道这个事实(她们也知道村子里的规则),似乎是,老太太对这个事实的宣布并没有增加这些女人的知识——关于村里男人不忠行为的知识。但为什么老太太的宣布使得村里的女人产生了对她们丈夫的屠杀行为呢?这是因为,老太太的宣布使得这个群体里的女人的知识结构发生了变化:“至少一个男人是不忠的”在老太太做宣布之前是每个女人的知识,宣布之后仍然是她们的知识,但它在老太太宣布之前不是公共知识,老太太的宣布使得它成为公共知识。
如何理解这种变化?设想一下,假定共有3个女人A、B、C,那么在未宣布之前,A想:由于自己不知道自己的丈夫不忠,其他两个女人B、C也同样不知道,那么A想B不知道C是否知道“至少有一个男人是不忠的”。而当老太太宣布了“至少一个男人是不忠的”之后,“至少一个男人是不忠的”便成了A、B、C之间的公共知识。
在这个100人组成的小村里,老太太的宣布使得“至少一个男人是不忠的”成了公共知识。于是,推理与行动便开始了。这是大屠杀的原因!
三、帽子:红色的还是白色的?
与上述故事相同结构的一个事例是“帽子的颜色问题”。在“帽子的颜色问题”中,同样是公共知识不断公布,推理不断进行的过程。
有一群人围坐在一起,为了便于分析,我们假定有4人(人数为其他数字,可作同样分析)。这4个人每人头戴一顶帽子,帽子为红色和白色两种中的一种。每个人看不到自己帽子的颜色,但能看到别人帽子的颜色。因此,每个人不能看到自己头上的帽子的颜色。
一个局外人来到他们的群体当中,对他们说:“你们其中至少一位头戴的是红色的帽子。”当他说了这句话后,他问:“你们知道你们头上的帽子的颜色吗?”4个人都说“不知道”;这个局外人第二次问:“你们知道你们头上的帽子的颜色吗?”4个人又都说“不知道”。局外人第三次问:“你们知道你们头上的帽子的颜色吗?”4个人又说“不知道”。局外人又问第四次:“你们知道你们头上的帽子的颜色吗?”这时4个人均说:“知道了!”
你能知道,他们中有几个人戴红色的帽子?几个人戴白色的帽子?
答案是,4个人都戴红色的帽子。你知道为什么吗?
当局外人未宣布“至少一个人戴的是红帽子”时,这个事实其实每个人都知道了,因为每个人看到其他3个人的帽子都是红色的。但这个事实在局外人未做宣布之前尽管是这4个人的知识,但不是他们的公共知识。而当这个局外人做了宣布了之后,“至少一个人帽子是红色的”便成了公共知识。此时不仅每个人知道“至少一个人的帽子是红色的”这个事实,每个人知道其他人知道这个事实……
如果只有1个人戴红色的帽子,那么,当局外人第一次问时,这个人因面对3个戴白色的帽子、必定知道自己的帽子颜色,他必定会回答“知道”。因此,当4个人第一次均回答“不知道”时意味着,4人中“至少有2人戴的是红色的帽子”,而且这也成了新的公共知识。
当局外人第二次问时,因为上述推理,如果只有2人戴的是红色的帽子,这2人就会回答说“知道”——因为他们各自面对的是1个戴红色帽子的人,这戴红色帽子的2个人马上知道自己戴的是红色的帽子。因此,局外人第二次问他们而他们回答“不知道”,此时,意味着,4人中“至少3个人戴红色的帽子”,并且它也成了该群体新的公共知识。
同样,当局外人第三次问时,他们回答的“不知道”,意味着4个人均戴的是红色的帽子。此时,他们每个人都知道他们头上都戴着红色的帽子,并且这也是公共知识。
因此,当局外人第四次问时,他们4个人马上说“知道”。
在这个过程中,当局外人首先宣布“其中至少一个人的帽子是红色的”,以及每次的回答(无论是回答“知道”还是“不知道”)构成该群体新的公共知识——构成所有人推理的前提。
这就是“帽子的颜色问题”。本人将这个问题简化了。原来的问题是这样的:有一个游戏,有一个主持人和戴着两种颜色帽子的一群人(假定有n人),每个人的帽子的颜色或者是红色或者是白色,但这n个人不能看到自己的帽子的颜色却看得到其他人的帽子的颜色。游戏的主持人说:“你们中至少一个人的帽子是红色的。”主持人开始一次次地问:“你们知道不知道自己的帽子的颜色?”现在的问题是:当主持人问到第几次时,才有人说“知道”?并且多少人说“知道”?
据说,这个问题在20世纪曾风靡欧美。
四、皇帝新装的新解读
我们都熟悉安徒生的童话《皇帝的新装》。
从前,一个皇帝爱穿漂亮的衣裳。有两个骗子对皇帝说,他们能做出世界上最漂亮的衣服,这衣服不仅华丽,而且穿上它后能知道谁是愚蠢的人,因为愚蠢的人是看不见这衣服的。皇帝相信骗子的话,给了骗子许多金子,让骗子开始织布。两个骗子在织机旁煞有其事地忙碌着。皇帝派他的宠臣去看看工作的进度,然而他们惊呆了:天啊,我什么也看不见!他们想,难道我是愚蠢的人?我不胜任自己现有的权位?这是多么可怕的事啊!但好在其他人不知道。于是他们装着看见的样子,称赞布料是多么多么的漂亮,骗子向他们描述布料的色彩和图样,他们点头称是。回去后,他们将骗子的话汇报给皇帝。皇帝亲自来看衣服制作的进度,他也同样被眼前的情景惊呆了,因为他什么也没看见!他当然看不见,因为确实什么也没有。皇帝也怀疑自己是愚蠢的人,但他想,千万不能让别人知道我看不见布,千万不能让我的臣民知道我是愚蠢的人,于是他也同样夸赞起布来。
全城庆典的那天,骗子装模作样地赶制好了衣服,皇帝脱掉了他原来的衣服,骗子做出给皇帝穿衣服的样子。当骗子给皇帝穿好所谓的“新衣服”后,皇帝步出宫殿,向他的臣民致意。皇帝在大街上被他的臣子们簇拥着行走,什么也没穿。他的臣民们都看着没穿衣服的皇帝,然而他们怕别人知道自己是愚蠢的人,不敢承认自己没有看到皇帝没有穿衣服。
这时,一个小孩突然说:“其实皇帝什么也没穿啊!”这一声无疑是晴天霹雳。老百姓开始议论纷纷,私下传着这个天真无邪的小孩的话,人们开始相信小孩说的话是对的。皇帝也知道了老百姓们的窃窃私语,他想老百姓的话可能是对的,但他没办法就此回头,他坚持把游行进行下去,他硬着头皮高傲地向前走去。
在这个童话中,骗子们所谓的皇帝的新衣服其实什么也没有,每个人都没有看到皇帝的新衣服,或者说,每个人所看到的是皇帝没有穿衣服。但每个人都不相信自己所看到的是事实——“看到”和“相信”是两回事。对每个人来说,“皇帝什么都没穿”没有构成他们的知识,当然更不是他们之间的“公共知识”。
这里有一个虚假信念在误导着他们:如果我没看见皇帝的新衣服意味着我是愚蠢的。因此,每个人尽量地不让其他人了解自己没看见皇帝的新装。尽管每个人都没有看到皇帝的“新衣服”,每个人包括皇帝在内,都在说着假话,硬说自己看见了新衣服。每个人都在谎言下生活。这就是一个均衡,一个大家都“说谎的均衡”。
小孩说出“其实皇帝什么也没穿”后,小孩的话传到每个人那里,“其实皇帝什么也没穿”便成各个人的知识,自然也成了公共知识。原来的均衡打破了。
安徒生的这个童话里让小孩子说出真话有他的用意,小孩子是真诚的,不受错误的世俗观念污染的。说真话的小孩使人们所看到的东西成为知识,同时成为公共知识。
五、“教—学”均衡的公共知识条件——教育的公共知识结构分析
我们不一定做过教师,但生活于现代社会的我们必定做过学生。
我们离不开教师。我们上小学,教师教我们识字、教加减乘除;我们上中学,教师教我们几何、代数;我们上大学,教师教我们未来生存的专业知识。当然,在任何时候,教师教我们做人的道理。“师者,传道,授业,解惑也。”
如果我们对学生—教师的知识结构作一分析,我们会发现,教育有着特别的知识结构。
教育有什么样的结构?对于教师,教师知道他或她应该知道某些知识,学生知道他们的教师知道他们想学的知识,教师也知道学生知道他或她拥有某些知识。即:教师知道某些要求的知识是公共知识。我们用K1p表示“教师知道某些学科的知识”。1代表教师,K代表知道,p代表学科的知识。K1p为公共知识。
同时,学生不知道教师知道的学科性知识,学生对这些知识的无知也成为公共知识。即:教师知道学生对这些知识的无知,成为学生和教师间的公共知识,同时也是全社会的公共知识。我们用~K2p表示“学生不知道某个学科的知识”。2代表学生,p代表学科知识,~K表示不知道。~K2p也是公共知识。
K1p和~K2p不仅是教师和学生间的公共知识,同时也是社会的公共知识。因此,之所以教师站在讲台上,处于“教”或“传授”的位置,而学生坐在课桌前处于“学”或“聆听”的位置,就是因为有这样的公共知识存在。“教—学”或“讲授—聆听”构成一博弈均衡。如果没有这样的知识构成,“教—学”或“讲授—聆听”的均衡便不会形成。
这样的均衡何时会打破呢?
我们说,既然“教—学”的均衡依赖于公共知识K1p和~K2p ,一旦这样的知识构成被打破,“教—学”之间的关系将被终结。这里有两种可能情况:第一,K1p不是公共知识。或者因为教师不具有这些知识,或者教师具有这些知识但没有成为公共知识,“教—学”的均衡不能形成,这个教师便不能站在讲台上。第二,通过一段时间的学习,教师将知识教给了学生,学生也知道了教师讲授的东西,学生将离开该课堂,此时“教—学”均衡也被打破了。
当然,要注意的是,K1p和~K2p为公共知识,只是“教—学”均衡形成的必要条件,而非充分条件。
六、诸葛亮、周瑜的掌中之“火”
《三国演义》描写了这样的故事:曹操带领大军进攻东吴,诸葛亮来到东吴,劝说东吴与刘备一起抵抗曹操大军。吴军都督周瑜向诸葛亮请教如何破曹操的百万大军。周瑜说,我昨天察看曹操水寨,极为严整、有章法,不是一般人所能够攻破的。我想了一个计策,不知道是否可行,请先生为我决策。孔明则说:都督暂不要说,我们各自写在手上,看一看是否一样。
瑜大喜,教取笔砚来,先自暗写了,却送与孔明;孔明亦暗写了,两人移近坐榻,各出掌中之字互相观看,皆大笑。原来周瑜掌中字,乃一“火”字;孔明掌中亦一“火”字。瑜曰:“既我两人所见相同,更无疑矣。幸勿漏泄。”
在诸葛亮和周瑜未在掌中写出“火”字之前,或者尽管他们在掌中写出“火”字但没有互相观看之前,火攻曹操为一个致胜的妙计是他们两个人所知道的,但不是公共知识。因为周瑜不知道诸葛亮知道这个策略。此时很有可能的是,诸葛亮知道周瑜知道这个策略,但周瑜以为诸葛亮不知道他知道这个策略。而当两人在手中写出“火”字,并“互相观看”之后,这个策略可以取胜为他们的公共知识。
诸葛亮与周瑜将“火”字写在掌中,并互相观看,这样的行为使他们的知识结构发生变化。在这个过程,知识结构发生变化的群体只有诸葛亮和周瑜两个人,而无其他人,“诸将皆不知其事”。如果其他(尤其是曹操)知道火攻为诸葛亮和周瑜之间的公共知识,那么火攻策略便不能战胜曹操,赤壁一战便会出现另外的结果。知识的分布关系到战争的成败。
七、将军的困境与公共知识形成悖论
我们在生活中经常见到某些场合下,两个人为某件事情会心一笑,此时两人达到了默契。如果用公共知识的概念来解释,就是说两人都知道了某些知识,而且他们知道对方知道自己知道了该事情……即该事情是他们的公共知识。他们不通过言语使某个公共知识得以形成。
两个默契的双方不用语言就可形成某个公共知识,而在有些时候,即使用语言多次传递某个信息,该信息也难以成为公共知识。我们来看一看著名的“协同攻击难题”中公共知识是如何难以形成的。
两个将军各带领自己的部队埋伏在相距一定距离的两个山上,等候敌人。将军A得到可靠情报说,敌人刚刚到达,立足未稳。如果敌人没有防备,两股部队一起进攻的话,就能够获得胜利;而如果只有一方进攻的话,进攻方将失败。这是两位将军都知道的。A遇到了一个难题:如何与将军B协同进攻?那时没有电话之类的通讯工具,而只有通过派情报员来传递消息。将军A派遣一个情报员去了将军B那里,告诉将军B:敌人没有防备,两军于黎明一起进攻。然而可能发生的情况是,情报员失踪或者被敌人抓获。即:将军A虽然派遣情报员向将军B传达“黎明一起进攻”的信息,但他不能确定将军B是否收到他的信息。事实上,情报员回来了。将军A又陷入了迷茫:将军B怎么知道情报员肯定回来了?将军B如果不能肯定情报员回来的话,他必定不会贸然进攻的。于是将军A又将该情报员派遣到B地。然而,他不能保证这次情报员肯定到了将军B那里……
这就是著名的协同攻击难题(coordinated attack problem),它是由格莱(J.Gray)于1978年第一次提出。糟糕的是,有学者证明,不论这个情报员来回成功地跑多少次,都不能使两个将军一起进攻。[9]
在协同攻击难题中,两个将军协同进攻的条件是:“于黎明一起进攻”是将军A、B之间的公共知识,然而,无论情报员跑多少次,都不能够使A、B之间形成这个公共知识!如果你是这两位将军中的一个,你有什么办法?
在这个难题中,一个新的公共知识形成的悖论出现了:公共知识是群体中的人们进行交流、协作的必要前提,实际中我们确实能够进行交流协作,但从逻辑上一个新的公共知识无法形成。这样就形成一个悖论。
这个悖论类似于阿基里斯追不上乌龟的芝诺悖论。从逻辑上,跑得很快的阿基里斯永远追不上跑得很慢的乌龟:他要追上乌龟必须要经过乌龟出发的地方A,但当他跑到这个地方的时候,乌龟又向前爬了一段距离、到达了新的一点, 阿基里斯要追上乌龟必须跑到这新的一点,但当他追到该点时候,乌龟又爬走了……因此,阿基里斯永远也追不上乌龟。而事实上,阿基里斯能够追上乌龟,只要他的速度快于乌龟。这是我们不容置疑的常识。理论与事实发生矛盾。
八、交流与公共知识的形成
若我们假定交流者的言语行为是同时的,即听和说之间不存在延时;并且假定听和说者都是真诚的,那么说者表达出来的知识立即成为听和说者之间的公共知识。
不同的认知主体的认知结构一样即均分为信念、怀疑、无知世界,认知世界里的元素往往因认知主体的不同而不同。
如,信仰亚里士多德物理学的科学家和信仰哥白尼学说的科学家之间的不同在于,前者所相信的命题“太阳围绕地球转”在后者那里则属于怀疑世界里。任何一个主体的认知世界随认知的变化而变化,通过言语交流是获得新的认知的一种方式。
言语博弈如何改变群体的认知世界呢?通过辩论——证明与反驳,对话者能够改变对方的信念,当然也可以改变自己的信念。辩论能够使认知世界里的元素发生变化,但这不是必然的。如:“地心说”的信奉者和“日心说”的信奉者都能够给出支持它们信念的证据,然而这些证据不能对他们的信念提供决定性的证明。通过辩论而使信念发生改变的逻辑过程和心理过程是重要的研究课题。
如果某个命题是某一个群体中所有都知道的,该语句能够被表达吗?该命题能够被表达。因为所有人都知道该命题,不表明表达者知道他人知道该命题,不表明他知道他人知道他知道该命题……何时才会发生某人不说某句话呢?这个条件是:该真命题是群体的公共知识!
在《关于知识的推理》中作者说诙谐地说,“公共知识”是傻瓜知道的知识,而“隐含知识”是聪明人才知道的知识。公共知识是大家知道、大家都知道大家知道……的知识。既然四傻瓜都知道的知识,那么,它有表达的必要吗?
因此,我们这里得出一个群体存在“听-说”的条件:某个命题得以表达的条件是,它不是一个群体的公共知识。
这个条件表明,所表达的必定不是群体的公共知识,但不被表达的一定是公共知识吗?不一定。比如,一个群体都无知的东西是无法进行表达的。
一个群体的认知结构通过交流发生变化,即公共知识发生增加。这个过程当然会达到一个极限,这个极限便是:任何新的表达都只能是公共知识,此时群体的任何言语都无认知意义。若交流仅限于认知,这个群体此时边归于沉默。
(编辑,请注意:本章中的一些符号为方正排版符号,没有消去。)
第三章 你的权力有多大?
一、“独裁的”妻子
先看一个幽默。同事经常与一有“妻管严”的丈夫开玩笑,同事逗他:“你家里谁拿主意?”“妻管严”笑着说:“一半一半。”同事问他:“一半一半是什么意思?”他说:“当意见不一致的时候听老婆的,当意见一致的时候听我的。”众人哈哈大笑。
在这个笑话中,当丈夫和妻子意见一致时妻子听丈夫的,不一致的时候他听妻子的,这时候丈夫的权力是一半吗?显然,这时候丈夫不能作出任何主张,我们说,他的权力为0。妻子是这个家庭的“独裁者”。
在家庭中,这个妻子是温柔的“独裁者”,而丈夫是幸福的“被统治者”。但是如果在一个社会中,独裁者未必是温柔的,而被统治的臣民也未必是幸福的。而独裁者之所以被称为独裁者是因为他拥有绝对的权力。
权力体现在决策之中。在许多事情上我们都是独裁者,因为我们在这些事情上能够有绝对的决策权力。当然,这些事情所涉及的当事人是我们自己,而不是他人,我们与那些主宰他人命运的政治上的独裁者有本质的区别。
在生活中你要作出许多决策,能作出决策构成你的权力。比如,当你有一笔钱的时候,你对它有足够的使用权力:你可以用它去买股票,你可以将之存在银行,也可以买房产,等等。
当你决定去投资股票的时候,你面对的是几百种股票,你怎么选择呢?你当然要分析这些股票所属的行业,是传统行业还是高科技行业。你要看现在股价的高低,看它们每股收益多少,是赢利还是亏损——股价与每股收益之比为市盈率,即你要看市盈率是多少。你还要看流通股数量有多少。当然还要看有没有炒作题材,有没有庄家在坐庄,等等。此时,无论你是股海畅游的老手,还是偶尔在股海边忐忑不安、想一试身手的新手,你的收益——赢还是赔,赢多少还是赔多少,完全取决于你的选择:买哪种股票,买多少,什么时候买,什么时候卖,等等。
你有权决定买股票,你有权决定买什么股票,你有权决定将它们卖掉。每种选择下,你都自己承受你自己作出的决定的结果,这是你进入股票市场的前提。在计划经济下,没有股票市场,即使你有钱,你也无法作出买股票的选择。你没有选择的自由,你也没有选择的快乐和痛苦,你当然也不必承担选择的结果,因为没有结果。
作为一个普通公民,你对股票可以选择买和卖,而且有绝对的或完全的选择权。但是你对决定你单位的领导、对决定省市及国家的领导人有多大的权力呢?显然,你没有绝对的决定权(尽管可能拥有部分的决定权)。
在独裁制度下,人民对自己的命运也有一定的选择权,但许多权力掌握在独裁者手中,更不用说对国家的重大决策了。独裁者可以对任何人的命运说“死”或“生”,你如果要得出与独裁者作出的决定相反的结果,那么只有一条路,那就是造反。公元前209年陈胜、吴广作为屯长,带领900人充军渔阳,因大雨道路不通,无法按规定时间到达,而逾期当斩。陈胜、吴广商议:“今亡亦死,举大计亦死,等死,死国可乎?”逃亡也是死,起义也是死,同样都是死,为国家反抗暴政死不是值得吗?造反也是一种表达方式,它是人民在迫不得已的情况下对暴政表达不同看法的方式。
在民主制度下,人们可以表达自己的想法,可以参与决策;可以民主地选择他们的领导人。当然并不是说,民主制度下每件重大事情的决策都采取民主的方式,因为民主选举上去的领导人可以是独裁的,但如果可以民主地将独裁者选举下去,这才是真正的民主选举结构。选举只是按民主决策机制进行的全民决策问题,像东帝汶1998年通过“全民公决”,以确定留在印尼还是独立,是另一种全民性的民主决策议题。民主的决策程序是所有人均能表达自己的看法的程序。
在私人事务的决策中我们能够有绝对的权力,而在选举等群体决策中,我们的权力有多大呢?
二、一个国家的权力分配故事与班扎夫权力指数
有一个国家,名叫Saha国,该国有六个按地理的自然疆域划分的省份,它们是Alice,Bline,Cinda,Duhe,Eho,Frida。[10]该国实行代议制民主政治,所有立法决策由这些省份的代表来实施。由于这些地区的人口数量不同,它们按人口分配了不同比例的票数。票数分配为:Alice:10,Bline:9,Cinda:7,Duhe:3,Eho:1,Frida:1。总票数为31张。
该国的法律规定:如果一项议案拥有半数以上的票数即获得通过。即:如果一项议案获得31票中的16票或16票以上,那么就获得通过。总统选举也一样,如果在两位候选人之间进行选举,那么谁获得16张或以上的票即当选。
该国这样的政治体制运行了很多年,一直良好地进行着。但是Duhe,Eho和Frida的人民总觉得有点问题。于是他们请来了法律专家班扎夫(John.F.Banzhaf Ⅲ)来分析一下该国的政治体制。通过分析,班扎夫发现,尽管Duhe,Eho和Frida分别有3票、1票和1票,但实际上,这三个省份在表决时,在任何情况下都不起作用!
他们向总统反映了这个情况,要求总统提请修改票数分配的议案。总统不明白:“这是怎么一回事?”
班扎夫向总统解释说:“每个决策者在决策时的权力体现在他能够作为‘关键加入者’出现在获胜联盟中。如果决策者作为‘关键加入者’出现的次数多,那么他的权力大;反之则小。我们可以把一个决策者作为‘关键加入者’在获胜联盟中出现的次数称之为‘权力指数’。”
班扎夫接着说:“在贵国的政治体制中,Alice,Bline,Cinda三个省份垄断了所有的权力,而Duhe,Eho,Frida三个省份在现有的体制下,不是任何获胜联盟的‘关键加入者’。即Duhe,Eho,Frida三个省份的权力指数为0。”
“什么是获胜联盟?什么是‘关键加入者’?能不能举个例子?”总统问。
班扎夫举例说:“比如联盟‘Alice-Bline’就是一个获胜联盟,它们两者加起来的票数为19张,大于16张,因此,‘Alice-Bline’就是一个获胜联盟。在这个获胜联盟中,Alice和Bline都是不可缺少的,因此,Alice与Bline均是获胜联盟‘Alice-Bline’的关键加入者。”
“‘Alice-Bline-Duho’也是一个获胜联盟,但是Duho不是关键加入者,是不是?那我明白了。你能不能帮我具体算一下各个省份现有的权力指数?”总统说。
“可以。贵国现有的决策体制可以标记为(16;10,9,7,3,1,1)。前面的16为一个获胜联盟至少要获得的票数,或者说一个提案获得通过至少需要的票数。后面的数字为各个地区被分配的票数。”班扎夫说:“这个投票体制的权力指数情况见这样一个表。”班扎夫拿出一张纸给总统看。
表 3-1 (16;10,9,7,3,1,1)体制下Saha 国各省权力指数
地区 |
票数 |
权力指数 |
权力指数比(%) |
Alice |
10 |
16 |
33.3 |
Bline |
9 |
16 |
33.3 |
Cinda |
7 |
16 |
33.3 |
Duho |
3 |
0 |
|
Eho |
1 |
0 |
|
Frida |
1 |
0 |
|
“权力指数比是什么?”总统问。
“权力指数也称为归一化的权力指数。如果我们用百分比来分析投票过程中各投票者的权力所占的比例。对于n个人,每人的权力指数为c1,c2 ……cn ,则投票者j的权力指数比为:rj= cj/(c1 +c2+…… cn)
由上面这个公式我们就能算出各个投票者的权力指数比例。一个极端的情况是,如果一投票者拥有51或以上的股份则他拥有100%的权力,而其他投票者拥有的权力为0%。”班扎夫说。
“哦,原来是这样。这确实不太公平。有什么办法改变这样的状况?”总统问。
“可以的,总统先生。”班扎夫说,“您有什么具体要求?”
“首先,人数多的地区,权力要大些;其次,人数少的地区也能有一定的权力。当然,最好不要作太多的修改,否则很难实施。大致是这些吧。”总统想了想说:“不过现在首要的是要增加人数少的三个地区的权力。否则太不公平了。”
“要绝对公平很难,重新分配票还要经过各省份之间进行平衡和争吵。”班扎夫边说边思考,“这样吧,我给出一个简单的方案。”
班扎夫考虑了一下说:“多给Alice地区两张票吧。这样就能使得其他票数不变的情况下增加三个弱小地区的权力。”
“这样行吗?”总统怀疑地说。
“可以的,”班扎夫解释说,“原来的总票数为31,获得16张票就赢。而现在的总票数为33,获得17票才能赢。这样权力指数就发生了变化。”
“怎么个变化法?”
“让我计算一下。”
班扎夫掏出笔认真地计算起来,以确保无误。过了一会儿,班扎夫说:“这个方案看样子能行得通。”说着,他拿出计算结果给总统看:
表3-2 (17;12,9,7,3,1,1)体制下Saha国各省权力指数
地区 |
票数 |
权力指数 |
权力指数比(%) |
Alice |
12 |
18 |
34.615 |
Bline |
9 |
14 |
26.923 |
Cinda |
7 |
14 |
26.923 |
Duho |
3 |
2 |
3.846 |
Eho |
1 |
2 |
3.846 |
Frida |
1 |
2 |
3.846 |
总统看着班扎夫给他的各省份权力指数的结果,自言自语地说:“对于Frida来说,它在‘Alice-Duho-Eho-Frida’和‘Bline-Cinda-Frida’两个联盟中起关键作用,即它的加入能使这两个联盟获胜,若背离则使得它们落败。因此它的权力指数为2。Duho和Eho和Frida都得到了改进。”
总统对班扎夫说:“它确是一个改进了的可行的方案。但不知道能不能说服国会给以通过。我试试办吧。谢谢你了。”
在Saha国的权力分配故事中所提到的权力指数,是班扎夫于1965年提出的。夏普里—舒比克权力指数提出最早(1954),但不太直观,班扎夫给出了一种不同的计算权力的方法,由这个方法得到的权力指数被学术界称为班扎夫权力指数。
班扎夫权力指数的意思是,某个投票者的权力体现在,他能通过自己加入一个要失败的联盟而使得它获胜,这同时也意味着他能通过背弃一个本来要胜利的联盟而使得它失败。这就是说,他是这个联盟的“关键加入者”;而他的权力指数就是他是关键加入者的获胜联盟的个数。
我们用一个简单的例子来说明如何计算班扎夫权力指数。有A、B、C三个人,A有两票,B、C各有一票,这三个人组成一个群体,对某项议题进行投票,假定此时赢的规则服从“大多数”规则,即若获得3票,即得到通过。他们各自的权力有多大?
对各自的权力指数进行分析时,起作用的是获胜联盟的“关键加入者”。对于该问题,获胜的联盟有:AB,AC,ABC。而对于这三个可能获胜的联盟来说,A在AB、AC和ABC中均是关键加入者,所以他的权力指数是3。而对于B来说,他是联盟AB的关键加入者,所以他的权力指数为1。而对于C来说,他与B一样只是一个联盟的关键加入者,即联盟AC,他的权力指数是1。因此A、B、C的权力指数之比是3∶1∶1。
在前面“独裁的”妻子的幽默中,如果用权力指数来分析,获胜联盟有两个:妻子—丈夫;妻子。而在这两个联盟中,妻子是这两个联盟的关键加入者,即她的权力指数为2。丈夫不是任何联盟的关键加入者,他的权力指数为0。
由这两个例子可看到,权力指数和票数不是一回事。权力指数是真正权力的一个反映,而票数只是一个虚假的指标而已。因此,我们在设计具体的投票制度、分配票数时要考虑并计算权力指数。我们要在票数上体现各个投票者以我们设计的权力。
三、夏普里—舒比克权力指数
夏普里—舒比克权力指数是最早提出的计算权力大小的一种指数。该权力指数是夏普里和舒比克在1954的一篇文章“评价委员会中权力分布的一个方法” [11]中提出的。
在投票中,投票人的力量或权力体现在他作为投票关键者而使提案得以通过,而提案被通过的场合很多。一个投票人在很多场合下都是作为关键投票者出现,他的权力就大;一个投票人他在很少的场合下作为关键投票者出现,他的权力就小。那么,可考虑的这些场合共有多少种呢?夏普里和舒比克认为,若投票人有n个人,共有n!个可能的场合。这是夏普里—舒比克权力指数的思想。由此可见,夏普里和舒比克用投票人的排列数作为出现的各个可能的情况,不同于班扎夫的获胜联盟数。
我们举例来说明夏普里—舒比克权力指数的计算方法。
考虑这样一个例子:有A、B、C三个人,A有两票,B、C各有一票,这三个人组成一个投票群体,假定该决策群体的决策的规则是“大多数”规则,即某提案若获得3票,则可得到通过;反之则得不到通过。他们各自的权力有多大?
我们用(3;2,1,1)表示上述投票博弈。(3;2,1,1)表示:一个议案需要的最少3张票;三个投票人分别拥有的票数为2、1、1。
根据夏普里—舒比克权力指数的计算方法,我们将A、B、C的可能排列写出来,并确定各种可能的排列下的关键加入者。每个投票人作为关键加入者的个数与可能的排列数之比率,即得出了各个投票人的权力大小。
表3-3。投票体(3;2,1,1)的可能排列与关键加入者
可能的排列 |
ABC |
ACB |
BAC |
BCA |
CAB |
CBA |
关键加入者 |
B |
C |
A |
A |
A |
A |
从上表得出,φ(A)=4/6;φ(B)=φ(C)=1/6。即A的权力指数为4/6;B和C的权力指数相等,均为1/6。
这种方法计算出来的权力指数被称为夏普里-舒比克权力指数。该权力指数为归一化的,想当于上面所给出的班扎夫权力指数比。
夏普里与舒比克预设了,所有排列的顺序是等可能的,在每一个排列下,每个参与人对这个排列有一个边际贡献,若参与人使提案得以通过,他的边际贡献为1,若参与人不能使提案得到通过,他的边际贡献为0。一个投票人在很多情况下都作为关键人物出现,表明他在很多情况下对提案通过的贡献大,自然他的权力就大,反之就小。根据这种方法计算出来的数值能够反映决策群体中各个投票人的权力大小。
夏普里—舒比克权力指数是最早提出的计算权力大小的指数,它的提出在本人看来意义重大。它使我们看到了以前没有看到的东西。我们举一个实际中出现的例子。
1958的欧共体总共有6国,它们是法国、德国、意大利、荷兰、比利时和卢森堡。这些国家对相关的经济问题进行决策。法国、德国和意大利的票数为4张,荷兰、比利时为2张,卢森堡为1张。总票数为17张。投票规则为2/3多数,即一个议案获得17张中的12张或以上就获得通过。让我们根据夏普里—舒比克权力指数来分析欧共体各国的权力。
投票体可表示为(12;4,4,4,2,2,1)。下表为各国的票数与夏普里—舒比克权力指数:
表3-4 1958年欧共体各国的权力分析
国家 |
德国 |
法国 |
意大利 |
比利时 |
荷兰 |
卢森堡 |
票数 |
4 |
4 |
4 |
2 |
2 |
1 |
权力指数 |
14/60 |
14/60 |
14/60 |
9/60 |
9/60 |
0 |
从上表中可看到,卢森堡尽管有1张票,但其权力为0,即尽管卢森堡的财政部长每次都在投票,但他在任何情况下对议案均不会产生任何影响。卢森堡完全是一个摆设!它作为傀儡而存在!
夏普里与舒比克分析了联合国安理会的权力分布。1965前联合国安理会有5个常任理事国和6个非常任理事国。常任理事国有否决权,非常任理事国无否决权。联合国安理会规定,一个提案通过的条件是:有7张赞成票且5个常任理事国无否决票。夏普里与舒比克用他们的方法计算出,5个常任理事国的权力指数之和为98.7%,6个非常任理事国的权力指数之和为1.3%。[12]据夏普里与舒比克的分析,美国总统与参议院及众议院的权力指数之比为2∶5∶5,而总统与一个参议员、一个众议员的权力比为:350∶9∶2。就是说,美国总统的权力几乎是一位参议员的权力指数的40倍,是众议员的175倍。
夏普里—舒比克权力指数也可用于经济分析。夏普里与舒比克在《评价委员会中权力分布的一个方法》中说:一个有股份40%的股东,其权力为各拥有0.1%的400个股东的每个股东权力的1000倍,尽管股份比为400:1。
经过博弈论专家的研究,夏普里—舒比克权力指数与班扎夫权力指数是等价的。
四、聪明的股东:班扎夫权力指数的应用
班扎夫权力指数比夏普里—舒比克权力指数直观,我们在下面举一个班扎夫权力指数的应用。
有一个股份公司,有5个股东,他们是A、B、C、D、E。在公司重大决策上,公司法规定,遵循“一股一票原则”——即每个股东的票数与他所持的股数相等,“大多数原则”——某项议案能否通过取决于是否得到51%或以上的票数(或股数)的同意。5个股东均同意这两个原则。
5个股东在公司成立时均拥有相同的股份20%,随着经营的变化,股东的想法出现分化。B、C、D、E想逐渐减持股份,而A想多拥有一些股份。而B、C、D、E又不想让A完全控制公司——根据“大多数原则”拥有51%或以上的股份即有绝对的说话权。
B、C、D、E各减持了3个百分点,A增加了12个百分点。此时A、B、C、D、E拥有的股份分别为32%、17%、17%、17%、17%。
A认真想了想,向B、C、D、E提出各减持1个百分点而他自己拥有36%股份的要求。B、C、D、E想,A拥有36%的股份,不超过50%,不能完全控制该公司,也就同意了A的要求。此时A、B、C、D、E分别拥有的股份为36%、16%、16%、16%、16%。A达到了目的。
为什么A要多持4个百分点的股份?
通过分析,我们看到,A的股份由32%增加到36%,虽然股份仅增加了4个百分点,但他的班扎夫权力指数发生了突变。A占了便宜。
让我们将这5个股东的股份与班扎夫权力指数、班扎夫权力指数比列于下面三个表格。
表3-5 股份的变化与班扎夫权力指数比的变化:股权情况1
股东 |
股份(%) |
班扎夫权力指数 |
班扎夫权力指数比(%) |
A |
20 |
6 |
20 |
B |
20 |
6 |
20 |
C |
20 |
6 |
20 |
D |
20 |
6 |
20 |
E |
20 |
6 |
20 |
表3-6 股份的变化与班扎夫权力指数比的变化:股权情况2
股东 |
股份(%) |
班扎夫权力指数 |
班扎夫权力指数比(%) |
A |
32 |
6 |
20 |
B |
17 |
6 |
20 |
C |
17 |
6 |
20 |
D |
17 |
6 |
20 |
E |
17 |
6 |
20 |
表3-7 股份的变化与班扎夫权力指数比的变化:股权情况3
股东 |
股份比(%) |
班扎夫权力指数 |
班扎夫权力指数比例(%) |
A |
36 |
14 |
63.636 |
B |
16 |
2 |
9.091 |
C |
16 |
2 |
9.091 |
D |
16 |
2 |
9.091 |
E |
16 |
2 |
9.091 |
从表3-5至表3-7可见,在5个股东之间平均持股的情况下,即均持有20%的股份,班扎夫权力指数也是平均的。当股份发生偏离时,如股东A持有的股份多几个百分点、其他股东仍持同样的股份,班扎夫权力指数比还不发生变化。从表3-5可看到,当A拥有32%的股份时,班扎夫权力指数还是平均的,在这种股权结构下,对A来说是最不公平的,他拥有的股份是其他股东的近两倍,但权力却一样!
但是当A的股份再有所增加,而其他每个股东降低一个百分点时,班扎夫权力指数比发生突变。A的班扎夫权力指数一下子由6增加到14,班扎夫权力指数比由20%增加到63.636%,而其他股东的班扎夫权力指数由6降低到2,班扎夫权力指数比则由20%降到9.091%。
A此时虽然不能拥有51%的股份或以上而有100%的决策权,但由于他在决策时作为高获胜联盟中的关键加入者,要比其他4个股东的班扎夫权力指数高得多,因此他的权力比其他股东大得多。
五、 逻辑结构与投票影响度
为什么在上面“丈夫—妻子”的例子中丈夫与妻子不拥有相同的权力呢?为什么Saha国原来的投票体制(16;9,7,3,1,1)拥有的票数分别为3、1、1的三个省不具有权力呢?上面通过指出投票者在形成获胜联盟中作为“关键加入者”的个数,得出他权力的大小。而这也可从整个群体决策的逻辑结构中分析。
假定妻子是A,丈夫为B,在上述幽默中,对事情决定的逻辑式是:
F=AB+A[AKB~](3-1)
这里,“F”表示表决结果,“F=1”表示得到通过,“F=0”表示没有通过。“AB”是丈夫B与妻子A意见相同的逻辑项,A[AKB~]是他们意见不同的逻辑项。表面上两者有相同的权力,其实(3-1)等值于下式:
F=A (3-2)
从(3-2)中可以看到,妻子是“独裁者”,在现实中这个丈夫是幸福的“被统治者”。但是在政治生活中,如果出现这样的独裁的行动结构,独裁者有绝对的说话权力,而被统治的人民则没有任何发言权,被统治者则是不幸的。
(3-2)是独裁的一般的表达式,A是独裁者对某项事情进行表决的值,“A=1”表示他“同意”,“A=0”表示“不同意”。、
例如,假定这个社会由3个人组成:A、B、C,其中A是独裁者。我们可以将B、C表示进独裁社会的F=A的逻辑式中,尽管B、C在其中对F的值没有影响:
F=A
=A(B+〖AKB~〗)(C+〖AKC~〗)=ABC+AB〖AKC~〗+A〖AKB~〗C+A〖AKB~〗〖AKC~〗[JY](3-3)
变化后的式子尽管复杂,然而B、C根本不起作用。
3个人的民主社会的逻辑式是什么样的呢?假定这3人决定服从“大多数原则”,即对一项决定有二人同意即通过,假定“F=1”表示通过,“F=0”表示否决。“1”表示决策者表示“同意”,“0”表示“不同意”。那么民主的逻辑结构是:
F=AB+AC+BC(3-4)
要说明的是,“AB”、“AC”、“BC”的意思是“逻辑乘”,如“AB”的取值是:A、B均等于1时取1,A、B有一个取0就得0。而“+”为“逻辑和”,如“A+B”的取值为:只要A、B有一个取值为1就为1,A、B取值均为0时为0。
(3-4)与(3-2)完全是不同的。对于(3-4)这样的结构,每个人对结果没有绝对的控制权,而只有部分决定权,A、B、C每个人的权力是均等的。
民主的社会是所有投票者都能影响表决结果的社会,不过不同的民主方式,群体的大小不同,每个投票者在里面的影响程度不同。
在Saha国,我们分别用A、B、C、D、E、F代表Alice 、Bline、Cinda、Duhe、Eho、Frida六个省份。在原有的投票体制(16;10,9,7,3,1,1)下,获胜的最小联盟为:AB,AC,BC。
在本人看来,用最小获胜联盟来衡量个体在集体投票行动或博弈中的权力可能更合适,因为在最小获胜联盟中,每个投票者都是关键加入者,计算此时每个参与人作为关键加入者的个数是合理的,而在非最小获胜联盟中某个非关键加入者对联盟没有贡献,应当将它删去。
最小获胜联盟可用逻辑的方法来表示,各个最小联盟的“逻辑和”构成一个投票博弈的结构。Saha国原来的投票体制(16;10,9,7,3,1,1)的逻辑结构为:
F=AB+AC+BC (3-5)
它与三个人的投票体制的逻辑结构是一样的。而在新的投票体制(17;12,9,7,3,1,1)下,最小的获胜的“逻辑和”为:
F=AB+AC+BCD+BCE+BCF+ADEF (3-6)
从逻辑结构的角度来看,原有的投票体制中,D、E、F三省不存在任何权力。新的体制下,D、E、F的权力得到改进。
我们可以用一个决策者说“是”和说“不”时议案获得通过的概率之差来反映它的权力。这个值反映了他对整个行动决策的影响程度,我们可称之为“投票影响度”,它的大小构成投票者权力的大小。某个投票者的投票影响度d(A)的公式是:
d(A)= p(A=1)- p(A=0)
其中,p(A=1)和p(A=0),分别为A“同意”和“不同意”时整个议案得到通过的概率。
在这里,我们假定其他投票者的概率为1/2,这个假定是说,每个投票者对某项议案事先的态度居于“中位”,或者说平均而言是1∶2,也可以认为是“先验概率”。在(16;10,9,7,3,1,1)投票体制下,我们可以算出这六个省份的影响度为:d(A)= d(B)= d(C)= 1/2;d(D)= d(E)= d(F)=0。
而在(17;12,9,7,3,1,1)投票体制下,投票影响度d(A)= 21/32;d(B)= d(C)= 7/16;d(D)= d(E)= d(F)=1/16。此时权力之比为:21∶14∶14∶2∶2∶2。
这种方法的结果与权力指数的计算结果几乎一样。
六、民主社会中为什么很多人不投票?
投票者可以通过判断群体决策的结果对自己的有利程度来投票,即判断F=1与F=0给他带来的好处来决定,因此他的选择是较简单的:如F=1对自己有利就选择“同意”(1),否则就“不同意”(0)。
但是,在互动过程中,投票者要考虑的另外一个重要的问题是他的投票对决策的影响程度。如果他对整个社会或集体的决策影响大,他的权力大,他的积极性就高,反之他的积极性就低。而权力反映在上面所说的投票影响度上。
在一个群体中,一个人对一项决策可以完全由他决定,那么他就是独裁者,独裁者的投票影响度为1。而独裁制度下的臣民对投票结果的影响程度为0。在民主制度下,每个投票者对结果的影响程度必定是介于0和1之间的一个值。
在一个人数很多的采取民主投票的群体中,投票者由于考虑到他对投票结果的影响程度低,投票不积极,或者说,干脆不投票。让我们分析这个情况。
在3个人组成的群体中,“大多数原则”下逻辑式为(3-4),每个人的投票影响度可求得为:d(n=3)=1/2。
通过数值计算我们求得:
d(n=10)=0.246
d(n=50)=0.112
d(n=100)=0.0796
如果我们用一个百分比来衡量影响程度,投票者投票的“影响比率”为:
通过计算我们可得:
r(n=3)=300%
r(n=10)=96.9%
r(n=50)=28.9%
r(n=100)=18.8%
由此可见,随着人数的增加,影响比率在降低。当人数达到上千万上亿的时候,每个投票者对投票结果的影响度近于0,即几乎没有影响,它反映的是在人数很多的情况下,人们的权力太小了,几乎是0。这也就是为什么在民主社会中许多选民不投票的原因。
因此,对于一个有很多人组成的社会,尽管在“大多数原则”下民主投票是揭示群体偏好的一个好的方法,它是“正义的”,但在进行民主投票表决时,每个人有充分的投票意识是至关重要的。虽然个人的投票对选举结果影响不大,但他要意识到,投票不仅仅是他神圣的权利,更重要的是他为社会所尽的义务。只有这样才能摆脱民主中投票存在的不投票的问题。
七、一个群体中有多少种可能的权力结构?
我们已经说明:投票是揭示群体各投票者的偏好的方式。但是投票结果取决于逻辑结构。在上面的例子中我们已经表示了“独裁的”和“大多数原则”的民主方式。这只是投票博弈的两种方式,只是权力分配的两种方式。一般地说,对于n人组成的社会有多少种可能的权力结构呢?
在A、B两人组成的最简单的群体中,从逻辑可能性的角度,A、B之间有16种可能的决策结构,但有以下4种决策方式是常见的,或者能在现实中找到意义的。它们是:
(1) F=A,(2)F=B,(3)F=A+B,(4)F=AB。
在(1)和(2)中分别是A、B说了算的独裁式的决策结构。在(3)、(4)中A与B有相等的决策权力,但是在(3)中,只要有一个人同意就通过,在(4)中要A、B两人同时同意才行。
因此在方式(3)中的决策比方式(4)中的决策要容易。
夫妻间的决策是现实的例子。他们间的决策无非是这4种方式。也许在民主的夫妻间,重大的决策采取的是(4),即夫妻均同意才去做,如:夫妻商量着决定买房、孩子上学,等等。对一些小事或者一些临时碰到的事情则可能采取的是(3),比如每天买什么菜这样日常生活或工作中的小事。读者不妨想一想是不是这么一回事情。
其他12种呢?这12种是:
(5)F=[AKA~],(6)F=[AKB~],(7)F=[AKA~]+B,(8)F=[AKA~]+[AKB~],
(9)F=A+[AKB~],(10)F=[AKA~]B,(11)F=[AKA~]+[AKB~],(12)F=A+[AKB~],(13)F=[AKA~]B+A[AKB~],(14)F=[AKA~][AKB~]+AB,(15)F=1,(16)F=0。
其中(15)、(16)是两种特殊的逻辑结构,即投票结果为常数,与投票者是否投票无关。
怎么解释其他10种呢?
可以这么认为,一旦在决策的逻辑结构中存在“逻辑非”,表明在投票中存在“相互的策略投票”,即:投票者不仅要考虑自己的偏好而且要考虑他人的偏好,这10种方式反映了投票者或决策者相互的猜测。因此,这10种结构不是独立的,它们分别是上述4种的变化。它们也反映了投票时人们之间复杂的关系。
如:(5)F=[AKA~],(6)F=[AKB~],与F=A或F=B是同构的。但一个两人的群体的决策结构如何可能是F=[AKA~](或F=[AKB~])?一个解释是:F=[AKA~] (F=[AKB~])表明的是,B(或A)是独裁者,但是他的决策与A(或B)的决策正好相反!它反映了独裁者B(或A)这么认为:“凡是A(或B)反对的,我就赞同;凡是A(或B)赞同的,我都反对。”这只是一个解释。
对于这10种情况另外的解释是:有第三个人,他是决策的决定者,但是他的决定根据的是其他两个决策者的偏好情况。如“F=[AKA~]+B”说的是A“不同意”,B“同意”,这第三个人就“同意”,否则就“不同意”。
3个人组成的群体有多少变化呢?3人组成的一个决策群体,从逻辑可能性来说,其可能的权力分配的结构相当多,有256种之多!而独立的不含“逻辑非”的逻辑结构共有13种。读者可以试着写出这些逻辑式子,并找出在现实中反映的是什么情况。可以说,实际中的权力分配的情况全部在这些可能的结构中。
一般而言,n人组成的群体,可能的权力安排形式有2 种!
由此可见,可能的逻辑状态与人数呈几何级数增长。当人数超过3或者人数很大时,可能的状态情况非常多,也难以列举。这也是为什么社会出现多种多样的形态的原因。
逻辑结构反映了决策者在投票博弈中的权力,只要一确定群体的决策的逻辑表达式给定,我们就能分析每个决策者对结果影响的权力。
第四章 公平分配可能吗?
一、 什么是公平分配?
马克思反对资本主义,其根本原因在于他认为资本主义分配不合理。《资本论》认为,劳动与资本的结合创造了价值,然而,工人只得了维持生存的微薄工资,而期于的即剩余价值被资本家剥夺了。马克思认为,劳动创造价值,剩余价值“应当”归工人所有,这是公平的分配。
分配是任何时代、任何社会的重要问题。在中国传统中人们有这样的思维:“不患贫,而患不均”,即是说,人们能够忍受贫穷,而不能忍受社会财富分配的不均等。微观经济学通常涉及三个方面的内容:“生产什么”、“如何生产”以及“如何分配”——分配是经济学的一个重要研究内容。
改革开放以来,中国的经济发生了巨大发展,每个中国人都从这个发展中得到了“好处”。这如同做蛋糕,每人都分得了其中的一份,尽管大小不一。
如何进行分配呢?为了分配,必须建立一个分配标准。这样的标准应当是公平的。然而,什么是公平的分配标准呢?
公平的并不是平均的,尽管有时是平均的。一个公平的分配是,各方之所得是其“应该”所得的。但什么是“应该”所得的?作为理性人,每个理性主体均想多分配一点。现实中的许多争吵,大到国家间的领土争端,小到人与人之间的鸡毛蒜皮的小事,很大一部分是由于分配“不公平”造成的。这种争吵或者由于一方认为不公平造成的,或者由于双方均认为不公平造成的。
当然,建立的分配标准首先应当是有效的,即容易进行操作。有这样一个被称为“第18只骆驼”的故事。一个父亲有17只骆驼,他在临死之前召集自己的三个儿子,说:“在我死后,我的骆驼归你们。老大分其中的1/2,老二分其中的1/3;老三分其中的1/9。”但是,三个儿子在父亲死后分这17只骆驼时遇到了困难。因为17的1/2是8.5,1/3是5.6,1/9是1.8只。将骆驼切成块来分?即:他们的父亲给了他们不好操作的标准。他们找到了牧师。牧师对他们说,我借给你们一只骆驼,你们分一下试试看。此时,骆驼总数变成了18只,老大分了18中的1/2即9只,老二分了18中1/3即6只,老三分了18中的1/9,即2只,三人分得的总数之和为17只,剩1只,又还给了牧师。这个例子中牧师的分配充满智慧,使得原来难以操作的分配难题得以化解。
下面我们不讨论分配标准的有效性问题,而是通过例子来分析不同情况下什么样的分配是公平的。
二、 8个金币的故事
有这样一个故事。
约克和汤姆结伴旅游。约克和汤姆准备吃午餐。约克带了3块饼,汤姆带了5块饼。这时,有一个路人路过,路人饿了。约克和汤姆邀请他一起吃饭。路人接受了邀请。约克、汤姆和路人将8块饼全部吃完。吃完饭后,路人感谢他们的午餐,给了他们8个金币。路人继续赶路。
约克和汤姆为这8个金币的分配展开了争执。汤姆说:“我带了5块饼,理应我得5个金币,你得3个金币。”约克不同意:“既然我们在一起吃这8块饼,理应平分这8个金币。” 约克坚持认为每人各4块金币。为此,约克找到公正的夏普里。
夏普里说:“孩子,汤姆给你3个金币,因为你们是朋友,你应该接受它;如果你要公正的话,那么我告诉你,公正的分法是,你应当得到1个金币,而你的朋友汤姆应当得到7个金币。”
约克不理解。
夏普里说:“是这样的,孩子。你们3人吃了8块饼,其中,你带了3块饼,汤姆带了5块,一共是8块饼。你吃了其中的1/3,即8/3块,路人吃了你带的饼中的3-8/3=1/3;你的朋友汤姆也吃了8/3,路人吃了他带的饼中的5-8/3=7/3。这样,路人所吃的8/3块饼中,有你的1/3,汤姆的7/3。路人所吃的饼中,属于汤姆的是属于你的的7倍。因此,对于这8个金币,公平的分法是:你得1个金币,汤姆得7个金币。你看有没有道理?”
约克听了夏普里的分析,认为有道理,愉快地接受了1个金币,而让汤姆得到7个金币。
在这个故事中,我们看到,夏普里所提出的对金币的“公平的”分法,遵循的原则是:所得与自己的贡献相等。
这就是夏普里值(Shapley value)的意思。
三、贡献与所得相等: 夏普里值在分配中的应用
如果说纳什均衡是非合作博弈中的核心概念的话,那么我们可以说,夏普里值(Shapley Value)是合作博弈(或联盟博弈)中的最重要的概念。具体地说,夏普里值是合作性博弈的解,如同纳什均衡是非合作性博弈的一个解。
理性主体往往为了利益往往与其他理性主体订立协议,形成联盟。这个联盟形成后能够获得更大的好处,即取得更大的利益。若不带来更大的利益,联盟是不可能形成的。如何分配联盟形成后获得的好处呢?这是合作性博弈所关心的。
考虑这样一个联盟博弈。有一个三人财产分配问题:假定财产为100万元,假定这100万元在三个人之间进行分配。a拥有50%的票力,b拥有40%的票力,c拥有10%的票力。规则规定,当超过50%的票认可了某种方案时,才能获得整个财产,否则三人将一无所获。
我们看到,任何单独一个人的票力都不超过50%,从而不能单独决定财产的分配。要超过50%的票力必须要形成联盟。也就是说,在这个例子中任何人的权力都不是决定性的,也没有一个人是无权力的或权力为0。
此时财产应当按票力分配吗?如果是的话,即a,b,c的财产分配为:50%,40%,10%。但如果这样分配的话,c可以提这样的方案,a:70%,b:0,c:30%。这个方案能被a,c接受,因为对a,c来说这是一个比按票力分配方案有明显的改进的方案,尽管b被排除出去,但是a,c的票力构成大多数(60%)。
在这样的情况下,b会向a提出这样一个方案:a:80%,b:20%,c:0。此时a和b所得均比刚才c提出的方案要好,但c成了一无所有,但a、b票力总和构成大多数(90%)……这样的过程可以一直进行下去。
在这个过程中,理性的人会形成联盟ab,ac或abc。但哪个联盟能够形成呢?最终的分配结果应该是怎样的呢?
夏普里(L.S.Shapley)提出了一种分配方式,根据他的理论求得的联盟者的先验实力被称为夏普里值(Shapley Value)。
夏普里,一个在二战中与中国人民并肩与日本侵略者作战的老兵,对中国人民有深厚的感情。1944—1945年,他随美军部队转战于中国西南边境,笔者在2001年的一次国际博弈论大会上与他聊天时,他神秘地谈起40多年前他在中国的情形,他还记得当年学的许多中国话,如“美国兵”、“你好”、“谢谢”,等等。二战结束后,他回到美国接受高等教育,并从事数学研究。他于1953年提出的夏普里值,随着合作博弈在博弈论中的地位的提升而日显重要。
夏普里值是这样的一个值:在各种可能的联盟次序下,参与人对联盟的边际贡献之和除以各种可能的联盟组合。
在财产分配问题上,我们可以写出各种可能排列,并计算各个排列下各个参与人的边际贡献。
表4-1财产问题中各种排列下各个参与人的边际贡献(单位:万元)
排列 |
abc |
acb |
bac |
bca |
cab |
cba |
a |
0 |
0 |
100 |
100 |
100 |
100 |
b |
100 |
0 |
0 |
0 |
0 |
0 |
c |
0 |
100 |
0 |
0 |
0 |
0 |
由表3-3,我们得出a、b、c、的夏普里值分别为:
Φa=400/6(万元),Φb=100/6(万元),Φc=100/6(万元)
夏普里值反映了“平均的”边际贡献,这样它可以用来划分财产。按照夏普里值我们可以将财产分为a:200/3,b:100/6,c:100/6,单位为万元。
四、海盗分宝石:公平规则下的不公平
有这样一个分配故事:5个海盗抢到了100颗宝石,他们决定对这100颗价值一样的宝石进行分配。分配规则是:(1)抽签确定分配的顺序;(2)由抽到1号签的海盗提出分配方案,然后由5个海盗(包括提出方案的1号海盗)进行表决,当且仅当半数和超过半数的人同意时,1号海盗的分配方案得以通过,并根据该分配方案进行分配,否则1号被扔入大海喂鱼;(3)如果第1号被扔到大海后,再由2号提出分配方案,然后剩余4人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则将被扔入大海喂鲨鱼;(4)依此类推。
假定每个海盗都是绝顶聪明的,即都能够进行充分推理和计算而作出策略选择。问题是:抽到1号签的海盗提出怎样的分配方案既能够不使自己被扔到海里,又能使自己得到最多的宝石?
假设海盗已经确定的顺序为(1,2,3,4,5),1号提出的方案要使其余4个人中至少2个人同意才能获得通过,因此,1号要分析,他要使两个人同意的条件是,他给这两个人的宝石要多于假若1号被抛进大海后其他人给他们的分配,即这两个人如果不同意他的方案,得到的宝石更少。同时,1号为了自己的利益,他要笼络的两个人是处于劣势的人,即在其他情况下,得到珠宝最少的两个人。现在,我们来看一下,1号是怎样提出分配方案的。
根据规则,假设前3个人均被抛下了海,只留下4号和5号,4号提出100∶0方案,表决时4号同意,5号无法改变表决结果,所以,在只有4号和5号时,分配方案是(0,0,0,100,0)。这个分配结果是任何理性人均能够预测到的。
当只有3、4、5号时,如3号提出99∶0∶1方案,表决时,3号和5号必定同意。因为5号知道,若不同意,将3号抛下海后,他将一无所得。3号知道5号所作的分析,所以他提出这样的方案,3号自己当然是同意的。因此,此时分配方案是(0,0,99,0,1)。这个结果也是理性能够预测到的。
我们再往前推。当有2、3、4、5号时,2号预测到若他被抛下海后,分配方案将是(0,0,99,0,1)。因此,2号提出的最好的分配方案是:99∶0∶1∶0,即给自己留99颗,给4号1颗。4号会想,若我不同意,将2号抛下海后我得到的将是0颗宝石,因此,我应当同意2号给我的1颗的分配。此时,2号和4号同意该方案,该方案得到了通过,尽管3号和5号不同意。此时分配方案为(0,99,0,1,0)。
现在我们来看1号的最优方案。1号被淘汰,则3号和5号一颗也得不到——这是所有海盗均能够预测到的。所以1号方案是给3号和5号各1颗,即方案为98∶0∶1∶0∶1。对该方案进行表决时,3号、5号和1号均同意,这个方案获得通过。
因此,最终的分配方案为(98,0,1,0,1),1号海盗获得了98颗!
在这个分配案例中,我们假定了海盗是理性的,他们每人均有很强的分析能力,能够作出我们上述的分析。若不如此,海盗们会不满意上述的分配方案而大打出手。
海盗分宝石的规则貌似公平:抽签决定分配顺序似乎表明每个海盗的机会相等,提出的分配方案通过表决来进行,看起来也挺民主。而分配结果则出人意料,最多的为98颗,最少的为0颗!
公平规则下出现了不公平。
五、所罗门的智慧:公平不是平均
所罗门是历史上以色列国的国王,是大卫王的二儿子。他十分具有智慧。
据传说,有两个妇人争夺一个孩子,让所罗门王来裁决。所罗门王说:“既然你们都说,孩子是自己的,然而你们均没有足够的证据证明孩子确实是自己的,那么就将孩子劈成两半,你们一人一半,这样不就公平了?”所罗门的话是严肃的。此时,所罗门的手下要执行所罗门的命令。其中一个妇人同意这个分法,认为所罗门王英明;而另一个妇人大哭,说:“亲爱的所罗门王,我不要孩子了。整个孩子归她吧。”此时,所罗门对大哭的妇人说:“你才是孩子的母亲。母亲是爱孩子的,宁愿不要孩子,也不要孩子死啊。”所罗门命令手下把那个争孩子的假母亲抓了起来,重重惩罚。
这里,结果是公平的——孩子归他的母亲,而获得这个结果的方式则是充满智慧的。
所罗门王所用的策略是不可重复的,这只有在特殊情况下才能得到:那两个妇人均是在不知道所罗门王的真正意图的情况下表达出自己的偏好的:真母亲首先希望孩子活着,其次才是孩子回到自己的身边;假母亲首先关心的是不要输掉官司,孩子的归属是次要的。
我们看到,这里的公平的分配不是指平均的分配,也不是双方均满意的分配,而是合理的分配。
六、从分蛋糕到财产分割与边界争端的解决:双赢的分配
两人分一个蛋糕,用什么方法才能分配得公平?一个公平的分法是:由其中一人持刀来分,分者后取。这样,分的人因担心后取而吃亏,他所能采用的最好办法是尽量将蛋糕分平均,即使他后拿,也不会吃亏。
分蛋糕只是对同质的东西所进行的一个简单的分配,对不同质的东西能否建立一个像“你分我先取”分蛋糕那样的一个程序,从而做到公平分配吗?美国纽约大学政治系的勃拉姆兹(S.Brams)教授给出了肯定的回答。他提出了一个“双赢”的分配办法。我们来看一下一个离婚的财产分割的例子。假定一对夫妇,安娜和汤姆,感情破裂,不想在一起过日子了。他们到法院进行财产分割。
法官看了他们的财产:冰箱、电脑、缝纫机、烟斗、自行车、书桌。一共有6件。法官叫他们对这6件物品进行轮流选择,所选择的归其所有。当然是女士先选。选择顺序是:安娜,汤姆,安娜,汤姆,安娜,汤姆。
选择的结果是什么呢?我们假定安娜与汤姆对不同物品的偏好不同,比如,安娜作为家庭主妇最喜欢冰箱,认为它也最值钱;而汤姆由于工作的关系更喜欢电脑,认为它更有用。他们对物品的“评价”见表4-2。
表4-2离婚分财产
排序 |
安娜 |
汤姆 |
1 |
冰箱 |
电脑 |
2 |
缝纫机 |
烟斗 |
3 |
自行车 |
书桌 |
4 |
书桌 |
自行车 |
5 |
电脑 |
冰箱 |
6 |
烟斗 |
缝纫机 |
于是,选择的结果是:安娜选了冰箱、缝纫机和自行车,而汤姆选了电脑、烟斗和书桌。安娜得到了6件物品中她认为价值最高的3件物品,汤姆同样得到了他希望得到的价值在前3位的物品。两人对分配均满意。
这是一个双赢分配。
勃拉姆兹的这里给出的分配方法,类似于我们小时候玩游戏时对人员的分配方法。一群小伙伴要被分成两组进行如“斗鸡”、“攻城”,或者“踢足球”等这样的游戏,两个最强的或两个最弱的小伙伴轮流“要”人,或通过“锤子剪刀布”的方式赢家先“要”人,直到人员分配完毕,两个实力大致相当的游戏队伍便形成了。
勃拉姆兹方法所实现的“双赢”分配,其基础是:我们假定了他们对不同的物品的估价“差别较大”,或者说不同物品在不同的人那里其“效用”是不同的。为了分析这里的分配是双赢的结果,我们设定他们对每件物品进行打分,假定满分为100分,安娜和汤姆分别将这100分分配给不同的物品。见表4-3:
表4-3
排序 |
安娜 |
汤姆 |
1 |
冰箱 |
28 |
电脑 |
30 |
2 |
缝纫机 |
22 |
烟斗 |
25 |
3 |
自行车 |
20 |
书桌 |
20 |
4 |
书桌 |
15 |
自行车 |
15 |
5 |
电脑 |
10 |
冰箱 |
5 |
6 |
烟斗 |
5 |
缝纫机 |
5 |
这样,安娜总共得到了70分,而汤姆得到了75分。两人分配得到的结果大大超过了50分。[13]
如此看来,这样的分配确实是双赢的。
在上述的分配中,我们假定了安娜和汤姆对不同物品的估价或者排序是不同的。如果他们的估价差不多,情形又将如何?
假定安娜和汤姆对不同物品估价后进行的排序为表4-4。与前面一样,同样是安娜先选择,然后是汤姆,接着是安娜……
在这样的选择中,如果每个人进行的选择是诚实的,即每个人进行选择时,都是从剩下的物品中选择自己认为价值最高的物品,那么结果是:安娜选择了冰箱、自行车和缝纫机;而汤姆选择了电脑、烟斗和书桌。
表4-4 诚实的选择
排序 |
安娜 |
汤姆 |
1 |
冰箱 |
电脑 |
2 |
电脑 |
烟斗 |
3 |
自行车 |
书桌 |
4 |
书桌 |
自行车 |
5 |
缝纫机 |
冰箱 |
6 |
烟斗 |
缝纫机 |
在这个分配中,安娜获得了她认为的价值“第一”,“第三”和“第四”的物品,而汤姆获得了他认为价值“第一”、“第二”和“第六”的物品。
这样的分配对双方来说,虽然不是最好的结果,但是双方应该对这个分配结果感到满意的。
在这个例子中,聪明的读者会想到:安娜第一次不选择冰箱,而先选择电脑,情形会怎样呢?即:安娜的选择是策略性的,而不是诚实的。因为,安娜知道在汤姆那里电脑排第一,而冰箱排倒数第二。安娜第一次选择了电脑,轮到汤姆选择时,汤姆不会选择冰箱,而选择了烟斗。结果见表4-5。
在表4-5中,安娜得到了她认为的最值钱的前三位东西。汤姆得到了他认为的第二、第三及第六位价值的物品。
表4-5 策略选择
排序 |
安娜 |
汤姆 |
1 |
冰箱 |
电脑 |
2 |
电脑 |
烟斗 |
3 |
自行车 |
书桌 |
4 |
书桌 |
自行车 |
5 |
缝纫机 |
冰箱 |
6 |
烟斗 |
缝纫机 |
在这个例子中,如果汤姆对自己的分配所得的结果不满意,他同样可以采取策略行为。当他看到安娜采取策略性行为而选择了电脑时,论到他选择时,他先选择冰箱!尽管冰箱在他看来价值最低,但他知道冰箱在安娜那里价值最高,当他选择了冰箱后,他可以用它与安娜交换电脑!这样一来,情形就较复杂。读者不妨自己分析此时的结果。
如果双方对物品的估价一样,此时的分配便无法做到双赢了。这样的分配问题演变成一个“常和博弈”:双方所得之和为一个常数,一方如果分配所得多了,另外一方的所得便少了。我们这里不对这个问题进行探讨。
七、《塔木德》中的分配困惑与破产问题
《塔木德》(Talmud)为犹太法典,它有许多版本。在公元初的5个世纪里《塔木德》在犹太人的生活中起着重要作用。
在《塔木德》中有这样一个被称为婚姻契约问题。某个男人要与他的三个妻子订立一个婚姻契约,这个契约是关于如何在三个妻子间分配他死后财产的。他可能的财产为100,200,300。法典给出了一个似乎有矛盾的分配建议:当男人死后,若留下的财产为100,则平均分配;而如果留下的财产值300,则按(50,100,150)来分配;蹊跷的是,当财产为200的时候,法典建议按(50,75,75)分配。这个问题困扰了《塔木德》研究者2000年。这个问题终于在1985年被博弈论专家奥曼和马希勒所解决。
奥曼和马希勒认识到,《塔木德》预示着合作性博弈理论。我们在第一章已经对博弈做了分类,博弈分合作性博弈和非合作性博弈。合作性博弈又称联盟博弈,在合作性博弈中的核心问题是,如何在联盟成员间分配利益。根据这两位博弈论专家的分析,《塔木德》所建议的遗产分配方案的每个解,都在博弈的“核”之中,因而都是合理的。
在这个遗产问题中,当财产为100时,假定每个妻子的分配是(A1,A2,A3),那么这三个数字必定大于等于0。但是某些分配方案是不会采取的,比如方案(30,30,30)不可能被采取,因为其总和小于100,此时至少存在一个使每个人的好处都提高的更好的方案,如(20,20,60)等等。因此,(30,20,30)是一个“被占优的”。那么能够对(20,20,60)这样的方案进行进一步改进,而使得所有人的财产都提高或至少没有人降低吗?不能。所有的不能被改进的方案集合构成合作性博弈的“核”。
当财产总数为100时候,这个合作性的博弈的核为:
A1+A2+A3=100
A1≥0,A2≥0,A3≥0
被建议的方案(100/3,100/3,100/3)在核中。
在遗产为200的情况,我们假定每个人的分配为(B1,B2,B3)。那么核为:
B1+B2+B3=200
B1≥0,B2≥0,B3≥0
同时我们注意到,遗产为100时,假定三个妻子接受了分配方案,当遗产增加到200后,每个妻子所得的必定要大于遗产为100的时候,或至少不能少!
即:B1≥ A1
B2≥A2
B3≥A3
我们可发现(50,75,75)在这个核中,并满足上述条件。
同理,在遗产为300时的分配(C1,C2,C3),核为:
C1+C2+C3=200
C1≥0,C2≥0,C3≥0
并且在这个分配中,每个人所得不少于遗产总数为200的时候:
C1≥ B1
C2≥B2
C3≥B3
分配(50,100,150)在核之中,并且满足上述条件。
由此可见,《塔木德》中的分配符合合作性的博弈理论。当然,读者要问,为什么是这样的分配,而不是其他的分配(因为有许多方案均在核中)?这取决于具体的背景情况,这些妻子各自给出了她们应当多分的理由,这些理由使得不同情况下分配方案不同。
这个问题中的遗产分配之所以被博弈论专家所分析和探讨,是因为这个问题与一个重要的经济问题有共同的结构,这个经济问题便是破产问题。
在这个遗产问题中,妻子们要将丈夫遗留下的财产全部分割而不剩下,以偿还丈夫“欠”他们的。这与企业破产后法院对企业的财产进行分割是一样的。企业之所以破产是因为它的负债之和超过其财产总值。当企业资不抵债,便根据法律程序宣布破产。宣布破产后,企业的全部资产不够偿还各个债主的债务总和,各个债主一定程度地分得剩余资产的一部分,他们所获得的不一定能够补偿他们应得的财产。通过清理和偿还,破产企业的资产将被分割完毕。企业破产后法院往往不是根据比例将所剩下财产进行“平均”判赔。每个债权人都会给出自己应当首先被偿还的“理由”,法官根据所给的理由进行判赔。
对该例所涉及到的破产的理论分析可见奥曼和马希勒的论文:对《塔木德》中的一个破产问题博弈分析[14]。
第九章 理性的界限
一、蜈蚣博弈悖论
倒推法是分析完全且完美信息下的动态博弈的有用工具,在第五章我们分析言语博弈中“威胁”或“承诺”是否可信时,已给出了一个倒推法例子。我们看到,倒推法符合我们的直觉。然而,通过下面的蜈蚣博弈的悖论,我们将看到倒推法存在致命的缺陷。
蜈蚣博弈是由罗森塞尔(Rosenthal)与1981年提出的。它是这样一个博弈:两个参与人A、B轮流进行策略选择,可供选择的策略有“合作”和“背叛”(“不合作”)两种。假定A先选,然后是B,接着是A,如此交替进行。A、B之间的博弈次数为有限次,比如198次。假定这个博弈各自的支付给定如下:
A B A A B (100,100)
(1,1)(0,3) (2,2) (99,99) (98,101)
A、 B是如何进行策略选择的?
这个博弈因形状像一只蜈蚣,而被命名成蜈蚣博弈。
这个博弈的奇特之处是:当A决策时,他考虑博弈的最后一步即第198步;B在“合作”和“背叛”之间作出选择时,因“合作”给B带来100的收益,而“不合作”带来101的收益,根据理性人的假定,B会选择“背叛”。但是,要经过第197步才到第198步,在197步,A考虑到B在198步时会选择“背叛”——此时A的收益是98,小于B合作时的100,那么在第197步时,他的最优策略是“背叛”——因为“背叛”的收益99大于“合作”的收益98……如此推论下去,最后的结论是:在第一步A将选择“不合作”,此时各自的收益为1,远远小于大家都采取“合作”策略时的收益:A:100,B:100。
根据倒推法,结果是令人悲伤的。从逻辑推理来看,倒推法是严密的,但结论是违反直觉的。直觉告诉我们,一开始就采取不合作的策略获取的收益只能为1,而采取合作性策略有可能获取的收益为100。当然,A一开始采取合作性策略的收益有可能为0,但1或者0与100相比实在是太小了。直觉告诉我们采取合作策略是好的。而从逻辑的角度看,一开始A应取不合作的策略。我们不禁要问:是倒推法错了,还是直觉错了?
这就是蜈蚣博弈的悖论。
什么是悖论?悖论(paradox)来源于希腊语,para意即“超越”,doxos的意思是“相信”。Paradox的意思是:本来可以相信的东西不能相信,而有的东西看起来不可信但是反而是正确的。悖论指由肯定它真,就推出它假,由肯定它假,就推出它真的一类命题。在历史上有许多悖论。如“阿基里斯赶不上乌龟”的芝诺悖论,“一个克里特人说‘所有克里特人都说谎’”的说谎者悖论,“一个理发师说:‘我给所有不给自己理发的人理发’”的理发师悖论或罗素悖论,等等。这些悖论在历史上对于逻辑和数学的发展起了巨大的作用。
对于蜈蚣悖论,许多博弈专家都在寻求它的解答。在西方有研究博弈论的专家做过该方面的实验[15]。通过实验发现,不会出现一开始选择“不合作”策略而双方获得收益1的情况。双方会自动选择合作性策略,从而走向合作。这种做法违反倒推法,但实际上双方这样做,要好于一开始A就采取不合作的策略。
倒推法似乎是不正确的。然而,我们会发现,即使双方开始能走向合作,即双方均采取合作策略,这种合作也不会坚持到最后一步。理性的人出于自身利益的考虑,必定在某一步采取不合作策略。倒推法必定在某一步要起作用。只要倒推法在起作用,合作便不能进行下去。
这个悖论在现实中的对应情形是,参与人不会在开始时确定他的策略为“不合作”,但他难以确定在何处采取“不合作”策略。
二、最后通牒博弈中理性的困境
有这样一个博弈——该博弈被称为最后通牒博弈:
两人分一笔总量固定的钱,比如100元。方法是:一人提出方案,另外一人表决。如果表决的人同意,那么就按提出的方案来分;如果表决人不同意的话,两人将一无所得。假定该最后通牒博弈的参与人为A和B,其中A提分配方案,B表决。比如,A提的方案是70∶30,即A得70元,B得30元;如果B接受,则A得70元,B得30元;如果B不同意,则两人将什么都得不到。该博弈的结果是什么?
A要根据B的反应来提出方案,以使自己得到做多。A这样推理:根据理性人的假定,A无论提出什么方案给B——除了将所有100元留给自己而一点不给B留这样极端的情况,B只有接受,因为B接受了还有所得,而不接受将一无所获——当然此时A也将一无所获。此时理性的A的方案可以是:留给B一点点比如1分钱,而将99.99元归为己有,即方案是:99.99∶0.01。B接受了还会有0.01元,而不接受,将什么也没有。
这是根据理性人的假定的结果,而实际则不是这个结果。英国博弈论专家宾莫做了实验,发现提方案者倾向于提50∶50,而接受者会倾向于:如果给他的少于30%,他将拒绝;多于30%,则不拒绝。
这个博弈反映的是“人是理性的”这样的假定在某些时候存在与实际不符的情况。理论的假定与实际不符的另外一个例子是“彩票问题”。
我们说理性的人是使自己的效益最大,如果在信息不完全的情况下则是使自己的期望效益最大。但是这难以解释现实中人们购买彩票的现象。
人们愿意掏少量的钱去买彩票,如买福利彩票、体育彩票等,以博取高额的回报。在这样的过程中,人们自己的选择理性发挥不出来,而惟有靠运气。在这个博弈中,人们要在决定购买彩票还是决定不买彩票之间进行选择,根据理性人的假定,选择不买彩票是理性的,而选择买彩票是不理性的。
彩票的发行与购买行为为零和博弈。彩票的命中率必定低,并且命中率与命中所得相乘必定低于购买的付出,因为彩票的发行者早已计算过了,他们通过发行彩票将获得高额回报,他们必定能够获得高回报;而他们的高回报意味着彩民的高付出。因此,在这样的博弈中,彩票购买者是不理性的:他未使自己的期望效益最大。但在社会上有各种各样的彩票存在,也有大量的人来购买。可见,理性人的假定与实际中进行决策的人之间存在一定的距离。
三、陈水扁上台与民主选举的不可根除的缺陷
蜈蚣博弈的悖论反映了在一个博弈中单个参与人策略选择的困难。理性的个体为了利己,结果确不能利己。蜈蚣博弈悖论是单个决策者的决策悖论,它反映了个体理性的局限。
在集体进行决策时同样也面临着理性的局限。
2000年台湾所谓“总统”选举可以说是中国发生的一件大事。对于中国大陆来说,谁来做台湾新的领导人意味着台湾的未来走向,即:独立还是统一。而对于台湾人民,新的领导人的未来政策意味着给他们带来灾难还是福祉。
选举的结果是民进党的陈水扁上台,陈水扁成了台湾第一任“民选总统”。国民党自1949年逃到台湾51年后,终于通过民主规则和平地交出了政权。现在大家不禁要问:作为台湾第一大党的国民党为什么输给了弱小的民进党?陈水扁上台真的意味着台湾的“民意”吗?
2000年的那次选举的结果是李登辉“弃连保扁”的阴谋得逞。李登辉是国民党主席,国民党跑到台湾,其政治主张是一个中国,长期抱着反攻大陆的思想。随着共产党在大陆的渐渐强大,国民党认识到反攻大陆是不现实的,然而有大陆情结的国民党虽然与共产党势不两立、一山不能容纳二虎,但因其坚持“一个中国”的立场,国民党执政期间,不存在台独泛滥问题。
然而到了李登辉时代,情形发生了变化,在国民党内部分裂成主张统一的“统一派”和主张独立的“独派”。骨子里主张台独、并有日本情结的李登辉,由于身为国民党主席,无法施展他内心的政治主张,而只能从所谓理论上“论证”台湾与大陆的不同、台湾独立的合理性,这就是臭名昭著的“两国论”、“七国论”。在理论上他要阐述他的“政治思想”,以成为台湾所谓的“国父”;在行动上他找到了与他内心政治主张一致的人,这就是主张台湾独立的民进党主席陈水扁。因而作为国民党主席的李登辉,在实际行动上支持陈水扁。
国民党被李登辉“玩残”,他真独立的主张使国民党发生分裂。主张统一的宋楚瑜被李登辉开除出党。宋楚瑜原来是李登辉政治上坚强的合作伙伴,因为他的资历,他得到大批的国民党党员的拥护。李登辉与宋楚瑜分道扬镳使得宋楚瑜另立山头,成立了亲民党。国民党被李登辉肢解。
此次台湾选举是所谓的“民主选举”,各党派“平等竞争”。从理论上讲,弱小的党派获得选举胜利可能吗?我们将在下一节从理论上简单地阐述这是可能的,但是需要一定的条件。我们先来看一下陈水扁是如何上台的。
李登辉推出连战作为国民党的“总统”候选人,但是身为国民党主席却在不同场合下支持陈水扁,使得民进党得以快速发展。“总统”的竞争最后在宋楚瑜、 陈水扁、连战以及独立候选人李敖四者之间角逐。最后,陈水扁以微弱优势获胜,而宋楚瑜和连战均告失败。
大家想一想,如果李登辉不耍“弃连保扁”的政治伎俩,或者维护国民党的统一而不使其分裂,使得国民党只有一人参加竞选,那么支持宋楚瑜加上连战的总票数必定超过陈水扁。
另外一种情况是,假如台湾选举不是直选,选举规则是先角逐出两个而不是多个候选人,然后再在这两个候选人之间进行竞选,会出现什么结果呢?我们可以看一下,假定陈水扁能顺利过第一关而成为两个候选人之一,而宋楚瑜、连战有一个成为候选人,假定是连战,在连战与陈水扁之间的最后角逐中,支持宋楚瑜的选民这次会支持连战——因他们的政治主张相近,那么连战获胜的机会必定大于陈水扁。但是事实上不是这样,台湾选举是直接选举,各候选人同时竞选,国民党因分裂而使票数分散,陈水扁得以上台。
现在我们来看一下中国申办2000年奥运会失败的例子。北京1992年开始大张旗鼓地申请主办2000年奥运会的工作。申办奥运会的投票规则是逐步淘汰制,具有投票权的委员在参加申请的城市里进行投票,得票最少的城市便被淘汰。前两轮投票中北京一直领先。经过两轮投票,最后剩下3家:德国的柏林、澳大利亚的悉尼以及中国的北京。在第三轮投票时,北京获得最多的票,悉尼第二,柏林第三。
这一轮投票结束后,柏林被淘汰掉。如果这是最终投票,那么北京获胜无疑。但问题是还得再投一次票。当在北京与悉尼之间角逐时,北京必定会再次获得胜利吗?
事实是,北京输了,悉尼获得了举办2000年奥运会的主办权。为什么会这样?原因在于,原来支持柏林的投票人中的大多数转而支持悉尼,北京输了。
民主投票不能得出惟一的结果,其选举结果取决于民主投票的程序安排以及每次确定的候选人的多少,即投票规则。不同的投票规则将得出不同的选举结果。这就是说,民主投票有内在的缺陷。
四、通过民主的方式能使少数人支持的候选人赢吗?
读者会问,能不能通过所谓民主选举而得出任意结果呢?
如所有投票人的偏好都相同,任何制度下的选举结果都是一样的。假定一次性选举时所有人都选某一个人——即所有人都认为该候选人最应该当选,那么在任何的选举规则下,无论独裁的还是不同民主规则下的选举,这个人必定当选。在这种极端情况下,无论什么制度,选举结果都一样,独裁制度也会得出这个结果。反之,如果所有人都不选某一个人,无论是民主的选举制度,还是独裁的选举制度,也都会得出同样的结果,即该候选人都不会被选上。这就是为什么独裁者都认为,他是人民的代表,他的决定代表着民意,因为代表着民意意味着你们对所有的决定不要再表达自己的意见了,我的意见就是你们的意见,即使通过民主的方式,也是同样的结果。这就是独裁者经常强奸民意的理论根据。
而当人们的偏好不同时,民主选举程序的规则设计就极大地影响着选举结果。
我们举一个例子。一由n人组成的社会,假定n取300,对候选人A、B进行选举,并假定进行一次性投票,有2/3的人即200人反对A而选B,1/3的人即100人选A而不选B。我们有没有办法设计一个结构,通过“民主的”投票规则使A能够当选呢?这是可能的。
假定该群体成员都同意“大多数规则”,但程序可以商量。我们把这300人构成3组。若候选人获得某组的大多数选票,他就赢得这组的选举,3组中赢得2组即赢了。在实际中这些是任何候选人都能同意的规则,并且也是公平的规则。
我们假定每组的人数不是一样的:第一组是50人,第二组是100人,第三组是150人——我们这里人数的确定完全是随意的。假定第一组中有30人赞成A而反对B,第二组中有60人赞成A而反对B,第三组中10人赞成A而反对B。即:第一组A与B的比例是:30∶20;第二组A与B的比例是:60∶40;第三组A与B的比例是:10∶140。
在这样一种规则下进行投票,A获得了3组中2组的赞成票。
A获胜。
在这个例子中,如果不分组就选一次,那么B必定获胜。
这个例子中,使B获胜的是直选机制,使A获胜的是间接选举机制。台湾采取的是前者,美国采取的是后者。
布坎南在《同意的计算》[16]中举了另外一个例子。一个25个人组成的社会,只需要9个人的同意票某个议案就可使得它通过。具体做法是,将这25个人分成5个区,每个区5个人,这样,只要有3个区(5个区中的多数)中的多数人同意,即每个区有3个人同意就能使一项议案通过。
具体地,我们将25个人分成A、B、C、D、E共5个区。同意改议案者被分在A、B、C三区,见下表中,*表示对议案“同意”的人。
表9-1
A |
B |
B |
B |
E |
* |
* |
* |
|
|
* |
* |
* |
|
|
* |
* |
* |
|
|
|
|
|
|
|
|
|
|
|
|
这样在“大多数”原则下使一项议案得到通过,尽管可以有16人不同意。如果是36961人(199×199)的一个社会,只需10000人就可使一项议案获得通过,只比总数的1/4多一些,而无须多于1/2的人同意。我们用此方法对两个候选人或候选议案进行选举或进行表决,可以使其中本来获得少数人同意的当选。
这说明民主选举有其局限性,当然这并不是说民主选举是虚伪的和带欺骗性的,更不能构成不进行民主选举的理由。正如有一篇讨论民主与丑闻的文章里说的那样,民主选举不是绝对好的,但反民主绝对是坏的。在民主社会里,罪恶被最大限度地暴露出来,并受到谴责,因此抑制了更多的罪恶;而在反民主的社会里,罪恶被最大限度地掩盖起来,于是往往导致更大的罪恶。斯塔尔法官对克林顿与莱温斯基的性丑闻穷追不舍,克林顿为此不得不在电视上公开道歉。总统没有绝对的权力,他也有服软的时候。
选举是揭示群体偏好的一种方法,我们这里要说的是,一群体进行的所谓民主选举并不能客观地揭示一群体成员的偏好。
五、 投票悖论与阿罗不可能性定理
在对陈水扁当选“总统”的分析中,我们可看到民主选举的结果取决于规则与程序。通过个人的偏好而揭示群体的偏好是福利经济学研究的对象,而著名经济学家阿罗提出的不可能性定理(被称为阿罗不可能性定理),对人与人组成的社会的群体理性作了分析。
我们来看这样一个群体决策。假定有3个群体(可以是3个人),他们对备选方案A、B、C进行表决。方法是两两进行比较,即让投票者对3个方案中的两个进行分别表决,然后再根据大多数规则决定哪个方案胜出。假定这3个群体的偏好关系如下:
表9-2 一个可能的偏好顺序
群体1 |
群体2 |
群体3 |
A |
B |
C |
B |
C |
A |
C |
A |
B |
我们先让投票者对A和B进行投票。由于群体1和群体3均认为“A优于B”,群体2认为“B优于A”,这样,在这轮投票中A以2比1战胜B。
我们再让这三个群体对B和C进行投票。群体1和群体2认为“B优于C”,群体3认为“C优于B”,投票结果是:B以2比1战胜C。
既然A战胜了B,B又战胜了C,似乎是,如果对A与C进行投票,A应当战胜C。对于任何一个理性的投票人,这是自然的。但是,当群体对A和C进行投票时,C以2比1战胜了A!
这就是阿罗悖论,又称为孔多塞投票悖论、循环投票悖论。当然,投票中不是任何时候都会产生投票悖论。三个群体对3个方案的可能偏好状态为216个,出现悖论的状态是6个,即悖论的可能性是1/36即2.78%。
投票悖论这个现象所反映的问题具有重大的理论意义,它反映了在社会加总成员偏好过程中,存在致命的缺陷,这正是著名的“阿罗不可能性定理”所揭示的。
这个例子反映的道理是深刻的。如果社会对几个方案进行表决,如国家选举总统、某个城市让市民决定先修建哪个公共事业工程,等等,这个例子说明,社会投票很可能得出矛盾的结果。
对于社会的选择问题,阿罗认为,在非独裁的情况下,不存在任何加总社会个体成员偏好的方法。
所谓加总社会偏好即找到一个社会偏好函数,阿罗提出了这样的函数要满足4条公设:第一,定义域不受限制,即适合所有的个人的偏好类型;第二,非独裁,即社会偏好不以一个人或少数人的偏好来决定;第三,帕累托原则,即所有人的偏好都认为a优于b,那么社会偏好也是a优于b;第四,独立性,即不管个人对除了a与b的其他的偏好顺序发生什么变化,只要所有个人对a与b的偏好不变,那么社会对a与b的偏好不变。
这4条公设是基本的,或者自明的。但是,阿罗论证了不存在这样的社会福利函数。我们设计出来的揭示偏好的选举方法,其结果不具有传递性,从而会产生矛盾。我们在数学中的“大于(>)”的关系是具有传递性的:如果a>b,并且b>c,那么a>c。如果社会选举的结果是“a优于b”,“b优于c”并且“a优于c”,那么社会偏好就是满足传递性的,但事实上,在非独裁的情况下我们往往做不到。这就是阿罗不可能性定理的意思。
阿罗定理指的是,社会没有一种客观地反映群体的社会偏好的方法。如果某种偏好得以反映出来,如台湾陈水扁当选“总统”,或者小布什而不是戈尔当选美国第53任总统,那完全取决于所确定的“民主”的选举规则。另外一套规则得出的完全可能是另外一种结果。
戈尔比小布什多几十万张选票,然而美国实行的投票人制度是,谁获得了某一州的多数票,那么他就获得该州所分配的选举人的选票,小布什与戈尔之争的关键是佛罗里达州的选举结果,小布什获胜就在于他以微弱优势获得了佛罗里达州的25张选举人票。最后,小布什与戈尔的选票之比为277∶266。小布什获胜。
你会说,通过一次性投票来决定谁当选,即对候选人或候选方案进行一次性表决,这应该是合理的。但是,这很有可能让选民最不喜欢的人或方案当选。
举一个例子。假定有4个候选人,他们是A、B、C、D,假定有26%的人“最喜欢”A,各有25%的人“最喜欢”B和C,有24%的人“最喜欢”D。现在进行一次性投票,A当选。而很有可能的是“最喜欢”B、C、D的那些人“最不喜欢”A,即:“最不喜欢”A的人有74%!在这种规则下,最多人“最不喜欢”的候选人当选了!这样的规则合理吗?很有可能的是,台湾的陈水扁就是这里的A。
如果有一种确定了的规则,并且候选人的竞选纲领在选民心里得到确切的定位,即每个选民对不同的候选人确定了其偏好程度,那么结果是确定的。而为什么不同的候选人同意同样的规则呢?因为,每个候选人总会尽量以其竞选纲领及个人魅力赢得选民的偏好。这里有一个真理:假如你的竞选纲领及个人魅力赢得了所有的选民,即对所有选民进行偏好排序,你都是在最前面的,那么在任何选举规则下你都会被选中。同样,如果你永远排在最后面,那么无论什么规则,你都不会选中。这一点可以用数学证明。
同时,候选人接纳某种民主的选举规则而参与竞选,是因为他无法预先知道每个选民的偏好。民主的选举是人们以此来揭示选民的心理排序情形的方法。阿罗不可能性定理正说明了人的有限理性的悖论。
此外,阿罗定理说的是,社会的选择方法不可能既是有效率的,又是民主的。因为循环投票本身就是无效率的,而有效率的方式必须是独裁的。这就再次揭示了民主和效率的矛盾。当然也有可能是,有效率的独裁方式能够揭示民意——当独裁者和所有的臣民想法相同,但是现实中怎么知道臣民的偏好呢?除非他是上帝,否则揭示臣民的偏好必须通过某种方式,即通过民主的程序来进行。这就是为什么中国的封建统治者常常以上天的儿子即“天子”自居。
六、革命:另外一种投票方式
投票是加总社会中各个人偏好的一种方式。我们已说明,无论哪种投票制度都是不完善的,之所以采用是因为对所有的候选人来说是公平的。对于群体选择,或者表达群体偏好,还存在另外的方法——革命,或者如毛泽东所说的“枪杆子里面出政权”。革命是极端的投票方式。一个合理的社会将不断地调整社会财富的分配,如所得税率实行低收入低征乃至于不征,高收入按高比率征收的方法。当财富集中在少数人手里时,两极分化严重,社会出现极度的不公正,对一社会来说隐藏着巨大的社会危机。危机意味着革命的发生。
什么是革命?革命是政治学范畴,如果从经济学范畴来说,革命就是社会财富的再分配。在经济学里有边际效用递减规律。所谓效用是指物品对人的需要或欲望的满足程度,而边际效用指的是消费者在消费物品时所消费的每一单位物品给他的满足程度。比如:某人一顿吃了3碗饭,每一碗饭给他一个效用;一富豪买了一辆奔驰车后又买了第二辆奔驰车,他买第一辆奔驰车和第二辆奔驰车时的满足程度是不同的。这就是边际效用的概念。
边际效用递减规律说的是,消费者在消费物品时,每一单位物品对消费者的效用是不同的,它们呈递减关系。无论是饿着肚子的人还是饱食终日的人,第一碗饭给他的效用最大,第二碗饭则没有那么大的效用了,吃到一定程度后,再吃的话,饭给他的效用是负的,即不仅不能给他好处,反而是负担。对买车的人也一样,当他买了第一辆奔驰车时,他感到方便很多,同时有巨大的心理满足感。当他买第二辆奔驰车时,他不能同时用两辆车,这第二辆车给他的方便及满足感会没有第一辆车大。当然第二辆车会体现他的成功,从而增加他的炫耀资本,此时总的效用是增加的,但增加的幅度没有他买第一辆车时增加的幅度大。如果他继续购买车,他想,买了车后,既要雇司机,又要准备停车的车库,同时要防范窃贼的光顾,等等,会感觉到得不偿失。这第三辆车给他带来的效用更低了。
可以这么认为,边际效用递减规律是关于人的规律,正如诺贝尔奖获得者H.西蒙提出的关于人的理性是有限的看法,它们均为关于人的假设。
人的边际效用是递减的,那么将财富从富人那里部分地转移到穷人那里似乎是合理的,此时富人的效用减少了,但减少得不多,但穷人增加的效用则很大。如果一个社会贫富悬殊过大,政府又没有调节好贫富之间的关系,那么革命就有可能发生。
劫富济贫从来就是不合法但被颂扬的行为,因为它增进了大多数人的效用,在政府无力的时候,这是惟一的增进社会总的效用的方式。抢夺富人接济穷人,或者因生活潦倒、无法生存而去抢夺富人的东西以活命,同样增进社会的效用。当然,抢劫穷人的物品来为自己享用是土匪行径,这种行为是可耻的。
从这个意义上说,革命就是多数人通过暴力对少数人的财富进行剥夺和再分配,因此它是一种偏好的表达方式,是非和平的方式,而不像投票那样的和平方式。之所以要采取暴力的方式,是因为,一般情况下,理性的财富拥有者是不会自动地将财富分给穷人的,慈善者除外。
革命不同于民主的选举方式和民主化的决策方式,革命是非理性的。如果一个社会有合理地表达人民意愿(或偏好)的程序或方法,那么革命就不会发生。但是正如我们上面说的那样,由于不可能有一种绝对合理的民主决策方式,任何决策方式本身都只是一种在某种程度上揭示偏好的方法而已。因此,任何社会都不能排除革命的可能。
在民主社会里人民的偏好得到一定程度的表达,发生革命的概率较低。一般情况下,革命不是发生在专制社会里,就是发生在前民主的社会里,前者完全没有表达人民意愿的机会,后者表达人民意愿的机制尚不完善。一个完善的社会制度存在一个渐进完善的机制,可以在某种程度上化解革命的发生,这样才能避免社会震荡。
中国古代的朝代更替就是震荡式的。专制社会没有人民表达意愿的机会,再加上“家天下”的政治机制不存在“退出”机制,人民只能以激烈的方式来表达自己的意愿。
因此,对于社会来说,关键不在于它现在的体制多么不完善、政治架构多么不合理,而在于它是否有一个合理改进的机制,从而使得制度渐进合理。
[1]用支付矩阵表示一个两个人的博弈为2005年诺贝尔经济学奖得主托马斯·谢林所发明。
[2] 纳什夫妇于2002年夏到中国参加世界数学大会。期间,中央电视台主持人水均益采访了纳什夫妇。采访结束后,水均益送给纳什夫妇的礼物是一副中国麻将!
[3]这个博弈有一个纳什均衡:其中一个出价人叫出100元的竞标价,另外一个人不出价(因为在对方叫出100元的价格后,他继续叫价将是不理性的)。出价100元的参与人得到该物品。
[4]赌博赌的不仅仅是机会,而且赌所拥有的资源。因此,从理论上讲,赌徒与赌场之间的博弈如果是多次的,那么赌徒必定输的,因为赌场赢的机会大于赌徒,同时赌徒的“资源”与赌场的“资源”相比实在太小了。如果你的资源与赌场的资源相比很大,那么赌场有可能输;与赌场相比如果你的资源(比如你的后盾是某个国家)无限大,只要你有非0的赢的可能性,那么赌场的财产必定成为你的财产。
[5]所谓“零和博弈”是指,博弈各方在各种可能性下的得益之和均为一常数零;常和博弈是指,博弈各方在各种可能性下的所得之和为一个非零常数;而“变和博弈”指的是博弈各方在不同情况下的所得之和为变数或变量。
[6] 假定司机在选择“左”还是“右”时没有选择的提示,此时司机选择“左”“右”是等可能性的,发生不能通行或相撞的可能性即概率为1/2!
[7]这也是警察在办案中经常用到的方法。多个犯罪嫌疑人可事先通过“约定”而欺骗警察。但犯罪嫌疑人不可能事事都预先进行约定。若在某个事情上他们说的是真话,所有相关问题上的回答都应当是一致的;若是假话,总会存在某个问题,他们的回答是不一致的,因此,通过意想不到的问题警察能够分清事情的真假。
[8]另外一个被隐含的知识(implicit knowledge)的概念同样是分析社会现象的有用概念。根据某个群体中的某些人或所有人的掌握的知识“推理”得到的知识便是隐含的知识。这个隐含知识是该群体中的每个人都不知道的,但他们所知道的知识汇聚起来可得到这个知识。如:甲知道“A爱B或C中的一个”,乙知道“A不爱B”。那么我们可以根据甲乙所知道的知识推理得,“A爱C”,这便是隐含的知识,它是甲、乙所不知道的,但他人可根据他们的知识进行推理而得到的。
[9]Ronald Fagin,Joseph Y.Halpern,Yoram Moses,Moshe Y.Vardi:Reasoning about knowledge,MIT Press,1995。
[11] L.S.Shapley and M. Shubik, A method for evaluating the distribution of power in a committee system, American Political Science Review 48(1954) 787-92.
[12] 1965年后,联合国安理会增加了4个非常任理事国,有5个常任理事国和10个非常任理事国。10个非常任理事国的夏普里—舒比克权力指数和为:1.86%;5个常任理事国的夏普里—舒比克权力指数为1-1.86%=98.14%。
[13]勃拉姆兹在《双赢解》一书中还提出了分配的“无嫉妒原则”。这里,安娜的所得为70分,汤姆的所得为75分。安娜嫉妒汤姆,认为他的所得超过自己。勃拉姆兹提出,可以让汤姆补给安娜2.5分值的东西,这样,安娜的心理就平衡了。此时双方都不会产生嫉妒心理。
[14] Aumann, R. J. and M. Maschler, (1985), Game Theoretic Analysis of a Bankruptcy Problem from the Talmud, Journal of Economic Theory 36, 195-213
[15] 通过实验验证集体的交互行为已成学术研究的时尚,2002年诺贝尔经济学奖便授予了实验经济学的先驱丹尼尔·卡尼曼和弗农·史密斯。
[16]布坎南,塔洛克:《同意的计算》,中国社会科学出版社,2000年版,第242页。