鱼为什么永远是鱼：怎样突破困境

2009-03-10 来源：价值中国浏览数：2881

    若对方沉默、背叛会让我获释，所以会选择背叛。
    若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。
    二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。

    这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑半年，总体利益更高，结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。
    一般形式
    整理囚徒困境的基本博弈结构，可更清楚地分析囚徒困境。实验经济学常用这种博弈的一般形式分析各种论题。以下是实现一般形式的其中一例：
    有两个参与者和一个庄家。参与者每人有一式两张卡片，各印有“合作”和“背叛”。参与者各把一张卡片文字面朝下，放在庄家面前。文字面朝下排除了参与者知道对方选择的可能性1。然后，庄家翻开两个参与者卡片，根据以下规则支付利益：
    一人背叛、一人合作：背叛者得5分（背叛诱惑），合作者0分（受骗支付）。
    二人都合作：各得3分（合作报酬）。
    二人都背叛：各得1分（背叛惩罚）。
    用支付矩阵表格展示支付如下（以红和蓝分别表示二参与者）：
    一般形式囚徒困境的支付矩阵合作背叛