15、破解囚徒困境的方法可以通过建立长期关系，使得囚徒困境可以多次重复。

第1题：

请论述“囚徒困境”的经济学意义。

正确答案：

回答此问题，可以参考教材以及以下资料【囚徒困境是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。单次发生的囚徒困境，和多次重复的囚徒困境结果不会一样。

　　在重复的囚徒困境中，博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时，合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服，从而可能导向一个较好的、合作的结果。作为反复接近无限的数量，纳什均衡趋向于帕累托最优。

　囚徒困境的主旨为，囚徒们虽然彼此合作，坚不吐实，可为全体带来最佳利益（无罪开释），但在资讯不明的情况下，因为出卖同伙可为自己带来利益（缩短刑期），也因为同伙把自己招出来可为他带来利益，因此彼此出卖虽违反最佳共同利益，反而是自己最大利益所在。但实际上，执法机构不可能设立如此情境来诱使所有囚徒招供，因为囚徒们必须考虑刑期以外之因素（出卖同伙会受到报复等），而无法完全以执法者所设立之利益（刑期）作考量。

经典的囚徒困境

　　1950年，由就职于兰德公司的梅里尔•弗勒德（Merrill Flood）和梅尔文•德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问艾伯特•塔克（Albert Tucker）以囚徒方式阐述，并命名为“囚徒困境”。经典的囚徒困境如下：

　　警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：

　　若一人认罪并作证检控对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。

　　若二人都保持沉默（相关术语称互相“合作”），则二人同样判监半年。

　　若二人都互相检举（互相“背叛”），则二人同样判监2年。

　　用表格概述如下：

　　甲沉默（合作）甲认罪（背叛）

　　乙沉默（合作）二人同服刑半年甲即时获释；乙服刑10年

　　乙认罪（背叛）甲服刑10年；乙即时获释二人同服刑2年

　　解说

　　如同博弈论的其他例证，囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。

　　囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：

　　若对方沉默、背叛会让我获释，所以会选择背叛。

　　若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。

　　二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。

　　这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑半年，总体利益更高，结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。

现实的例子

　　上述例子可能显得不甚自然，但现实中，无论是人类社会或大自然都可以找到类似囚徒困境的例子，将结果划成同样的支付矩阵。社会科学中的经济学、政治学和社会学，以及自然科学的动物行动学、进化生物学等学科，都可以用囚徒困境分析，模拟生物面对无止境的囚徒困境博弈。囚徒困境可以广为使用，说明这种博弈的重要性。以下为各界例子：

　　政治学例子：军备竞赛

　　在政治学中，两国之间的军备竞赛可以用囚徒困境来描述。两国都可以声称有两种选择：增加军备（背叛）、或是达成削减武器协议（合作）。两国都无法肯定对方会遵守协议，因此两国最终会倾向增加军备。似乎自相矛盾的是，虽然增加军备会是两国的“理性”行为，但结果却显得“非理性”（例如会对经济造成都有损坏等）。这可视作遏制理论的推论，就是以强大的军事力量来遏制对方的进攻，以达到和平。

　　经济学例子：关税战

　　两个国家，在关税上可以有以两个选择:

　　提高关税，以保护自己的商品。（背叛）

　　与对方达成关税协定，降低关税以利各自商品流通。（合作）

　　当一国因某些因素不遵守关税协定，独自提高关税（背叛），另一国也会作出同样反应（亦背叛），这就引发了关税战，两国的商品失去了对方的市场，对本身经济也造成损害（共同背叛的结果）。然后二国又重新达成关税协定。（重复博弈的结果是将发现共同合作利益最大。）

　　商业例子：广告战

　　商业活动中亦会出现各种囚徒困境例子。以广告竞争为例。

　　两个公司互相竞争，二公司的广告互相影响，即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告，收入增加很少但成本增加。但若不提高广告质量，生意又会被对方夺走。

　　此二公司可以有二选择：

　　互相达成协议，减少广告的开支。（合作）

　　增加广告开支，设法提升广告的质量，压倒对方。（背叛）

　　若二公司不信任对方，无法合作，背叛成为支配性策略时，二公司将陷入广告战，而广告成本的增加损害了二公司的收益，这就是陷入囚徒困境。在现实中，要二互相竞争的公司达成合作协议是较为困难的，多数都会陷入囚徒困境中。

　　自行车赛例子

　　自行车赛事的比赛策略也是一种博弈，而其结果可用囚徒困境的研究成果解释。例如每年都举办的环法自由车赛中有以下情况：选手们在到终点前的路程常以大队伍（英文:Peloton）方式前进，他们采取这策略是为了令自己不至于太落后，又出力适中。而最前方的选手在迎风时是最费力的，所以选择在前方是最差的策略。通常会发生这样的情况，大家起先都不愿意向前（共同背叛），这使得全体速度很慢，而后通常会有二或多位选手骑到前面，然后一段时间内互相交换最前方位置，以分担风的阻力（共同合作），使得全体的速度有所提升，而这时如果前方的其中一人试图一直保持前方位置（背叛），其他选手以及大队伍就会赶上（共同背叛）。而通常的情况是，在最前面次数最多的选手（合作）通常会到最后被落后的选手赶上（背叛），因为后面的选手骑在前面选手的冲流之中，比较不费力。

第2题：

执行50次囚徒困境实验，得出的结果是否定的。()

答案：错

解析：

题中实验被反复地进行，因而每个囚徒都有机会去“惩罚”另一个囚徒前一回合的不合作行为；这时，合作可能会作为均衡的结果出现，坦白的动机这时可能被受到惩罚的威胁所克服，从而可能导向一个较好的、合作的结果。作为反复接近无限的数量，纳什均衡趋向于帕累托最优，所以得出的结果是肯定的。所以说法错误。

第3题：

在一次囚徒困境中，两个囚徒不会合作，但如果博弈重复100次，则他们之间可能合作。( )

答案：错

解析：

如果对一次博弈，只有唯一的纳什均衡，那么对于有限次重复博弈而言，这一结果不会改变。采用逆向归纳法：当博弈到第100次，博弈者不合作的收益大于合作的收益，所以最优策略是不合作。当博弈到99次时，理性博弈者知道第100次博弈不会合作，所以第99次博弈也不合作。依此类推，最优策略都是不合作。

第4题：

试述重复博弈可以使博弈参与人走出“囚徒困境”。

正确答案: 重复博弈可以改变一次博弈的结果，重复博弈可以使博弈参与人作出在一次性博弈下所不可能作出的行动和选择，从而重复博弈可以使博弈参与人走出“囚徒困境”，出现一次博弈下所不可能出现的合作。其原因主要有以下两个方面：
（1）如果博弈重复无穷次且每个参与人有足够的耐心，那么任何的短期的机会主义行为的所得都会变得微不足道，参与人有积极性为自己建立一个乐于合作的声誉，同时也有积极性惩罚对方的机会主义行为。
（2）重复博弈中，每一个参与人都产生长期利益，从而参与人必须在短期利益和长期利益之间进行权衡。因此，参与人可能会为了长期利益而牺牲眼前利益进而选择不同的均衡策略，由此带来了合作的可能。

第5题：

囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。

正确答案:错误

第6题：

可用来解释纳什均衡的模型是（）

A、古诺模型
B、囚徒困境
C、斯塔克尔伯模型
D、重复博弈

正确答案:B

第7题：

囚徒困境中两个囚徒之所以会处于困境，无法得到较理想的结果，是因为两球图都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。在一个对策行为中可以有多个局中人。

正确答案:错误

第8题：

论述“囚徒困境”模型对商务谈判的启示。

正确答案: 从合作博弈角度来讲，交易双方都能从合作行为中得到利益，合作性结果的出现需要谈判双方拥有充分的交流和信息，一旦谈判双方不能进行信息交流，就难以实现一个有利于每个当事人的合作利益，这种谈判就叫“囚徒困境”是一种非合作性的博弈状况，纳什的强谈判理论给出了谈判的唯一可行解是这一理论中的重要成就。

第9题：

寡头厂商走出囚徒困境的前提条件是（）

A、一次性博弈
B、重复博弈
C、共谋
D、承诺

正确答案:B

第10题：

纳什均衡在囚徒困境中属于合作博弈的均衡解。

正确答案:错误

第11题：

问答题

试述重复博弈可以使博弈参与人走出“囚徒困境”。

正确答案：重复博弈可以改变一次博弈的结果，重复博弈可以使博弈参与人作出在一次性博弈下所不可能作出的行动和选择，从而重复博弈可以使博弈参与人走出“囚徒困境”，出现一次博弈下所不可能出现的合作。其原因主要有以下两个方面：
（1）如果博弈重复无穷次且每个参与人有足够的耐心，那么任何的短期的机会主义行为的所得都会变得微不足道，参与人有积极性为自己建立一个乐于合作的声誉，同时也有积极性惩罚对方的机会主义行为。
（2）重复博弈中，每一个参与人都产生长期利益，从而参与人必须在短期利益和长期利益之间进行权衡。因此，参与人可能会为了长期利益而牺牲眼前利益进而选择不同的均衡策略，由此带来了合作的可能。

解析：暂无解析

第12题：

填空题

囚徒困境反映了：（）与（）。

正确答案：个人理性,集体非理性冲突

解析：暂无解析

第13题：

因徒困境指的是两个被捕的囚徒之间的一种特殊博弈，两人共谋犯罪的人被关入监狱，不能互相沟通情况。如果两个人都不揭发对方，则由于证据不确定，每个人都坐牢一年；若一人揭发，而另一人沉默，则揭发者因为立功而立即获释，沉默者因不合作而入狱五年；若互相揭发，则因证据确实，二者都判刑两年。由于囚徒无法信任对方，因此倾向于互相揭发，而不是同守沉默。以下关于囚徒困境的表述，不正确的是（）。

A.在重复的囚徒困境中，每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为
B.单次发生的囚徒困境和多次重复的囚徒困境结果是一样的
C.囚徒困境说明为什么甚至在合作对对方都有利时，保持合作也是困难的
D.作为反复接近无限的数量，纳什均衡趋向于帕累托最优

答案：B

解析：

囚徒困境：两个被捕的囚徒之间的一种特殊博弈，说明为什么甚至在合作对双方都有利时，保持合作也是困难的。单次发生的囚徒困境，和多次重复的囚徒困境结果不会一样。在重复的囚徒困境中，博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时，合作可能会作出均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服，从而可能导向一个较好的、合作的结果。作为反复接近无限的数量，纳什均衡趋向于帕累托最优。

第14题：

用囚徒困境说明什么是占优策略均衡？

答案：

解析：

(1)囚徒困境是指两个被捕获的囚徒之间的一种特殊“博弈”，说明为什么在合作对双方都有利时，保持合作也是困难的。囚徒困境反映了个人理性和集体理性的矛盾，出于个人理性的考虑并不能实现集体理性，个人理性并不是实现集体理性的充分条件。 (2)在博弈中，无论其他参与人采取什么策略，该参与人的最优策略是唯一的，这样的策略称为占优策略，此时达到的博弈均衡称为占优策略均衡。 (3)囚徒困境如表1-1中的例子：

显然，对张三和李四两个人来说，最好的结果是两个人都不坦白，因为两个人都不坦白，每个人都只坐1年牢，总共坐牢时间是2年。但是，对于张三来说，无论李四选择坦白还是不坦白，张三的最优决策总是坦白。同理，对于李四来说，无论张三选择坦白还是不坦白，李四的最优决策也总是坦白。此时，（坦白，坦白）就是一个占优策略均衡。

第15题：

利己与合作冲突使寡头企业陷入“囚徒困境”。（）

答案：对

解析：

本题考查微观经济常识。
囚徒困境是指两个被捕的囚徒之间的一种特殊博弈，说明了为什么在合作对双方都有利时，保持合作也是困难的。寡头市场的特征：少数几个卖者提供相似或相同的产品；如果合作，可以只生产少量产品享受垄断利润，但是由于利己的动机这种合作的垄断很难持久。换言之，由于寡头市场只有几个卖者，所以寡头垄断的关键特征是合作与利己之间的冲突，即利己与合作冲突使寡头企业陷入“囚徒困境”。

第16题：

在具有占优战略均衡的囚徒困境博弈中（）。

A、只有一个囚徒会坦白
B、两个囚徒都没有坦白
C、两个囚徒都会坦白
D、任何坦白都被法庭否决了

正确答案:C

第17题：

现代城市管理中存在的囚徒困境现象有哪些？

正确答案: （1）城市公共产品供给不足。
（2）城市公共组织效率缺失。
（3）城市、区域之间竞争恶化。

第18题：

空调厂商之间“价格战”可以用来说明“囚徒困境”。

正确答案:正确

第19题：

什么是囚徒困境？它与寡头有什么关系？

正确答案:（1）囚徒困境指两个被捕获的囚犯之间的一种特殊“博弈”，说明为什么甚至在合作对双方有利时，保持合作也是困难的。
（2）囚徒困境与寡头的关系在一次性静态博弈的情况下，寡头市场上结成共谋的每个寡头都面临着囚徒困境：每个寡头出自个人理性的占优策略选择却导致了从整体而言的最坏的结局，即在占优策略均衡中不仅总体利益下降，而且个人利益也是下降的。造成这一结局的原因很清楚：一方面，在达成合作协议以后，每个寡头厂商出于对自己利益的考虑，都有一种采取机会主义行为的冲动，即单方面偷偷独自采取不合作的策略，以获得更大的利益。例如，当合作协议规定各寡头厂商共同维持一个较高的市场价格水平时，每个厂商都会有一种利己的冲动去单方面偷偷降低自己产品的销售价格，以期获得更大的市场份额和销售收入。当每个寡头厂商都这样想并且这样做之后，整个市场的价格水平就会下降，寡头们的合作协议便被撕毁，最后，每个寡头都落到了最差的结局。另一方面，需要指出的是，在一次性博弈中，任何厂商的违约和欺骗行为都不会受到惩罚。因为，当每个厂商完成一次性的策略选择（包括违约和欺骗的策略选择）以后，整个博弈也就永远地结束了，即没有后续的博弈来对已经发生的违约和欺骗行为进行惩罚。正因为如此，寡头厂商之间的共谋不稳定性是不可避免的，或者说，一次性博弈的囚徒困境的不合作解是必然的。

第20题：

囚徒困境（prisoners’dilemma）

正确答案:囚徒困境指两个被捕获的囚犯之间的一种特殊“博弈”，说明为什么甚至在合作对双方有利时，保持合作也是困难的。囚徒困境是图克（Tucker）在20世纪40年代首先提出的，之后作为博弈论的经典案例被广泛引用。囚徒困境反映了个人理性追求并不一定能达到最后集体理性的结果，而个人理性达到集体理性的论断一直是主流经济学的主要思想。
囚徒困境是非零和博弈的著名例子，产生于被拘留并分别受审的罪犯的决策问题。假设检察官认为他们有罪，但未获确切的证据。摆在两个罪犯面前的情况是：两个人都不招供并不告发同谋犯，他们就会免受惩罚或判处轻刑；如果一个招供，而另一个拒绝招供，则招供者会受到从轻发落，而不认罪者会受到严惩；如果两个人都招供，则他们都会判刑，但没有只有一个人招供时判的那么重。本来“最好的”解是攻守同盟、拒不认罪，但从人的理性出发，每个人都受到引诱招供而让其他人承担后果，然而，这一符合个人理性的后果却导致了明显的不合集体理性的后果。“囚徒困境”对策适合于模拟各类冲突问题，如核裁军会谈、劳资双方的工资谈判等。
囚徒困境模型深刻地揭示了社会和经济生活中的一种普遍情形，即“个人理性”与“集体理性”的矛盾，这就是“困境”。

第21题：

为什么多次博弈可以有效解决囚徒困境？

正确答案:在多次重复博弈中，可以有效解决囚徒困境。在分析重复博弈时，首先要增加一个假定条件，该假定条件是：在结成合作同盟的寡头厂商之间都采取一个“以牙还牙”的策略。该策略的内容是：所有的成员一开始是合作的。对于每一个成员来说，只要其他成员是合作的，则他就把合作继续下去。但只要有一个成员一旦背弃合作协议采取不合作的策略，则其他成员便会采取“以牙还牙”的惩罚和报复策略，即其他成员都采取相同的不合作策略，并将这种不合作的策略在重复博弈中一直进行下去，以示对首先破坏协议者的惩罚和报复。这就是“以牙还牙”的策略。
无限期（次）重复是指相同结构的博弈可以无限次地重复进行下去。在无限期的重复博弈中，只要任何一个参与者在某一轮的博弈中采取了不合作的违约和欺骗行为。他便会在下一轮的博弈中受到其他参与者的“以牙还牙”策略的惩罚与报复，即其他所有的参与者都采取相同的不合作策略，并将不合作策略在以后的无限次重复博弈中永远进行下去。这样一来，首先采取违约和欺骗行为的一方就会永远丧失与他人合作的机会，并由此遭受长期的惨重损失。由于在无限期重复博弈中对违约和欺骗方采取“以牙还牙”的惩罚和报复机会总是存在的，所以，每一个参与者为了避免“以牙还牙”策略给自己带来的长期损失，就都会放弃首先采取不合作策略的做法，这样一来，寡头厂商们之间的合作解就得以维持，或者说，寡头厂商们就可以走出类似的“囚犯困境”。

第22题：

重复博弈和一次性博弈情况下的囚徒困境收益矩阵是完全相同的。

正确答案:错误

第23题：

问答题

简单描述囚徒困境。

正确答案：合作，则双方均获得较少惩罚，一方合作，另一方不合作，不合作的一方得到最少的惩罚，合作的一方得到最大的惩罚，均不合作，均得到中等程度的惩罚。

解析：暂无解析

第24题：

问答题

城市管理中存在的哪些问题是囚徒博弈的结果和囚徒困境的表现？

正确答案：（1）城市公共产品供给不足；
（2）城市公共组织效率缺失；
（3）城市、区域之间竞争恶化。

解析：暂无解析

15、破解囚徒困境的方法可以通过建立长期关系，使得囚徒困境可以多次重复。

题目

相似考题

参考答案和解析

更多“15、破解囚徒困境的方法可以通过建立长期关系，使得囚徒困境可以多次重复。”相关问题

相关内容