空调厂商之间“价格战”可以用来说明“囚徒困境”。

第1题：

请论述“囚徒困境”的经济学意义。

正确答案：

回答此问题，可以参考教材以及以下资料【囚徒困境是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。单次发生的囚徒困境，和多次重复的囚徒困境结果不会一样。

　　在重复的囚徒困境中，博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时，合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服，从而可能导向一个较好的、合作的结果。作为反复接近无限的数量，纳什均衡趋向于帕累托最优。

　囚徒困境的主旨为，囚徒们虽然彼此合作，坚不吐实，可为全体带来最佳利益（无罪开释），但在资讯不明的情况下，因为出卖同伙可为自己带来利益（缩短刑期），也因为同伙把自己招出来可为他带来利益，因此彼此出卖虽违反最佳共同利益，反而是自己最大利益所在。但实际上，执法机构不可能设立如此情境来诱使所有囚徒招供，因为囚徒们必须考虑刑期以外之因素（出卖同伙会受到报复等），而无法完全以执法者所设立之利益（刑期）作考量。

经典的囚徒困境

　　1950年，由就职于兰德公司的梅里尔•弗勒德（Merrill Flood）和梅尔文•德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问艾伯特•塔克（Albert Tucker）以囚徒方式阐述，并命名为“囚徒困境”。经典的囚徒困境如下：

　　警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：

　　若一人认罪并作证检控对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。

　　若二人都保持沉默（相关术语称互相“合作”），则二人同样判监半年。

　　若二人都互相检举（互相“背叛”），则二人同样判监2年。

　　用表格概述如下：

　　甲沉默（合作）甲认罪（背叛）

　　乙沉默（合作）二人同服刑半年甲即时获释；乙服刑10年

　　乙认罪（背叛）甲服刑10年；乙即时获释二人同服刑2年

　　解说

　　如同博弈论的其他例证，囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。

　　囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：

　　若对方沉默、背叛会让我获释，所以会选择背叛。

　　若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。

　　二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。

　　这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑半年，总体利益更高，结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。

现实的例子

　　上述例子可能显得不甚自然，但现实中，无论是人类社会或大自然都可以找到类似囚徒困境的例子，将结果划成同样的支付矩阵。社会科学中的经济学、政治学和社会学，以及自然科学的动物行动学、进化生物学等学科，都可以用囚徒困境分析，模拟生物面对无止境的囚徒困境博弈。囚徒困境可以广为使用，说明这种博弈的重要性。以下为各界例子：

　　政治学例子：军备竞赛

　　在政治学中，两国之间的军备竞赛可以用囚徒困境来描述。两国都可以声称有两种选择：增加军备（背叛）、或是达成削减武器协议（合作）。两国都无法肯定对方会遵守协议，因此两国最终会倾向增加军备。似乎自相矛盾的是，虽然增加军备会是两国的“理性”行为，但结果却显得“非理性”（例如会对经济造成都有损坏等）。这可视作遏制理论的推论，就是以强大的军事力量来遏制对方的进攻，以达到和平。

　　经济学例子：关税战

　　两个国家，在关税上可以有以两个选择:

　　提高关税，以保护自己的商品。（背叛）

　　与对方达成关税协定，降低关税以利各自商品流通。（合作）

　　当一国因某些因素不遵守关税协定，独自提高关税（背叛），另一国也会作出同样反应（亦背叛），这就引发了关税战，两国的商品失去了对方的市场，对本身经济也造成损害（共同背叛的结果）。然后二国又重新达成关税协定。（重复博弈的结果是将发现共同合作利益最大。）

　　商业例子：广告战

　　商业活动中亦会出现各种囚徒困境例子。以广告竞争为例。

　　两个公司互相竞争，二公司的广告互相影响，即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告，收入增加很少但成本增加。但若不提高广告质量，生意又会被对方夺走。

　　此二公司可以有二选择：

　　互相达成协议，减少广告的开支。（合作）

　　增加广告开支，设法提升广告的质量，压倒对方。（背叛）

　　若二公司不信任对方，无法合作，背叛成为支配性策略时，二公司将陷入广告战，而广告成本的增加损害了二公司的收益，这就是陷入囚徒困境。在现实中，要二互相竞争的公司达成合作协议是较为困难的，多数都会陷入囚徒困境中。

　　自行车赛例子

　　自行车赛事的比赛策略也是一种博弈，而其结果可用囚徒困境的研究成果解释。例如每年都举办的环法自由车赛中有以下情况：选手们在到终点前的路程常以大队伍（英文:Peloton）方式前进，他们采取这策略是为了令自己不至于太落后，又出力适中。而最前方的选手在迎风时是最费力的，所以选择在前方是最差的策略。通常会发生这样的情况，大家起先都不愿意向前（共同背叛），这使得全体速度很慢，而后通常会有二或多位选手骑到前面，然后一段时间内互相交换最前方位置，以分担风的阻力（共同合作），使得全体的速度有所提升，而这时如果前方的其中一人试图一直保持前方位置（背叛），其他选手以及大队伍就会赶上（共同背叛）。而通常的情况是，在最前面次数最多的选手（合作）通常会到最后被落后的选手赶上（背叛），因为后面的选手骑在前面选手的冲流之中，比较不费力。

第2题：

用囚徒困境说明什么是占优策略均衡？

答案：

解析：

(1)囚徒困境是指两个被捕获的囚徒之间的一种特殊“博弈”，说明为什么在合作对双方都有利时，保持合作也是困难的。囚徒困境反映了个人理性和集体理性的矛盾，出于个人理性的考虑并不能实现集体理性，个人理性并不是实现集体理性的充分条件。 (2)在博弈中，无论其他参与人采取什么策略，该参与人的最优策略是唯一的，这样的策略称为占优策略，此时达到的博弈均衡称为占优策略均衡。 (3)囚徒困境如表1-1中的例子：

显然，对张三和李四两个人来说，最好的结果是两个人都不坦白，因为两个人都不坦白，每个人都只坐1年牢，总共坐牢时间是2年。但是，对于张三来说，无论李四选择坦白还是不坦白，张三的最优决策总是坦白。同理，对于李四来说，无论张三选择坦白还是不坦白，李四的最优决策也总是坦白。此时，（坦白，坦白）就是一个占优策略均衡。

第3题：

在一次囚徒困境中，两个囚徒不会合作，但如果博弈重复100次，则他们之间可能合作。( )

答案：错

解析：

如果对一次博弈，只有唯一的纳什均衡，那么对于有限次重复博弈而言，这一结果不会改变。采用逆向归纳法：当博弈到第100次，博弈者不合作的收益大于合作的收益，所以最优策略是不合作。当博弈到99次时，理性博弈者知道第100次博弈不会合作，所以第99次博弈也不合作。依此类推，最优策略都是不合作。

第4题：

囚徒困境说明个人的理性选择不一定是集体的理性选择。

正确答案:正确

第5题：

可用来解释纳什均衡的模型是（）

A、古诺模型
B、囚徒困境
C、斯塔克尔伯模型
D、重复博弈

正确答案:B

第6题：

城市管理中存在的（）问题是囚徒博弈的结果和囚徒困境的表现。

A、城市公共产品供给不足
B、城市公共组织效率缺失
C、城市、区域之间竞争恶化
D、城乡失衡发展

正确答案:A,B,C

第7题：

“囚徒困境”是一种合作博弈。

正确答案:错误

第8题：

囚徒困境（prisoners’dilemma）

正确答案:囚徒困境指两个被捕获的囚犯之间的一种特殊“博弈”，说明为什么甚至在合作对双方有利时，保持合作也是困难的。囚徒困境是图克（Tucker）在20世纪40年代首先提出的，之后作为博弈论的经典案例被广泛引用。囚徒困境反映了个人理性追求并不一定能达到最后集体理性的结果，而个人理性达到集体理性的论断一直是主流经济学的主要思想。
囚徒困境是非零和博弈的著名例子，产生于被拘留并分别受审的罪犯的决策问题。假设检察官认为他们有罪，但未获确切的证据。摆在两个罪犯面前的情况是：两个人都不招供并不告发同谋犯，他们就会免受惩罚或判处轻刑；如果一个招供，而另一个拒绝招供，则招供者会受到从轻发落，而不认罪者会受到严惩；如果两个人都招供，则他们都会判刑，但没有只有一个人招供时判的那么重。本来“最好的”解是攻守同盟、拒不认罪，但从人的理性出发，每个人都受到引诱招供而让其他人承担后果，然而，这一符合个人理性的后果却导致了明显的不合集体理性的后果。“囚徒困境”对策适合于模拟各类冲突问题，如核裁军会谈、劳资双方的工资谈判等。
囚徒困境模型深刻地揭示了社会和经济生活中的一种普遍情形，即“个人理性”与“集体理性”的矛盾，这就是“困境”。

第9题：

为什么多次博弈可以有效解决囚徒困境？

正确答案:在多次重复博弈中，可以有效解决囚徒困境。在分析重复博弈时，首先要增加一个假定条件，该假定条件是：在结成合作同盟的寡头厂商之间都采取一个“以牙还牙”的策略。该策略的内容是：所有的成员一开始是合作的。对于每一个成员来说，只要其他成员是合作的，则他就把合作继续下去。但只要有一个成员一旦背弃合作协议采取不合作的策略，则其他成员便会采取“以牙还牙”的惩罚和报复策略，即其他成员都采取相同的不合作策略，并将这种不合作的策略在重复博弈中一直进行下去，以示对首先破坏协议者的惩罚和报复。这就是“以牙还牙”的策略。
无限期（次）重复是指相同结构的博弈可以无限次地重复进行下去。在无限期的重复博弈中，只要任何一个参与者在某一轮的博弈中采取了不合作的违约和欺骗行为。他便会在下一轮的博弈中受到其他参与者的“以牙还牙”策略的惩罚与报复，即其他所有的参与者都采取相同的不合作策略，并将不合作策略在以后的无限次重复博弈中永远进行下去。这样一来，首先采取违约和欺骗行为的一方就会永远丧失与他人合作的机会，并由此遭受长期的惨重损失。由于在无限期重复博弈中对违约和欺骗方采取“以牙还牙”的惩罚和报复机会总是存在的，所以，每一个参与者为了避免“以牙还牙”策略给自己带来的长期损失，就都会放弃首先采取不合作策略的做法，这样一来，寡头厂商们之间的合作解就得以维持，或者说，寡头厂商们就可以走出类似的“囚犯困境”。

第10题：

多选题

城市管理中存在的（）问题是囚徒博弈的结果和囚徒困境的表现。

A

城市公共产品供给不足

B

城市公共组织效率缺失

C

城市、区域之间竞争恶化

D

城乡失衡发展

正确答案： A,B,C

解析：暂无解析

第11题：

问答题

城市管理中存在的哪些问题是囚徒博弈的结果和囚徒困境的表现？

正确答案：（1）城市公共产品供给不足；
（2）城市公共组织效率缺失；
（3）城市、区域之间竞争恶化。

解析：暂无解析

第12题：

单选题

可用来解释纳什均衡的模型是（）

A

古诺模型

B

囚徒困境

C

斯塔克尔伯模型

D

重复博弈

正确答案： C

解析：暂无解析

第13题：

因徒困境指的是两个被捕的囚徒之间的一种特殊博弈，两人共谋犯罪的人被关入监狱，不能互相沟通情况。如果两个人都不揭发对方，则由于证据不确定，每个人都坐牢一年；若一人揭发，而另一人沉默，则揭发者因为立功而立即获释，沉默者因不合作而入狱五年；若互相揭发，则因证据确实，二者都判刑两年。由于囚徒无法信任对方，因此倾向于互相揭发，而不是同守沉默。以下关于囚徒困境的表述，不正确的是（）。

A.在重复的囚徒困境中，每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为
B.单次发生的囚徒困境和多次重复的囚徒困境结果是一样的
C.囚徒困境说明为什么甚至在合作对对方都有利时，保持合作也是困难的
D.作为反复接近无限的数量，纳什均衡趋向于帕累托最优

答案：B

解析：

囚徒困境：两个被捕的囚徒之间的一种特殊博弈，说明为什么甚至在合作对双方都有利时，保持合作也是困难的。单次发生的囚徒困境，和多次重复的囚徒困境结果不会一样。在重复的囚徒困境中，博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时，合作可能会作出均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服，从而可能导向一个较好的、合作的结果。作为反复接近无限的数量，纳什均衡趋向于帕累托最优。

第14题：

试论述囚徒困境对于经济学的意义．

答案：

解析：

“囚徒困境”是博弈论的一个经典案例。它是著名经济学家塔克最早修改而提出来的一个例子。囚徒困境讲述的是这样一个故事：警察抓住两个偷窃的嫌疑犯，并分别把他们隔离在两个审讯室中进行审问。警察知道这两个人除此次人赃俱获的偷窃外，还犯有其他罪行，但缺乏足够的证据定罪。于是，警察想就此机会，让嫌疑犯彻底坦白其罪行，其方法是分别私下告诉每一个嫌疑犯如下的出路：如果只有他一人坦白而对方抵赖，那么，坦白者被释放，抵赖者被判9年徒刑；如果两人都坦白，各判5年；如果两人都抵赖，当然就只能以现有证据，各判2年。在这种情况下，每个嫌疑犯都只有“坦白”或“抵赖”两种策略选择，并面临着四种可能的结局，表10-2刻画了这两个嫌疑犯面对的博弈。其中，每格前一个数字代表A的支付（即被判的刑期），后一个数字代表B的支付。这种博弈的结果将是：如果每个嫌疑犯都只是想使自己的利益最大化（即被判的刑期最短），而且无法影响对方的行为，那么，唯一可能的答案就是：两人都坦白交代，各自被判5年徒刑。因为在此案例中，当参与者力图使其损失最小化时，他就只能遵循“最小最大”的决策标准，即“最大损失中求取最小损失”的决策，参与者将选择那种能使可能的最大损失最小化的策略。对于囚犯A来说，最大损失中求取最小损失的策略是“坦白”，对B来说，同等的策略也是“坦白”，从而建立起一种策略均衡。在这种均衡中，“坦白”是他们每个人的超优策略。{图0} 其实在“囚徒困境”中，最好的结局是都“抵赖”，各判2年徒刑，但这是不可能的。因为不论是嫌疑犯A还是B，只要单独改取“坦白”的策略，就会由2年的徒刑改为释放，因而存在着偷换策略的诱感，处于不稳定的状态。在右上角如果B改取“坦白”的策略，刑期就可以从9年减为5年，因而也存在着偷换策略的诱惑，处于不稳定状态。同样的道理，左下角也处于不稳定状态。简言之，“抵赖”是一种劣策略。理性的参与者当然不会选择这种策略。如果嫌疑犯在决定是否坦白之前可以交流信息，结果不会有差异。假设他们认识到警察已经发现他们的隐瞒之事，但他们在被抓之前有几分钟时间进行理性的讨论。嫌疑犯A-开始就指出，虽然每个人都有一个超优策略，但“坦白”会导致一个帕累托无效率的结果，所以，为什么不一致否认罪行呢？嫌疑犯B也有此思想，并同意这样做。但是两个小时后，他们最终会背叛同盟，坦白认罪，形成各判5年的结果。因为虽然有口头协议，但它却不具有约束力。每个囚徒都希望对方抵赖，自己坦白而释放。当他们都这样想并这么做时，就形成（坦白，坦白）的策略组合，（坦白，坦白）的策略组合是一个纳什均衡。可以从上述讨论中得出一个重要的结论：超优策略均衡虽然是唯一可以预见到的结果，但这种策略组合却不一定是帕累托有效率的策略。在“囚徒困境”中，（坦白，坦白）是帕累托无效率的策略，因为每个人都被判5年徒刑，并不是博弈者共同的最优结果。他们共同的最优结果应该是各判2年，但却是无法实现的。于是，“囚徒困境”常常被经济学家作为一个经典案例来说明：自利的个人理性行为并没有导致一个社会的最佳结果，即个人理性与集体理性之间存在着深刻的冲突。当然，在重复博弈中，囚徒困境可能会出现非合作性的共谋。尽管每个囚犯冒着被其他囚犯出卖的风险，但如果他选择不合作，就会失去获得长期合作收益的可能性，如果博弈重复的次数足够多，未来收益的损失就会超过短期被出卖的损失，因此，可能会出现参与者彼此合作的情况，采取帕累托有效的策略。

第15题：

试述重复博弈可以使博弈参与人走出“囚徒困境”。

正确答案: 重复博弈可以改变一次博弈的结果，重复博弈可以使博弈参与人作出在一次性博弈下所不可能作出的行动和选择，从而重复博弈可以使博弈参与人走出“囚徒困境”，出现一次博弈下所不可能出现的合作。其原因主要有以下两个方面：
（1）如果博弈重复无穷次且每个参与人有足够的耐心，那么任何的短期的机会主义行为的所得都会变得微不足道，参与人有积极性为自己建立一个乐于合作的声誉，同时也有积极性惩罚对方的机会主义行为。
（2）重复博弈中，每一个参与人都产生长期利益，从而参与人必须在短期利益和长期利益之间进行权衡。因此，参与人可能会为了长期利益而牺牲眼前利益进而选择不同的均衡策略，由此带来了合作的可能。

第16题：

囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。

正确答案:错误

第17题：

城市管理中存在的哪些问题是囚徒博弈的结果和囚徒困境的表现？

正确答案: （1）城市公共产品供给不足；
（2）城市公共组织效率缺失；
（3）城市、区域之间竞争恶化。

第18题：

两个被捕获的囚徒之间的一种特殊“博弈”，说明为什么甚至在合作对双方都有利时，保持合作也是困难的，这一状况被称作（）。

A、囚徒困境
B、蝴蝶效应
C、两难理论
D、科斯理论

正确答案:A

第19题：

纳什均衡借助于“囚徒困境”进行论证说明，下列各项中属于“囚徒困境”的现实意义的有（）。

A、个体理性与集体理性之间存在冲突
B、个人理性导致集体非理性
C、合作是有利的“利己策略”
D、合作不具有约束性

正确答案:A,B,C,D

第20题：

寡头厂商走出囚徒困境的前提条件是（）

A、一次性博弈
B、重复博弈
C、共谋
D、承诺

正确答案:B

第21题：

多选题

纳什均衡借助于“囚徒困境”进行论证说明，下列各项中属于“囚徒困境”的现实意义的有（）。

A

个体理性与集体理性之间存在冲突

B

个人理性导致集体非理性

C

合作是有利的“利己策略”

D

合作不具有约束性

正确答案： A,B

解析：暂无解析

第22题：

问答题

简单描述囚徒困境。

正确答案：合作，则双方均获得较少惩罚，一方合作，另一方不合作，不合作的一方得到最少的惩罚，合作的一方得到最大的惩罚，均不合作，均得到中等程度的惩罚。

解析：暂无解析

第23题：

问答题

试述重复博弈可以使博弈参与人走出“囚徒困境”。

正确答案：重复博弈可以改变一次博弈的结果，重复博弈可以使博弈参与人作出在一次性博弈下所不可能作出的行动和选择，从而重复博弈可以使博弈参与人走出“囚徒困境”，出现一次博弈下所不可能出现的合作。其原因主要有以下两个方面：
（1）如果博弈重复无穷次且每个参与人有足够的耐心，那么任何的短期的机会主义行为的所得都会变得微不足道，参与人有积极性为自己建立一个乐于合作的声誉，同时也有积极性惩罚对方的机会主义行为。
（2）重复博弈中，每一个参与人都产生长期利益，从而参与人必须在短期利益和长期利益之间进行权衡。因此，参与人可能会为了长期利益而牺牲眼前利益进而选择不同的均衡策略，由此带来了合作的可能。

解析：暂无解析

空调厂商之间“价格战”可以用来说明“囚徒困境”。

题目

相似考题

更多“空调厂商之间“价格战”可以用来说明“囚徒困境”。”相关问题

相关内容