浅析生活中的囚徒困境

2022-04-15 07:28:14   第一文档网     [ 字体: ] [ 阅读: ] [ 文档下载 ]
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。下载word有问题请添加QQ:admin处理,感谢您的支持与谅解。点击这里给我发消息

#第一文档网# 导语】以下是®第一文档网的小编为您整理的《浅析生活中的囚徒困境》,欢迎阅读!
囚徒,浅析,困境,生活

浅析生活中的囚徒困境

电信学院15211082杨哲



一. 囚徒困境的基本概念

囚徒困境1950年美国兰德公司的梅里尔·弗勒德Merrill Flood和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为囚徒困境。两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确实,二者都判刑八年。由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。最终导致纳什均衡仅落在非合作点上的博弈模型。

二. 囚徒困境的意义

囚徒困境指出市场是残酷的、无情的。你不追求利润最大化,不追求效用最大化,你就难以存活下去。同自然界“物竞天择”一样,从这个方面讲,人类社会似乎是一个“利”者生存的社会,没有利润,企业生存不了,工人存活不了。所以,自利的原则还是存在的。不可能使得最终所追求的利益最大化,但这并不是说人们不想最大化其利润,个体理性、个体利益最大,不一定能导致集体理性、集体利益最大,“囚徒困境”就是个人利益与集体利益相冲突的典型。它揭示了非合作的自利行为可能导致两败俱伤的前景。

三. 生活中囚徒困境博弈

公共设施修建的囚徒困境

设想有两户相居为邻的农家(双方都是理性人),十分需要有一条好路从居住地通往公路。修一条路的成本为4每个农家从修好的好路上获得的好处为3如果两户居民共同出资联合修路,并平均分摊修路成本,则每户居民获得净的好处(支付)为3-4/2=1;当只有一户人家单独出资修路时,修路的居民获得的支付为3-4=-1(亏损), “搭便车”不出资但仍然可以使用修好的路的另一户人家获得支付3-0=3。修路博弈的得利如下图所示:

1修路博弈



不修



11 -13 不修 3-1 00



我们看到,对甲和乙两家居民来说,“修路”都是劣战略,因而他们都不会出资修路。这里,为了解决这条新路的建设问题,需要政府强制性地分别向每家征税2单位,然后投入4单位资金修好这条对大家都有好处的路,并使两家居民的生活水平都得到改善。

教育类囚徒困境

我国的中小学的教育一直在提倡减负,但大家都知道,减到现在反而是越减越重了,经陷入到素质和作业的囚徒困境中去了。在现有的教育体制下,学生(或学生家长)有两个


可选择的策略:“减负”和“增负”。学生的精力是有限的,如果选择“减负”策略,意味着学生有更多的时间学习课本以外的东西,这样学生的素质得到提高,因此,“减负”策略往往与素质教育联系在一起;而如果选择“增负”策略,则意味着学生花大量的时间做大量的习题,以“学透”“学精”课本规定的东西,此时,学生没有时间学习课本以外的没有规定的内容。“减负”的结果是学生的全面发展;而“增负”的结果是学生获得高的分数。

在这样的博弈结构下,学生(或学生家长)如何选择呢?每个学生这样想:其他人采取的是“增负”教育策略的话,如果我采取“减负”教育策略,我的考试分数不如他人,在求学方面我会落后,接受不了好的教育在未来求职时我也赶不上他人。在他人采取“增负”的策略下,我也应当采取“增负”策略。如果其他人采取的是“减负”策略,我应当采取什么策略呢?还是应当采取“增负”策略!因为,如果其他人采取的是“减负”策略的话,如果我采取的是“增负”策略,我的考试分数会比其他人高,我会上好的学校,在未来的职业竞争中我会处于优势。因此,无论其他人采取的是什么策略,我采取“增负”策略都是最好的。当每个学生都这样想的时候,全社会便进入了应试教育这样一个囚徒困境之中。

如果我国现有的考试制度没有改变,现在假设所有的学生都选择“减负”策略,即除了做少量的巩固性的作业外,不补课、不做其他的练习题,情况会是什么样子?

假设这种状态会出现,我们说,这种状态会很快消失,而立即会出现所有学生都进入“增负”的这样一个状态。可以说,均选择“减负”策略的状态是不稳定的,而“增负”的状态是稳定的均衡。原因就是,目前的教育的博弈结构规定了各种行动或行为的收益或好处:获得高分的会进入好的初中、高中,进入好的初中、高中的学生可以考高分进入好的大学。在这个博弈中,对于教师来说,学生的升学率高意味着其成绩大、奖金高,对自己的学生采取“增负”策略,对于自己而言是占优策略。

我国基础教育的博弈与囚徒困境有共同的结构,大家均选择“增负”策略构成基础教育博弈的纳什均衡。纳什均衡是一个稳定的博弈结果,这也是为什么我国目前的应试教育难以改变的原因。

恋人变心的囚徒困境

两个人相爱后,在以后的时间内,如果双方都不变心,那是最好的结局,在天愿为比翼鸟,在地愿为连理枝嘛;如果都变了心,效果也不坏,你走你的阳关道,我过我的独木桥嘛;如果一方变了心,另外找到了更好的情侣,一方却还傻乎乎地忠贞不二,那么,另觅新欢的一方是最幸福的,比两人都不变心的结果还幸福,因为他找见了更好的情人,而被抛弃的一方是最不幸的,比两人都变心的结果更不幸,因为他承担的压力既来自于对方的太幸福,也来自于自己的太不幸福。 按照囚徒困境的分析结论,恋人最得意的选择是另觅新欢,最天真的选择是天荒地老,最理性的选择是分道扬镳,最糟糕的选择是被另有新欢的对方无情抛弃。但是,反观现实中的恋人,大都天真的认为能够天荒地老,对于最理性的选择,又认为结局过于残酷, 没有谁愿意回头是岸,甚至被对方抛弃了还不死心,反而结果变成了最糟糕的选择。所以这就是假设为理性人的情况下,个体的最优化选择和整体最优的矛盾。

四.囚徒困境的博弈和分析感受

囚徒困境的理性人假设,注定每个人都是利己的,在消息不对称的情况下,每个人只能根据自身要采取的利己措施,来保证自己的利益最大化,但当每个人都这么想的话,都会采取对别人最坏的措施,最终的结果是整体处于一个非常糟糕的状态,但由于此时已经达到纳什均衡,这个状态时稳定的,所以最后就陷入了恶性循环中。这个时候就要有类似于公共设施的政府来保证整体的利益维持在最坏和最好的之间保持稳定。

对于个体和集体的矛盾,解决的办法就是彼此相信,合作共赢。当然,在现实世界里,信任与合作很少达到如此两难的境地。谈判、人际关系、强制性的合同和其他许多因素左右


了当事人的决定。但囚徒的两难境地确实抓住了不信任和需要相互防范背叛这种真实的一面。正如中国的一句俗话“冤冤相报何时了”,要想避免两败俱伤的情况出现,就要对彼此有信心,相互了解,在这样的博弈中,善意的、宽容的、强硬的、简单明了的人最后都会是大赢家。每个人都应该以自己的实际行动展现自己的善意,创造双赢的局面,共同走出囚徒困境。


本文来源:https://www.dywdw.cn/af248834a36925c52cc58bd63186bceb19e8edb4.html

相关推荐
推荐阅读