首页 > 科学探索文章正文

让人绝望的“囚徒困境”，真的不可破解吗？

科学探索 2025-04-20 15:29:01 趣奇闻(www.quqiwen.com)

设想你是一个警察，抓住了两个罪犯。

你很确定两个罪犯都有罪，但是缺乏证据，于是你希望让两个罪犯自己坦白罪行。

请问你应该怎么做？

一个非常好的方法是：构建“囚徒困境”。

（顺便一提，“内卷”其实就是“囚徒困境”一种高级形式。）

让人绝望的“囚徒困境”，真的不可破解吗？

囚徒困境（1.0版）

具体的操作很简单，只需要把两个罪犯关在不同的房间审讯，告诉两个罪犯相同的条件：

如果两个人都抵赖，各判1年。

如果两个人都坦白，各判3年。

如果一个人抵赖，一个人坦白，那么坦白的人被释放，抵赖的人被判5年。

（纯粹是简化问题，请不要套用具体的法律。）

只要开出这样的条件，就能让两个罪犯都坦白。当然，前提是：决策之时，两个罪犯都不知道对方的决策。

以上就是“囚徒困境”最简单的版本，巧妙利用了博弈论中的一个重要概念：纳什均衡。

让人绝望的“囚徒困境”，真的不可破解吗？

纳什均衡很好理解，我们可以先把两个罪犯记为A和B。

根据上面的条件，我们可以画出A和B的收益矩阵：

A抵赖

A坦白

B抵赖

A被判1年

B被判1年

A被释放

B被判5年

B坦白

A被判5年

B被释放

A被判3年

B被判3年

所谓的收益矩阵，其实就是用表格把所有的结果列出来而已，没什么神秘之处。

（至于为什么要用“收益”这个词，是因为博弈论原本就是用来研究经济学的理论。被少判几年，也可以看成是一种“收益”。）

借助收益矩阵，可以直观理解纳什均衡。我们可以先分析B的决策：

A抵赖

A坦白

B抵赖

A被判1年

B被判1年

A被释放

B被判5年

B坦白

A被判5年

B被释放

A被判3年

B被判3年

如果A抵赖，那么B坦白，对B更有利。

A抵赖

A坦白

B抵赖

A被判1年

B被判1年

A被释放

B被判5年

B坦白

A被判5年

B被释放

A被判3年

B被判3年

如果A坦白，那么B坦白，对B也更有利。

所以不管A是抵赖还是坦白，B坦白，始终对B更有利。

分析A的决策，也会得出相同的结果。不管B是抵赖还是坦白，A坦白，始终对A更有利。

所以A和B都会坦白。

让人绝望的“囚徒困境”，真的不可破解吗？

当然，上述分析有一个前提条件：A和B都是理性的人，懂得利用“收益矩阵”分析问题。

这就会引出一个问题：

如果A和B都能做出上述分析，就都能看穿“囚徒困境”的把戏，他们难道不会都抵赖，实现“双赢”吗？

A抵赖

A坦白

B抵赖

A被判1年

B被判1年

A被释放

B被判5年

B坦白

A被判5年

B被释放

A被判3年

B被判3年

这就是“囚徒困境”的厉害之处，就算A和B都能看穿“囚徒困境”的把戏，也都会坦白，因为“A和B都坦白”已经达到了纳什均衡的状态。

我们还是先分析B的决策，B知道两个人都坦白就中了圈套，但是如果B选择抵赖，A依旧坦白，B就会吃亏。当然，A也会做出同样的分析，

所以说，想要摆脱“囚徒困境”，就不能只靠自己一个人改变决策。只要别人不改变决策，你改变决策就一定会吃亏，此时的状态就是“纳什均衡”。

其实“囚徒困境”只是一个壳子，真正的精髓是纳什均衡。

让人绝望的“囚徒困境”，真的不可破解吗？

囚徒困境（2.0版）

上文写的只是1.0版的“囚徒困境”，只有两个囚徒，其实并不牢固。

在上文中，两个囚徒是合伙作案，他们的私人关系会改变原本的收益矩阵，很可能会让他们一起抵赖。

A抵赖

A坦白

B抵赖

A被判1年

B被判1年

患难见真情

A被释放

B被判5年

B将来报复A

B坦白

A被判5年

B被释放

A将来报复B

A被判3年

B被判3年

再见面，都尴尬

所以，1.0版的“囚徒困境”只是一个思想实验，没有太大的应用价值。

想要应用，就必须使用2.0版的“囚徒困境”。

让人绝望的“囚徒困境”，真的不可破解吗？

从1.0到2.0的过程很简单：加人数。

2个囚徒不牢固，那就找20个囚徒。

20个囚徒还不牢固，那就找200个囚徒。

200个囚徒还不牢固，那就找2000个囚徒。

……

千万不要小看“加人数”，我们一定要清楚：多者，异也。

或者说：量变引起质变。

注意，“囚徒困境”真正的精髓是纳什均衡。2.0版的“囚徒困境”已经不是“一些罪犯合伙犯罪”的事了，而是：人人皆是“囚徒”。

让人绝望的“囚徒困境”，真的不可破解吗？

大家最熟悉的2.0版“囚徒困境”应该就是“内卷”。

虽然2.0版“囚徒困境”人数众多，不过依然可以按照两个人情况列出收益矩阵，只需要考虑“你”和“别人”。

比如：加班。

如果有加班费的话。

别人加班

别人不加班

你加班

你多拿钱

别人多拿钱

你多拿钱

别人少拿钱

你不加班

你少拿钱

别人多拿钱

你少拿钱

别人少拿钱

如果没有加班费，但是不加班会被辞退的话。

别人加班

别人不加班

你加班

你有工作

别人有工作

你有工作

别人没工作

你不加班

你没工作

别人有工作

你没工作

别人没工作

老板招不到人

当然，实际问题会更复杂。

如果你不想加班，也有强制规定不准加班，那么老板就会降你的基本工资，让你不加班就没法养活自己，逼你自愿加班。

你可以选择不干，但是老板丝毫不慌，因为收益矩阵是：

别人干

别人不干

你干

你有工作

别人有工作

你有工作

别人没工作

你不干

你没工作

别人有工作

你没工作

别人没工作

老板招不到人

注意，“别人”是一个非常微妙的概念，除非你能确保所有人都不干，不然收益矩阵中蓝色文字的结果就不会出现。

人越多，就越难达成共识，纳什均衡的威力越大。

顺便提一句，“纳什均衡”并不是一个坏东西，只是在某些条件下让人觉得坏。

让人绝望的“囚徒困境”，真的不可破解吗？

当然，现实中的“内卷”在触发纳什均衡之前就已经牢不可破了。

注意，纳什均衡的前提条件是：所有人都理性。是在所有人都理性（能看出圈套）的前提下，依旧维持“内卷”的理论。

但是，假设所有人都理性，本身就不理性。所以，维持“内卷”，根本就轮不到纳什均衡出手，群体固有的愚蠢早就完全维持“内卷”了。

让人绝望的“囚徒困境”，真的不可破解吗？

囚徒困境（3.0版）

不管是1.0还是2.0的“囚徒困境”，都建立在某一套具体的规则之上，根据一套具体的规则列出收益矩阵，得出对许多人有害的纳什均衡。

如果直接推翻某一套具体的规则，那么2.0版的“囚徒困境”也不复存在。

由此可以引出3.0版的“囚徒困境”，也就是把多个“囚徒困境”一层又一层嵌套在一起。想打破某一套“囚徒困境”的规则，就必须先打破另一套“囚徒困境”的规则。

3.0版的“囚徒困境”是在保护实现“囚徒困境”的规则，具体方法简单地说就是：在打破“囚徒困境”之前，要先打破“囚徒困境”，由此陷入“死循环”。

具体内容太过敏感，我不能写，在这里只能给一部分读者道歉。

把“囚徒困境”推进到3.0版，基本是不可破解了，大家对此有何看法？

让人绝望的“囚徒困境”，真的不可破解吗？

后台-插件-广告管理-内容页尾部广告（手机）

声明：部分图文来源于网络，版权归原作者所有，侵权请联系删除：wzwt58@qq.com。本站发布此信息目的在于传播更多信息，与本网站立场无关，不保证该信息（包括但不限于文字、数据及图表）准确性、真实性、完整性等。本文地址：https://www.quqiwen.com/kxts/24953.html

揭秘蛇类起源：中国科学家的重大发现

玛雅文明有多先进？千年前的壁画被还原

趣奇闻Copyright @ 2022-2022 备案号：陕ICP备19013690号-3 网站地图