让人绝望的“囚徒困境”,真的不可破解吗?
设想你是一个警察,抓住了两个罪犯。
你很确定两个罪犯都有罪,但是缺乏证据,于是你希望让两个罪犯自己坦白罪行。
请问你应该怎么做?
一个非常好的方法是:构建“囚徒困境”。
(顺便一提,“内卷”其实就是“囚徒困境”一种高级形式。)
具体的操作很简单,只需要把两个罪犯关在不同的房间审讯,告诉两个罪犯相同的条件:
如果两个人都抵赖,各判1年。
如果两个人都坦白,各判3年。
如果一个人抵赖,一个人坦白,那么坦白的人被释放,抵赖的人被判5年。
(纯粹是简化问题,请不要套用具体的法律。)
只要开出这样的条件,就能让两个罪犯都坦白。当然,前提是:决策之时,两个罪犯都不知道对方的决策。
以上就是“囚徒困境”最简单的版本,巧妙利用了博弈论中的一个重要概念:纳什均衡。
纳什均衡很好理解,我们可以先把两个罪犯记为A和B。
根据上面的条件,我们可以画出A和B的收益矩阵:
A抵赖
A坦白
B抵赖
A被判1年
B被判1年
A被释放
B被判5年
B坦白
A被判5年
B被释放
A被判3年
B被判3年
所谓的收益矩阵,其实就是用表格把所有的结果列出来而已,没什么神秘之处。
(至于为什么要用“收益”这个词,是因为博弈论原本就是用来研究经济学的理论。被少判几年,也可以看成是一种“收益”。)
借助收益矩阵,可以直观理解纳什均衡。我们可以先分析B的决策:
A抵赖
A坦白
B抵赖
A被判1年
B被判1年
A被释放
B被判5年
B坦白
A被判5年
B被释放
A被判3年
B被判3年
如果A抵赖,那么B坦白,对B更有利。
A抵赖
A坦白
B抵赖
A被判1年
B被判1年
A被释放
B被判5年
B坦白
A被判5年
B被释放
A被判3年
B被判3年
如果A坦白,那么B坦白,对B也更有利。
所以不管A是抵赖还是坦白,B坦白,始终对B更有利。
分析A的决策,也会得出相同的结果。不管B是抵赖还是坦白,A坦白,始终对A更有利。
所以A和B都会坦白。
当然,上述分析有一个前提条件:A和B都是理性的人,懂得利用“收益矩阵”分析问题。
这就会引出一个问题:
如果A和B都能做出上述分析,就都能看穿“囚徒困境”的把戏,他们难道不会都抵赖,实现“双赢”吗?
A抵赖
A坦白
B抵赖
A被判1年
B被判1年
A被释放
B被判5年
B坦白
A被判5年
B被释放
A被判3年
B被判3年
这就是“囚徒困境”的厉害之处,就算A和B都能看穿“囚徒困境”的把戏,也都会坦白,因为“A和B都坦白”已经达到了纳什均衡的状态。
我们还是先分析B的决策,B知道两个人都坦白就中了圈套,但是如果B选择抵赖,A依旧坦白,B就会吃亏。当然,A也会做出同样的分析,
所以说,想要摆脱“囚徒困境”,就不能只靠自己一个人改变决策。只要别人不改变决策,你改变决策就一定会吃亏,此时的状态就是“纳什均衡”。
其实“囚徒困境”只是一个壳子,真正的精髓是纳什均衡。
上文写的只是1.0版的“囚徒困境”,只有两个囚徒,其实并不牢固。
在上文中,两个囚徒是合伙作案,他们的私人关系会改变原本的收益矩阵,很可能会让他们一起抵赖。
A抵赖
A坦白
B抵赖
A被判1年
B被判1年
患难见真情
A被释放
B被判5年
B将来报复A
B坦白
A被判5年
B被释放
A将来报复B
A被判3年
B被判3年
再见面,都尴尬
所以,1.0版的“囚徒困境”只是一个思想实验,没有太大的应用价值。
想要应用,就必须使用2.0版的“囚徒困境”。
从1.0到2.0的过程很简单:加人数。
2个囚徒不牢固,那就找20个囚徒。
20个囚徒还不牢固,那就找200个囚徒。
200个囚徒还不牢固,那就找2000个囚徒。
……
千万不要小看“加人数”,我们一定要清楚:多者,异也。
或者说:量变引起质变。
注意,“囚徒困境”真正的精髓是纳什均衡。2.0版的“囚徒困境”已经不是“一些罪犯合伙犯罪”的事了,而是:人人皆是“囚徒”。
大家最熟悉的2.0版“囚徒困境”应该就是“内卷”。
虽然2.0版“囚徒困境”人数众多,不过依然可以按照两个人情况列出收益矩阵,只需要考虑“你”和“别人”。
比如:加班。
如果有加班费的话。
别人加班
别人不加班
你加班
你多拿钱
别人多拿钱
你多拿钱
别人少拿钱
你不加班
你少拿钱
别人多拿钱
你少拿钱
别人少拿钱
如果没有加班费,但是不加班会被辞退的话。
别人加班
别人不加班
你加班
你有工作
别人有工作
你有工作
别人没工作
你不加班
你没工作
别人有工作
你没工作
别人没工作
老板招不到人
当然,实际问题会更复杂。
如果你不想加班,也有强制规定不准加班,那么老板就会降你的基本工资,让你不加班就没法养活自己,逼你自愿加班。
你可以选择不干,但是老板丝毫不慌,因为收益矩阵是:
别人干
别人不干
你干
你有工作
别人有工作
你有工作
别人没工作
你不干
你没工作
别人有工作
你没工作
别人没工作
老板招不到人
注意,“别人”是一个非常微妙的概念,除非你能确保所有人都不干,不然收益矩阵中蓝色文字的结果就不会出现。
人越多,就越难达成共识,纳什均衡的威力越大。
顺便提一句,“纳什均衡”并不是一个坏东西,只是在某些条件下让人觉得坏。
当然,现实中的“内卷”在触发纳什均衡之前就已经牢不可破了。
注意,纳什均衡的前提条件是:所有人都理性。是在所有人都理性(能看出圈套)的前提下,依旧维持“内卷”的理论。
但是,假设所有人都理性,本身就不理性。所以,维持“内卷”,根本就轮不到纳什均衡出手,群体固有的愚蠢早就完全维持“内卷”了。
不管是1.0还是2.0的“囚徒困境”,都建立在某一套具体的规则之上,根据一套具体的规则列出收益矩阵,得出对许多人有害的纳什均衡。
如果直接推翻某一套具体的规则,那么2.0版的“囚徒困境”也不复存在。
由此可以引出3.0版的“囚徒困境”,也就是把多个“囚徒困境”一层又一层嵌套在一起。想打破某一套“囚徒困境”的规则,就必须先打破另一套“囚徒困境”的规则。
3.0版的“囚徒困境”是在保护实现“囚徒困境”的规则,具体方法简单地说就是:在打破“囚徒困境”之前,要先打破“囚徒困境”,由此陷入“死循环”。
具体内容太过敏感,我不能写,在这里只能给一部分读者道歉。
把“囚徒困境”推进到3.0版,基本是不可破解了,大家对此有何看法?
后台-插件-广告管理-内容页尾部广告(手机) |
声明:部分图文来源于网络,版权归原作者所有,侵权请联系删除:wzwt58@qq.com。本站发布此信息目的在于传播更多信息,与本网站立场无关,不保证该信息(包括但不限于文字、数据及图表)准确性、真实性、完整性等。本文地址:https://www.quqiwen.com/kxts/24953.html
相关文章