改变传统认知理论！他们发现大脑是这样“算”出惩罚决策的

发布时间：2025-02-11来源：吴丹李浏览次数：10次

合作行为在自然界中普遍存在，是人类社会得以持续发展的关键所在。合作行为在组织和团队中一直扮演着重要的角色，被越来越多的管理者所关注。然而，合作行为产生与维持的动因一直是悬而未决的科学问题，已成为经济学家、生物学家、心理学家和神经科学家关注的热点研究领域。

传统的经济学理论认为，合作中人们常常面临集体利益与个体利益相矛盾的局面。在完成团队任务时，个体在尽己之力与坐享其成之间往往会犹豫不定，甚至会受到“搭便车”的诱惑，期望在不做出贡献的情况下获得收益。

早期研究发现合作中加入惩罚机制能够使合作水平提高。那么，合作中惩罚机制背后的思考过程是怎样的？学者们多用卡尼曼的双系统认知加工理论进行解释：根据思考的快与慢，在合作环境中，当个体感受到不公平时系统一可能会迅速触发愤怒或不满的情绪，促使个体采取即时的惩罚措施。系统二则会进行更为深入的分析权衡惩罚的成本与收益从而做出不惩罚的决策。

然而，合作中人们作出惩罚决策真的是“条件反射”吗？近日，乐投在线数据科学与管理工程学系长聘副教授陈发动、求是特聘教授汪蕾携手沃顿商学院学者Gideon Nave在Journal of Business Ethics（FT50期刊之一）上发表题为Calculated Punishment的研究。该研究通过公共品博弈实验，解构惩罚决策背后的认知加工机制，构建认知计算模型，来探究合作中人们做出惩罚决策的动因。

论文发表截图

研究发现，人们作出惩罚决策并非简单的“条件反射”，而是一个复杂的决策过程，即惩罚决策背后是“证据”累积加工的过程，惩罚所付出的成本、惩罚的影响、合作中的贡献差异三因素在加工过程中发挥作用。换言之，人们在面对合作中贡献不一的现象时会综合考虑这三个因素从而做出惩罚决策。

该研究结论颠覆传统的双系统认知加工理论中关于“个体基于直觉做出惩罚决策”，揭示了“惩罚决策是可以被计算的”，为促进组织内部合作、激发正向合作行为提供可参考的理论依据。本期【科研】专题，我们一起来看看这项高水平研究。

陈发动，乐投在线数据科学与管理工程学系长聘副教授、博士生导师

汪蕾，乐投在线数据科学与管理工程学系教授，浙江大学求是特聘教授、博士生导师

惩罚是基于直觉的“条件反射”？他们的研究颠覆传统解释

传统经济学假设人们总是理性和自私的，并以此做出决策。至于人们为什么最终还是会选择合作，往往用经典的研究范式——公共品博弈进行解释。公共物品博弈理论作为一种博弈范式巧妙简化现实生活中的复杂合作情境，通过策略选择等数学化方式较为完整地呈现出人际互动中的各种行为，为研究团队合作提供了可行路径。

公共品博弈的早期研究表明，惩罚是维持社会秩序的重要工具。亲社会惩罚是指个体为了维护社会规范和促进公共利益而对违反社会规范的行为进行的惩罚，通过惩罚违规行为来强化社会规范，从而促进合作行为的发生；而反社会惩罚是指个体对表现出亲社会行为的高贡献或高合作性他人实施惩罚，会损害合作水平。

在先前探讨惩罚背后认知机制的研究中，惩罚的双系统认知加工理论假设认为惩罚决策是两种过程相互作用的结果：一种是快速且基于直觉的过程，另一种是深思熟虑的过程。人类的第一本能反应是倾向于实施亲社会惩罚。具体而言，双系统认知加工理论区分了快速、直觉式的系统一思维与缓慢、分析性的系统二思维。在此框架下，研究指出，面对违规行为时，个体往往首先依赖系统一的直觉反应，倾向于维护社会规范和公平原则。

同样聚焦惩罚背后的认知过程，陈发动团队提出单重过程理论，将惩罚决策描述为一个价值计算过程。该过程理论不仅适用于惩罚决策，与诸如经济、感知等其他领域决策有着共同的机制并得到普遍认可。

研究采用漂移扩散模型（Drift-Diffusion Model，简称DDM）计算分析个体惩罚决策的影响因素，以精准描述、预测惩罚行为。该模型结合行为和反应时间生成定量预测，可以较为系统地评估惩罚决策的隐含过程，不仅研究亲社会惩罚，也能够将反社会惩罚纳入研究，为我们准确理解、把握其心理机制提供具体明确的理论参考。

漂移扩散模型（DDM模型）

研究发现个体在做出惩罚决策时并非是不假思索的“第一反应”。相反，这一过程涉及到大脑对信息的复杂处理与深度思考。具体而言，当面对是否对他人实施惩罚的选择时，人们的大脑会经历一个“证据累加”的过程，即收集并评估各种相关信息进行更为审慎的考虑。该发现挑战了传统的双系统认知理论，深化了我们对惩罚行为背后心理机制的理解。

研究发现这三个因素发挥重要作用，亲社会惩罚与反社会惩罚存在共性机制

该研究对德国一所大学的132名学生进行公共物品博弈与惩罚实验，经过二十轮实验，研究发现惩罚机制的背后是“证据”累计加工的过程，受个体惩罚所付出的成本、对被惩罚者的影响、合作中的贡献差异三因素影响。

当惩罚与否的差异并不显著时，个体在做出是否实施惩罚的决策过程中所耗费的时间往往最长。具体而言，人们在考虑是否对他人进行惩罚时会逐步收集、分析并整合成本收益、惩罚的后果、自己与他人贡献的差异这三方面因素，当这些证据不足以明确指向一个确定的结论时，个体就需要更多的时间来权衡利弊。

研究还发现，惩罚所带来的效益越高，个体越倾向于实施惩罚。无论是亲社会惩罚还是反社会惩罚，只要个体认为通过惩罚能够获得较大的正面效果，他们就更愿意采取行动。越愿意惩罚他人的人，在作决策时往往更加迅速果断；相反，对于不太愿意采取惩罚措施的人，则可能需要更长时间来克服内心的犹豫。

此外，研究还发现在没有充分信息的情况下，人们倾向于不惩罚。这与早期研究中“人们第一反应倾向于惩罚他人”的结论相反。无论是亲社会惩罚，还是反社会惩罚，其背后有着共同的认知加工过程。

这项研究揭示了人类惩罚决策背后的复杂心理机制，这些发现对于理解人类在组织中的社会行为、优化制度设计具有重要意义。

该研究为促进亲社会合作提供依据，为组织创设合作氛围提供参考

理论价值方面，该研究创新性地开发了将认知过程数据（如反应时间和眼动轨迹）与惩罚行为相结合的综合模型，这一突破深化了对于伦理决策的内在机制的认知和理解。

应用价值方面，研究结论为促进组织内部合作与惩罚决策的合理性提供重要启示。企业在制定组织内部的管理制度时，需要充分考虑个体实施惩罚所需的成本及其可能带来的收益。同时，企业为营造协作的氛围，应将个体惩罚所付出的成本、惩罚的影响、合作中的贡献差异这三个因素纳入考量范围。通过强调这些因素的重要性，引导员工更加关注积极行为。

此外，研究还揭示了一个重要现象：当惩罚无需承担任何成本时，人们更倾向于进行反社会惩罚，反社会惩罚会严重影响组织内部合作的氛围。因此，管理者在制定惩罚措施时，应该审慎考量其成本收益，以促进合作规范，因为低成本或无成本可能会无意中助长反社会惩罚行为。

最后，管理者可以通过实施针对性的培训项目，增强员工对影响惩罚背后的计算过程的因素的认识，从而有效减轻与惩罚相关的偏见，促使组织行为更加严格地遵循商业伦理规则，确保企业运营的公正性与可持续性。

附：论文摘要

Punishment is fundamental to the evolution of cooperative norms in teams, organizations, and societies. Based on findings that people are faster when punishing others (relative to when withholding punishment), dual-process theories of punishment assert that humans have an intuitive tendency to punish, which requires effortful deliberation to overcome. Here, we propose an alternative single-process theory that models punishment decisions as a sequential sampling process. We provide supporting evidence for this theory using a public goods game experiment that experimentally manipulates the cost–benefit tradeoff across the game. We show that people are not systematically faster when punishing (versus withholding) across tradeoffs.

We also find an inverted-U-shaped relationship between response times and the strength of preferences for punishing, and a negative association between punishment rates and the relative speed of punishment across individuals. Further computational analysis using the drift–diffusion model (DDM) reveals that, on average, people exhibit a pre-disposition to withhold punishment. Our study provides a unified single-process framework for studying the micro-foundations of punishment and integrating process measures to better describe and predict behavior.

导航

改变传统认知理论！他们发现大脑是这样“算”出惩罚决策的