特色

实验方法不是中立的工具

安娜，索菲亚，莫莱斯和拉尔夫，赫特威格

2022年8月30日

标签:

登录到Save for Later

下载

50多年来，心理学家进行了无数的实验，一次又一次地证明，人们在统计推理方面似乎是多么绝望。

半岛体育官方网址入口研究人员发现，人们倾向于高估别人同意自己的程度(Ross et al.， 1977)。他们还发现，人们倾向于相信两个事件同时发生的可能性比只发生一个事件的可能性更大(Tversky & Kahneman, 1983)。他们已经表明，人们倾向于高估容易出现在脑海中的事件的可能性，比如悲剧但罕见的事件，尽管发生的频率很低，但它们却会烙印在记忆中(Tversky & Kahneman, 1973)。

这些发现让心理学家和经济学家相信，人们没有能力进行合理的统计推理和决策——我们的心理软件功能失调，毫无理性可言。根据诺贝尔奖得主理查德·塞勒(Richard Thaler, 1994)的说法，人们受到如此多的认知偏见或心理错觉的影响，以至于这些缺点“应该被视为普遍现象，而不是例外。”

这一观点具有潜在的重大社会和政治影响，我们认为这是错误的。我们认为，许多实验心理学家对人类理性的描述过于消极，他们的悲观情绪源于一个看似平凡的细节:方法的选择。

实验方法不是中立的工具。它们影响参与者的统计推理，进而影响实验者得出的关于人类理性的结论。多年来，研究界主要依赖于单一的实验方案——从设计上就排除了实践和从经验中学习。在我们看来，这种同质性导致了一种不平衡的观点，认为人是非理性的存在。

不同的方法导致不同的观点

非理性思维的观点与过去50年心理学最具影响力的研究项目有关。启发式和偏见项目始于20世纪70年代，由Amos Tversky和Daniel Kahneman推动。关键的观点是人们有认知的局限性，这使得他们无法进行理性的计算。相反，人们依赖于启发式，这更容易应用，但可能导致系统错误。这个程序产生了一个长串人们的判断系统地偏离了理性推理的规范。

但在此之前，另一个研究项目——直觉统计学家得出了一个非常不同的结论。就像启发式和偏见程序的发现一样，直观的统计学家程序的发现不是一个意见问题;他们也是基于实验数据。

这个直观的统计程序在人们的判断和规范模型(即概率论和统计学的规则)的预测之间找到了足够的对应关系，从而得出结论，这些模型可以为人们如何推理概率的理论提供基础。的确，在1967年审查心理学家卡梅伦·彼得森和李·罗伊·比奇通过160多个实验得出结论，人们可以对概率做出相当准确的推断。研究人员认为，人是凭直觉半岛体育官方网址入口的统计学家。

心理学如何能如此迅速而显著地改变其关于人类统计推理的结论?毕竟，人们不会突然变得不擅长实验任务。

一个分析来自我们实验室的研究人员检查了来自这两个研究方向的600多个实验的方法(Lejarraga & Hertwig, 2021)。分析表明，Tversky和Kahneman建立了一个全新的实验方案来测量统计直觉，随后在整个研究界被采用。

在20世纪60年代，研究人员半岛体育官方网址入口使用了一种经验协议，允许人们从直接经验中学习概率。通常，人们可以练习，按顺序抽取信息，并通过反馈不断调整反应。

但是Tversky和Kahneman用描述性的协议取代了这个经验协议。他们的实验向人们展示了描述性的场景和语言问题，并倾向于要求一次性的估计或判断。他们的研究参与者几乎没有机会练习或从反馈中学习。

我们认为，实验方案的这种变化是一个关键因素，从把人们视为直觉的统计学家，到把他们视为不可挽回的非理性。

贝叶斯推理的例子

考虑一下这两个协议是如何用于研究贝叶斯推理的——在获得新信息(例如，阳性测试结果)后更新事件(例如，患有疾病)的预测概率的能力。

在体验方案下，研究人员向人们展示了一个真正的扑克筹码样本，每次抽取一个。扑克筹码可以是红色或蓝色。在看到每个筹码后，人们被要求估计扑克筹码样本来自两个袋子中的一个的概率:一个袋子里70%的筹码是红色的，30%是蓝色的，另一个袋子里70%的筹码是蓝色的，30%是红色的。参与者被允许在看到每个筹码后修改他们的答案。使用不同的样品和不同的蓝片和红片基准率，重复此过程多次。

相比之下，Tversky和Kahneman使用描述性协议来研究贝叶斯推理。例如，他们让参与者阅读五份虚构人物的描述，据称这些虚构人物是从30名工程师和70名律师(或70名工程师和30名律师)中随机抽取的。一些描述让人联想到工程师的刻板印象，另一些则让人联想到律师的刻板印象。对于每一个描述，参与者都被要求指出这个人是工程师的概率。

与体验式协议不同，关于样本的所有相关信息都是口头描述并一次性传递的。从经验中学习既没有必要也不可能，而且没有提供任何反馈。

这两个实验旨在测量相同的能力，但得出了相互矛盾的结果。经验方案发现，人们本质上是贝叶斯推理者，只是他们在修正自己的信念时过于看重基础比率。相比之下，描述性协议发现人们的推理完全不是贝叶斯的。人们忽略了基础比率，而是根据某人的描述与工程师的刻板印象有多接近来判断此人是工程师的可能性——这种现象被称为基础比率谬误。

问题是:研究人员在实验室中使用的实验方法并不是中性工具。半岛体育官方网址入口它们可以影响人们的判断。人们似乎不太擅长解决关于概率的文字问题——至少在没有明确指示的情况下是这样。但当他们有机会通过实践和直接经验来学习时，他们似乎确实有相当强的直觉统计推理能力，并根据每一个新的观察来调整他们的判断。经验很重要。

方法不是中立的，科学家也不是

鉴于这两种实验方案，其中一种比另一种对人类理性产生了更积极的看法，人们可能会期望科学家们考虑两种证据流，并研究从描述或经验中获得统计信息的好处和局限性。

事实并非如此。一个分析对1972年至1981年间发表的科学文章的研究表明，报告业绩不佳的文章被引用的可能性几乎是报告业绩良好的文章的六倍(Christensen-Szalanski & Beach, 1984)。

反面证据可能胜出的一个原因是，特维斯基和卡纳曼的描述方案，其设置和实施成本最低，使得数据收集更容易——最终盖过了20世纪50年代和60年代的发现。

更重要的是，对负面证据的解释揭示了心理学家的一种倾向，即把实验中人们的行为过度归因于性格特征(即人们的认知局限)，而忽视了实验背景的作用(例如，统计信息是如何表示的，以及是否允许顺序学习)。

以这种方式解释人们行为的倾向与社会心理学中研究的一种现象相对应，即基本归因错误。心理学家也是人，所以他们可能无法对他们所研究的认知偏见免疫。

对糟糕表现和认知局限性的选择性强调已经从心理学蔓延到经济学甚至公共政策。政策制定者想当然地认为，人们的认知错觉是如此普遍和持久，以至于处理这些错误会更有效推动)而不是试图克服它们。

大多数“助推”都涉及改变人们通常声称不关心的选择环境的某些方面，以引导人们的行为朝着正确的方向发展。经典的“轻推”措施包括重新设计自助餐厅，使其在与眼睛平视的高度展示更健康的食物，以及自动将个人纳入养老金计划，除非他们特别选择退出。

“轻推”会引导人们的行为，同时让他们的能力保持不变，而直觉统计学家的研究项目对人们的学习能力给出了更乐观的看法。

2022年3月/ 4月号相关内容:“轻推”如何养成习惯:小改变的颠覆性冷漠

从过去吸取教训

源于不同实验方案的关于合理性的相互冲突的观点突出了完全依赖单一方法的风险。我们相信，描述性和经验性协议的结合，比单独使用任何一种协议都能更全面地理解人们的能力和理性。

半岛体育官方网址入口研究人员应该调查人们在健康和金融等领域处理概率的各种各样的情况，并考虑到实践、反馈、学习机会和财务激励等方面。

半岛体育官方网址入口研究人员还应该继续使用描述性协议，同时使用经验协议，以调查表示统计信息的不同方式如何影响人们的推理。改变统计信息的表示形式——从概率到自然频率，从相对风险到绝对风险，从数字到图形表示，从描述性到经验格式——可以使人们更善于用贝叶斯方法进行推理。

描述性和经验性协议的结合使用也有助于阐明在整个生命周期和跨物种的统计推理的发展。发展心理学家，APS总裁艾莉森·戈普尼克曾经问道“为什么连婴儿和黑猩猩都能如此聪明，成年人却常常对概率如此愚蠢?”(Gutíerrez, 2014)。回顾文章我们实验室的研究表明，实验方案可能是理解这种差异的关键因素(Schulze & Hertwig, 2021)。虽然针对成年人的研究通常使用描述性协议，但针对婴儿和类似的非人类动物的协议往往涉及信息的第一手经验。

看到艾莉森·戈普尼克的APS总统专栏。

在我们看来，描述性和经验性协议的组合比单独使用任何一种协议都更好。此外，关于合理性的争论不能与实验方案的选择分离。当研究人员半岛体育官方网址入口从行为数据中得出结论时，他们必须考虑到实验方案的选择和由此产生的泛化限制。将研究结果从描述性方案推广到经验方案是否合理，反之亦然，必须通过经验来建立，而不是简单地假设。

让我们以最后一个呼吁来结束:关于人们的统计直觉的辩论对于如何支持公民做出更好的决策具有重要意义。基于经验方案的研究证明，对于旨在提高人们能力的干预措施，比“轻推”方法所假设的更加乐观。现在是政策制定者充分探索……潜力的时候了提高，一种由行为科学提供信息的政策方法，旨在培养人们在尊重他们的代理和自主权的同时做出正确选择的能力(参见，例如，Hertwig & Grüne-Yanoff, 2017)。“推动”和“推动”这两种方法都应该在政策制定者的工具箱中占有一席之地。

应答:

作者感谢Deb Ain, Gerd Gigerenzer, Susannah Goss, Tomás Lejarraga, Lael Schooler和Jolene Tan-Davidovic为本文的早期版本提供了许多有益的评论。

对这篇文章的反馈?电子邮件apsbdapp官网下载observer@psychologicalscience.org或登录评论。

参考文献

李丽娟，李志刚(1984)。引用偏误:判断与决策文献中的Fad与fashion。美国心理学家，39岁(1), 75 - 78。https://doi.org/10.1037/0003-066X.39.1.75

Gutíerrez .(2014年1月10日)。令人惊讶的概率大师穿着尿布。《华尔街日报》。https://www.wsj.com/articles/SB10001424052702303393804579308662389246416

赫特威格，R.， & Grüne-Yanoff, T.(2017)。引导和推动:引导或授权做出好的决定。心理科学展望，12(6), 973 - 986。https://doi.org/10.1177/1745691617702496

Lejarraga, T.， & Hertwig, R.(2021)。实验方法如何塑造对人类能力和理性的看法。心理学通报，147(6), 535 - 564。https://doi.org/10.1037/bul0000324

彼得森，C. R. &比奇，L. R.(1967)。人类作为一个直观的统计学家。心理学通报，68(1) 29-46。https://doi.org/10.1037/h0024722

罗斯，L.，格林，D.和豪斯，P.(1977)。“错误共识效应”:社会感知和归因过程中的自我中心偏见 实验社会心理学杂志，13 (3),279 - 301https://doi.org/10.1016/0022 - 1031 (77) 90049 - x

Schulze, C. & Hertwig, R.(2021)。统计直觉的描述-经验差距:聪明的婴儿，善于冒险的黑猩猩，直觉的统计学家和愚蠢的成年人。认知,210, 104580年。https://doi.org/10.1016/j.cognition.2020.104580

塞勒，r.h.(1994)。准理性经济学。罗素·塞奇基金会。

塞勒，R. H. &桑斯坦，C. R.(2021)。助推:最终版。耶鲁大学出版社。

Tversky, A. & Kahneman, D.(1973)。可用性:判断频率和概率的启发式方法。认知心理学， 5(2)， 207-232。

Tversky, A. & Kahneman, D.(1983)。外延推理与直觉推理:概率判断中的连接谬误。心理评估， 90(4)， 293-315。https://doi.org/10.1037/0033-295X.90.4.293

bdapp官网下载 >2022 >九月/十月 >实验方法不是中立的工具

埃里希·威特 2022年10月3日
DGPS
退休-没有日记bd体育在线app下载安卓
成员自2010年1月20日

这是对心理学这一特殊领域的杰出贡献，毕竟，这一领域已经获得了诺贝尔奖。从实验结果中得出的结论与其他实证研究的实质性可比结果不一致，即使是在诺贝尔奖授予实验研究的情况下。那么哪些结果是正确的呢?是实验方法伪造了结果吗?如果不同的方法导致不同的结果，而这本身是一致的，那么两个结果都可以是“正确的”，他们只是测试了不同的东西。不幸的是，我们没有验证实验设置，所以我们不知道发生了什么变化。更重要的是总体设定的有效性。(所有其他实验条件也是如此。)要做到这一点，我们需要理论，更全面的验证策略，以及理论结构的有效度量。只有这样，我们才能得出相关结论并提出建议。 At the same time, the statements and recommendations must also be externally valid. So, it is not the tool that is the problem but the lack of validation and theory. The following applies: Different tools can have different validity, the same tools can have different validity, different tools can have the same validity, and the same tools should have the same validity. You must check this intensively. The manipulation check is not a validity check.

APS定期在我们的网站上开放某些在线文章供讨论。从2021年2月起，您必须是登录的APS成员才能发表评论。发表评论，即表示您同意我们的社区指导原则以及显示您的个人资料信息，包括您的姓名和隶属关系。文章评论中出现的任何观点、发现、结论或建议都是作者的观点，并不一定反映APS或文章作者的观点。欲了解更多信息，请参阅我们的社区指导原则。

请登入您的APS帐户进行评论。

饼干	持续时间	描述
兰德公司的	从来没有	AddThis设置这个cookie来跟踪页面访问、流量来源和共享计数。
同意	2年	YouTube通过嵌入的YouTube视频设置这个cookie，并注册匿名统计数据。
短波紫外线	1年27天	由addthis.com设置，以确定addthis.com服务的使用情况。
_ga	2年	谷歌Analytics安装的_ga cookie可以计算访问者、会话和活动数据，还可以跟踪网站的使用情况，用于网站的分析报告。cookie匿名存储信息，并分配一个随机生成的号码来识别唯一的访问者。
_gat_gtag_UA_3507334_1	1分钟	由谷歌设置，用于区分用户。
_gid	1天	由谷歌Analytics安装的_gid cookie存储了访问者如何使用网站的信息，同时还创建了网站性能的分析报告。收集的一些数据包括访问者的数量、他们的来源以及他们匿名访问的页面。

饼干	持续时间	描述
疯狂的	1年27天	AddThis设置这个地理位置cookie，以帮助了解共享信息的用户的位置。
VISITOR_INFO1_LIVE	5个月27天	由YouTube设置的cookie，用于测量带宽，以决定用户是否获得新的或旧的播放器界面。
YSC	会话	YSC cookie由Youtube设置，用于跟踪Youtube页面上嵌入的视频的观看情况。
yt-remote-connected-devices	从来没有	YouTube设置此cookie来存储使用嵌入式YouTube视频的用户的视频首选项。
yt-remote-device-id	从来没有	YouTube设置此cookie来存储使用嵌入式YouTube视频的用户的视频首选项。
yt.innertube: nextId	从来没有	这个cookie由YouTube设置，注册一个唯一的ID来存储用户看过的YouTube视频的数据。
yt.innertube:请求	从来没有	这个cookie由YouTube设置，注册一个唯一的ID来存储用户看过的YouTube视频的数据。

特色

实验方法不是中立的工具

不同的方法导致不同的观点

贝叶斯推理的例子

方法不是中立的，科学家也不是

从过去吸取教训

评论

作者简介

相关的

I，心理学家:探索人工智能在医疗保健中的伦理障碍和临床优势

后起之秀:重访经典

心理科学协会

董事会及委员会行政官

不同的方法导致不同的观点

贝叶斯推理的例子

方法不是中立的，科学家也不是

从过去吸取教训

评论

作者简介

相关的

I，心理学家:探索人工智能在医疗保健中的伦理障碍和临床优势

后起之秀:重访经典

人们把体型和性格特征联系在一起

心理科学协会

董事会及委员会行政官

饼干