特色

错误的正确一面:新兴的研究透明文化

几年前,一组研究人员决定为他们的同事树立一种罕见的诚实水半岛体育官方网址入口平。他们每个人都同意公开他们对他们发表的一项发现的怀疑。他们称之为“信心丧失计划”。

德国莱比锡大学人格心理学家、该项目的负责人茱莉亚·罗勒在接受《德国时报》采访时表示:“我们的主要目标是消除对自己的研究结果丧失信心的污名。bdapp官网下载.“正因为如此,我们也决定把重点放在最难开放的例子上——一项研究的核心发现因为一个明确的理论或方法问题而受到质疑,而人们必须为此承担责任。”

这一倡议产生了一批13个自我更正发表在 心理科学视角.Rohrer和她的同事们希望他们的文章能激励其他研究人员重新评估他们的工作,并在必要时向更大的科学界披露潜在的错误或缺点。半岛体育官方网址入口

自心理科学研究人员开始发现许多研究中的方半岛体育官方网址入口法缺陷——引发了该领域的“复制危机”——以来的十年里,罗勒等科学家一直在为社会和行为科学的新文化奠定基础。他们正在创造一种氛围,在这种氛围中,研究人员可以分享他们的数据和材料,这半岛体育官方网址入口样其他人就可以审查和发现潜在的方法问题,在不扼杀他们的职业生涯的情况下承认错误,即使他们的研究结果是负面的,也可以发表文章。

APS研究员Brian a . Nosek指出:“在心理科学领域,改善研究实践的真正行为变化已经开始。”Brian a . Nosek是该领域努力支持科学方法和可靠性的领导者。“该领域正在引领变革,并评估这些变革是否对提高可信度产生了预期效果。”

成长的烦恼

科学心理学在2010年代度过了一段密集的(通常是充满怨恨的)自我检查时期,因为当试图复制该领域一些最有影响力的研究时,一个又一个实验室报告了更小的效应量或微不足道的结果。改革派指出,研究结果扭曲的做法被广泛使用,比如p-黑客(不恰当的数据选择或统计分析,使不显著的结果变得显著)和在发现显著结果后进行假设。这些研究的作者发现,他们的声誉即使没有受到打击,也受到了损害。

心理学远远不是唯一面临复制问题的科学学科。从经济学到生物医学,许多领域都在努力解决有关研究完整性和严谨性的类似问题。但心理科学因其自我纠正举措的广度而脱颖而出。

诺塞克是弗吉尼亚大学(University of Virginia)的教授,是这些改革努力的前沿人物。2013年,他和定量心理学家杰弗里·斯皮斯(Jeffrey Spies)成立了非营利组织开放科学中心(Center for Open Science),以提高科学研究的透明度和诚信。在开放科学中心的第一个项目中,他们召集了270名科学家来重复100项同行评议的心理学研究的结果。总体而言,97%的原始研究报告具有统计学意义 p 值(p < .05),但只有36%的复制研究发现有统计学意义的结果。此外,平均效应量是原始研究报告的一半(开放科学合作,2015)。该项目的结果推动了该领域提高可重复性的动力。 

此外,各种各样的基层努力已经出现,以促进更强大的科学。其中包括心理科学加速器,这是一个全球范围的实验室网络,旨在大规模重新进行实验。在其 第一个重大项目, 于2021年报道,该小组发现了强有力的证据——尽管有一些细微差别——支持 的发现2008年的一项研究 表明,人们会根据可信度和体力来判断陌生面孔(Oosterhof & Todorov, 2008)。

本期相关内容:

承认错误

这些举措背后的愿望是消除围绕科学错误的污名,以帮助科学家理解承认错误不会玷污他们的职业生涯 

罗勒说的灵感丧失信心的项目来自社会心理学家达纳·卡尼(加州大学伯克利分校),她在2016年写道她不再相信她早期关于权力姿势对情感、行为和荷尔蒙影响的发现。她指出效应量小,样本量小,而且p-黑客(卡尼,2016)。

Rohrer的团队向心理学研究人员发出了公开邀请,邀请他们提交关于对之前发表的一篇作品失去信心的声明。半岛体育官方网址入口他们还进行了一项在线调查,询问受访者是否对之前发表的研究结果失去信心,以及原因。

Rohrer和她的同事在《纽约时报》上写道:“这一举措背后的想法是帮助个人自我纠正正常化和去污名化,同时,希望也能奖励以这种方式在出版物中暴露自己的作者。视角篇文章。

参与研究的研究人员提交了一份半岛体育官方网址入口声明,描述他们认为不再站得住脚的研究。5个报告方法错误,4个承认无效推断,7个承认p-黑客——在许多情况下,这是由于对统计方法的理解不足。

Rohrer的团队还收集了316份对他们的调查的回复,收集了科学家职业生涯各个阶段的数据。44%的受访者表示,他们至少对其中一项调查结果失去了信任。其中,超过一半的人表示,这一发现是由于“判断上的错误或缺陷”,大约四分之一的人对错误负有主要责任。受访者也承认存在可疑的研究行为。

在那些对研究结果失去信心的人中,只有17%的人表示,他们的担忧是公开记录的问题,其中大多数情况下涉及到文章、会议演示或社交媒体帖子的承认,这些文章、会议演示或社交媒体帖子与原始研究报告没有直接联系。

当被问及为什么他们不表达他们对一项发现失去信心时,一些受访者说他们不知道如何表达,而另一些人则认为披露他们的担忧是不必要的,因为这一发现几乎没有引起人们的关注。一些人担心会伤害合著者的感情,另一些人担心他们的披露会被如何看待(Rohrer et al., 2021)。

Rohrer和她的同事们希望促进一种自我纠正的文化,这样研究人员就可以公开后来发现的研究问题,而不用担心他们的声誉和工作受到损害。半岛体育官方网址入口

她说:“许多半岛体育官方网址入口研究人员担心,这种开放和谦逊可能会损害他们的职业前景。”“我希望对这些人来说,信心丧失项目告诉他们自我纠正不是 , 这是件大事——每个人都会时不时地犯错误。”

引用滞后于复制失败

新的研究表明,尽管在过去10年里,失败的复制已经使一系列具有里程碑意义的心理学发现受到了质疑,但文献中的引用模式并没有跟上步伐。

由阿姆斯特丹大学心理学研究员汤姆·e·哈德威克(Tom E. hardwick)领导的科学家剔除了四个与原始结果相矛盾的主要多实验室重复实验。哈德威克的团队随后观察了这些失败的重复之后的引用模式,发现对原始研究的正面引用只有小幅下降。

“与原始发现强烈矛盾的重复结果并不一定会否定它的可信度。”哈德威克和他的同事写道心理科学方法与实践进展“,(ampp)。“然而,人们至少可以期望重复的结果在后续的文献中得到承认和明确的辩论。”

在另一项研究中,加州大学圣地亚哥分校的社会科学家使用谷歌Scholar来检查心理学、经济学和普通科学研究的引用模式,在其他实验室试图复制它们之前和之后(Serra-Garcia & Gneezy, 2021)。研究人员半岛体育官方网址入口发现,到目前为止,那些后来未能复制的研究最有可能被引用,而这些引用中只有12%甚至承认了不成功的复制。

在他们的AMPPS文章中,哈德威克和他的同事承认,一些复制结果受到了挑战。他们解释说,即便如此,也不能成为忽视这种不协调的理由。

“因为这场争论还远远没有解决,理想情况下,任何对原始研究有利的引用至少应该伴随着重复结果的共引,以及对差异结果的一些讨论。”

参考文献

哈德威克,T., Szücs, D., Thibault, R. T., Crüwell, S., van den Akker, O. R., Nuijten, M. B., & Ioannidis, J. P. A.(2021)。引用模式遵循一个强烈矛盾的复制结果:心理学的四个案例研究。心理科学方法与实践进展,4(3), 1 - 14。https://doi.org/10.1177/25152459211040837

Serra-Garcia, M., Gneezy, U.(2021)。 Nonreplicable publications are cited more than replicable ones科学的进步7(21), eabd1705。https://www.science.org/doi/10.1126/sciadv.abd1705

正常化复制

其他科学家则希望让复制超越成功/失败的范式,成为科学进步中被接受的一部分。

“对其他科学家、公众和政策制定者来说,复制可以是一个强有力的指标,表明事情正在按照应有的方式进行。”约翰·e·埃德隆德(罗切斯特理工学院)和他的同事在 上发表了一篇新文章心理科学视角.“因为复制可以确保可靠的结果,并引发关于研究发现的对话,它们可以推动科学向前发展……通过在科学界重视复制,我们将复制正常化为科学过程的一部分,允许随着证据的出现而修改信念”(Edlund et al., 2021)。

Nosek、Rohrer和其他14名研究人员组成的团队在一份新的报告中指出,培养这种观点需要改变建立科学声誉的方式半岛体育官方网址入口在 条心理学年度评论y.许多学者将他们的职业身份建立在他们的发现上,这可能会导致他们在这些结果不被重复时采取防御姿态(Nosek et al., 2021)。过去在社交媒体上的行为证实了这些担忧:许多研究人员发现,在别人发现他们工作中的缺点后,他们的性格和意图受到了攻击。半岛体育官方网址入口

但2016年UVA的一份报告表明,承认自己工作复制失败的科学家可能会看到自己的声誉得到提升,而不是受到质疑。心理学家Charles R. Ebersole(现就职于美国研究所)和Jordan R. Axt(现就职于麦吉尔大学)与Nosek合作,对近4800名美国成年人进行了在线调查,研究了这一现象。研究人员向参与者展示了一名假想科学家的描述,他提出了“无聊但确定的”结果,另一名科学家提出了“令人兴奋但不确定的”发现。(对于样本的一个子集,“可重复性”和“不太可重复性”被使用,而不是“确定”和“不确定”)受访者被要求对每个科学家的智力、道德、声誉、令人钦佩的程度和就业能力进行评分,这些评分表明,他们更喜欢产生更确定结果的科学家,而不是那些发现更令人兴奋的科学家。

然后,Ebersole和Axt向参与者展示了各种场景,这些场景涉及的科学家的发现未能被复制。当研究人员承认复制失败时,与批评复制失败时相比半岛体育官方网址入口,受访者对研究人员的道德和能力的评价更有利。此外,他们在这些方面给那些对自己的研究进行了复制的研究人员最高的评价,尤其是如果他们发表了一篇不成功的复制论文,而不是驳回它。半岛体育官方网址入口

Ebersole、Axt和Nosek对313名心理学研究人员和428名大学生进行了类似的调查,得出了类似的结果。半岛体育官方网址入口但与一般人群不同的是,这些参与者表示,他们认为产生令人兴奋但不确定结果的科学家将获得更大的事业成功(Ebersole et al., 2016)。

调查结果强调了改变科学领域激励结构的呼吁。多年来,希望提高科学诚半岛体育官方网址入口信的研究人员一直抱怨,期刊编辑、资助者和学术机构倾向于那些有新发现的研究人员,往往以牺牲稳健性为代价。大学管理者希望教师的科学记录能带来拨款。资助申请者夸大了他们对潜在资助者的预期发现。期刊编辑倾向于积极的结果,促使研究人员埋葬那些可能不会发表的无效发现。半岛体育官方网址入口

Nosek告诉 :“朝着严格和透明的可持续变化要求出版、资助、招聘和晋升的奖励系统积极促进严格和透明。bdapp官网下载.“如果他们不这样做,在改善研究文化方面取得的明显进展将不可避免地倒退。”

在复制危机之后,这种有问题的结构正在慢慢改变。APS及其期刊编辑本着透明度的精神对出版实践进行了许多改变。其中包括预注册,科学家在收集数据和分析结果之前详细说明他们的研究假设、设计和分析计划。他们还向那些公开提供数据和材料供审查的作者颁发开放实践徽章。对这些进展的影响的评估仍处于早期阶段。Nosek和同事报告说,调查产生了不同比例的数据共享和预注册。但也有一些令人鼓舞的迹象。 

在2019年发布的调查结果中,由经济学家加勒特·克里斯滕森(Garret Christensen半岛体育官方网址入口)领导的一组研究人员发现,报告共享数据或代码的心理科学家比例从2011年的20%上升到2017年的51%;同期,预注册从8%攀升至44% (Christensen等人,2019). 

与此同时,越来越多的期刊正在采取旨在提高可复制性的bd体育在线app下载安卓政策。大学也在慢慢地、但越来越多地提到,在申请教师职位的申请人的工作中,更倾向于可复制性和透明度。

许多人认为,预先注册等开放科学实践很麻烦,会减慢发现的步伐。其他人则担心,复制项目的升级将进一步损害该领域的声誉,更不用说某些研究人员的职业生涯了。半岛体育官方网址入口

但改革者表示,如果该领域能够接受结构性变革,不再将复制失败视为危机,创新研究将不会受到扼杀。诺塞克和他的同事在他们的 中写道,科学的存在是为了扩大知识的边界心理学年评 文章——这种扩张包括错误的开始和未实现的预测。他们说,健康的心理科学将产生许多不可复制的发现,同时继续努力提高可复制性。 

“一个成功的科学生涯的一部分,”他们写道,“包括习惯于犯错,很多时候。“

斯科特·索林是马里兰州银泉市的自由撰稿人。

参考文献

Christensen, G., Wang, Z., Paluck, E. L., Swanson, N., Birke, D. J. & Littman, M. E.(2019)。开放科学实践正在兴起:社会科学状况(3S)调查。PLOS生物学,14(5) e1002460。
https://doi.org/10.1371/journal.pbio.1002460

卡尼,d.w.(2016, 9月25日)。我对"力量姿势"的看法https://faculty.haas.berkeley.edu/dana_carney/pdf_my%20position%20on%20power%20poses.pdf

艾博索,c.r., Axt。[J. R., & Nosek, b.a. (2016).]科学家的声誉是建立在正确而不是正确的基础上的。公共科学图书馆生物学, 14(5), e1002460。https://doi/10.1371/journal.pbio.1002460

Edlund, j.e., Cuccolo, K, Irgens, m.s., Wagge, j.r., & Zlokovich, m.s.(2021)。通过复制研究拯救科学。心理科学视角.推进在线出版。https://doi.org/10.1177/1745691620984385

琼斯,B. C.,德布鲁因,L. M.,弗雷克,J. K.,刘扎,M. T.,安特福克,J.,阿林兹,N. C.,恩杜开赫,I. L. G.,布洛索姆,N. G.,刘易斯,S. C.,福洛尼,F.,威利斯,M. L., Cubillas, C. P.,瓦迪罗,M.,图列加诺,E.,吉利德,M., Simchon, A.,萨里贝,S. A.,奥斯利,N. C.,张,C.,……科尔斯,N. A.(2021)。社会知觉的价价-支配模型适用于哪些世界地区?人类行为, 5(1), 159-169,https://doi.org/10.1038/s41562-020-01007-2

诺塞克,B. A.,哈德威克,T. E.,莫桑茨,H.,阿拉德,A.,考克,K. S.,德雷伯,A.,菲德勒,F.,希尔加德,J., Kline, M., Nuijten, M. B.,罗勒,J.,罗梅罗,F.,谢尔,A.,谢勒,L., Schönbrodt, F. D., &瓦齐尔,S.(2022)。心理科学中的可复制性、稳健性和可重复性。 心理学年度评论.推进在线出版。https://doi.org/10.31234/osf.io/ksfvq

奥斯特霍夫,n.n.,托多罗夫,A.(2008)。人脸评价的功能基础。美国国家科学院学报, 105(32), 11087-11092。https://doi/10.1073/pnas.0805664105

开放科学合作。(2015).估计心理科学的可重复性。科学, 349(6251), 943。https://www.science.org/doi/10.1126/science.aac4716

罗勒,J. M.,蒂尔尼,W.,乌尔曼,E. L.,德布鲁因,L. M.,海曼,T.,琼斯,B.,施穆克,S. C.,西尔伯扎恩,R. M., Willén, R. M.,卡尔森,R.,卢卡斯,R. E.,斯特兰德,J.,瓦齐尔,S.,维特,J. K., Zentall, T. R.,夏布里斯,C. F., & Yarkoni, T.(2021)。自我纠正:信心丧失项目的发现。心理科学视角.推进在线出版。https://doi.org/10.1177/1745691620964106


APS定期在我们的网站上开放某些在线文章供讨论。从2021年2月起,您必须是登录的APS成员才能发表评论。发表评论,即表示您同意我们的社区指导原则以及显示您的个人资料信息,包括您的姓名和隶属关系。文章评论中出现的任何观点、发现、结论或建议都是作者的观点,并不一定反映APS或文章作者的观点。欲了解更多信息,请参阅我们的社区指导原则

请登入您的APS帐户进行评论。