错误在我们的统计数据

就像技术的发展彻底改变了收集和测量的数据,新数据提供了一个分析方法,可以使结果在一个更广泛的科学研究和应用背景。问责和可靠性的不断增长的需求在社会科学中促使增加研究报告影响的大小措施的大小关系,置信区间提供一个估计的误差。与假设检验和p扭曲的价值观,这些参数不是人口规模,因此可以用来比较在多个研究结果(分析),作为一个标准的措施。增加使用效果和心理科学领域的置信区间,是很重要的对于年轻研究人员掌握这些“新统计数据。”半岛体育官方网址入口

小型公立艺术学院读本科时,我发现了新的统计数据不是直接从类,而是听从教授的建议,我的研究方法。教授浸染。我认为掌握统计可以帮助我进入世界学术界,这似乎无法访问我在本科一年级新生机构。然而,像我的许多非常支持教授,他只能给我鼓励发现更多,作为新一代的统计数据并不包括几十年前在他的训练作为一个心理学家。建立基本的统计课,我把我这一代的无限智慧的泉源:互联网。

我的首要任务是解决科恩的d和置信区间。我把维基百科学习效果的语言和动作,鼓励经验主义的新统计数据作为标准。然后,我寻找简单的论文揭开了数学,如罗伯特·科2002纸”效果,愚蠢”和杰夫·卡明的2001年撰写的开创性文章。我练习使用的数据都是容易和我熟悉的——例如,我重新回归为一个项目专用的导师,琼·祖克,调查青少年的社会目标和peer-nominated声望如何影响学术自我表现策略。复制参数方差分析估计,我检查如何school-specific因素预测学术成果的罗彻斯特市学区超出收入的影响——数据我分析导致当地的州参议员的白皮书(数据可用在这里)。

起初,我试图复制结果我已经建立了:新SPSS软件,通过描述性统计我点击我需要,插入到方程和科恩的计算d用手数的观察。这个平凡的过程强化每个描述性统计的意义和效果的逻辑而不是假设检验。最终,我发现探索性软件置信区间(ESCI), Microsoft Excel免费插件可用tinyurl.com/free-esci。我只是把我的数据到Excel,方差分析计算,生成的置信区间。再检查一遍我的回归,我重新在SPSS包括η2,给定的总方差影响(通过检查选项“估计效果”)。尽可能多的训练在定量方法警告说,仅仅是危险的点击你的方式通过统计数据没有考虑到上下文,限制,和假设,如治疗统计数据是连续的。然而,扩大估计参数的可访问性的好处更广泛的受众超过这个陷阱。最终,采用效果作为标准做法会增加参与荟萃分析和强调意义和效果之间的差异。

我开始检查这些箱子作为我的日常数据分析的一部分,保留的价值评估技术获得越来越先进的统计能力。我进行了文献回顾地面新技能的理论和应用统计的大背景。评估技术的优点是,他们更容易受到样本量错误信息和低于传统的假设检验。置信区间可以解释p价值观:置信区间的范围是统计学意义如果它不包含null值。信心限制进一步提供一个估计的精度:窄范围的值显示更准确的估计,而更广泛的价值,有时对应样本过小、少提供了一个精确的测量。结果是一个更可靠的测量效果p值(卡明,2008):置信区间的中心是总体均值最可能的值,如样本均值方差分析或β系数的回归。

置信区间被报道在同一单位作为结果的措施,使它们更容易解释。同样,尺度效应导致一致的解释,有实际意义,鼓励协作和比较学者之间在一个学科。当估计参数结合引导技术,我们可以更有信心,结果没有一个工件选择性抽样或报告。说,更全面的统计数据不能弥补错误的研究设计或抽样偏差。

鼓励我学习新的统计调查方法背后的内容在我的心理学课程。然而,缓慢的VPN连接必要的访问SPSS,加上越来越多的爱好编程,让我发现R的魔力,开源统计软件。发生了我的大学提供两个高级研讨会需要R和因此,第一学期2周,R成了我学习(三)兼职工作。所有的传言都是真的:陡峭的学习曲线,没有内置图形界面,和错误消息令人沮丧。然而,自由、效率和R的计算能力产生巨大的回报。R要求一个想实现一个结果;超越其他的语法统计软件,精密R要求教会了我欣赏的优点和局限性统计科学。

那些努力学习R是从不孤单:R的一个独特的优点是,所有的答案是一个谷歌搜索,提供的增长,积极开源社区的用户和开发者。因此,信息自由(在成本和数量)分散,从最基本的最先进的统计程序。我强烈建议新的R尝试Quick-R采用者,位于statmethods.net。此外,我很幸运有一个辉煌的统计专业的室友,我可以纠缠在我拒绝运行代码。我们彼此将编辑的代码输入错误(像一个错位的括号);从stackoverflow.com搜索解决方案,帮助程序员论坛;或者,如果愤怒的红色错误消息不会停止,表明Netflix打破。此外,学术文化在我的学校是非常支持,与教授慷慨地仔细研究我的代码,提供建设性的批评磨练培养我的野心,我对统计到一个精致的兴趣技能。

我涉足高级统计方法旨在提高我在进入研究生院的几率;然而,在这个过程中,我发现了一个对数据科学的爱我从不知道。作为一个“高等代数”辍学,我无法想象我会征服估计统计,可怕的R,结构方程建模。这学期,我将塑造我的荣誉论文发表,申请研究生,并带头数据驱动,在全校推广每周时事通讯,民意调查学生和教员和模型结果。

现在是一个关键的转折点在数据分析科学:跨学科学者、记者、和程序员是团结的提高信息的可靠性。心理学家负责推进我们的科学在这个紧要关头——无论是通过几次点击或几行代码,新的统计方法提供一个更方便,准确、广泛适用的选择p经验主义的价值观,让研究人员提高我们的半岛体育官方网址入口标准。

引用和进一步阅读

Coe r(2002年9月)。效果,愚蠢:效果是什么,为什么它是重要的。论文发表于英国教育研究协会的年会上,英国埃克塞特大学。从http://www.leeds.ac.uk/educol/documents/00002182.htm获取

Cumming, g (2008)。复制和p时间间隔:p只值预测未来模糊,但置信区间做得更好。心理科学观点,3(4),286 - 300。

Cumming G。&雀,美国(2001年)。底漆的了解、使用和置信区间的计算是基于中部和非中心分布。教育和心理测量,61年(4),532 - 574。

Kalinowski, p .(2010年4月)。理解置信区间(CIs)和效果评估。bdapp官网下载观察者,23岁(4)从//m.obsidohoteles.com/index.php/publications/observer/2010/apbdapp官网下载ril-10/understanding-confidence-intervals-cis-and-effect-size-estimation.html获取

格林沃尔德,。冈萨雷斯,R。哈里斯,R。& Guthrie, d . (1996)。影响大小和p价值观:应该报道什么,应该被复制?心理生理学,33岁(2),175 - 183。

传教士,k . J。&凯利,k (2011)。效果措施中介模型:量化策略间接影响交流。心理方法,16(2),93。

沙利文,g M。& Feinn r (2012)。使用效果的大小,或者为什么P值是不够的。研究生医学教育学报,4(3),279 - 282。

汤普森,b (2002)。未来的量化社会科学研究可能是什么样子:置信区间的影响大小。教育研究人员,31(3)25-32。

评论

文章从学习者的角度来看!谢谢你!

这是一个很棒的资源和视频教程(Cumming)博士在研究如何应用新的统计数字:
//m.obsidohoteles.com/index.php/members/new-statistics

使用它!


APS定期打开特定的在线文章讨论在我们的网站上。有效的2021年2月,你必须登录APS成员发表评论。通过发布评论,你同意我们社区指导原则和显示您的个人信息,包括你的名字和联系。任何意见、发现、结论或建议在文章评论的作家和不一定反映APS的观点或文章的作者。有关更多信息,请参阅我们的社区指导原则

请登录你的APS账户置评。