发现与牧夫座引导效应值的置信区间gydF4y2Ba
牧夫座gydF4y2Ba(发音“战利品”)是一个免费软件计算的R unstandardized和标准化效果的措施对于大多数实验研究设计和发现引导置信区间(CIs)的尺度效应(Gerlanc &科比,2015)。我们开发了牧夫座填补现有软件提供的数据分析方法之间的差距和当前的最佳实践的建议。我们的工作遵循一长串的脚步的支持者被称为“新统计”(见Geoff CumminggydF4y2Ba文章gydF4y2Ba在2014年的“疯狂三月方法”的问题gydF4y2Babdapp官网下载)。gydF4y2Ba
改革的工具。gydF4y2Ba零假设意义测试(NHST)作为推论方法,逻辑上无效的和gydF4y2BapgydF4y2Ba值它得到误导我们的大小的影响,因为他们是样本容量的函数(见,例如,Loftus, 1996)。因此,当前的最佳实践需要,心理科学家报告:gydF4y2Ba
- 效应值估计,不受样本量的影响;和gydF4y2Ba
- CIs,沟通效果的精度估计,包含所有的信息gydF4y2BapgydF4y2Ba价值和更多。gydF4y2Ba
许多研究期刊,包括bd体育在线app下载安卓gydF4y2Ba心理科学gydF4y2Ba,正在敦促人员从依赖转向N半岛体育官方网址入口HST效应值估计和其他首选技术(可以忍受,2014年,p . 5),并设置适当的尺度效应和置信区间的报告公布的最低预期。为什么这么少的期刊上发表的研究文章见过这些期望吗?bd体育在线app下载安卓gydF4y2Ba
我们认为,最大的障碍是缺乏适当的统计软件。大型商业统计项目中所有发达NHST的鼎盛时期。大多数甚至不报告标准化效应大小对于许多常见的研究设计,如混合因子设计。当他们计算CIs,他们通常使用传统CI方法已知(即低覆盖率。,他们95% CIs并不覆盖人口值95%的时间)。gydF4y2Ba
因此,心理直到最近科学家们缺乏现成的工具甚至满足最低预期,“更别提最佳实践。批评者NHST难以获得动力的改革,部分原因是缺乏可行的替代方案提供了一个借口,坚持传统。创建牧夫座我们的目标之一是提供一个可行的替代NHST,帮助将最佳实践,人人皆可承受。gydF4y2Ba
为什么引导CIs ?gydF4y2Ba引导CI方法比其他方法有优势,他们不要认为来自正态分布的数据,甚至是分布的形状。相反,引导方法近似未知分布的数据样本本身。程序反复吸引与替换(称为随机抽样gydF4y2Ba重新取样gydF4y2Ba)从原始数据样本和重新计算预期的效果大小重新取样。例如,程序可能会画一个重新取样,计算如科恩的大小产生影响gydF4y2BadgydF4y2Ba重复2000次,2000年科恩gydF4y2BadgydF4y2Ba年代。这些2000效应值估计的分布作为经验近似的人口分布的影响大小,我们可以使用这个分布发现CI人口效应大小。gydF4y2Ba
例如,找到使用百分比的95%置信区间的方法,我们只是把2000重新取样尺度效应的排序和查找的值在2.5和97.5百分位数,其中包含中间95%的分布。不这样CIs假设分布的形状效应大小的人口。(虽然百分位方法更直观,牧夫座实际上使用默认情况下gydF4y2Babias-corrected-and-acceleratedgydF4y2Ba(BCa)方法,它往往比百分位方法更好的报道。)gydF4y2Ba
在大多数实际研究、人口分布的数据和效果的形状大小是未知的。因此,我们相信,大多数研究报告的最佳实践引导CIs。在情况下,当一个人有很好的理由相信数据是正态分布,我们推荐“确切CI”方法,在先锋软件中实现的APS的Geoff Cumming(2016),肯•凯利(2007)和詹姆斯·h·Steiger和雷切尔·t·Fouladi (1992)。尽管引导的优势和具体方法已经知道了几十年,只有在最近几年,个人电脑已经足够快的让他们实际的日常数据分析。牧夫座让现成的引导方法,为典型的数据集计算最多几秒钟。gydF4y2Ba
为什么R ?gydF4y2Ba第一作者(克里斯)开始在他的本科教学引导CI方法课程使用自定义函数写在商业软件。然而,他想让他的学生毕业时他们的技能和使用这些技能没有一个昂贵的地方网站许可证。第二作者(丹)鼓励他实现他在R的函数,一个免费的、开源的、跨平台的运行在macOS统计语言和环境,Windows和Linux操作系统(R开发核心团队,2016)。教学学生执行数据分析R意味着他们可以免费使用这些技能无论他们去哪里。最终,丹接管牧夫座的编程R,我们大大扩展了牧夫座的最初功能,和丹一起把它打包R所有用户可用。gydF4y2Ba
这会带来使用R /商业软件的另一个巨大的优势:综合R档案网络(凹口,2017)团队允许R开发人员提交他们的包库专用包,满足凹口的质量控制标准。一旦把这些包,用户可以很容易地下载并安装在R -还免费供自己使用。大量的心理科学家可以找到很棒的包在存储库中,如APS的威廉·r·雷维尔的(2017)心理包和凯利(2016)mbes包-,当然,牧夫座。在撰写本文时,牧夫座已经被下载超过13000次的一个镜像网站,计算这些数字。gydF4y2Ba
一些可能会吓倒R的命令行界面和一个陡峭的学习曲线。实际上,R的在线文档是深奥的,很难效仿。然而,R是容易学习当一个显示如何使用它。在附录1中我们的文章描述牧夫座,我们提供了大部分的R命令的示例数据分析师的需求,从导入数据保存结果(Kirby & Gerlanc, 2013)。大学本科生第一学期只有一点经验,甚至可以复制,粘贴,并编辑示例命令尽可能轻松高效地搜索下拉菜单和对话框在商业软件进行分析。用户然后可以逐渐学会使用更多的R强大的内置功能,包括可发布图形。gydF4y2Ba
我们把大量的精力让牧夫座尽可能友好的。所有函数调用通过一个命令,和牧夫座的猜测基于数据结构的类型大小和CI用户所期望的效果,要求用户指定一个最小的选项。例如,命令gydF4y2Ba牧夫座(myVariable)gydF4y2Ba牧夫座发现,单变量的均值gydF4y2BamyVariablegydF4y2Ba根据2000年复制及其95%可信区间。相反,当一个提交两个变量作为参数,如gydF4y2Ba牧夫座(c(如上所述,variable1的操作)gydF4y2Ba,牧夫座发现之间的关系gydF4y2Bavariable1gydF4y2Ba和gydF4y2Bavariable2gydF4y2Ba和95%可信区间的相关性。gydF4y2Ba
当然,可选参数允许一个改变默认值,如通过选择几个标准化效应大小。例如,找到对冲gydF4y2BaggydF4y2Ba的意思是由影响gydF4y2BamyVariablegydF4y2Ba,一个简单地指定类型的选项,如gydF4y2Ba牧夫座(myVariable effect.type = " hedges.g”)gydF4y2Ba。在科比和Gerlanc(2013),我们展示如何改变所有的缺省值并解释如何使用附加参数来找到更多复杂的效应大小如这些主题之间的对比,试,混合因子设计。牧夫座还发现独联体为斜坡和相关性之间的区别。gydF4y2Ba
为什么对比?gydF4y2Ba符合长期存在的最佳实践建议,牧夫座1-degree-of-freedom只计算尺度效应(gydF4y2BadfgydF4y2Ba)的影响,也被称为gydF4y2Ba对比gydF4y2Ba或gydF4y2Ba集中的比较gydF4y2Ba(见,例如,罗森塔尔&搬进,1991年,页467 - 469,486)。多gydF4y2BadfgydF4y2Ba效应,也叫gydF4y2Ba综合影响gydF4y2Ba或gydF4y2Ba无重点的比较gydF4y2Ba模棱两可的解释,很少的科学兴趣,多余时伴随着先验或事后对比。因此,当有两个以上的条件比较,牧夫座鼓励通过要求用户定义最佳实践分析受试对比数据集本身(使用电子表格或R)和定义主题之间与参数牧夫座命令,它允许牧夫座在正常条件下重新取样。这种方法有效地实现了所有的阶乘设计在单向设计对比;我们相信这种方法的透明度和解释清楚导致更好的科学推理的自动生成默认的输出影响因子方差分析。gydF4y2Ba
最雄心勃勃地,我们看到牧夫座而不是补充大型商业项目作为他们的gydF4y2Ba更换gydF4y2Ba。牧夫座和知识如何计算阶乘设计之间的对比,一个心理科学家可以找到影响大小和CIs的任何类型的实验设计,他或她会遇到。当最佳实践是免费的,为什么支付第二个最好?gydF4y2Ba
APS的威廉·r·雷夫尔说在2017年的APS年会,可能25 - 28,2017年,在马萨诸塞州的波士顿。gydF4y2Ba
引用gydF4y2Ba
全面的R档案网络(凹口)包(2017)。从https://cran.r-project.org/web/packages/获取gydF4y2Ba
Cumming, g(2014年3月)。有生命超越. 05。gydF4y2Babdapp官网下载观察者,27gydF4y2Ba月19 - 21日。gydF4y2Ba
Cumming, g (2016)。ESCI置信区间(探索性软件)。计算机软件。从http://thenewstatistics.com/itns/esci/获取gydF4y2Ba
可以忍受,大肠(2014)。业务不像往常一样。gydF4y2Ba心理科学,25gydF4y2Ba,3 - 6。gydF4y2Ba
埃夫隆,b (1979)。引导方法:另一个重叠。gydF4y2Ba年报的统计,7gydF4y2Ba,1-26。gydF4y2Ba
Gerlanc D。,& Kirby, K. N. (2015). bootES: Bootstrap effect sizes (Version 1.2). Computer software. Retrieved from https://cran.r-project.org/package=bootES
凯利,k (2007)。方法行为、教育和社会科学:R包。gydF4y2Ba行为研究方法,39岁gydF4y2Ba,979 - 984。gydF4y2Ba
凯利,k (2016)。mbes: mbes R包。(版本4.1.0)。计算机软件。从https://cran.r-project.org/package=MBESS获取gydF4y2Ba
科比,k . N。,& Gerlanc, D. (2013).牧夫座:gydF4y2BaR包引导置信区间的影响大小。gydF4y2Ba行为研究方法gydF4y2Ba,gydF4y2Ba45gydF4y2Ba,905 - 927。(本文的预印本,勘误表修正,可以从https://cran.r-project.org/web/packages/bootES/bootES.pdf获得)gydF4y2Ba
Loftus g r (1996)。心理学将是一个更好的科学当我们改变我们分析数据。gydF4y2Ba当前的心理科学方向,6gydF4y2Ba,161 - 171。gydF4y2Ba
R发展核心团队(2016)。R(3.3.2版)。计算机软件。统计计算的R项目。从https://cran.r-project.org/index.html获取gydF4y2Ba
雷夫尔,w (2017)。心理:程序心理、心理和人格研究(1.6.12版)。计算机软件。从https://cran.r-project.org/package=psych获取gydF4y2Ba
罗森塔尔,R。,& Rosnow, R. (1991).行为研究的要点:方法和数据分析gydF4y2Ba(第二版)。纽约:麦格劳-希尔。gydF4y2Ba
Steiger j . H。,& Fouladi, R. T. (1992).R2:gydF4y2Ba区间估计的计算机程序,计算,和方多重相关的假设检验。gydF4y2Ba行为研究方法、仪器和电脑,4gydF4y2Ba,581 - 582。gydF4y2Ba