YaRrr !海盗指南R

R上教学一些介绍性的课程之后,我意识到最好的方法让人们兴奋编程是遵循两条规则。规则1:让他们简单的开始。规则2:让它有趣。的yarrrR包是为了遵循这些规则。

的主要工具之一yarrr包是pirateplot ()。pirateplot的目的是要回答以下问题:我如何能快速理解之间的关系的一个或多个分类独立变量和连续因变量?这个问题经常出现在实验研究中使用的阶乘设计。例如,一个实验可能比较四种不同的实验条件(a, b, c,d)在一个因变量(y)。

想象一个阶乘设计的标准方法是一个酒吧的情节就像图1所示。酒吧图显示每个分布的均值误差。酒吧的情节是标准的做法,因为他们是简单和容易的创建与任何统计软件。他们还提供的图片数据,显得简单。在我们酒吧的阴谋,它看起来像没有条件对因变量之间的区别。事实上,一个方差分析这些数据将证实这一结论p.939的价值。

但这一结论是合理的?不。问题是,我们的数据虚拟化工具,酒吧情节,被遮挡的重要模式在数据通过隐藏底层每组原始数据。统计学家们一次又一次的表明,因为酒吧情节隐藏原始数据和分布信息,他们掩盖重要数据中的模式,从多个模式异常值。尽管这压倒性的证据表明酒吧情节不够表达数据中的模式(克利夫兰,1984;莱恩&桑德尔,2009;& Garovic Weissgerber、Milic Winham, 2015),仍然定期发布栏情节在我们的顶级期刊上(库珀,Schriger &关闭,2002)。bd体育在线app下载安卓

为什么我们仍然使用条形图来可视化数据?虽然有酒吧情节替代品,如小提琴情节(迈克&尼尔森,1998)和bean情节(Kampstra, 2008)表明分布信息,大多数人根本不知道它们是什么或如何创建它们。或者,如果他们知道替代品,他们根本没有动力去使用他们,因为他们不是简单的开始(规则1)或不好玩(规则2)。

海盗的阴谋被设计成代替酒吧情节,人们会想要使用。与酒吧情节只显示描述性统计(可能还有一些推论统计的形式一个置信区间),一个海盗情节同时显示三个关键方面的数据:原始数据作为单独的点(如图所示),描述性统计(显示为线),和推论统计(贝叶斯密度最高的间隔或频繁的置信区间,平滑密度)。海盗的情节我们的数据如图1所示酒吧旁边的阴谋。在这里,我们可以清楚地看到酒吧情节遗漏的数据中的模式。例如,我们看到条件bc有两个不同的子组,而条件一个d似乎真正相同的。由于海盗的阴谋,我们可以立即看到我们之前的结论数据,支持酒吧情节和方差分析,是错误的。

重要的是,海盗的阴谋之前,让人们兴奋编程的两条规则。首先,它很容易开始。一旦你加载相关数据,您可以创建一个海盗情节简单的打字pirateplot (y ~条件,data =数据)。第二,海盗情节有趣。例如,通过包括主题朋友参数,您可以自定义你的海盗的阴谋与颜色灵感来自电影和电视节目,包括我最喜欢的童年星期六早上卡通,《x战警》。在图4中,可以看到四个不同版本的情节从创建完全相同的数据pirateplot ()通过添加主题朋友参数。颜色的调色板yarrr包不限于一个海盗的阴谋。所有的调色板中包含piratepal ()功能,可以很容易地用于任何你想要的图,如图3所示的散点图使用小马驹调色板。

我发现学生们更加兴奋数据当他们看到它在丰富多彩,丰富海盗情节比当它就变成了一个沉闷的酒吧。事实上,尽管我为我的学生创造了海盗的阴谋,我发现自己几乎每天都在用他们自己的分析。块创建或受到海盗的阴谋已经被用于出版物(Wagenmakers,发现,Dijkhoff & Gronau, 2016),甚至在潘多拉等公司研究部门。

图1

图2

图3

图4

引用

w·s·克利夫兰(1984)。图表在科学出版物。38岁的美国统计学家,261 - 269。

库珀r . J Schriger, d . L。&密切,r . j . h (2002)。图形素养:图形的质量在发行量较大的期刊。40岁的急诊医学年鉴317 - 322。doi: 10.1067 / mem.2002.127327

Hintze j . L。,& Nelson, R. D. (1998). Violin plots: A box plot-density trace synergism.美国统计学家,52岁,181 - 184。

Kampstra, p (2008)。Beanplot:视觉比较的箱线图替代分布。杂志的统计软件,28,1 - 9。

巷,d . M。,& Sándor, A. (2009). Designing better graphs by including distributional information and integrating words, numbers, and images.心理方法,14,239 - 257。doi: 10.1037 / a0016620

Wagenmakers E.-J。发现,T。,Dijkhoff, L., & Gronau, Q. F. (2016). Registered replication report: Strack, Martin, & Stepper (1988).心理科学观点,11,917 - 928。doi: 10.1177 / 1745691616674458

Milic Weissgerber, t . L, n . M。Winham, s . J。,& Garovic, V. D. (2015). Beyond bar and line graphs: Time for a new data presentation paradigm.《公共科学图书馆·生物学》上,13,e1002128。doi: 10.1371 / journal.pbio.1002128