实践
方法:如何做数据可视化使用R-Even如果你不使用R
统计学家罗斯Ihaka和罗伯特先生在1993年创建了R编程语言R核心团队2021),越来越多的跨领域研究人员至今为数据处理和使用半岛体育官方网址入口统计分析。从2006年到2018年,引用的R核心团队平均每年增长87%(巴雷特,2019)。
有很多喜欢R等优势,它给用户增加的功能语言通过选择和创建R包(R扩展的统计包含代码的编程语言,数据在一个标准化的格式和文档,可以安装的用户做不同的分析或数据处理),和官方的R软件环境是一个开放源码的免费软件,任何人都可以使用。然而,许多研究人员可能认为R半岛体育官方网址入口编程技能难学,因此选择单击软件SPSS和SAS等。
在一个2022篇文章在bdapp安卓手机版最精准 ,艾米丽高加索和格拉斯哥大学的同事们共同挑战知觉编码技能需要使用R难以学习。教程在如何使用R数据可视化,特别是目标研究人员使用R有很少或没有经验,可以通过OSF半岛体育官方网址入口https://osf.io/bj83f/。1
使用R有助于再现性和透明度
使用R的一个优势是其潜在益处再现性和透明度。因为R使代码用于处理数据,统计分析,并创建数据可视化容易,其他研究人员可以复制数据分析过程和直接测试的代码错误。半岛体育官方网址入口R也给研究人员“更大范围的半岛体育官方网址入口完全可定制的数据可视化选项比通常可以在单击软件因为R的开源性质,“高加索和他的同事写道。
此外,编写代码生产数据可视化稍后可以节省你的时间,因为您可以重用和适应这些代码,而不是从头开始。此外,数据可视化在R可以看起来更有吸引力比创建指向-点击软件或Excel和高度可定制的,因为你有更多的控制每个元素的可视化。
使用层在每个可视化最大化可用性
在教程中,高加索和他的同事们使用包ggplot2(2016)韦翰的集合包的一部分提供数据处理的功能。构建可视化,ggplot2使用图形的分层的语法(即。,一个标准的方法来描述图形的组成部分;威尔金森et al ., 2005),情节是建立在一系列的层。例如,一个散点图可以用六层:
层1:构建情节空间
层2:指定变量
第三层:指定类型的可视化为这些变量所需的
层4:添加个人数据点和一个最适合线
第五层:编辑轴标签为了便于阅读
第六层:应用主题改变的整体外观图
每一层都是相互独立的,可以单独定制。例如,您可以调整大小,颜色,每一层的每个组件的位置和单独删除每一层。“使用层很容易建立复杂的情节逐步和适应从现有代码或扩展块,“高加索和他的同事解释说。
使用R数据可视化
高加索和他的同事们为100名参与者提供一个模拟数据集和七个变量的兴趣。模拟数据来自一个2×2(即混合设计词汇决定任务。,参与者决定是否一串字母词或非言词)。然后他们指导读者使用RStudio(一个开发环境,使R处理更加简单;RStudio团队,2021)在r .您将学习如何编写代码最好的准备和格式化数据;在RStudio负载包;加载数据;与一些常见的可定制的可视化和总结数据,如条形图的计数,骨料的情节和百分比和直方图。
作者引导读者格式化数据集使用R-transforming通常的宽格式(每个参与者一行的值)为长格式(几行每个参与者,每个刺激)。这种格式的数据。ggplot2可以创建可视化。高加索和他的同事们提供关于创建的详细说明:
- 柱状图(如反应时间和准确性)
- 密度图
- 散点图
- 箱形图
- 小提琴的情节
- 柱状图
- 小提琴盒阴谋
- 交互图
- 结合交互图
- 方面(单独的情节为每个级别的变量)
除了能够自定义每种类型的情节,您将学习如何存储和保存土地和多个情节显示如何结合在一起。在额外的在线资源(可用https://psyteachr.github.io/introdataviz/),高加索和他的同事们提供额外的先进plots-including split-violin情节,乌云情节,脊情节,冲积情节,地图定制选项。
反馈这篇文章?电子邮件apsbdapp官网下载observer@psychologicalscience.org或登录置评。
相关内容我们认为你会喜欢>
-
可视化数据科学与学生沟通,公众和政策制定者
最新一期的《公共利益心理科学探索的好与坏数据可视化以及公众理解科学如何能更好的提高如果研究人员采用了可视化技术。半岛体育官方网址入口
-
映射的情绪COVID-19:全球研究使用数据可视化跟踪心理反应,确定干预的目标
-
展示科学:最佳实践数据“流行”
引用
巴雷特,t . s . (2019)。六个理由考虑使用R在心理学研究。PsyArXiv。https://doi.org/10.31234/osf.io/8mb6d
高加索,E。McAleer, P。Toivo, W。帕特森,H。&德布鲁因,l . m . (2022)。数据可视化使用R为研究人员不使用。半岛体育官方网址入口心理科学方法和实践的进步,5(2)。https://doi.org/10.1177/25152459221074654
R核心团队。(2021)。接待员:统计计算的语言和环境。R统计计算的基础。https://www.R-project.org/
RStudio团队。(2021)。RStudio:集成开发环境为R。RStudio。http://www.rstudio.com/
韦翰,h (2016)。ggplot2:优雅的图形进行数据分析。斯普林格出版社。https://ggplot2.tidyverse.org
威尔金森,L。Anand,。&格罗斯曼,r (2005)。用scagnostics。在j . Stasko & m·沃德(Eds)。IEEE研讨会信息可视化(InfoVis 05):程序(页157 - 158)。IEEE计算机协会。
APS定期打开特定的在线文章讨论在我们的网站上。有效的2021年2月,你必须登录APS成员发表评论。通过发布评论,你同意我们社区指导原则和显示您的个人信息,包括你的名字和联系。任何意见、发现、结论或建议在文章评论的作家和不一定反映APS的观点或文章的作者。有关更多信息,请参阅我们的社区指导原则。
请登录你的APS账户置评。