业务范围
你的位置:欧皇娱乐 > 业务范围 > 新手小白如何绘制箱线图?1分钟搞定!(附R语言代码)
新手小白如何绘制箱线图?1分钟搞定!(附R语言代码)
发布日期:2024-07-22 02:19    点击次数:168

箱形图,有时也称为箱型图,提供了连续变量分布的快照。它们特别擅长于比较数据集中各组的分布情况。箱形图以一种简化的格式显示大量的信息。

尤其在比较不同组别间的数据分布时,箱形图真正发挥了作用。其紧凑的设计提供了一个整洁的数据摘要,通过盒状和须状标记的定位,可以轻松地比较各组的分布特性,应用十分的广泛。

下面我们将通过一个实操案例分别运用R语言与风暴统计网站为大家详细介绍箱式图的绘制方式,十分便捷快速。

一、实操案例介绍

数据集来源于R自带MASS数据集birthwt,这是一份于1986年在在马萨诸塞州收集的与婴儿出生体重低相关的危险因素的数据。本次复现涉及的变量说明如下。

图片

二、R语言实操

1.安装加载R包

install.packages("survival")install.packages("ggplot2")install.packages("ggpubr")library(survival)library(ggplot2)library(ggpubr)

2.导入数据

由于用到的是MASS中的数据集,因此也要先加载一下MASS包。

library(MASS)data(birthwt)

3.分类变量因子化

如果跳过这一步,可能导致绘图失败哦!

birthwt$race <- as.factor(birthwt$race)

4.绘制箱式图

birthwt,"race","bwt"的位置分别对应数据集,分类变量,定量变量。其他主要参数有fill指箱子的填充色,color选入分组变量,palette指定箱线图的配色。method很重要!根据不同的数据类型,选择不同的方法,比如两组正态选用t.test,两组偏态选用wilcox.test,两组及以上偏态数据用kruskal.test,两组及以上正态数据用anova.

Boxplot1<-  ggboxplot(birthwt,"race","bwt",                      add = " NULL",rug = TRUE,                      color = "race",fill = NULL,width = 0.4,                      palette = "npg", size = 0.4)Boxplot<- Boxplot1+stat_compare_means(method = "kruskal.test",label.x.npc = "center")Boxplot

接下来就得到了完整的箱式图!

图片

如果想要增加一些元素,比如绘制抖动点式箱线图,只需要将“add = " NULL"”修改为“add="jitter"”,其他不变,运行后,就可以得到下面的图啦!

图片

三、风暴统计平台实操1.进入网站分析模块电脑端打开风暴统计平台——“风暴智能统计”模块,点击“小白画出精美的统计图”,进入“箱式图!”页面。

图片

2.导入数据集点击“Browse...”选择需要导入的数据,目前网站支持10M以内的csv、Excel格式数据集。

图片

3.分类变量参照组设置在箱式图绘制板块,此功能还是很重要的!相当于R语言中的分类变量因子化操作。在R语言中没有因子化操作,不能绘制完整的箱线图,风暴统计网站也一样。因此,建议大家在这一步定义一下用到的全部分类变量。

图片

如果需要更改对照组,将对照组的编码值方块拖动到第一位即可,不需要更改参照组的话,只需要选中就可以了,最后,记得点击“确定”!

图片

4.选择变量最重要的就是绘图变量与分组变量。绘图变量必须是连续变量,分组变量也很好理解,选入意向的分类变量就行。 

图片

图片

下面一一展示不同设置下的箱式图!1.两组或多组统计图选入绘图变量与分组变量后,默认形式的箱线图。

图片

2.加点其他素材,比如jitter点图

图片

是不是十分简单呢,不需要修改代码,只需要选择相应的参数,就秒出结果图!

绘图完毕后,支持下载PDF版与PNG版!下载参数可以自行设定,十分便利!

图片

更多的参数设置,如果你有需要,你们可以提出来,我继续完善!本周更新到此结束,欢迎各位多提提意见,新的更新,下周再见! 本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报。