百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

R语言ggboxplot-一文掌握箱线图绘制所有细节

bigegpt 2024-08-11 14:30 3 浏览

载入数据

 1Sys.setlocale('LC_ALL','C')
 2load(file = "F:/Bioinfor_project/Breast/AS_research/AS/result/hubgene.Rdata")
 3head(data)
 4require(cowplot)
 5require(tidyverse)
 6require(ggplot2)
 7require(ggsci)
 8require(ggpubr)
 9mydata<-data %>% 
10  ## 基因表达数据gather,gather的范围应调整
11  gather(key="gene",value="Expression",CCL14:TUBB3) %>% 
12  ##
13  dplyr::select(ID,gene,Expression,everything()) 
14head(mydata)  ## 每个基因作为一个变量的宽数据

创建带有pvalue的箱线图

  • 参考资料
  • 展示绘图细节控制
1p <- ggboxplot(mydata, x = "group", y = "Expression",
2          color = "group", palette = "jama",
3          add = "jitter")
4#  Add p-value
5p + stat_compare_means()

image.png

改变统计方法

1# Change method
2p + stat_compare_means(method = "t.test")

image.png

统计学意义标注

  • label="p.signif"
  • p.format等
  • label.x标注位置
1p + stat_compare_means( label = "p.signif")

image.png

多组比较

  • 给出global pvalue
1# Default method = "kruskal.test" for multiple groups
2ggboxplot(mydata, x = "gene", y = "Expression",
3          color = "gene",add="jitter", palette = "jama")+
4  stat_compare_means()
5
6# Change method to anova
7ggboxplot(mydata, x = "gene", y = "Expression",
8          color = "gene", add="jitter", palette = "jama")+
9  stat_compare_means(method = "anova")

image.png


image.png

指定比较

  • 配对比较:会完成各个变量的比较,默认wilcox.test法,可修改
  • my_comparisions:可以指定自己想要进行的比较
  • 指定参考组,进行比较
 1require(ggpubr)
 2compare_means(Expression ~ gene,  data = mydata)
 3
 4## 指定自己想要的比较
 5# Visualize: Specify the comparisons you want
 6my_comparisons <- list( c("CCL14", "HBA1"), c("HBA1", "CCL16"), c("CCL16", "TUBB3") )
 7ggboxplot(mydata, x = "gene", y = "Expression",
 8          color = "group",add = "jitter", palette = "jama")+ 
 9  stat_compare_means(comparisons = my_comparisons)#+ # Add pairwise comparisons p-value
10  #stat_compare_means()     # Add global p-value

image.png

指定参考组

指定CCL14作为参考组与其它各组比较
ref.group

 1compare_means(Expression ~ gene,  data = mydata, ref.group = "CCL14",
 2              method = "t.test")
 3# Visualize
 4mydata %>% 
 5  filter(group=="TNBC") %>% # 筛选TNBC数据
 6ggboxplot( x = "gene", y = "Expression",
 7          color = "gene",add = "jitter", palette = "nejm")+
 8  stat_compare_means(method = "anova")+      # Add global p-value
 9  stat_compare_means(label = "p.signif", method = "t.test",
10                     ref.group = "CCL14")      

image.png

多基因分面

按另外一个变量分组比较

 1## 比较各个基因在TNBC与Normal表达
 2compare_means( Expression ~ group, data = mydata, 
 3              group.by = "gene")
 4# Box plot facetted by "gene"
 5p <- ggboxplot(mydata, x = "group", y = "Expression",
 6          color = "group", palette = "jco",
 7          add = "jitter",
 8          facet.by = "gene", short.panel.labs = FALSE)
 9# Use only p.format as label. Remove method name.
10p + stat_compare_means(label = "p.format")

image.png

将pvalue换成星号

  • hide.ns = TRUE.参数可隐藏ns
1p + stat_compare_means(label =  "p.signif", label.x = 1.5)

image.png

将各个图绘制在一张图中

1p <- ggboxplot(mydata, x = "gene", y = "Expression",
2          color = "group", palette = "nejm",
3          add = "jitter")
4p + stat_compare_means(aes(group = group))

image.png

修改下pvalue展示的方式

1# Show only p-value
2p + stat_compare_means(aes(group = group), label = "p.format")

image.png

用星号表示pvalue

1# Use significance symbol as label
2p + stat_compare_means(aes(group = group), label = "p.signif")

image.png

配对样本比较

要求x,y具有相同的样本数,进行一一配对比较

 1head(ToothGrowth)
 2compare_means(len ~ supp, data = ToothGrowth, 
 3              group.by = "dose", paired = TRUE)
 4# Box plot facetted by "dose"
 5p <- ggpaired(ToothGrowth, x = "supp", y = "len",
 6          color = "supp", palette = "jama", 
 7          line.color = "gray", line.size = 0.4,
 8          facet.by = "dose", short.panel.labs = FALSE)
 9# Use only p.format as label. Remove method name.
10p + stat_compare_means(label = "p.format", paired = TRUE)

image.png

封装为函数命名为group_box

  • 功能:已经选定的基因绘制箱线图
  • - 参数1:group分组变量,可以是自己所有感兴趣的变量
  • 参数2:mydata为整理好的清洁数据,gene为长数据(gather版本)
 1head(mydata)
 2group_box<-function(group=group,data=mydata){
 3        p <- ggboxplot(mydata, x = "gene", y = "Expression",
 4          color = group, 
 5          palette = "nejm",
 6          add = "jitter")
 7p + stat_compare_means(aes(group = group))
 8}
 9
10## 
11group_box(group="PAM50",data = mydata)

封装为函数命名为group_box

  • 功能:已经选定的基因绘制箱线图
  • - 参数1:group分组变量,可以是自己所有感兴趣的变量
  • 参数2:mydata为整理好的清洁数据,gene为长数据(gather版本)
 1head(mydata)
 2group_box<-function(group=group,data=mydata){
 3        p <- ggboxplot(mydata, x = "gene", y = "Expression",
 4          color = group, 
 5          palette = "nejm",
 6          add = "jitter")
 7p + stat_compare_means(aes(group = group))
 8}
 9
10## 
11group_box(group="PAM50",data = mydata)

image.png

封装函数gene_box

  • 目的功能:对感兴趣的基因绘制和分组绘制boxplot

- 注意这时使用的应该是基因的宽数据,因为涉及到单个基因作为变量

 1head(data)
 2usedata<-data
 3## 封装函数
 4gene_box<-function(gene="CCL14",group="group",data=usedata){
 5p <- ggboxplot(data, x = group, y = gene,
 6          ylab = sprintf("Expression of %s",gene),
 7          xlab = group,
 8          color = group, 
 9          palette = "nejm",
10          add = "jitter")
11p + stat_compare_means(aes(group = group))
12}
1gene_box(gene="CCL14")

image.png

牛刀小试

1gene_box(gene="CCL16",group="PAM50")

image.png

批量绘制

  • 目的功能:绘制任意基因,任意分组,批量绘制一气呵成了
  • 封装函数+lapply批量绘制无敌
  • 在lapply中的函数参数设置,不在原函数中,而是直接放置在lapply中
  • do.call中参数1为函数,+c()包含原函数的参数设置,同样参数设置不在原函数中
1require(gridExtra)
2head(data)
3
4## 需要批量绘制的基因名
5name<-colnames(data)[3:6]
6## 批量绘图
7p<-lapply(name,gene_box,group = "T_stage")
8## 组图
9do.call(grid.arrange,c(p,ncol=2))

image.png

相关推荐

ActiveAndroid使用(对象化数据库)

配置模块的build.gradlerepositories{mavenCentral()mavenLocal()maven{url"https://oss.sonatype.org/conte...

AndroidStudio下的依赖管理(android app依赖外部jar包)

在开发中用第三方库是很常见的事,如何在AndroidStudio下管理这些依赖呢?这就是这篇文章的目的。目录Maven/Ivy仓库依赖Module依赖aar文件依赖jar文件依赖例子完整代码一、Mav...

Android Studio之gradle的配置与介绍

1、gradle的简单介绍Gradle是可以用于Android开发的新一代的BuildSystem,也是AndroidStudio默认的build工具。其实Gradle脚本是基于一种JVM语言—...

Android中的run-as命令带来的安全问题

一、前言最近一周比较忙,没时间写东西了,今天继续开始我们今天的话题:run-as命令,在上周的开发中,遇到一个问题,就是在使用run-as命令的时候出现了一个错误,不过当时因为工作进度的问题,这问题就...

Android系统级深入开发——input驱动程序

1、Input驱动程序是Linux输入设备的驱动程序,分成游戏杆(joystick)、鼠标(mouse和mice)和事件设备(Eventqueue)3种驱动程序。其中事件驱动程序是目前通用的驱动程序...

Android项目中如何用好构建神器Gradle?

CSDN移动将持续为您优选移动开发的精华内容,共同探讨移动开发的技术热点话题,涵盖移动应用、开发工具、移动游戏及引擎、智能硬件、物联网等方方面面。如果您想投稿、参与内容翻译工作,或寻求近匠报道,请发送...

Android Studio自定义文件类头(android studio自定义标题栏)

--简书作者谢恩铭转载请注明出处今天给大家介绍一个很简单的"小"技巧。平时,我们在AndroidStudio中开发Android时,总免不了要创建新的文件,也许是Java文件,也许是C...

C语言#include头文件真的是插入代码吗?

若文章对您有帮助,欢迎关注程序员小迷。助您在编程路上越走越好!编译器理论和实作既是又不是。从编译器理论理解,#include头文件"相当于"插入了头文件的代码,以供源代码引用(宏定...

Android 系统核心机制binder(03)binder C++层实现

本章关键点总结&说明:这里主要关注BinderC++部分即可,看到,也是本章节的核心内容,主要就是以C++封装的框架为主来解读binder。之前主要针对于底层驱动binder的数据交互以及...

Java对象序列化与反序列化的那些事

Java对象序列化与反序列化的那些事在Java的世界里,对象序列化和反序列化就像一对孪生兄弟,它们共同构成了Java对象存储和传输的基础。如果你曾经尝试将对象保存到文件中,或者在网络中传输对象,那么你...

Java对象序列化剖析(java 对象序列化)

对象序列化的目的1)希望将Java对象持久化在文件中2)将Java对象用于网络传输实现方式如果希望一个类的对象可以被序列化/反序列化,那该类必须实现java.io.Serializable接口或jav...

C++模板 - 16(SFINAE)(c++模板编程)

C++支持函数重载,同一个函数名,只要它的签名不一样,可以声明若干个版本(这个特性也是必须的,不然构造函数就只能有一个了)。现在函数的重载集合中又加入了新的成员-函数模板,事情就变得越发有趣起来,...

NewtoSoft.Json相关使用技巧(newtosoft.json相关使用技巧有哪些)

  本篇将为大家介绍Newtonsoft.Json的一些高级用法,可以修改很少的代码解决上述问题。Newtonsoft.Json介绍  在做开发的时候,很多数据交换都是以json格式传输的。而使用Js...

C#调用DeepSeek API(c#调用deepseek api 流式输出)

一、官方网站二、DeepSeek测试DeepSeek三大适用模式:基础模型(V3)、深度思考(R1)、联网搜索。基础模型(V3)深度思考(R1)联网搜索三、C#调用DeepSeekAPI核心代码//...

.NET性能系列文章二:Newtonsoft.Json vs System.Text.Json

微软终于追上了?图片来自GlennCarstens-Peters[1]Unsplash[2]欢迎来到.NET性能系列的另一章。这个系列的特点是对.NET世界中许多不同的主题进行研究、基准和比较...