百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

xCell:基因表达数据的免疫浸润分析专家!

bigegpt 2024-08-11 14:31 4 浏览

尔云间 一个专门做科研的团队

原创 小果 生信果

欢迎点赞+收藏+关注[给你小心心]

生信人R语言学习必备

立刻拥有一个Rstudio账号

开启升级模式吧

(56线程,256G内存,个人存储1T)


  • hi大家,好久不见,小果又来啦!
  • 今天我们学习“xCell”是一种基于基因表达数据的免疫细胞浸润评估工具,可以识别出潜在的免疫细胞亚群并计算它们在组织中的相对丰度。它可以广泛应用于癌症、自身免疫性疾病和其他疾病的免疫浸润分析中。

小果就来教大家如何实战应用xCell进行基因表达数据的免疫浸润分析,那就和小果一起来看下吧!


数据预处理

下载xCell包并导入:

install.packages('devtools')
devtools::install_github('dviraran/xCell')
library(xCell)


xCell免疫浸润分析

导入基因表达矩阵,并通过xCellAnalysis分析表达矩阵,该函数用于预测细胞组分在给定样本中的相对丰度:

exprSet=read.csv("GSE57065_ExprMatrix.csv",header=T,row.names=1)
xCell <- xCellAnalysis(exprSet)        ###array data
write.csv(xCell,"xCell_score.csv") #将计算后的结果写入表格文件中

先来一起看下分析后的数据集吧!


处理xCell分析后的结果数据集

接下来,我们可以根据样本的分组情况,提取出对应的细胞类型得分。

首先我们要读取 group.txt 的文件,这里包含了样本的分组信息,温馨提示,细胞表达样本数据包含两种类型哦!

我们可以读入这个文件,并提取出“septic_shock” 和 “healthy” 两组样本的得分:

group=read.delim("group.txt",header=T,stringsAsFactors = FALSE,sep="\t")  
  score=read.csv("xCell_score.csv",header=T,row.names=1,stringsAsFactors = FALSE)
#取出结果文件中的前64个样本,并分别取出“septic_shock”,即带有疾病的样本群和“healthy”,即健康的样本群到对应的数据集中
  case_data=score[1:64,group$group=="septic_shock"]
  control_data=score[1:64,group$group=="healthy"]
  all(row.names(case_data)==row.names(control_data))
  normal=ncol(control_data)
  tumor=ncol(case_data)
  normal_data=as.data.frame(t(control_data))
  tumor_data=as.data.frame(t(case_data))
  #合并两种类型的结果文件
  rt_total = rbind(normal_data,tumor_data)
  cell_group_file=read.delim("cell_type.txt",header=T,stringsAsFactors = FALSE)
cell_group=unique(cell_group_file$Subgroup)


整合样本分组信息与细胞分组信息

处理好分析后的数据后,我们可以通过进一步整合绘制所有结果数据集对应的热图,那就和小果一起来看一下怎样绘制吧!

在绘制热图之前,我们首先要整合数据、对所需数据进行筛选等操作,为后续的热图绘制工作做好准备工作,我们一起来看一下吧!

rt=t(rbind(normal_data,tumor_data)) #正常组和肿瘤组的基因表达矩阵按行合并,并进行转置,使样本在列上排列。
cell_group_file=cell_group_file[order(cell_group_file$Subgroup),]
rt=rt[cell_group_file$Cell.types,] #读入细胞类型信息文件cell_group_file,对其按照Subgroup这一列列进行排序
all(row.names(rt)==cell_group_file$Cell.types)
group1=c(rep("healthy",nrow(normal_data)), #合并健康组和肿瘤组样本
         rep("septic_shock",nrow(tumor_data)))
names(group1)=colnames(rt)
group1=as.data.frame(group1)
type=cell_group_file[,2:3]
row.names(type)=type$Cell.types
type$Cell.types=NULL


生成热图

做好上述准备工作后,我们可以导入pheatmap包并绘制热图,热图的具体绘制方法可以看小果之前发过的笔记哦,接下来和小果一起来看一下绘制过程吧!

library(pheatmap)
pdf("Heatmap.pdf",height=8,width=12)
    pheatmap(rt, 
             annotation_col =group1, 
             annotation_row=type,
             annotation_colors =list(Type=c(healthy = "#42B540FF", septic_shock = "#925E9FFF")) ,
             color = colorRampPalette(c("green", "black", "red"))(50),
             cluster_cols =F,
             fontsize = 9,
             fontsize_row=8,
             fontsize_col=6,
             cluster_rows = F,
             show_colnames = F)
dev.off()

好啦!现在你已经成功完成了热图的绘制,接下来我们看看绘制效果:


xCell对分析结果下游分析

同样地,我们也可以对xCell分析的结果进行下游分析并通过小提琴图对结果进行直观的分析,和小果一起来看一下怎样操作吧!

现在我们提取出了xCellAnalysis分析后的样本数据集并做了封装处理,现在我们可以针对我们的细胞群数据进行下游分析以及可视化处理的操作。

主要的流程为:根据不同的细胞子群对样本进行分类,遍历每个细胞子群,并计算每个子群的差异显著性,并对显著差异的细胞子群进行绘图展示和保存结果。那么就让我们一起来看下代码实现吧!

for (subgroup in cell_group){
    s=which( cell_group_file$Subgroup==subgroup) #获取当前细胞所属子群的index
    cells=cell_group_file$Cell.types[s] #提取属于当前子群的所有细胞
    rt=rt_total[,cells]   #提取属于当前子群的所有细胞类型的数据,并保存在 rt 中
    cell=c()
    p.value=c()
    for(i in 1:ncol(rt)){
    normalData=rt[1:normal,i]
    tumorData=rt[(normal+1):(normal+tumor),i]
    wilcoxtest=wilcox.test(normalData,tumorData,exact = F) #计算其差异的 p-value,并保存在p.value中,细胞类型名称保存在cell中
    p=round(wilcoxtest$p.value,3)
    p.value=c(p.value,p) #合并
    cell=c(cell,colnames(rt)[i])
    }
    sig=data.frame(cell,p.value)
    sig=sig[sig$p.value<0.05,] #选出p值小于0.05的显著细胞类型
    s=which(colnames(rt)%in%as.character(sig$cell))
    rt=rt[,s]
    all(colnames(rt)==as.character(sig$cell))

现在,小果给大家展示遍历到的其中一个细胞子群的最终计算结果数据,即我们提取出的要可视化的数据集,一起来看看吧!


通过小提琴图可视化下游分析的结果

现在,我们可以将最终的计算结果通过小提琴图展示出来,让我们来看看具体的代码实现吧!

library(vioplot)
pdf(paste(subgroup,"Xcell_score.pdf",sep="_"),height=8,width=15) #设置可视化和保存的文件名称
par(las=1,mar=c(10,6,3,3))
x=c(1:ncol(rt))
y=c(1:ncol(rt))
#绘制空白散点图
plot(x,y,
     xlim=c(0,(ncol(rt)-1)*3+2),ylim=c(min(rt),max(rt)+0.02),
     main="GSE57065",xlab="", ylab="Xcell score",
     pch=21,col="white",xaxt="n",cex.lab=1.3,cex.main=1.5)   
  for(i in 1:ncol(rt)){
    normalData=rt[1:normal,i]
    tumorData=rt[(normal+1):(normal+tumor),i]
    wilcoxtest=wilcox.test(normalData,tumorData,exact = F)
    p=round(wilcoxtest$p.value,3)
    vioplot(normalData,at=3*(i-1),lty=1,add = T,col = '#42B540FF')  #绘制正常数据的小提琴图
    vioplot(tumorData,at=3*(i-1)+1,lty=1,add = T,col = '#925E9FFF') #绘制肿瘤数据的小提琴图
    mx=max(c(normalData,tumorData))
    lines(c(x=3*(i-1)+0.2,x=3*(i-1)+0.8),c(mx,mx))
    text(x=3*(i-1)+1,y=mx+0.02,labels=ifelse(p<0.001,paste0("p<0.001"),paste0("p=",p)),cex = 0.8)
 }
    text(seq(1,((ncol(rt)-1)*3+1),3),-0.01,xpd = NA,labels=colnames(rt),cex = 1,srt = 45,pos=2,font=2)
    dev.off()
    write.csv(sig,paste(subgroup,"_sig_cell.csv",sep=""))  #保存最终结果 
}  

现在,你已经成功完成了xCell分析细胞到可视化的左右工作,现在小果给大家展示其中一个细胞子群的下游分析可视化结果!一起来看吧!


怎么样,你学会怎么使用xCell包了嘛? 更多学习资源请大家移步小果专属云生信平台搜索更多资源哦!

小果专属云生信平台云生信 - 学生物信息学 (biocloudservice.com)

云生信平台也有免疫专版的学习模块哦,快来找到你想学习的专属模块吧!有用服务器需求的私信小果哦!

“生信果”,生信入门、R语言、生信图解读与绘制、软件操作、代码复现、生信硬核知识技能、服务器、生物信息学的教程,以及基于R的分析和可视化等原创内容,一起见证小白和大佬的成长。

相关推荐

ActiveAndroid使用(对象化数据库)

配置模块的build.gradlerepositories{mavenCentral()mavenLocal()maven{url"https://oss.sonatype.org/conte...

AndroidStudio下的依赖管理(android app依赖外部jar包)

在开发中用第三方库是很常见的事,如何在AndroidStudio下管理这些依赖呢?这就是这篇文章的目的。目录Maven/Ivy仓库依赖Module依赖aar文件依赖jar文件依赖例子完整代码一、Mav...

Android Studio之gradle的配置与介绍

1、gradle的简单介绍Gradle是可以用于Android开发的新一代的BuildSystem,也是AndroidStudio默认的build工具。其实Gradle脚本是基于一种JVM语言—...

Android中的run-as命令带来的安全问题

一、前言最近一周比较忙,没时间写东西了,今天继续开始我们今天的话题:run-as命令,在上周的开发中,遇到一个问题,就是在使用run-as命令的时候出现了一个错误,不过当时因为工作进度的问题,这问题就...

Android系统级深入开发——input驱动程序

1、Input驱动程序是Linux输入设备的驱动程序,分成游戏杆(joystick)、鼠标(mouse和mice)和事件设备(Eventqueue)3种驱动程序。其中事件驱动程序是目前通用的驱动程序...

Android项目中如何用好构建神器Gradle?

CSDN移动将持续为您优选移动开发的精华内容,共同探讨移动开发的技术热点话题,涵盖移动应用、开发工具、移动游戏及引擎、智能硬件、物联网等方方面面。如果您想投稿、参与内容翻译工作,或寻求近匠报道,请发送...

Android Studio自定义文件类头(android studio自定义标题栏)

--简书作者谢恩铭转载请注明出处今天给大家介绍一个很简单的"小"技巧。平时,我们在AndroidStudio中开发Android时,总免不了要创建新的文件,也许是Java文件,也许是C...

C语言#include头文件真的是插入代码吗?

若文章对您有帮助,欢迎关注程序员小迷。助您在编程路上越走越好!编译器理论和实作既是又不是。从编译器理论理解,#include头文件"相当于"插入了头文件的代码,以供源代码引用(宏定...

Android 系统核心机制binder(03)binder C++层实现

本章关键点总结&说明:这里主要关注BinderC++部分即可,看到,也是本章节的核心内容,主要就是以C++封装的框架为主来解读binder。之前主要针对于底层驱动binder的数据交互以及...

Java对象序列化与反序列化的那些事

Java对象序列化与反序列化的那些事在Java的世界里,对象序列化和反序列化就像一对孪生兄弟,它们共同构成了Java对象存储和传输的基础。如果你曾经尝试将对象保存到文件中,或者在网络中传输对象,那么你...

Java对象序列化剖析(java 对象序列化)

对象序列化的目的1)希望将Java对象持久化在文件中2)将Java对象用于网络传输实现方式如果希望一个类的对象可以被序列化/反序列化,那该类必须实现java.io.Serializable接口或jav...

C++模板 - 16(SFINAE)(c++模板编程)

C++支持函数重载,同一个函数名,只要它的签名不一样,可以声明若干个版本(这个特性也是必须的,不然构造函数就只能有一个了)。现在函数的重载集合中又加入了新的成员-函数模板,事情就变得越发有趣起来,...

NewtoSoft.Json相关使用技巧(newtosoft.json相关使用技巧有哪些)

  本篇将为大家介绍Newtonsoft.Json的一些高级用法,可以修改很少的代码解决上述问题。Newtonsoft.Json介绍  在做开发的时候,很多数据交换都是以json格式传输的。而使用Js...

C#调用DeepSeek API(c#调用deepseek api 流式输出)

一、官方网站二、DeepSeek测试DeepSeek三大适用模式:基础模型(V3)、深度思考(R1)、联网搜索。基础模型(V3)深度思考(R1)联网搜索三、C#调用DeepSeekAPI核心代码//...

.NET性能系列文章二:Newtonsoft.Json vs System.Text.Json

微软终于追上了?图片来自GlennCarstens-Peters[1]Unsplash[2]欢迎来到.NET性能系列的另一章。这个系列的特点是对.NET世界中许多不同的主题进行研究、基准和比较...