百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

富集分析,看完这篇就够

bigegpt 2024-09-08 11:36 3 浏览

在我们做完组学项目看报告时经常遇到的词儿就有“富集分析”那到底什么是富集分析,它又是用来做什么的,以及富集分析的结果要怎么查看。今天小编就通过自问自答的方式给大家一起科普一下。


1

为什么要做功能富集分析?

组学数据得到的差异基因或者物质非常多,面对海量数据我们无法做到挨个研究、逐一验证来把待研究现象的机制解析清楚。通过富集分析我们可以把差异基因或者物质根据其功能进行归类,这样具有相似功能的基因或者物质就被放在一起,从而减少工作量,并可以实现功能和表型相关联。

2

什么是富集?

富集表示差异基因或者差异物质中注释到某个代谢通路的基因或者物质数目在所有差异基因或者物质中的比例显著大于背景基因或物质中注释到某个代谢通路的基因或物质数目在所有背景基因或者物质中的比例。

3

常用的富集分析有哪些?

常用的富集分析包括GO富集分析、KEGG富集分析以及GSEA富集分析。其中前两者均基于统计学的超几何分布,计算出一个p值来确定是否真的富集。而GSEA的原理是判断功能基因集中的成员在差异表达基因排序列表中的位置,如果都位于差异表达基因排序列表的顶端或者底部,则该基因集也是我们需要关注的。

4

什么是GO富集分析?

我们都知道GO主要是用来看基因的三个方面,分别是分子功能(比如有催化活性功能)、细胞组分(如定位在细胞膜上)、参与的生物过程(如参与物质运输等)。所以一个基因可能可以同时被定义到GO的这三个层面。GO富集就是看我们得到的差异基因或者物质是否富集在这三个层面的基因集中。举例说,铁离子结合的GO term是GO:0005506,如果我们对所得到的差异基因进行GO富集分析后得到该term富集,则我们可以认为我们所研究的现象可能与铁离子结合有关系。由上述信息也可以看出,我们得到的差异基因个数与富集的GO term的个数不是一一对应的关系,一个GO term里会有好多个基因,而一个基因也可以富集在多个term中。

5

什么是KEGG富集?

KEGG是代谢通路图,所以我们得到的是一张展示各个基因或物质关系的网状图。例如通过KEGG分析后我们得到其中一条富集通路的编号是map00010(糖酵解/糖异生),则我们可以认为我们所研究的现象的机制与糖酵解/糖异生有关。同样,可能很多个基因会被富集在同一条通路中,而也有可能很多个基因没有被富集到,所以差异基因的个数与KEGG富集结果也不是一一对应的关系。

6

什么是GSEA富集分析?

是先把差异表达基因按照表达差异倍数从大到小进行排序,然后看某一个基因集下的所有基因主要位于这个排列顺序的前面还是后面部分,如果在前面则表示该基因是上调;如果在后面则表示基因是下调,所以,GSEA富集主要关注两端的基因。

7

GO、KEGG和GSEA富集分析

的区别是什么?

GO是用来找差异基因引起的功能改变,KEGG是用于寻找通路上的影响。GO/KEGG对差异基因的富集需要明确的阈值,这样容易漏掉部分有重要生物学意义的基因。GSEA不需要指定明确的差异基因阈值,算法根据实际整体趋势分析,所以结果可以补充GO和KEGG的富集分析。

8

是否可以在线富集分析?

可以,常用的在线富集分析网站有DAVID(https://david.ncifcrf.gov/)和KOBAS(http://kobas.cbi.pku.edu.cn/),两者都可以在线进行GO或者KEGG富集分析。

9

GO富集分析文件结果如何看?

一般GO富集分析后会看到这样的表格,第一列表示GO的三个levels,ID表示 GO数据库ID,Decription:表示该GO term的功能描述,GeneRAatio:富集到该term里的差异基因数/全部差异基因数,BgRatio:该term的全部基因数/该物种全部有GO注释信息的基因数,pvalue是p值,p.adjust表示矫校正过的p值,qvalue是q值,geneID表示富集到该term里的基因的名称,Count表示富集到该term中的差异基因的数目。

10

GO富集分析结果图怎么看?

GO注释的结果一般有三种展示形式,第一种是有向无环图(DAG,directed-acyclic-graph),第二种是柱状图,第三种是气泡图。下面依次来做介绍。


(1)有向无环图:

箭头表示上下层级关系;椭圆形表示富集程度没有在前10的GO terms;方框表示富集程度在前10的GO terms。颜色表示差异基因在GO term里的富集程度,颜色越深则表示富集越显著,红色代表富集最显著的,黄色是富集次之的,无色表示富集不显著。框内的第一行表示GO的term编号,第二行表示该term的功能描述,第三行表示p值,最后一行数字表示该研究中富集到该term中的差异基因数/该term中全部差异基因数。


(2)柱状图

富集的柱状图或者气泡图一般会选择前10或者前20个进行作图。x轴一般有几种情况,如count/Gene Ratio/-Log10(padj)。柱子越长说明该条目下基因数越多、富集后越显著。y轴表示富集条目,GO富集下面有三个level,不同level可以使用不同颜色区分,也可以像下图这样做成不同的框图。



(3)气泡图

x轴是一个比值(Rich Factor/GeneRatio/ (GeneRatio / BgRatio ))或者差异表达倍数,值越大,富集到该通路的差异代谢物/蛋白质/基因富集程度越高。Y轴表示富集出来的GO或者通路名称,挑选富集通路前20或30的通路来绘图;点的大小表示Gene数目,点越大,表示富集到该通路的基因越多;颜色代表P值的高低,-log10(Pvalue)越大,P值越小,表示该通路越显著。



11

KEGG富集分析结果怎么看?

KEGG富集结果与GO结果类似,ID表示KEGG的PATHWAY数据库中途径标识,Description是该通路的描述,GeneRAatio:富集到该通路里的差异基因数/全部可以富集到KEGG里的差异基因数,BgRatio:该通路的全部基因数/该物种全部有KEGG信息的基因数,pvalue是p值,p.adjust表示矫校正过的p值,qvalue是q值,geneID表示富集到该通路里的基因的名称,Count表示富集到该通路中的差异基因的数目。



12

GSEA富集结果如何查看?

GSEA全称是Gene Set Enrichment Analysis ,GSEA的富集结果也分为对GO的富集以及KEGG富集,两者结果差不多,这里以对KEGG的富集结果为例做介绍。ID表示KEGG的PATHWAY数据库中途径标识,Description是该通路的描述,setSize:富集到该通路下的基因数,enrichmentScore是富集分数,NES表示归一化后的富集分数, pvalue是p值,p.adjust表示矫校正过的p值,qvalue是q值,rank是在基因集中对ES分数贡献最大的核心基因在基因表排序中的位置(按照log2FC从大到小的排序),leading_edge中tags表示核心基因在该基因集基因总数的占比,list表示核心基因占所有基因总数的比例,signal利用这两个指标计算得到,core_enrichment表示富集到该通路的基因列表。其中ES或者NES>0,则说明该通路高表达,反之,则认为该通路被抑制。



13

GSEA富集结果图如何查看?

GSEA富集图主要有三部分组成,最上面一部分是纵坐标为Enrichment score的这一块,这是把该通路里所有基因的富集分数连成一条线得到的,最高峰就是富集得分(ES),一般在最左侧或者最右侧有个明显峰的通路是我们可以深入研究的通路。第二部分是类似条形码的中间部分,每一条黑线表示一个基因,这些基因是按照极阴极里的排序位置进行定位的。条形码下面的红色部分表示在目的样本中高表达,后面紫色部分表示在对照组中高表达。第三部分为所有基因的rank值分布图,纵坐标为ranked list metric,即该基因排序量的值,可理解为公式化处理后的FC值。


相关推荐

恢复软件6款汇总推荐,帮你减轻数据恢复压力!

在当今数字化生活中,数据丢失的风险如影随形。无论是误删文件、硬盘故障,还是遭遇病毒攻击,丢失的数据都可能给我们带来不小的麻烦。此时,一款优秀的数据恢复软件就成为了挽救数据的关键。今天,为大家汇总推荐...

中兴星星一号刷回官方原版recovery的教程

【搞科技教程】中兴星星一号的官方recovery也来说一下了,因为之前给大家分享过了第三方的recovery了,之前给大家分享的第三方recovery也是采用一键刷入的方式,如果细心的朋友会发现,之前...

新玩机工具箱,Uotan柚坛工具箱软件体验

以前的手机系统功能比较单调,各厂商的重视程度不一样,所以喜欢玩机的朋友会解锁手机系统的读写权限,来进行刷机或者ROOT之类的操作,让使用体验更好。随着现在的手机系统越来越保守,以及自身功能的增强,...

三星g906k刷recovery教程_三星g906k中文recovery下载

【搞科技教程】看到有一些机友在找三星g906k的第三方recovery,下面就来说一下详细的recovery的刷入方法了,因为手机只有有了第三方的recovery之后才可以刷第三方的root包和系统包...

中兴星星2号刷recovery教程_星星二号中文recovery下载

【搞科技教程】咱们的中兴星星2手机也就是中兴星星二号手机的第三方recovery已经出来了,并且是中文版的,有了这个recovery之后,咱们的手机就可以轻松的刷第三方的系统包了,如果没有第三方的re...

数据恢复软件有哪些值得推荐?这 6 款亲测好用的工具汇总请收好!

在数字生活中,数据丢失的阴霾常常突如其来。无论是误删工作文档、格式化重要磁盘,还是遭遇系统崩溃,都可能让我们陷入焦虑。关键时刻,一款得力的数据恢复软件便是那根“救命稻草”。今天,为大家精心汇总6...

中兴u956刷入recovery的教程(中兴e5900刷机)

【搞科技教程】这次主要来给大家说说中兴u956手机如何刷入第三方的recovery,因为第三方的recovery工具是咱们刷第三方rom包的基础,可是很我欠却不会刷,所以太这里来给大家整理了一下详细的...

联想A850+刷recovery教程 联想A850+第三方recovery下载

【搞科技教程】联想A850+的第三方recovery出来了,这个第三方的recovery是非常的重要的,比如咱们的手机要刷第三方的系统包的时候,都是需要用到这个第三方的recovery的,在网上也是有...

工具侠重大更新 智能机上刷机一条龙完成

工具侠是针对玩机的机油开发的一款工具,不管是发烧级别的粉丝,还是普通小白用户,都可以在工具侠上找到你喜欢的工具应用。这不,最新的工具侠2.0.16版本,更新了专门为小白准备的刷机助手工具,以及MTK超...

shift+delete删除的文件找回6种硬盘数据恢复工具

硬盘作为电脑的重要存储设备,如同一个巨大的数字仓库,承载着我们日常工作、学习和生活中的各种文件,从珍贵的照片、重要的工作文档到喜爱的视频、音乐等,都依赖硬盘来安全存放。但有时,我们可能会不小心用sh...

使用vscode+Deepseek 实现AI编程 基于Cline和continue

尊敬的诸位!我是一名专注于嵌入式开发的物联网工程师。关注我,持续分享最新物联网与AI资讯和开发实战。期望与您携手探寻物联网与AI的无尽可能。这两天deepseek3.0上线,据说编程能力比肩Cl...

详解如何使用VSCode搭建TypeScript环境(适合小白)

搭建Javascript环境因为TypeScript不能直接在浏览器上运行。它需要编译器来编译并生成JavaScript文件。所以需要首先安装好javascript环境,可以参考文章:https://...

使用VSCode来书写你的Jupyter Notebooks

现在你可以在VScode里面来书写你的notebook了,使用起来十分的方便。下面来给大家演示一下环境的搭建。首先需要安装一个jupyter的包,使用下面的命令安装:pip3install-ih...

使用VSCode模板提高Vue开发效率(vscode开发vue插件)

安装VSCode安装Vetur和VueHelper插件,安装完成后需要重启VScode。在扩展插件搜索框中找到如下Vetur和VueHelper两个插件,注意看图标。添加Vue模板打...

干货!VsCode接入DeepSeek实现AI编程的5种主流插件详解

AI大模型对编程的影响非常之大,可以说首当其冲,Cursor等对话式编程工具渐渐渗透到开发者的工作中,作为AI编程的明星产品,Cursor虽然好用,但是贵啊,所以咱们得找平替,最好免费那种。俗话说,不...