GO|KEGG圈图
小伙伴们,大家好,欢迎来到小洋专栏!不知道上期的PCA和UMAP图大家学会了嘛?这一期,小洋将向大家介绍如何利用仙桃学术工具来进行GO|KEGG圈图的绘制。
基本概念
富集分析:简单而言,就是拿一堆有功能注释的分子与所有有功能注释的分子去比较(超几何分布检验),确定那一堆中都涉及了哪些功能作用。单独几个分子做富集分析意义并不大。
GO(Gene Ontology,基因本体)数据库:把基因的功能分成了三类:生物过程(biological process, BP)、细胞组分(cellular component, CC)、分子功能(molecular function, MF)。利用 GO 数据库,可以得到目标基因在 CC, MF和 BP 三个层面上有什么关联。
KEGG 数据库:一种通路数据库,收集了很多通路相关的数据库。通路数据库还包括 wikipathway,reactome 等。
富集分析联合 logFC:就是在富集分析的基础上,利用提供的分子的 logFC,计算每个条目对应的 zscore,初步判断对应的条目是正调节(zscore 为正)还是负调节(zscore 为负)。zscore 计算方法见下:
其中,这里的 Up \Down 代表对应条目分子的 logFC 为正以及为负分别对应数量,Counts 代表条目对应的分子总数。
应用场景
这个模块为 GO|KEGG 富集分析后结果的圈图可视化。
注意:这个模块需要先进行 GO|KEGG(联合logFC)的富集分析(不是 GO|KEGG 富集分析模块) 并保存结果后,此处的云端数据才会有结果记录,然后才能进行可视化的操作。右侧的基本参数中有 ID 列表输入框,可以将对应云端数据记录的富集分析表格中的感兴趣的 ID 列复制到此处,进行可视化。
主要结果
- 图可以分为内圈和外圈两个部分,内圈的每个柱子对应一个条目,高度为p.adj 的相对大小,越高说明该 ID 的 p.adjust 越小。柱子对应填充的颜色代表条目对应的 zscore 值。
- zscore 的计算方法来自 GOplot 包,计算方法见下:
其中,这里的Up\ Down 代表对应条目分子的 logFC 为正以及为负分别对应数量,Counts 代表条目对应的分子总数。
- 如果 zscore 为正,说明对应的条目可能是正调节,如果为负,对应条目可能是负调节;绝对值越大,说明高表达分子和低表达分子的数量差相对比较大,说明调节程度可能更高。
- 注意,zscore 仅仅只能作为一种可能性参考,因为计算的方法中,是没有考虑条目内的分子对这个条目是正调节还是负调节(GO|KEGG 库里面也并没有记录每个条目每个分子是对这个条目是正还是负调节的数据信息,这个是没有办法合并进去计算的)。
- 外圈为条目中包含的分子,不同的高度代表对应的 logFC 值,同时 logFC为正的分子被标记成 Up,logFC 为负的分子被标记成 Down,同时填充不同的颜色。
这个图的作用除了展示条目的 p.adj(柱子高低),还会同时展示每个条目对应的分子的 logFC 情况(如果同为 Up 或者同为 Down 的分子越多,则对应的柱子的颜色越深,靠一边的分子越多)。
云端数据
这里的云端数据与历史记录中 GO|KEGG(联合 logFC)模块的数据记录是保持一致的,可以在历史记录中找到相应的数据记录。
根据需要可视化的项目 选择好对应的云端数据记录。
以上就是有关GO|KEGG圈图的背景介绍,如果想要进一步掌握GO|KEGG圈图的相关内容,还可以登录解螺旋官方网站进行深入的学习和探索!
实战演练
下面让我们来看一篇2022年2月发表在“American Journal of Translational Research”(IF= 4.06)杂志上的一篇文章。题名为“Integrated analysis of differentially expressed genes and a ceRNA network to identify hub lncRNAs and potential drugs for multiple sclerosis”。
期刊简介
使用工具
仙桃学术(https://www.xiantao.love)
图形复现
复现过程
进入仙桃学术,点击【生信工具】
【高级版】 → 【立即使用】
【功能聚类(圈)】 → 【GO|KEGG】 →【圈图】→ 云端数据
上面的数据是模拟数据,所以并不会和文献中的图片完全一致。不过复现我们主要掌握方法即可,不需要完全复现。上传数据后,点击“确定”进行分析,并保存结果。
保存结果
好啦,本期有关GO|KEGG圈图的相关内容就介绍到这里,希望对大家的科研工作有所帮助。我是小洋,我们下期再见~