诺米代谢BioDeep大数据分析平台包括数据分布式存储、100+在线工具、智能化数据分析、机器学习与数据挖掘、多组学整合分析、数据共享、临床数据分析、区块链虚拟交互系统等一系列功能。为了方便广大科研工作者更好的使用BioDeep云工具进行个性化分析,小编撰写了一系列操作指南,本期主要介绍非靶或靶向类代谢组常用的“差异分析”小工具:
差异统计分析
韦恩图 & Upset韦恩图
登录biodeep系统,点击“云工具”,选择“代谢组学”及“通用组学”,筛选出所有可以进行代谢组学分析的工具。以下将进行介绍,主要内容包括:小工具功能介绍,如何在结题报告中查找对应数据,如何整理绘图数据,各小工具的参数应该如何选择。
(一)差异统计分析
- 功能:用于两组或者多组样本生物分子定量值的差异分析。主要侧重于FC(Fold change,差异倍数)和P值(显著性)的计算。
- 工具链接:https://www.biodeep.cn/tools/diffexpana?toolId=149
- 示例图
- 所需文件
(1)数据文件(必需)(2)分组文件(必需)(3)比较组文件(必需)
注:不支持中文文件名和特殊符号,请将上传文件命名为英文后再上传处理。
- 作图数据位置
分组文件和比较组文件请根据实际项目填写,以下主要说明数据文件的位置,需按照云工具示例数据整理。
(1)全靶项目:report/MSMS二级分析中的“代谢物鉴定定量表格”
(仅从该表整理name和各样本定量值即可,数据文件中请勿上传其他信息,否则报错)
(2)靶向项目:report\定量分析中的“定量结果”
(由于靶向涉及多个产品,格式稍有不同,下图仅参考,在结果中找到定量表格即可;仅整理出name和各样本的含量值上传)
- 主要参数
① Log转换:对数据进行log计算,缩小数据差异,包括none,log2,log10等。
② 统计检验方法:两组和多组比较的假设检验方式,用加号连接,包括:ttest+anova(参数检验)、wilcox+kstest(非参数检验)。可根据数据特征选择统计方法,如无特殊要求也可直接选择参数检验。
③ p值阈值:差异结果中只保留p值小于该值的分子;
④ log2FC阈值:差异结果中只保留对数差异倍数绝对值大于该值的分子;
⑤ FDR阈值:差异结果中只保留FDR值小于该值的分子。
- 输出
(1)差异分子统计图。默认生成png,pdf两种格式图片。
(2)差异分子韦恩图。默认生成png,pdf两种格式图片。如比对方式超过5种,则无法输出该图。建议可参考第二部分“Upset韦恩图”单独绘制。
(3)所有分子的差异检验结果。默认xlsx格式。
(4)差异分子的差异检验结果。默认xlsx格式。
(5)差异分子的定量结果。默认xlsx格式。
(6)差异分子统计结果。默认xlsx格式。
(二)韦恩图 & Upset韦恩图
- 功能:用于展示集合之间的交集和并集关系。不超过5个集合可使用韦恩图;超过5个集合需使用Upset韦恩图。
- 工具链接
(1)韦恩图:https://www.biodeep.cn/tools/venn?toolId=17
(2)Upset韦恩图:https://www.biodeep.cn/tools/upset_venn?toolId=55
- 示例图(左侧韦恩图,右侧Upset韦恩图)
- 所需文件
多个数据文件(至少2个文件,且不支持中文命名文件)
- 作图数据位置
通常基于各比较组下的差异物质,绘制韦恩图,用于展示不同比对方式获得差异物质的异同情况。
(1)全靶项目:report\MSMS二级分析\比较组\1-差异分析中的“差异代谢物定量列表”(仅从各表整理name即可)
(2)靶向项目:report\5.差异代谢物筛选分析\比对组下的“差异代谢物定量列表”(由于靶向涉及多个产品,格式不同,找到比较组下的差异代谢物名称即可)
- 主要参数
①Set*:每个集合对应的名称,可以自定义输入(仅支持英文和数字);
②透明度:调整填充颜色透明度;
③边框颜色:调整边框颜色;
④边框线宽度:调整边框粗细
● 输出
标准输出一张韦恩图/Upset韦恩图和一张比较结果表格。默认生成png,pdf两种格式图片,以及xlsx格式表格。
本期介绍就到这里,下期将会介绍代谢组学的其他小工具,尽请期待。