百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

高分生信文章不是梦,学会这5个数据库,你也是科研界的大佬

bigegpt 2024-12-26 11:49 9 浏览


众所周知,医生做科研很难,发SCI更难。基础研究,临床研究与生信研究都属于医生做科研的技能分支。


大部分医生做科研的主线是搞基础研究,通过做实验来产出数据,但是基础研究做的过程很费时间,数据产出的过程需要各种实验技巧,门槛相对较高。


临床研究的难点一方面来源于高质量的临床样本很难收集,另一方面在于对统计学知识的高要求。


近年来随着高通量测序技术的高速发展,生信研究异军突起,医生可以不再需要科研经费即可快速发文章灌水了,利用别人的数据进行二次挖掘,下载数据分析一遍,出一些花花绿绿的图就可以写文章了,这谁能不爱?


掌握一些生信基础知识,学有余力的小伙伴们再熟练掌握一些R语言的内容就可以实现弯道超车,是不是疯狂心动?


生信研究有套路吗?有!酸菜老师精心归纳了生信文章的四大组成板块:表达差异,功能聚类,交互网络与临床意义,总结为四字真言,即“挑圈联靠”。


简单来说,把公开的高通量数据拿来做二次分析,得到差异表达的分子列表,对其进行功能聚类分析后选出交际花类型的分子,抓住他们就能最有效率的控制整个网络,最后与临床资料相结合,转化成具有临床意义的科研成果。


上面这些步骤即对应了“挑圈联靠”四步走战略。当然这些过程中少不了一些生信技术手段来对数据进行分析,对于医生而言,会熟练掌握R语言就可以摸到天花板了,再往上的Perl,Python倒是大可不必,那又有人问,要是不会编程,计算机不好怎么办?


别慌,今天这就教你如何避开R语言,利用零代码的生信数据库及软件shinyGEO,GSEA, STRING,Cytoscape,GEPIA2,带你“挑、圈、联、靠”一波带走一篇生信文章!


一、“挑”----表达差异之shinyGEO使用教程


大名鼎鼎的GEO数据库想必大家都有所耳闻,GEO是著名的基因表达综合数据库,并自带GEO2R可以进行差异表达基因的分析,但是单个基因的评估却没有那么简单。


对于没有生物信息学专业知识的人来说,特定GEO数据集的生存分析也无法实现。那这个时候shinyGEO就提供了一种解决办法。


shinyGEO的特点总结如下:

(1)允许用户直接从GEO下载基因表达数据集,提供单基因差异表达和生存分析,并进行可视化作图;

(2)支持可视化图形定制、样本选择、数据导出和R代码生成。


表达差异分析


可视化作图


图形定制


数据导出


R代码生成


生存分析



总的来说,shinyGEO是一个GEO数据库的在线可视化工具,点击操作即可完成对GEO数据基因表达差异分析以及生存曲线绘制。



二、“圈”----功能聚类之GSEA软件使用教程


说到功能聚类,大家都能想到GO或者KEGG来对分子的功能和通路进行富集。


但是GO和KEGG进行分析的差异基因是通过人为定义的阈值得到的,而这种人为决定的阈值会遗漏掉某些表达差异不显著但有重要生物学意义的基因。


此外,如果上调基因和下调基因分开富集到了同一条通路,那这条通路到底是被激活还是抑制呢?


传统的富集分析只能定位到功能,而GSEA则可以通过预定义的基因集在排序好的基因列表中的分布回答某通路被抑制还是激活。


因此GSEA可以看作是GO和KEGG的补充和进阶,它检测的是基因集而不是单个基因的表达变化,得到更为理想的结果。


GSEA与传统GO、KEGG分析的区别:

(1)输入文件:GSEA是表达矩阵,传统的富集分析是基因名列表;

(2)排序:GSEA分析前需要根据表达量对基因进行排序,传统的GO、KEGG富集分析不需要;

(3)差异分析:GSEA不需要进行差异分析;

(4)目的:传统的富集分析主要关注的差异显著基因的功能,GSEA关注的是某个生物状态下功能基因集的变化。


GSEA简介




GSEA软件的下载和安装




GSEA输入文件的制作






GSEA分析



GSEA分析结果解读



总而言之,GSEA基因富集分析比传统的富集分析能发掘出更多的信息。



生信经典数据库使用教程合集(shinyGEO,GSEA, STRING,Cytoscape,GEPIA2)免费赠送,限量500 个名额。私信我回复“数据库”即可免费领取哦!


三、“联”----交互网络之STRING数据库+Cytoscape软件


在生信文章中,STRING数据库和Cytoscape可视化软件可谓是一对手拉手的好兄弟。


STRING数据库全称为search tool for the retrieval of interacting genes/proteins,基因/蛋白相互作用检索搜查工具,用来构建蛋白质-蛋白质相互作用网络(PPI网络)。


只有正确地发现和注释细胞中所有功能性的相互作用关系,才能对细胞的功能进行系统层面的学习和理解。


STRING数据库的核心功能包括:

(1)单蛋白检索:通过输入单个蛋白的名称或序列(支持模糊搜索),得到这个蛋白和其他蛋白的互作网络;

(2)多蛋白检索:通过输入多个蛋白的名称或序列,得到输入蛋白间的互作关系网络;

(3)对含有数量值/排序的蛋白进行富集,分析获得这些蛋白显著差异表达的通路,类似GSEA的新增模式。


STRING数据库概览



单蛋白检索:绘制PPI网络




单蛋白检索结果解读




多蛋白检索:绘制PPI网络




多蛋白检索结果解读




实例讲解




与Cytoscape软件联用



含有数量值/排序的蛋白检索




总结,STRING可简单便捷地实现基因的互作关系网络图。



正如前文所述,利用STRING数据库得到的PPI网络可以进一步导入到Cytoscape软件中进行进一步的作图和润色,并可利用一些插件对网络图的节点进行相应的计算。


Cytoscape可用于蛋白-蛋白相互作用、蛋白-DNA相互作用、miRNA-mRNA相互作用的分析,支持多种数据输入格式,支持外源数据导入,也可以利用软件本身的编辑器模块直接构建网络图


Cytoscape软件基本介绍



Cytoscape下载与安装




Cytoscape界面介绍




数据导入与图形编辑





常见插件应用




绘制PPI网络图




筛选Hub基因




绘制ceRNA网络图





总的来说,Cytoscape可简单便捷地实现网络可视化。



生信经典数据库使用教程合集(shinyGEO,GSEA, STRING,Cytoscape,GEPIA2)免费赠送,限量500 个名额。私信我回复“数据库”即可免费领取哦!


四、“靠”----临床意义之GEPIA2数据库


肿瘤生信之于非肿瘤生信的优势之一就是可以获取丰富的临床资料,通过将生信分析的结果与临床信息相互结合获得更有说服力,更有临床意义的结果。


在此为大家安利国人之光GEPIA2数据库,全称为Gene Expression Profiling Interactive Analysis,可以基于基因表达水平值,计算某个基因在某类肿瘤中的表达水平,进而计算其与肿瘤预后的关系,基因之间的共表达水平等等


该数据库零代码操作,零基础的同学也可以借助其完成纯生信文章发表或是基金申请,或是设计自己的课题。GEPIA2数据库由北京大学建立,目前国际认可度高,使用人群广泛。


GEPIA2数据库基本介绍




GEPIA2数据库操作解析之单基因分析













GEPIA2数据库操作解析之基于癌症类型分析




GEPIA2数据库操作解析之多基因分析



GEPIA2数据库优势与劣势



GEPIA2与其他数据库联用



GEPIA2数据库高分论文展示



总结,GEPIA2数据库可以零代码完成一个生信课题。



零代码生信文章的“挑、圈、联、靠”四大板块常用经典数据库已经带领大家都过了一遍,不知大家是否尽兴?


为了用最简单的方式帮助你成长,生信经典数据库使用教程合集(shinyGEO,GSEA, STRING,Cytoscape,GEPIA2)免费赠送,限量500 个名额。私信我回复“数据库”即可免费领取哦!

相关推荐

了解Linux目录,那你就了解了一半的Linux系统

大到公司或者社群再小到个人要利用Linux来开发产品的人实在是多如牛毛,每个人都用自己的标准来配置文件或者设置目录,那么未来的Linux则就是一团乱麻,也对管理造成许多麻烦。后来,就有所谓的FHS(F...

Linux命令,这些操作要注意!(linux命令?)

刚玩Linux的人总觉得自己在演黑客电影,直到手滑输错命令把公司服务器删库,这才发现命令行根本不是随便乱用的,而是“生死簿”。今天直接上干货,告诉你哪些命令用好了封神!喜欢的一键三连,谢谢观众老爷!!...

Linux 命令速查手册:这 30 个高频指令,拯救 90% 的运维小白!

在Linux系统的世界里,命令行是强大的武器。对于运维小白而言,掌握一些高频使用的Linux命令,能极大提升工作效率,轻松应对各种系统管理任务。今天,就为大家奉上精心整理的30个Linu...

linux必学的60个命令(linux必学的20个命令)

以下是Linux必学的20个基础命令:1.cd:切换目录2.ls:列出文件和目录3.mkdir:创建目录4.rm:删除文件或目录5.cp:复制文件或目录6.mv:移动/重命名文件或目录7....

提高工作效率的--Linux常用命令,能够决解95%以上的问题

点击上方关注,第一时间接受干货转发,点赞,收藏,不如一次关注评论区第一条注意查看回复:Linux命令获取linux常用命令大全pdf+Linux命令行大全pdf为什么要学习Linux命令?1、因为Li...

15 个实用 Linux 命令(linux命令用法及举例)

Linux命令行是系统管理员、开发者和技术爱好者的强大工具。掌握实用命令不仅能提高效率,还能解锁Linux系统的无限潜力,本文将深入介绍15个实用Linux命令。ls-列出目录内容l...

Linux 常用命令集合(linux常用命令全集)

系统信息arch显示机器的处理器架构(1)uname-m显示机器的处理器架构(2)uname-r显示正在使用的内核版本dmidecode-q显示硬件系统部件-(SMBIOS/DM...

Linux的常用命令就是记不住,怎么办?

1.帮助命令1.1help命令#语法格式:命令--help#作用:查看某个命令的帮助信息#示例:#ls--help查看ls命令的帮助信息#netst...

Linux常用文件操作命令(linux常用文件操作命令有哪些)

ls命令在Linux维护工作中,经常使用ls这个命令,这是最基本的命令,来写几条常用的ls命令。先来查看一下使用的ls版本#ls--versionls(GNUcoreutils)8.4...

Linux 常用命令(linux常用命令)

日志排查类操作命令查看日志cat/var/log/messages、tail-fxxx.log搜索关键词grep"error"xxx.log多条件过滤`grep-E&#...

简单粗暴收藏版:Linux常用命令大汇总

号主:老杨丨11年资深网络工程师,更多网工提升干货,请关注公众号:网络工程师俱乐部下午好,我的网工朋友在Linux系统中,命令行界面(CLI)是管理员和开发人员最常用的工具之一。通过命令行,用户可...

「Linux」linux常用基本命令(linux常用基本命令和用法)

Linux中许多常用命令是必须掌握的,这里将我学linux入门时学的一些常用的基本命令分享给大家一下,希望可以帮助你们。总结送免费学习资料(包含视频、技术学习路线图谱、文档等)1、显示日期的指令:d...

Linux的常用命令就是记不住,怎么办?于是推出了这套教程

1.帮助命令1.1help命令#语法格式:命令--help#作用:查看某个命令的帮助信息#示例:#ls--help查看ls命令的帮助信息#netst...

Linux的30个常用命令汇总,运维大神必掌握技能!

以下是Linux系统中最常用的30个命令,精简版覆盖日常操作核心需求,适合快速掌握:一、文件/目录操作1.`ls`-列出目录内容`ls-l`(详细信息)|`ls-a`(显示隐藏文件)...

Linux/Unix 系统中非常常用的命令

Linux/Unix系统中非常常用的命令,它们是进行文件操作、文本处理、权限管理等任务的基础。下面是对这些命令的简要说明:**文件操作类:*****`ls`(list):**列出目录内容,显...