r语言cor
- R语言学习 - 热图简化
-
热图绘制-pheatmap绘制热图除了使用ggplot2,还可以有其它的包或函数,比如pheatmap::pheatmap(pheatmap包中的pheatmap函数)、gplots::heatmap.2等。相比于ggplot2作heatmap,pheatmap会更为简单一些,一个函数设置不...
- R数据分析:网络分析的做法,原理和复现方法
-
对于复杂问题和现象行为的研究,尤其是他们之间还有复杂的交互影响(complexinterplay)的时候,网络分析(备用名:psychologicalnetworks,networkanalysisornetworkpsychometrics)是个备选的好方法,这个方法火了也没几年,感...
- Python 和 R 数据分析/挖掘工具互查
-
写在前面在此总结一些在数据分析/挖掘中可能用到的功能,方便大家索引或者从一种语言迁移到另一种。当然,这篇博客还会随时更新(不会另起一篇,为了方便大家索引),请大家如果有需要收藏到书签中。如果大家已经熟悉python和R的模块/包载入方式,那下面的表查找起来相对方便。python在下表中以模块.的方...
- 用R语言做数据分析——缺失值处理方法:多重插补
-
多重插补(MI)是一种基于重复模拟的处理缺失值的方法。在面对复杂的缺失值问题时,MI是最常用的方法,它将从一个包含缺失值的数据集中生成一组完整的数据集(通常是3到10个)。在每个模拟数据集中,缺失数据将用蒙特卡洛方法来填补。此时,标准的统计方法便可应用到每个模拟的数据集上,通过组合输出结果给出估计的...
- 聚类分析4—环境数据 (数量生态学:R语言的应用-第四章)
-
聚类分析4—环境数据来解释(数量生态学:R语言的应用-第四章)在这之前我们学习了聚类分析的基本概念、几种计算层次聚类的方法、进一步解读和比较层次聚类结果以及非层次聚类,这些聚类方法都是基于物种多度数据对样方进行分组,当然这些聚类方法也可以用于其他类型数据,特别是环境数据,所以本次就是介绍用环境数据...
- R语言——投影追踪回归(PPR)
-
今天是值得高兴的一天,同时也写得hin潦草的一天在stats包里翻出个看起来很高端,但我完全解释不动的拟合算法,ppr函数投影追踪回归这个名字是直接用百度翻译的,应该是没错吧,反正我没找到啥能参考的介绍文章,所以就纯粹地照着帮助文档的操作来走个过场上数据:#导入数据并做Z-score标准化Data...
- R语言计算基因表达量相关性
-
尔云间一个专门做科研的团队原创小果生信果关注我们小果今天的项目需要计算不同基因表达量间的相关性,是计算关注的ALKBH5基因与其他基因的相关性,撸起袖子开干rm(list=ls());gc();library(data.table)data<-read.csv("coun...
- 用R语言做数据分析——探索性因子分析
-
EFA的目标是通过发掘隐藏在数据下的一组较少的、更为基本的无法观测的变量,来解释一组可观测变量的相关性。这些虚拟的、无法观测的变量称作因子。(每个因子被认为可解释多个观测变量间共有的方差,因此准确说,它们应该称作公共因子。)模型的形式为:其中Xi是第i个可观测变量(i=1...k),Fj是公共因子(...
- 用R语言做数据分析——描述统计量
-
统计分析分为统计描述和统计推断两个部分,统计描述是通过绘制统计图、编制统计表、计算统计量等方法来表述数据的分布特征,它是数据分析的基本步骤,也是进行统计推断的基础。这里结合R语言介绍统计描述,也就是数据的描述性分析,用R语言作数据的描述性分析,可以更加方便、直观,有利于对统计描述的理解。已知一组观测...
- 用R语言做数据分析——主成分和因子分析概论
-
信息过度复杂是多变量数据最大的挑战之一。若数据集有100个变量,如何了解其中所有的交互关系呢?即是只有20个变量,当试图理解各个变量与其他变量的关系时,也需要考虑190对相互关系。主成分分析和探索性因子分析是两种用来探索和简化多变量复杂关系的常用方法,它们之间有联系也有区别。主成分分析(PCA)是一...