百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

用R语言做数据分析——R语言的基本学习

bigegpt 2024-09-05 12:16 37 浏览

R语言的基本学习

例:某学校在体检时测得12名女学生的题中X1(千克)和胸围X2(厘米),试计算题中与胸围的均值与标准差。

在R软件的主窗口输入命令:

> #输入体重

> X1<-c(35,40,40,42,37,45,43,37,44,42,41,39)

> #计算体重的均值

> mean(X1)

[1] 40.41667

> #计算体重的标准差

> sd(X1)

[1] 3.028901

> #输入胸围数据

> X2<-c(60,74,64,71,72,68,78,66,70,65,73,75)

> #计算胸围的均值

> mean(X2)

[1] 69.66667

> #计算胸围的标准差

> sd(X2)

[1] 5.210712

在上述代码中,”#“号是说明语句字符,后面是说明语句。”<-“表示赋值,c()表示数组,X1<-c()表示将一组数据赋值给X1,mean()是求均值函数,sd()是求标准差的函数。

在R软件中,你可以通过保存工作空间的方法,将编写的代码保存在".RData"的文件里,也可以通过”新建脚本程序“的方法将代码保存在".R"为后缀的R脚本文件里。

如果要绘制散点图,则调用plot()函数。

> plot(X1,X2)

如果要绘制直方图,则调用hist()函数。

> hist(X1)

下面以”demo1.R“脚本文件为例,完成一个简单的线性回归模型计算。

#读取数据,第一行是文件头 ,并打印出数据

rt<-read.table("demo1.txt",header = TRUE)

print(rt)

#对重量(Weight)与高度(Height)做线性回归,计算结果放在变量lm.sol中

lm.sol<-lm(Weight~Height,data = rt)

#使用summary()函数显示详细内容

summary(lm.sol)

其中,Min是最小值,1Q是一分位数,Median是中位数,3Q是三分位数,Max是最大值,Estimate是估计值,Std.Error是标准差,t value是t值,Pr是一个衡量标准,Residual standard error表示残余标准差,Multiple R-squared表示相关系数的平方,Adjust R-squared表示调整相关系数,F-statistic表示F统计量,p-value表示p值。

在《每天一点数据分析——回归分析》中讲到过使用Excel“回归”分析工具生成了回归统计表、方差分析表、回归系数表,这里打印的相关数值和用Excel做回归分析得出的结果是一样的。这里再次简单回顾:

Multiple R:因变量Y与自变量X之间的相关系数绝对值,越接近1,相关性越高;

R Square:判定系数R^2(也称拟合优度或决定系数),即相关系数R的平方,R^2越接近1,表示回归模型拟合效果越好;

Adjusted R Square:调整判定系数Adjusted R^2,仅用于多重线性回归时才有意义,它用于衡量其他自变量后模型的拟合程度。

标准误差:其实应当是剩余标准差(Std. Error of the Estimate),在对多个回归模型比较拟合程度时,通常会比较剩余标准差,此值越小,说明拟合程度越好。这里的标准误差为526.41。

最终拟合的方程为:Y = 3.899X - 143.0269

以下是一些常用的R函数:

R语言帮助函数

R语言管理函数

R语言图像输出函数

R语言包的安装与使用

包是R函数、数据、预编译代码以一种定义完善的格式组成的集合,计算机上存储包的目录称为库,libPaths()函数可以是库所在的位置,library()函数可以显示库中有哪些包,而search()函数可以告诉你哪些包已加载并可使用。

有许多R函数可以用来管理包,比如install.packages("gclus")安装gclus包,使用update.packages()函数可以更新已经安装的包,使用installed.packages()函数可以查看已安装包的描述。

在R语言中,要使用某个包需要事先载入这个包。例如,要使用gclus包,执行library(gclus)即可。加入对包的使用不了解,可以使用命令help(package="package_name")查看包的详细帮助。

相关推荐

Linux gron 命令使用详解(linux gminer)

简介gron是一个独特的命令行工具,用于将JSON数据转换为离散的、易于grep处理的赋值语句格式。它的名字来源于"grepableon"或"grepable...

【Linux】——从0到1的学习,让你熟练掌握,带你玩转Linu

学习Linux并掌握Java环境配置及SpringBoot项目部署是一个系统化的过程,以下是从零开始的详细指南,帮助你逐步掌握这些技能。一、Linux基础入门1.安装Linux系统选择发行版:推荐...

Linux常用的shell命令汇总(linux中shell的作用)

本文介绍Linux系统下常用的系统级命令,包括软硬件查看、修改命令,有CPU、内存、硬盘、网络、系统管理等命令。说明命令是在Centos6.464位的虚拟机系统进行测试的。本文介绍的命令都会在此C...

零成本搭建个人加密文件保险柜(适用于 Win11 和 Linux)

不依赖收费软件操作简单,小白也能跟着做支持双系统,跨平台使用实现数据加密、防删除、防泄露内容通俗无技术门槛,秒懂秒用使用工具简介我们将使用两个核心工具:工具名用途系统支持Veracrypt创建加密虚...

如何在 Linux 中使用 Gzip 命令?(linux怎么用gzip命令)

gzip(GNUzip)是Linux系统中一个开源的压缩工具,用于压缩和解压缩文件。它基于DEFLATE算法,广泛应用于文件压缩、备份和数据传输。gzip生成的文件通常带有.gz后缀,压缩效率...

Linux 必备的20个核心知识点(linux内核知识点)

学习和使用Linux所必备的20个核心知识点。这些知识点涵盖了从基础操作到系统管理和网络概念,是构建扎实Linux技能的基础。Linux必备的20个知识点1.Linux文件系统层级标...

谷歌 ChromeOS 已支持 7z、iso、tar 文件格式

IT之家6月21日消息,谷歌ChromeOS在管理文件方面进行了改进,新增了对7z、iso和tar等格式的支持。从5月的ChromeOS101更新开始,ChromeOS...

如何在 Linux 中提取 Tar Bz2 文件?

在深入解压方法之前,我们先来了解.tar.bz2文件的本质。.tar.bz2是一种组合文件格式,包含两个步骤:Tar(TapeArchive):tar是一种归档工具,用于将多个文件或目录打包...

如何在 CentOS 7/8 上安装 Kitematic Docker 管理器

Kitematic是一款流行的Docker图形界面管理平台,适用于Ubuntu、macOS和Windows操作系统。然而,其他发行版(如CentOS、OpenSUSE、Fedora、R...

Nacos3.0重磅来袭!全面拥抱AI,单机及集群模式安装详细教程!

之前和大家分享过JDK17的多版本管理及详细安装过程,然后在项目升级完jdk17后又发现之前的注册和配置中心nacos又用不了,原因是之前的nacos1.3版本的,版本太老了,已经无法适配当前新的JD...

爬虫搞崩网站后,程序员自制“Zip炸弹”反击,6刀服务器成功扛住4.6万请求

在这个爬虫横行的时代,越来越多开发者深受其害:有人怒斥OpenAI的爬虫疯狂“偷”数据,7人团队十年心血的网站一夜崩溃;也有人被爬虫逼到极限,最后只好封掉整个巴西的访问才勉强止血。但本文作者却走...

Ubuntu 操作系统常用命令详解(ubuntu必学的60个命令)

UbuntuLinux是一款流行的开源操作系统,广泛应用于服务器、开发、学习等场景。命令行是Ubuntu的灵魂,也是高效、稳定管理系统的利器。本文按照各大常用领域,详细总结Ubuntu必学...

Linux面板8.0.54 测试版-已上线(linux主机面板)

Linux面板8.0.54测试版【增加】[网站]Java项目新增刷新列表按钮【增加】[网站]PHP项目-Apache-服务新增守护进程功能【增加】[网站]Python项目创建/删除网站时新增同时创建...

开源三剑客——构建私有云世界的基石

公共云原生的浪潮正在席卷这个世界,亚马逊AWS、谷歌GCP和微软的Azure年收入增长超过了30%,越来越多的公司和个人开始将自己的服务部署到云环境中,大型数据中心的规模经济带来了成本的降低,可以在保...

2.2k star,一款业界领先的私有云+在线文档管理系统

简介kodbox可道云(原KodExplorer)是业内领先的企业私有云和在线文档管理系统,为个人网站、企业私有云部署、网络存储、在线文档管理、在线办公等提供安全可控,简便易用、可高度定制的私有云产品...