百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

R语言笔记3:提取R对象的子集 r语言怎么提取指定列

bigegpt 2024-10-12 06:41 3 浏览

Subsetting R Objects

取子集的三种基本方法

  • [ :“单方括号”返回的对象和原来相同,如向量的子集还是向量;也可用于在对象中选择多个元素
  • [ [:“双方括号”仅可用于提取单一元素,并且用来提取列表或者数据框中的元素,但是,由于列表或者数据框中的元素类别不唯一,因此它返回对象的类型不一定是列表或者数据框
  • $ :“美元符号”是提取有名字的列表或数据框中的一个元素

(一)向量取子集

举例

  1. 单括号+数字索引:
> x <- c("a", "b", "c", "c", "d", "a")  
> x[2]            ## 提取第二个元素
[1] "b"
> x[1:4]          ## 提取连续多个元素
[1] "a" "b" "c" "c"
> x[c(1, 3, 4)]   ## 提取不连续的多个元素
[1] "a" "c" "c"

2.单括号+逻辑索引(按字母排序):

> x <- c("a", "b", "c", "c", "d", "a")  
> x[x > "a"]      ## 提取首字母排序大于a的元素
[1] "b" "c" "c" "d"

3.创建逻辑向量

> u <- x > "a"
> u
[1] FALSE  TRUE  TRUE  TRUE  TRUE FALSE
> x[u]
[1] "b" "c" "c" "d"

(二)矩阵取子集

矩阵取子集可通过行索引和列索引来完成。

例如以下2*3的矩阵

> x <- matrix(1:6, 2, 3)
> x
     [,1] [,2] [,3]
[1,]    1    3    5
[2,]    2    4    6
> x[1, 2]            
[1] 3
> x[, 1]
[1] 1 2
> x[1, 2, drop = FALSE]   ## 修改drop参数,返回矩阵形式
     [,1]
[1,]    3
> x[, 1, drop = FALSE]
     [,1]
[1,]    1
[2,]    2

(三)列表取子集

列表取子集既可以使用“[”,"[[",也可以使用“$”

> ## 创建一个含有两个元素的列表
> x <- list(foo = 1:4, bar = 0.6)
> x
$foo
[1] 1 2 3 4

$bar
[1] 0.6
> ## 三种方法提取第一个元素
> x[1]            ## 单方括号返回的也是一个列表
$foo
[1] 1 2 3 4
> x[[1]]
[1] 1 2 3 4
> x$foo
[1] 1 2 3 4

列表取子集方法的好处是不需要记住顺序,只要有名字就可以。

但是如果要从列表中提取多个元素,只能使用单方括号(双方括号和美元符号只能提取单个元素),并且知道顺序。

> x <- list(foo = 1:4, bar = 0.6, baz = "hello")
> x[c(1, 3)]
$foo
[1] 1 2 3 4

$baz
[1] "hello"

双方括号和美元符号的区别

美元符号必须是列表中存在的元素名;

双方括号可以是后续再次赋值变量之后的

> x <- list(foo = 1:4, bar = 0.6, baz = "hello")
> name <- "foo"
>
> ## computed index for "foo"
> x[[name]]  
[1] 1 2 3 4
>
> ## element "name" doesn’t exist! (but no error here)
> x$name     
NULL
>
> ## element "foo" does exist
> x$foo      
[1] 1 2 3 4

另外双方括号可以取一个整数数列,不仅仅是一个数字

> x <- list(a = list(10, 12, 14), b = c(3.14, 2.81))
> 
> ## Get the 3rd element of the 1st element
> x[[c(1, 3)]]  
[1] 14
> 
> ## Same as above
> x[[1]][[3]]   
[1] 14
> 
> ## 1st element of the 2nd element
> x[[c(2, 1)]]  
[1] 3.14

(四)模糊匹配

美元符号$和双方括号[[有模糊匹配的功能。可以通过这种方法在命令行快速查找元素。

例:

> x <- list(aardvark = 1:5)
> x$a
[1] 1 2 3 4 5
> x[["a"]]                 ## 参数默认为精确匹配
NULL
> x[["a", exact = FALSE]]  ## 参数设置为不精确匹配
[1] 1 2 3 4 5

(五)删除缺失数据和缺失值(NA)

大部分真实数据中包含大量缺失数据,不管是向量、矩阵还是数据框,通过创建一个能够告诉你哪里有缺失值的逻辑向量,从而创建子集来删除它们

is.na() 函数可以找到某个向量中的缺失值,例:

> x <- c(1, 2, NA, 4, NA, 5)
> bad <- is.na(x)
> print(bad)
[1] FALSE FALSE  TRUE FALSE  TRUE FALSE
> x[!bad]         ## !bad表示非缺失值
[1] 1 2 4 5

如果有多个向量、多个对象,NA分布在各个不同地方,目的是去除所有缺失值建立新的子集,可以使用 complete.cases() 函数,如下例:

> x <- c(1, 2, NA, 4, NA, 5)
> y <- c("a", "b", NA, "d", NA, "f")
> good <- complete.cases(x, y)
> good
[1]  TRUE  TRUE FALSE  TRUE FALSE  TRUE
> x[good]
[1] 1 2 4 5
> y[good]
[1] "a" "b" "d" "f"

类似地,如果x,y两个向量的缺失值位置不同, complete.cases() 函数则取并集判断缺失位置:

> x <- c(1, 2, NA, 4, NA, 5)
> y <- c("a", "b", NA, NA, "d", "f")
> good <- complete.cases(x, y)
> good
[1]  TRUE  TRUE FALSE FALSE FALSE  TRUE
> 
> x[good]
[1] 1 2 5
> y[good]
[1] "a" "b" "f"

complete.cases() 函数也可以用于从数据框中移除缺失值

> ## 创建数据框airquality
> Ozone <- c(41, 36, 12, 18, NA, 28, 13, 15)
> Solar.R <- c(190, 118, 149, 313, NA, NA, 244, 222)
> Wind <- c (7.4, 8.0, 12.1, 11.2, 14.3, 13.9, 14.1, 15.2)
> Temp <- c(67, 72, 74, 62, 56, 66, 22, 33)
> Month <- c(5, 5, 5, 5, 5, 5, 5, 5)
> Day <- c(1, 2, 3, 4, 5, 6, 7, 8)
> airquality <- data.frame(Ozone, Solar.R, Wind, Temp, Month, Day)
> airquality
  Ozone Solar.R Wind Temp Month Day
1    41     190  7.4   67     5   1
2    36     118  8.0   72     5   2
3    12     149 12.1   74     5   3
4    18     313 11.2   62     5   4
5    NA      NA 14.3   56     5   5
6    28      NA 13.9   66     5   6
7    13     244 14.1   22     5   7
8    15     222 15.2   33     5   8
>
> ## 取数据框中的前六行数据
> head(airquality)
  Ozone Solar.R Wind Temp Month Day
1    41     190  7.4   67     5   1
2    36     118  8.0   72     5   2
3    12     149 12.6   74     5   3
4    18     313 11.5   62     5   4
5    NA      NA 14.3   56     5   5
6    28      NA 14.9   66     5   6
>
> ## 通过创建逻辑向量找到没有缺失数据的行
> good <- complete.cases(airquality)
> head(airquality[good, ])
  Ozone Solar.R Wind Temp Month Day
1    41     190  7.4   67     5   1
2    36     118  8.0   72     5   2
3    12     149 12.6   74     5   3
4    18     313 11.5   62     5   4
7    23     299  8.6   65     5   7
8    19      99 13.8   59     5   8

(六)提取某种条件下数据框的子集

如上例:

挑取Ozone列中数值大于18,且Temp数值大于60的数据子集,从该子集中计算Wind数据的平均值

> Ozone <- c(41, 36, 12, 18, NA, 28, 13, 15)
> Solar.R <- c(190, 118, 149, 313, NA, NA, 244, 222)
> Wind <- c (7.4, 8.0, 12.1, 11.2, 14.3, 13.9, 14.1, 15.2)
> Temp <- c(67, 72, 74, 62, 56, 66, 22, 33)
> Month <- c(5, 5, 5, 5, 5, 5, 5, 5)
> Day <- c(1, 2, 3, 4, 5, 6, 7, 8)
> data <- data.frame(Ozone, Solar.R, Wind, Temp, Month, Day)
> data
  Ozone Solar.R Wind Temp Month Day
1    41     190  7.4   67     5   1
2    36     118  8.0   72     5   2
3    12     149 12.1   74     5   3
4    18     313 11.2   62     5   4
5    NA      NA 14.3   56     5   5
6    28      NA 13.9   66     5   6
7    13     244 14.1   22     5   7
8    15     222 15.2   33     5   8
> 
> ## 设置条件
> d2 <- data[data$Ozone>18 & data$Temp>60, ]
> d2
  Ozone Solar.R Wind Temp Month Day
1    41     190  7.4   67     5   1
2    36     118  8.0   72     5   2
6    28      NA 13.9   66     5   6
> m <- d2$Wind
> m
[1]  7.4  8.0 13.9
> mean(m)
[1] 9.766667


参考资料:

  1. https://bookdown.org/rdpeng/rprogdatascience/R Programming for Data Science
  2. 《R语言实战》 Robert I. Kabacoff

相关推荐

恢复软件6款汇总推荐,帮你减轻数据恢复压力!

在当今数字化生活中,数据丢失的风险如影随形。无论是误删文件、硬盘故障,还是遭遇病毒攻击,丢失的数据都可能给我们带来不小的麻烦。此时,一款优秀的数据恢复软件就成为了挽救数据的关键。今天,为大家汇总推荐...

中兴星星一号刷回官方原版recovery的教程

【搞科技教程】中兴星星一号的官方recovery也来说一下了,因为之前给大家分享过了第三方的recovery了,之前给大家分享的第三方recovery也是采用一键刷入的方式,如果细心的朋友会发现,之前...

新玩机工具箱,Uotan柚坛工具箱软件体验

以前的手机系统功能比较单调,各厂商的重视程度不一样,所以喜欢玩机的朋友会解锁手机系统的读写权限,来进行刷机或者ROOT之类的操作,让使用体验更好。随着现在的手机系统越来越保守,以及自身功能的增强,...

三星g906k刷recovery教程_三星g906k中文recovery下载

【搞科技教程】看到有一些机友在找三星g906k的第三方recovery,下面就来说一下详细的recovery的刷入方法了,因为手机只有有了第三方的recovery之后才可以刷第三方的root包和系统包...

中兴星星2号刷recovery教程_星星二号中文recovery下载

【搞科技教程】咱们的中兴星星2手机也就是中兴星星二号手机的第三方recovery已经出来了,并且是中文版的,有了这个recovery之后,咱们的手机就可以轻松的刷第三方的系统包了,如果没有第三方的re...

数据恢复软件有哪些值得推荐?这 6 款亲测好用的工具汇总请收好!

在数字生活中,数据丢失的阴霾常常突如其来。无论是误删工作文档、格式化重要磁盘,还是遭遇系统崩溃,都可能让我们陷入焦虑。关键时刻,一款得力的数据恢复软件便是那根“救命稻草”。今天,为大家精心汇总6...

中兴u956刷入recovery的教程(中兴e5900刷机)

【搞科技教程】这次主要来给大家说说中兴u956手机如何刷入第三方的recovery,因为第三方的recovery工具是咱们刷第三方rom包的基础,可是很我欠却不会刷,所以太这里来给大家整理了一下详细的...

联想A850+刷recovery教程 联想A850+第三方recovery下载

【搞科技教程】联想A850+的第三方recovery出来了,这个第三方的recovery是非常的重要的,比如咱们的手机要刷第三方的系统包的时候,都是需要用到这个第三方的recovery的,在网上也是有...

工具侠重大更新 智能机上刷机一条龙完成

工具侠是针对玩机的机油开发的一款工具,不管是发烧级别的粉丝,还是普通小白用户,都可以在工具侠上找到你喜欢的工具应用。这不,最新的工具侠2.0.16版本,更新了专门为小白准备的刷机助手工具,以及MTK超...

shift+delete删除的文件找回6种硬盘数据恢复工具

硬盘作为电脑的重要存储设备,如同一个巨大的数字仓库,承载着我们日常工作、学习和生活中的各种文件,从珍贵的照片、重要的工作文档到喜爱的视频、音乐等,都依赖硬盘来安全存放。但有时,我们可能会不小心用sh...

使用vscode+Deepseek 实现AI编程 基于Cline和continue

尊敬的诸位!我是一名专注于嵌入式开发的物联网工程师。关注我,持续分享最新物联网与AI资讯和开发实战。期望与您携手探寻物联网与AI的无尽可能。这两天deepseek3.0上线,据说编程能力比肩Cl...

详解如何使用VSCode搭建TypeScript环境(适合小白)

搭建Javascript环境因为TypeScript不能直接在浏览器上运行。它需要编译器来编译并生成JavaScript文件。所以需要首先安装好javascript环境,可以参考文章:https://...

使用VSCode来书写你的Jupyter Notebooks

现在你可以在VScode里面来书写你的notebook了,使用起来十分的方便。下面来给大家演示一下环境的搭建。首先需要安装一个jupyter的包,使用下面的命令安装:pip3install-ih...

使用VSCode模板提高Vue开发效率(vscode开发vue插件)

安装VSCode安装Vetur和VueHelper插件,安装完成后需要重启VScode。在扩展插件搜索框中找到如下Vetur和VueHelper两个插件,注意看图标。添加Vue模板打...

干货!VsCode接入DeepSeek实现AI编程的5种主流插件详解

AI大模型对编程的影响非常之大,可以说首当其冲,Cursor等对话式编程工具渐渐渗透到开发者的工作中,作为AI编程的明星产品,Cursor虽然好用,但是贵啊,所以咱们得找平替,最好免费那种。俗话说,不...