R语言data.table 包 r语言data.table用法
bigegpt 2024-10-12 06:42 3 浏览
data.table包是干什么的
R语言里有data.frame的数据结构。data.table是data.frame的一个扩展,它几乎继承了所有的data.frame特性,我们通常对data.frame作出的操作,对于data.table同样也是有效的。那么data.table存在的价值是什么呢?它是由C语言写的,所以运行速度快,数据存储效率高,像取子集,变量分组,更新变量等操作都要优于data.frame,而且对于大型数据集的支持比较好。所以,如果你还没有学习过data.frame,可以直接越过它直接学习data.table。
实例中学习
创建数据集
创建data.frame
df <- data.frame(x=rnorm(9),y=rep(c('a','b','c'),each=3),z=rnorm(9))
## x y z
创建data.table
library(data.table)dt <- data.table(x=rnorm(9),y=rep(c('a','b','c'),each=3),z=rnorm(9))
## x y z
查看内存下所有的data table的情况
tables()
## NAME NROW NCOL MB COLS KEY
像data.frame一样进行操作
dt[2,] #取第二行,所有列
## x y z
dt[dt$y=="a",] #取dt表中y列取值为"a"的所有行
## x y z
和data.frame的区别
dt[c(2,3)] #data.table中索引没有逗号,默认是按行取,这里取出的是第2,3行
## x y z
df[c(2,3)] #data.frame没有逗号默认是按列取得,这里取出了第2,3列
## y z
取子集操作
data.table包用来取子集的函数与R中常用数据类型有些不同。
它采用:逗号+expression 的表达方式。
一个 expression 是指包含在一对花括号里的一系列语句。
例1
设想你想要求出x这一列的均值,z这一列的总和:
dt[,list(mean(x),sum(z))]
## V1 V2
例2
设想你想要对y变量各种值出现的频次做个统计
dt[,table(y)]
## y
例3
设想你想生成新的一列,新列是z那一列的平方
dt[,w:=z^2]
这里用 data.table,而不是用 data.frame 的好处就体现出来了,data.table 是直接在原来的表里添加新的一列,而 data.frame 要重新生成一个表,再把新列加进去,所以当数据集很大时,非常占内存,速度也会下降。
例4
dt2 <- dtdt[,y:=2]
## x y z w
head(dt2,3)
## x y z w
这里,我们把dt赋值给了dt2,然后修改了dt的值,发现dt2的值也被修改了。也就是说dt和dt2在内存中占用的是同一个地方,并没有做到真正的复制。这里我们需要用 copy 函数来进行真正的复制。
dt3 <- copy(dt)dt[,y:=3]
## x y z w
head(dt3,n=3)
## x y z w
例5
多条expression的情形
这里我们创建一个叫做 m 的新列,这个表达式包含两个语句,放在一个花括号里,语句之间用分号隔开,最后的返回值就是新列的值。
dt[,m:={tmp=x+z;log(abs(tmp)+2)}]
## x y z w m
在对数据进行分组时,常常依据一些判断条件,例如下面对 a 的正负性进行分组。
dt[,a:=x>0]
## x y z w m a
分组之后就可以求出不同组的一些特征,例如
dt[,b:=mean(x+w),by=a]
## x y z w m a b
dt[,.N,by=a]
## a N
相关推荐
- Linux gron 命令使用详解(linux gminer)
-
简介gron是一个独特的命令行工具,用于将JSON数据转换为离散的、易于grep处理的赋值语句格式。它的名字来源于"grepableon"或"grepable...
- 【Linux】——从0到1的学习,让你熟练掌握,带你玩转Linu
-
学习Linux并掌握Java环境配置及SpringBoot项目部署是一个系统化的过程,以下是从零开始的详细指南,帮助你逐步掌握这些技能。一、Linux基础入门1.安装Linux系统选择发行版:推荐...
- Linux常用的shell命令汇总(linux中shell的作用)
-
本文介绍Linux系统下常用的系统级命令,包括软硬件查看、修改命令,有CPU、内存、硬盘、网络、系统管理等命令。说明命令是在Centos6.464位的虚拟机系统进行测试的。本文介绍的命令都会在此C...
- 零成本搭建个人加密文件保险柜(适用于 Win11 和 Linux)
-
不依赖收费软件操作简单,小白也能跟着做支持双系统,跨平台使用实现数据加密、防删除、防泄露内容通俗无技术门槛,秒懂秒用使用工具简介我们将使用两个核心工具:工具名用途系统支持Veracrypt创建加密虚...
- 如何在 Linux 中使用 Gzip 命令?(linux怎么用gzip命令)
-
gzip(GNUzip)是Linux系统中一个开源的压缩工具,用于压缩和解压缩文件。它基于DEFLATE算法,广泛应用于文件压缩、备份和数据传输。gzip生成的文件通常带有.gz后缀,压缩效率...
- Linux 必备的20个核心知识点(linux内核知识点)
-
学习和使用Linux所必备的20个核心知识点。这些知识点涵盖了从基础操作到系统管理和网络概念,是构建扎实Linux技能的基础。Linux必备的20个知识点1.Linux文件系统层级标...
- 谷歌 ChromeOS 已支持 7z、iso、tar 文件格式
-
IT之家6月21日消息,谷歌ChromeOS在管理文件方面进行了改进,新增了对7z、iso和tar等格式的支持。从5月的ChromeOS101更新开始,ChromeOS...
- 如何在 Linux 中提取 Tar Bz2 文件?
-
在深入解压方法之前,我们先来了解.tar.bz2文件的本质。.tar.bz2是一种组合文件格式,包含两个步骤:Tar(TapeArchive):tar是一种归档工具,用于将多个文件或目录打包...
- 如何在 CentOS 7/8 上安装 Kitematic Docker 管理器
-
Kitematic是一款流行的Docker图形界面管理平台,适用于Ubuntu、macOS和Windows操作系统。然而,其他发行版(如CentOS、OpenSUSE、Fedora、R...
- Nacos3.0重磅来袭!全面拥抱AI,单机及集群模式安装详细教程!
-
之前和大家分享过JDK17的多版本管理及详细安装过程,然后在项目升级完jdk17后又发现之前的注册和配置中心nacos又用不了,原因是之前的nacos1.3版本的,版本太老了,已经无法适配当前新的JD...
- 爬虫搞崩网站后,程序员自制“Zip炸弹”反击,6刀服务器成功扛住4.6万请求
-
在这个爬虫横行的时代,越来越多开发者深受其害:有人怒斥OpenAI的爬虫疯狂“偷”数据,7人团队十年心血的网站一夜崩溃;也有人被爬虫逼到极限,最后只好封掉整个巴西的访问才勉强止血。但本文作者却走...
- Ubuntu 操作系统常用命令详解(ubuntu必学的60个命令)
-
UbuntuLinux是一款流行的开源操作系统,广泛应用于服务器、开发、学习等场景。命令行是Ubuntu的灵魂,也是高效、稳定管理系统的利器。本文按照各大常用领域,详细总结Ubuntu必学...
- Linux面板8.0.54 测试版-已上线(linux主机面板)
-
Linux面板8.0.54测试版【增加】[网站]Java项目新增刷新列表按钮【增加】[网站]PHP项目-Apache-服务新增守护进程功能【增加】[网站]Python项目创建/删除网站时新增同时创建...
- 开源三剑客——构建私有云世界的基石
-
公共云原生的浪潮正在席卷这个世界,亚马逊AWS、谷歌GCP和微软的Azure年收入增长超过了30%,越来越多的公司和个人开始将自己的服务部署到云环境中,大型数据中心的规模经济带来了成本的降低,可以在保...
- 2.2k star,一款业界领先的私有云+在线文档管理系统
-
简介kodbox可道云(原KodExplorer)是业内领先的企业私有云和在线文档管理系统,为个人网站、企业私有云部署、网络存储、在线文档管理、在线办公等提供安全可控,简便易用、可高度定制的私有云产品...
- 一周热门
- 最近发表
-
- Linux gron 命令使用详解(linux gminer)
- 【Linux】——从0到1的学习,让你熟练掌握,带你玩转Linu
- Linux常用的shell命令汇总(linux中shell的作用)
- 零成本搭建个人加密文件保险柜(适用于 Win11 和 Linux)
- 如何在 Linux 中使用 Gzip 命令?(linux怎么用gzip命令)
- Linux 必备的20个核心知识点(linux内核知识点)
- 谷歌 ChromeOS 已支持 7z、iso、tar 文件格式
- 如何在 Linux 中提取 Tar Bz2 文件?
- 如何在 CentOS 7/8 上安装 Kitematic Docker 管理器
- Nacos3.0重磅来袭!全面拥抱AI,单机及集群模式安装详细教程!
- 标签列表
-
- mybatiscollection (79)
- mqtt服务器 (88)
- keyerror (78)
- c#map (65)
- xftp6 (83)
- bt搜索 (75)
- c#var (76)
- xcode-select (66)
- mysql授权 (74)
- 下载测试 (70)
- linuxlink (65)
- pythonwget (67)
- androidinclude (65)
- libcrypto.so (74)
- linux安装minio (74)
- ubuntuunzip (67)
- logstashinput (65)
- hadoop端口 (65)
- vue阻止冒泡 (67)
- jquery跨域 (68)
- php写入文件 (73)
- kafkatools (66)
- mysql导出数据库 (66)
- jquery鼠标移入移出 (71)
- 取小数点后两位的函数 (73)