【实验目的】
1)熟悉R语言的基本数据类型
2)熟悉R语言的基本操作
3)熟悉R语言数据框的操作
【实验原理】
在R语言里操作和接触的所有东西都称作对象(object)。对象有很多种类 可以包含各种类型的数据。R 语言里所有的东西都被称为对象,R语言中常见的数据类型有几下几种,分别是字符型 (character)、数值型 (numeric)、复数型 (complex)以及逻辑型 (logical)。通过mode()函数可以查看一个对象的类型。
R语言中的基本运算包括以下:数学计算,比较运算,运算函数,向量常用统计函数,矩阵常用函数集合运算,向量化,从文件中读取数据,概率分布,循环和条件操作。
R语言的数据对象主要包括向量(vector),矩阵(matrix),因子(factors),列表(list),数据框(data frame),函数( function)。
数据框是表或二维阵列状结构,其中每一列包含一个变量的值,并且每一行包含来自每一列的一组值。
以下是数据框的特性。
1)列名称应为非空。
2)行名称应该是唯一的。
3)存储在数据框中的数据可以是数字,因子或字符类型。
4)每个列应包含相同数量的数据项。
【实验环境】
本次环境是:win7 64位系统 + R 3.3.3
【实验步骤】
一、打开R语言的界面
1.1双击桌面上的程序R x64 3.3.3,出现如下画面,则打开成功。如图1所示
二、数据框
2.1数据框介绍
数据框是R语言里中的一种数据结构,其内部可以由多种数据类型,每一列是一个变量,每行是一个观测记录。在R中数据框是很通用的数据结构,它是一种特殊的列表对象
2.2 数据框的生成。
语法是:data.frame(data1, data2, ...)。
2.3根据列表生成数据框。
根据矩阵生成数据框。
如果原来有列名,那么列名将被改作为数据框的变量名,如果没有列名,那系统会自动为矩阵的各列起一个变量名,如:V1,V2,V3...
三、数据框的引用。
3.1使用下标引用。
表示取数据框的第1到第2行,第2列到第4列。
3.2按列表名引用
3.3. 数据框的names()函数,显示列名。
修改数据框的列名。
使用colnames()函数。
修改数据框的行名。
使用rownames()来修改
数据框的合并
使用rbind()函数进行数据框的行合并。
使用cbind()函数进行数据框的列合并。
数据框attach()函数
数据框的主要用途是保存统计建模的数据,R的统计建模功能都需要以数据框为输入数据,我们可以把数据框当成一种矩阵来处理。在使用数据框的变量时可以使用“数据框名$变量名”来获取数据框的变量值。但是这种用法比较麻烦,R提供attach() 函数可以把数据框中的变量“连接”到内存中,这样便于数据框数据的调用。
使用attach()函数将数据框加载到内存中
将新的变量添加到数据框中
使用$命令将新变量添加到数据框中。
数据框的修改
数据框的修改
使用edit()函数。对于弹出的窗口可以手动修改里面的内容
使用fix()函数,对于弹出的窗口可以手动修改里面的内容
四、数据框的合并
merge函数对数据框的操作,从两个数据框中选择出条件相等的行组合成一个新的数据框
数据框的子集选择subset()函数
subset函数,从某一个数据框中选择出符合某条件的数据或是相关的列
5.1单条件查询
指定显示列
多条件查询