百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

ggplot2笔记4 语法基础

bigegpt 2024-08-15 19:53 2 浏览


本公众号R语言和ggplot2笔记系列作品为袁志林老师学员创作,请关注今天二条袁老师组博后招聘启事。


ggplot2绘图基础:

  • 1初识ggplot2、基本用法以及如何绘制几何对象
  • 2图层的使用——基础、怎样加标签、注释
  • 3工具箱——误差线、加权数、展示数据分布


碎碎念ing:终于结束了《ggplot2》的第一部分“Getting Started”,今天开始看第二部分——语法,第四章(Mastering the Grammar)介绍了ggplot2的一些基础语法知识,大概是对前期内容在理论上做一个总结。

建立一个散点图

首先还以“耗油量”数据集(mpg)为例。

library(ggplot2)
mpg
# A tibble: 234 x 11
   manufacturer model      displ  year   cyl trans      drv     cty   hwy fl    class
   <chr>        <chr>      <dbl> <int> <int> <chr>      <chr> <int> <int> <chr> <chr>
 1 audi         a4          1.80  1999     4 auto(l5)   f        18    29 p     comp…
 2 audi         a4          1.80  1999     4 manual(m5) f        21    29 p     comp…
 3 audi         a4          2.00  2008     4 manual(m6) f        20    31 p     comp…
 4 audi         a4          2.00  2008     4 auto(av)   f        21    30 p     comp…
 5 audi         a4          2.80  1999     6 auto(l5)   f        16    26 p     comp…
 6 audi         a4          2.80  1999     6 manual(m5) f        18    26 p     comp…
 7 audi         a4          3.10  2008     6 auto(av)   f        18    27 p     comp…
 8 audi         a4 quattro  1.80  1999     4 manual(m5) 4        18    26 p     comp…
 9 audi         a4 quattro  1.80  1999     4 auto(l5)   4        16    25 p     comp…
10 audi         a4 quattro  2.00  2008     4 manual(m6) 4        20    28 p     comp…
# ... with 224 more rows

我们想建立一个展示发动机排量(displ)和高速公路行驶记录每加仑行驶的英里数(hwy)关系的散点图,并用不同颜色标记汽缸变量(cyl)。代码如下:

ggplot(mpg, aes(displ, hwy, colour = factor(cyl))) +
  geom_point()

You can create plots like this easily, but what is going on underneath the surface? How does ggplot2 draw this plot?

1. 数据的美学映射(Mapping Aesthetics to Data)

散点图到底是啥?你以前见过很多,有可能也用手绘制过。散点图将每个观测值表示为一个点,根据两个变量的值进行定位。除了水平和垂直位置,每个点还具有大小,颜色和形状。这些属性被称为美学(aesthetics),是能在图形上感知的属性。每个美学可以映射到一个变量,或设置为一个常量值。在上图中, displ 映射到横轴上, hwy映射到纵轴上, cyl设置为彩色分类。大小和形状没有映射到变量,但保持其(恒定)默认值。

映射设定好之后,我们可以通过改变函数,画出除了散点图之外的折线图 geom_line()、柱形图 geom_bar()等:

## 折线图
ggplot(mpg, aes(displ, hwy, colour = factor(cyl))) +
geom_line() +
theme(legend.position = "none")

## 柱形图
ggplot(mpg, aes(displ, hwy, colour = factor(cyl))) +
geom_bar(stat = "identity", position = "identity", fill = NA) +
theme(legend.position = "none")

这些图虽然语法上是对的,但毫无意义。

点、线和条形都是不同的几何图形,他们组合起来可以有很多种plot:

Named plot

Geom

Others

Scatterplot

Point

---

Bubblechart

Point

Size mapped to a variable

Barchart

Bar

---

Box-and-whisker plot

Boxplot

---

Line chart

Line

---

有些图是根据实际需要添加的几何图形,他们没有确定的名称,如下:

ggplot(mpg, aes(displ, hwy, colour = factor(cyl))) +
  geom_point() +
  geom_smooth(method = "lm")

2. 标度(Scaling)

实际上,数据集中的数值对计算机没有任何意义。我们需要将它们从数据单位(例如,升,英里每加仑,气缸数量等)转换成计算机可以显示的图形单位(例如,坐标和颜色)。这种转换过程称为Scaling(scales)。

要生成一个完整的图表,需要三个主要元素:

  • data:数据
  • geom:代表数据的几何图形
  • scales and coordinate system:坐标系和标度

复杂化(Adding Complexity)

在普通的散点图中加线条和分面:

ggplot(mpg, aes(displ, hwy)) +
  geom_point() +
  geom_smooth() +
  facet_wrap(~year)

以上代码中增加了三个部分

  1. 分面(facets)
  2. 多个图层(multiple layers)
  3. 统计变换(statistics)

平滑图层 geom_smooth()与点图层 geom_point()不同,因为它不显示原始数据,而是显示数据的统计转换。所以,这个过程的形成是在将数据映射到美学之后,传递到统计转换(stat)加以处理。

图层语法的组成(Components of the Layered Grammar)

图表包括了数据、映射、统计变换、几何图形以及位置调整(position adjustment)。

图层 layers

图层由以下五个方面组成(具体见第五章):

  1. Data
  2. Aesthetic mappings.
  3. A statistical transformation (stat).
  4. A geometric object (geom).
  5. A position adjustment.

标度 Scales

标度控制的是从数据到图形属性的映射。下面是几种标度的例子:

(从左到右依次是连续型变量、离散型变量的形状和颜色标度)

(具体见第六章)

坐标系 Coordinate System

坐标系(简称coord)是指数据映射所在的图表平面,位置通常由两个坐标(x, y)决定。

坐标系的不同类型如下图:

(从左到右依次是笛卡尔坐标系、半对数坐标系、极坐标系)

分面 Facetting

(详见第七章)

= = = = = = = = 我是懵懵的分割线 = = = = = = = =

碎碎念2:这一章看下来感觉干货不多,貌似更像是本书中间的一个过渡章节(也可能是我没有get到,不是很懂作者的用意)。囧。最后还是要放上参考资料,镇楼。


参考资料:

Hadley Wickham(2016). ggplot2. Springer International Publishing. doi: 10.1007/978-3-319-24277-4

《R语言应用系列丛书·ggplot2:数据分析与图形艺术》

相关推荐

了解Linux目录,那你就了解了一半的Linux系统

大到公司或者社群再小到个人要利用Linux来开发产品的人实在是多如牛毛,每个人都用自己的标准来配置文件或者设置目录,那么未来的Linux则就是一团乱麻,也对管理造成许多麻烦。后来,就有所谓的FHS(F...

Linux命令,这些操作要注意!(linux命令?)

刚玩Linux的人总觉得自己在演黑客电影,直到手滑输错命令把公司服务器删库,这才发现命令行根本不是随便乱用的,而是“生死簿”。今天直接上干货,告诉你哪些命令用好了封神!喜欢的一键三连,谢谢观众老爷!!...

Linux 命令速查手册:这 30 个高频指令,拯救 90% 的运维小白!

在Linux系统的世界里,命令行是强大的武器。对于运维小白而言,掌握一些高频使用的Linux命令,能极大提升工作效率,轻松应对各种系统管理任务。今天,就为大家奉上精心整理的30个Linu...

linux必学的60个命令(linux必学的20个命令)

以下是Linux必学的20个基础命令:1.cd:切换目录2.ls:列出文件和目录3.mkdir:创建目录4.rm:删除文件或目录5.cp:复制文件或目录6.mv:移动/重命名文件或目录7....

提高工作效率的--Linux常用命令,能够决解95%以上的问题

点击上方关注,第一时间接受干货转发,点赞,收藏,不如一次关注评论区第一条注意查看回复:Linux命令获取linux常用命令大全pdf+Linux命令行大全pdf为什么要学习Linux命令?1、因为Li...

15 个实用 Linux 命令(linux命令用法及举例)

Linux命令行是系统管理员、开发者和技术爱好者的强大工具。掌握实用命令不仅能提高效率,还能解锁Linux系统的无限潜力,本文将深入介绍15个实用Linux命令。ls-列出目录内容l...

Linux 常用命令集合(linux常用命令全集)

系统信息arch显示机器的处理器架构(1)uname-m显示机器的处理器架构(2)uname-r显示正在使用的内核版本dmidecode-q显示硬件系统部件-(SMBIOS/DM...

Linux的常用命令就是记不住,怎么办?

1.帮助命令1.1help命令#语法格式:命令--help#作用:查看某个命令的帮助信息#示例:#ls--help查看ls命令的帮助信息#netst...

Linux常用文件操作命令(linux常用文件操作命令有哪些)

ls命令在Linux维护工作中,经常使用ls这个命令,这是最基本的命令,来写几条常用的ls命令。先来查看一下使用的ls版本#ls--versionls(GNUcoreutils)8.4...

Linux 常用命令(linux常用命令)

日志排查类操作命令查看日志cat/var/log/messages、tail-fxxx.log搜索关键词grep"error"xxx.log多条件过滤`grep-E&#...

简单粗暴收藏版:Linux常用命令大汇总

号主:老杨丨11年资深网络工程师,更多网工提升干货,请关注公众号:网络工程师俱乐部下午好,我的网工朋友在Linux系统中,命令行界面(CLI)是管理员和开发人员最常用的工具之一。通过命令行,用户可...

「Linux」linux常用基本命令(linux常用基本命令和用法)

Linux中许多常用命令是必须掌握的,这里将我学linux入门时学的一些常用的基本命令分享给大家一下,希望可以帮助你们。总结送免费学习资料(包含视频、技术学习路线图谱、文档等)1、显示日期的指令:d...

Linux的常用命令就是记不住,怎么办?于是推出了这套教程

1.帮助命令1.1help命令#语法格式:命令--help#作用:查看某个命令的帮助信息#示例:#ls--help查看ls命令的帮助信息#netst...

Linux的30个常用命令汇总,运维大神必掌握技能!

以下是Linux系统中最常用的30个命令,精简版覆盖日常操作核心需求,适合快速掌握:一、文件/目录操作1.`ls`-列出目录内容`ls-l`(详细信息)|`ls-a`(显示隐藏文件)...

Linux/Unix 系统中非常常用的命令

Linux/Unix系统中非常常用的命令,它们是进行文件操作、文本处理、权限管理等任务的基础。下面是对这些命令的简要说明:**文件操作类:*****`ls`(list):**列出目录内容,显...