在每节,先运行以下这几行程序。
library(ggplot2)
library(ggpubr)
library(ggtext) #用于个性化图表
library(dplyr) #用于数据处理
p_base <- ggplot(data = mtcars, aes(x = wt, y = mpg)) + geom_point()
geom_col() 是 ggplot2 包中用于创建柱状图的一个函数。geom_col() 特别适用于当你已经有了需要直接展示的计数或总和数据时。
ggplot(mtcars, aes(x = cyl, y = mpg)) +
geom_col()
在这个图中mpg值到底是什么呢?WalterWang帮你来算一下。
mtcars %>% group_by(cyl) %>% summarise(Freq = sum(mpg))
## # A tibble: 3 × 2
## cyl Freq
## <dbl> <dbl>
## 1 4 293.
## 2 6 138.
## 3 8 211.
geom_col() 的参数:
- fill: 控制柱状的填充颜色。
- color: 控制柱状图边界的颜色。
- position: 控制柱状图的位置排列方式,可以是”stack”(堆叠,默认)、“dodge”(并排)或 “identity”(重叠)。
geom_bar() 是 ggplot2 包中用于创建条形图的一个函数。与 geom_col() 不同,geom_bar() 主要用于计算条形高度的场合,它默认统计指定变量的计数(即频率),适合用于未预先汇总数据的情形。
ggplot(mtcars, aes(x = cyl)) +
geom_bar()
图中y值参考以下语句。
mtcars %>% group_by(cyl) %>% count(cyl)
## # A tibble: 3 × 2
## # Groups: cyl [3]
## cyl n
## <dbl> <int>
## 1 4 11
## 2 6 7
## 3 8 14
geom_bar()的参数:
- stat: 控制图形的统计变换,默认为”count”,即对每个组的数据量进行计数。你也可以设置为 “identity” 来使用数据框中的 y 值。
- position: 控制条形的位置排列方式,与 geom_col() 相同,可以是”stack”、“dodge”(并排)或 “identity”(重叠)。
- fill: 控制条形的填充颜色。
- color: 控制条形图边界的颜色。
更多示例:
p1 <- ggplot(mtcars, aes(x = cyl, y = mpg)) +
geom_col(color='red')
p2 <- ggplot(mtcars, aes(x = cyl, y = mpg)) +
geom_col(fill='red')
ggarrange(p1, p2, ncol = 2, nrow = 1, widths = c(1, 1), heights = 0.5)