在每节,先运行以下这几行程序。
library(ggplot2)
library(ggpubr)
library(ggtext) #用于个性化图表
library(dplyr) #用于数据处理
p_base <- ggplot(data = mtcars, aes(x = wt, y = mpg)) + geom_point()
geom_boxplot 是用于绘制箱线图。箱线图是一种统计图形,用于显示数据集的分布情况,包括中位数、四分位数、极值和异常值。
下面是 geom_boxplot的基本用法: ggplot(data, aes(x = x, y = y)) + geom_boxplot()
- data: 数据框,包含要绘图的数据。
- aes(): 美学映射,指定要绘制的变量。通常,x 是分类变量,y 是数值变量。
示例:
ggplot(mtcars, aes(x = as.character(cyl), y = mpg)) +
geom_boxplot()
那为什么以下程序不是想要的结果呢?因为cyl是数值,不是分类变量。
ggplot(mtcars, aes(x = cyl, y = mpg)) +
geom_boxplot()
也可以如下:
ggplot(mtcars, aes(x = factor(cyl), y = mpg)) +
geom_boxplot()
颜色和填充
ggplot(mtcars, aes(x = factor(cyl), y = mpg)) +
geom_boxplot(color = "blue", fill = "lightblue")
调整箱体宽度
ggplot(mtcars, aes(x = factor(cyl), y = mpg)) +
geom_boxplot(width = 0.5)
显示异常值
ggplot(mtcars, aes(x = factor(cyl), y = mpg)) +
geom_boxplot(outlier.colour = "red", outlier.shape = 8)
去掉异常值
ggplot(mtcars, aes(x = factor(cyl), y = mpg)) +
geom_boxplot(outlier.shape = NA)
添加统计信息
ggplot(mtcars, aes(x = factor(cyl), y = mpg)) +
geom_boxplot(fun = mean, geom = "point", shape = 20, size = 1, color = "red")