背景介绍
维恩图用于展示在不同的事物群组(集合)之间的数学或逻辑联系,尤其适合用来表示集合(或)类之间的“大致关系”,它也常常被用来帮助推导(或理解推导过程)关于集合运算(或类运算)的一些规律。通常每个集合以一个圆圈表示。每个集合都是一组具有共同之处的物件或数据。当多个圆圈(集)相互重叠时,称为交集 (intersection),里面的数据同时具有重迭集中的所有属性。
——百度百科、数据可视化工具目录
今天我们来使用R语言绘制一下维恩图,看看到底有多简单!
软件介绍
[软件1]:R (Version 4.1.2)
[软件2]:RStudio(Version 1.4.1106)
图文教程
1.首先一上来就是进行安装及其加载包
install.packages("VennDiagram") library(VennDiagram)
2.看一下该绘图函数的介绍
3.首先,我们生成一组数据,进行维恩图的绘制
set1 <- paste(rep("word_" , 200) , sample(c(1:1000) , 200 , replace=F) , sep="") set2 <- paste(rep("word_" , 200) , sample(c(1:1000) , 200 , replace=F) , sep="") set3 <- paste(rep("word_" , 200) , sample(c(1:1000) , 200 , replace=F) , sep="") set4 <- paste(rep("word_" , 200) , sample(c(1:1000) , 200 , replace=F) , sep="") set5 <- paste(rep("word_" , 200) , sample(c(1:1000) , 200 , replace=F) , sep="")
4.为了方便大家读取自己的数据,我们可以将数据写进Excel,然后再读取进来,那么首先我们将数据做成数据框
Venn_data <- data.frame(set1, set2, set3, set4, set5)
5.然后加载可以读取/写成Excel的包,将数据写成Excel文件
library(openxlsx) write.xlsx(Venn_data,"Venn_data.xlsx")
6.使用自己的数据的同学,可以直接从这一步开始:读取数据
sheet数值用来指定数据在哪个sheet中
Venn_data <- read.xlsx("Venn_data.xlsx", sheet = 1)
7.使用attach将该数据读取到R中,方便直接使用列名称
attach(Venn_data)
8.使用函数绘图
x数值为每个集合的列表
category.names为每个集合的名称
filename为图片名称
venn.diagram( x = list(set1, set2, set3,set4, set5), category.names = c("set1", "set2", "set3","set4","set5"), filename = 'Venn_diagramm.png', output=TRUE)
9.然后我们对维恩图的参数进一步调整
venn.diagram( x = list(set1, set2, set3,set4, set5), category.names = c("set1", "set2", "set3","set4","set5"), filename = 'Venn_diagramm.png', output=TRUE, # 输出图片要求,包括图片类型,高和宽,分辨率,压缩等方式 imagetype="png" , height = 1000 , width = 1000 , resolution = 300, compression = "lzw", # 圆环的调节,边的宽度,是否需要虚线,以及填充的颜色 lwd = 2, lty = 'blank', fill = c("#EE3B3B", "#6495ED", "#8B7355", "#EEC900", "#008B8B"))
10.有些字体没显示出来,再进行调整
venn.diagram( x = list(set1, set2, set3,set4, set5), category.names = c("set1", "set2", "set3","set4","set5"), filename = 'Venn_diagramm.png', output=TRUE, # 输出图片要求,包括图片类型,高和宽,分辨率,压缩等方式 imagetype="png" , height = 1000 , width = 1000 , resolution = 300, compression = "lzw", #圆环的调节,边的宽度,是否需要虚线,以及填充的颜色 lwd = 2, lty = 'blank', fill = c("#EE3B3B", "#6495ED", "#8B7355", "#EEC900", "#008B8B"), # 对图上的数字进行调节,包括大小,是否加粗,以及字体 cex = .6, fontface = "bold", fontfamily = "sans", # 对每个集合的名字进行调节,包括字体大小,是否加粗,在外部,以及位置,字体及其颜色 cat.cex = 0.7, cat.fontface = "bold", cat.default.pos = "outer", cat.pos = c(0,-45,240,135,45), cat.dist = c(0.2,0.2,0.2,0.2,0.2), cat.fontfamily = "sans", cat.col=c("#EE3B3B", "#6495ED", "#8B7355", "#EEC900", "#008B8B"))
11.这么详细的教程,赶紧来学学吧!