百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

R 数据可视化——circlize 布局 r数据可视化之美:专业图表pdf下载

bigegpt 2024-10-12 05:10 7 浏览

布局

通过前面一节的介绍,我们已经对 circlize 的构图方式有了一个大致的了解,下面我们将详细介绍一下 circlize 的布局结构

1. 坐标转换

我们最后看到的圆形布局结构图,其实是经过了三次的坐标转换。第一次是将数据映射到数据坐标系统中,即我们常用的笛卡尔坐标系;第二次进行极坐标变换,变成圆形布局;最后进行画布坐标变换,将图形输出到图形设备中。

图形总是绘制在半径为 1 的单位元内部,而且是从外向内依次进行绘制

2. 绘制规则

绘制圆形布局图的顺序依次是:初始化布局 -> 创建图形轨迹 -> 添加图形 -> 创建图形轨迹 -> 添加图形 ... -> clear

  1. 初始化布局

布局的初始化使用的是 circos.initialize() 函数,至少需要传递一个分类变量,而每个类别的 x 值范围可以设置为一个向量或范围值

circos.initialize(sectors, xlim)
  1. 创建并添加图形

新创建的图形会放置在前面一个图形的内侧,只有创建了图形轨迹之后,才能往里面添加图形。添加图形的方式有三种

  • 使用简单图形函数如 circos.points()circos.lines() 等,逐单元格添加,需要使用 for 循环并指定 sector.indextrack.index 来定位单元格,例如
circos.track(ylim)
for(sector.index in all.sector.index) {
    circos.points(x1, y1, sector.index)
    circos.lines(x2, y2, sector.index)
}
  • 批次添加模式,使用 circos.trackPoints()circos.trackLines() 等函数,同时要指定分类变量以及 xy 的值,会自动为相应的单元格绘制图形,例如
circos.track(ylim)
circos.trackPoints(sectors, x, y)
circos.trackLines(sectors, x, y)
  • 使用 panel.fun 参数添加自定义图形,推荐使用这种方式。这种方式会逐次添加单元格,每添加一个单元格会立即执行 panel.fun 函数,所以该函数总是指向当前创建的单元格,这样我们使用简单图形函数时就不需要指定单元格位置了
circos.track(sectors, all_x, all_y, ylim,
    panel.fun = function(x, y) {
        circos.points(x, y)
        circos.lines(x, y)
})

3. 扇形和轨迹

圆形布局的组成结构可以看下图

引自 circlize 文档

图中,蓝色部分的扇形是一个 sector 且索引为 a,红色圆圈是一个轨迹 track,轨迹的索引为 2

通过这两个索引值,就可以定位圆形布局中每一个单元格,如 a:1 可以用 sector.index = "a"track.index = 1 来获取

sector 是在调用 circos.initialize() 函数时创建的,必须使用分类变量。每个扇形的大小是根据数据的范围来自动设置的

可以设置参数 xxlim 的值来控制每个扇形的数据范围,x 接受一个长度与类别相同的数字向量,xlim 接受一个两列的矩阵为每个扇形设置不同的数据范围,或一个长度为 2 的向量,为所有的扇形设置相同的数据范围

circos.initialize(sectors, x = x)
circos.initialize(sectors, xlim = xlim)

如果没有设置 sectors 参数,将会把 xlim 的行名作为 sectors

circos.initialize(xlim = xlim)

如果想要设置 sectors 的排列顺序,需要使用 factor 并设置对应的 levels

circos.initialize(
  factor(sectors, levels = sectors), 
  xlim = c(0, 1)
)

同一扇形区域内的单元格拥有相同的 x 轴范围,而同一条轨迹中的图形共享相同的 y 范围。

circos.track() 可以接受 yylim 参数,ylim 为长度为 2 的向量。当然也可以指定 x 的值,但是该值只会传递到 panel.fun 的函数中。

circos.track(sectors, y = y)
circos.track(sectors, ylim = c(0, 1))
circos.track(sectors, x = x, y = y)

由于在初始化布局时就已经确定了每个扇形区域,所以,如果不指定 sectors 参数,默认会应用到所有的扇形中。而 sectors 参数可以是所有扇形的子集,意味着只对指定的这些扇形做相应的调整

circos.track(sub_sectors, y = y)

circos.track(ylim = c(0, 1))
circos.track(ylim = ranges(y))

每个单元格之间是相互独立的,拥有自己的坐标范围

4. 图形参数

圆形布局的一些基础参数,可以使用 circos.par() 来设置。

其中,对扇形进行定位的参数只能在初始化之前(circos.initialize)进行设置:

start.degree
gap.degree/gap.after
canvas.xlim
canvas.ylim
circle.margin
clock.wise
xaxis.clock.wise

可以使用函数参数的方式设置,如

circos.par("start.degree" = 30)

或者使用 $ 的形式

circos.par$start.degree = 30

重置参数的默认值

circos.par(RESET = TRUE)
# circos.clear()

5. panel.fun

panel.fun 参数是 circos.track() 函数中非常有用的参数,可以在创建完单元格之后立即绘制图形。

该参数接受的自定义函数需要两个参数 xy 来定义单元格的数据点,会自动从 circos.track() 函数中的 xy 中提取相应扇形区域的数据。

例如

sectors = c("a", "a", "a", "b", "b")
x = 1:5
y = 5:1
circos.track(sectors, x = x, y = y,
    panel.fun = function(x, y) {
        circos.points(x, y)
})

如果 circos.track() 函数中的 xy 为空,则相应的 panel.fun 函数中的 xy 也会为空,但是可以获取当前单元格索引的方式来获取全局数据变量的子集

sectors = c("a", "a", "a", "b", "b")
x2 = 1:5
y2 = 5:1
circos.track(ylim = range(y),
    panel.fun = function(x, y) {
        l = sectors == CELL_META$sector.index
        circos.points(x2[l], y2[l])
})

通过获取当前单元格的索引,可以获取对应扇形区域的数据子集,从而到达不使用 xy 参数的目的。

当前单元格的信息,可以使用 get.cell.meta.data() 函数来获取

可以使用 get.cell.meta.data() 获取的信息有:

  • sector.index: 扇形的名称
  • sector.numeric.index: 扇形的数值索引
  • track.index: 轨迹的数值索引
  • xlim: x 轴的最大、最小值
  • ylim: y 轴的最大、最小值
  • xcenter: xlim 的均值
  • ycenter: ylim 的均值
  • xrange: x 数据范围 (xlim[2] - xlim[1])
  • yrange: y 数据范围 (ylim[2] - ylim[1])
  • cell.xlim: 单元格 x 轴范围(包括空白填充)
  • cell.ylim: 单元格 y 轴范围
  • xplot: 绘图区域的右边框与左边框的角度差,不受圆形布局的方向影响,xplot[1] 总是大于 xplot[2]
  • yplot: 绘图区域的下方与上方的半径长度差别
  • cell.width: 单元格宽度,计算公式为 xplot[1] - xplot[2]) %% 360
  • cell.height: 单元格高度,计算公式为 yplot[2] - yplot[1]
  • cell.start.degree: 等同于 xplot[1]
  • cell.end.degree: 等同于 xplot[2]
  • cell.bottom.radius: 等同于 yplot[1]
  • cell.top.radius: 等同于 yplot[2]
  • track.margin: 单元格边距
  • cell.padding: 单元格空白填充

例如,我们可以在每个单元格中间添加标签

circos.track(ylim = ylim, panel.fun = function(x, y) {
    sector.index = get.cell.meta.data("sector.index")
    xcenter = get.cell.meta.data("xcenter")
    ycenter = get.cell.meta.data("ycenter")
    circos.text(xcenter, ycenter, sector.index)
})

如果想要在 panel.fun 的函数外部使用 get.cell.meta.data(),需要传递对应的单元格索引 sector.index 和 track.index

CELL_META 变量和 get.cell.meta.data() 一样,但是更加简洁,例如,上面的代码可以改写为

circos.track(ylim = ylim, panel.fun = function(x, y) {
    circos.text(CELL_META$xcenter, CELL_META$ycenter, 
        CELL_META$sector.index)
})

需要注意的是,CELL_META 只表示当前单元格的信息,所以无法在函数之外使用

如果想在 panel.fun 函数外部为某一单元格添加一些图形,可以使用 set.current.cell() 来设置当前单元格的位置,而免去重复的设置 sector.index = ..., track.index = ...

set.current.cell(sector.index, track.index)

circos.text(get.cell.meta.data("xcenter"),
            get.cell.meta.data("ycenter"),
            get.cell.meta.data("sector.index"))

更简便的方法是

circos.text(CELL_META$xcenter, CELL_META$ycenter, CELL_META$sector.index)

6. 实用函数

6.1 坐标转换

circlize 数据转换的核心函数是 circlize(),用于将单元格的数据坐标转换为极坐标,其逆转换函数 reverse.circlize() 用于将极坐标转换为数据坐标

例如,对于如下圆形布局

sectors = c("a", "b")
circos.initialize(sectors, xlim = c(0, 1))
circos.track(ylim = c(0, 1))

a1 上的点 c(0.5, 0.5) 转换为极坐标

> circlize(0.5, 0.5, sector.index = "a", track.index = 1)
     theta  rou
[1,] 270.5 0.94

将极坐标 c(90, 0.9) 转换为数据坐标

> reverse.circlize(90, 0.9, sector.index = "a", track.index = 1)
            x     y
[1,] 1.519774 -0.06

b1c(90, 0.9) 转换为数据坐标

> reverse.circlize(90, 0.9, sector.index = "b", track.index = 1)
             x     y
[1,] 0.5028249 -0.06

可以看到不同单元格的同一个坐标点,其数据坐标是不一样的

我们可以使用 circlize:::polar2Cartesian() (该函数接口未暴露,需要这种引用方式)将极坐标转换为画布上的坐标,这样就可以为添加一些特殊的图形。

6.2 绝对单位

在使用包的时候,我们经常需要对宽度或高度进行一些修改,circlize 包提供了一些绝对单位的转换函数,例如

mm_h(), cm_h(), inches_h()/inch_h() 用于将绝对单位:毫米、厘米、英寸转换为画布坐标,如果要转换字符串宽度和高度,可以使用 strheight()strwidth() 函数

mm_h(2) # 2mm
cm_h(1) # 1cm

还有一些函数用于将绝对单位转换为数据坐标:mm_x/y()cm_x/y()inches_x/y()/inch_x/y()

mm_x(2)
mm_x(1, sector.index, track.index)
mm_y(2)
mm_y(1, sector.index, track.index)

例如

sectors = letters[1:10]
circos.par(cell.padding = c(0, 0, 0, 0), track.margin = c(0, 0))
circos.initialize(sectors, xlim = cbind(rep(0, 10), runif(10, 0.5, 1.5)))
# 轨迹高度为 5mm
circos.track(
  ylim = c(0, 1), track.height = mm_h(5),
  panel.fun = function(x, y) {
    circos.lines(c(0, 0 + mm_x(5)), c(0.5, 0.5), col = "blue")
  }
)
# 轨迹高度为 1cm
circos.track(
  ylim = c(0, 1), track.height = cm_h(1),
  track.margin = c(0, mm_h(2)),
  panel.fun = function(x, y) {
    xcenter = get.cell.meta.data("xcenter")
    # 绘制长度为 1cm 的线
    circos.lines(c(xcenter, xcenter), c(0, cm_y(1)), col = "red")
  }
)
# 轨迹高度为 1 英寸
circos.track(
  ylim = c(0, 1), track.height = inch_h(1),
  track.margin = c(0, mm_h(5)),
  panel.fun = function(x, y) {
    line_length_on_x = cm_x(1 * sqrt(2) / 2)
    line_length_on_y = cm_y(1 * sqrt(2) / 2)
    circos.lines(c(0, line_length_on_x), c(0, line_length_on_y), col = "orange")
  }
)

7. 设置间距

set_track_gap() 函数可以设置轨迹之间的间距

circos.initialize(letters[1:10], xlim = c(0, 1))
circos.track(ylim = c(0, 1), bg.border = "red")
# 设置第二个轨迹与第一个轨迹之间的间距为 2mm
set_track_gap(mm_h(2)) 
circos.track(ylim = c(0, 1), bg.border = "blue")
# 设置第三个轨迹与第二个轨迹之间的间距为 0.5cm
set_track_gap(cm_h(0.5)) 
circos.track(ylim = c(0, 1), bg.border = "orange")



相关推荐

方差分析简介(方差分析通俗理解)

介绍方差分析(ANOVA,AnalysisofVariance)是一种广泛使用的统计方法,用于比较两个或多个组之间的均值。单因素方差分析是方差分析的一种变体,旨在检测三个或更多分类组的均值是否存在...

正如404页面所预示,猴子正成为断网元凶--吧嗒吧嗒真好吃

吧嗒吧嗒,绘图:MakiNaro你可以通过加热、冰冻、水淹、模塑、甚至压溃压力来使网络光缆硬化。但用猴子显然是不行的。光缆那新挤压成型的塑料外皮太尼玛诱人了,无法阻挡一场试吃盛宴的举行。印度政府正...

Python数据可视化:箱线图多种库画法

概念箱线图通过数据的四分位数来展示数据的分布情况。例如:数据的中心位置,数据间的离散程度,是否有异常值等。把数据从小到大进行排列并等分成四份,第一分位数(Q1),第二分位数(Q2)和第三分位数(Q3)...

多组独立(完全随机设计)样本秩和检验的SPSS操作教程及结果解读

作者/风仕在上一期,我们已经讲完了两组独立样本秩和检验的SPSS操作教程及结果解读,这期开始讲多组独立样本秩和检验,我们主要从多组独立样本秩和检验介绍、两组独立样本秩和检验使用条件及案例的SPSS操作...

方差分析 in R语言 and Excel(方差分析r语言例题)

今天来写一篇实际中比较实用的分析方法,方差分析。通过方差分析,我们可以确定组别之间的差异是否超出了由于随机因素引起的差异范围。方差分析分为单因素方差分析和多因素方差分析,这一篇先介绍一下单因素方差分析...

可视化:前端数据可视化插件大盘点 图表/图谱/地图/关系图

前端数据可视化插件大盘点图表/图谱/地图/关系图全有在大数据时代,很多时候我们需要在网页中显示数据统计报表,从而能很直观地了解数据的走向,开发人员很多时候需要使用图表来表现一些数据。随着Web技术的...

matplotlib 必知的 15 个图(matplotlib各种图)

施工专题,我已完成20篇,施工系列几乎覆盖Python完整技术栈,目标只总结实践中最实用的东西,直击问题本质,快速帮助读者们入门和进阶:1我的施工计划2数字专题3字符串专题4列表专题5流程控制专题6编...

R ggplot2常用图表绘制指南(ggplot2绘制折线图)

ggplot2是R语言中强大的数据可视化包,基于“图形语法”(GrammarofGraphics),通过分层方式构建图表。以下是常用图表命令的详细指南,涵盖基本语法、常见图表类型及示例,适合...

Python数据可视化:从Pandas基础到Seaborn高级应用

数据可视化是数据分析中不可或缺的一环,它能帮助我们直观理解数据模式和趋势。本文将全面介绍Python中最常用的三种可视化方法。Pandas内置绘图功能Pandas基于Matplotlib提供了简洁的绘...

Python 数据可视化常用命令备忘录

本文提供了一个全面的Python数据可视化备忘单,适用于探索性数据分析(EDA)。该备忘单涵盖了单变量分析、双变量分析、多变量分析、时间序列分析、文本数据分析、可视化定制以及保存与显示等内容。所...

统计图的种类(统计图的种类及特点图片)

统计图是利用几何图形或具体事物的形象和地图等形式来表现社会经济现象数量特征和数量关系的图形。以下是几种常见的统计图类型及其适用场景:1.条形图(BarChart)条形图是用矩形条的高度或长度来表示...

实测,大模型谁更懂数据可视化?(数据可视化和可视化分析的主要模型)

大家好,我是Ai学习的老章看论文时,经常看到漂亮的图表,很多不知道是用什么工具绘制的,或者很想复刻类似图表。实测,大模型LaTeX公式识别,出乎预料前文,我用Kimi、Qwen-3-235B...

通过AI提示词让Deepseek快速生成各种类型的图表制作

在数据分析和可视化领域,图表是传达信息的重要工具。然而,传统图表制作往往需要专业的软件和一定的技术知识。本文将介绍如何通过AI提示词,利用Deepseek快速生成各种类型的图表,包括柱状图、折线图、饼...

数据可视化:解析箱线图(box plot)

箱线图/盒须图(boxplot)是数据分布的图形表示,由五个摘要组成:最小值、第一四分位数(25th百分位数)、中位数、第三四分位数(75th百分位数)和最大值。箱子代表四分位距(IQR)。IQR是...

[seaborn] seaborn学习笔记1-箱形图Boxplot

1箱形图Boxplot(代码下载)Boxplot可能是最常见的图形类型之一。它能够很好表示数据中的分布规律。箱型图方框的末尾显示了上下四分位数。极线显示最高和最低值,不包括异常值。seaborn中...