百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

实测,大模型谁更懂数据可视化?(数据可视化和可视化分析的主要模型)

bigegpt 2025-07-17 17:24 6 浏览

大家好,我是 Ai 学习的老章

看论文时,经常看到漂亮的图表,很多不知道是用什么工具绘制的,或者很想复刻类似图表。

实测,大模型 LaTeX 公式识别,出乎预料

前文,我用 Kimi、Qwen-3-235B-A22B、Claude-3.7-sonnet、GPT-4.1、Gemini 2.5 Pro 测试了其在 LaTeX 公式识别中的表现。

本文就测试一下他们在图表识别、复刻中的表现,看看谁更擅长干这件事

备注:Kimi 开启了长思考,Qwen3 未开启深度思考,因为开启之后巨慢且失败

省流:Gemini 2.5 Pro 是最强大的代码模型,毫无争议

排名:Gemini 2.5 Pro > Claude 3.7 Sonnet > Kimi = Qwen3 > GPT-4.1

第一题

来源:https://www.biorxiv.org/content/10.1101/2024.04.02.587723v1.full.pdf

Kimi

有点弱智,绘制了傻瓜箱线图,图像理解有问题

Qwen-3-235B-A22B

也很傻瓜,与 kimi 半斤八两

Claude-3.7-sonnet

好一点点,绘制了半小提琴图 (half-violin plot) 结合箱线图 (box plot)

后续我又试了一下

如果明确告诉它用 R 绘制,Claude-3.7 结果如下,还不错!

GPT-4.1

失败,生成的代码满满得 bug,无法生成图表

Gemini 2.5 Pro

震惊了

它识别出这是雨云图 (raincloudplot),结合了以下 3 图表的元素:

散点图 (Scatter/Strip plot):显示每 1.个单独的数据点 (图中的绿色和蓝色小点)

箱形图 (Box plot):显示数据的分布摘要 (中位数、四分位数、均值和标准差范围)

小提琴图 (Violin plot) 或 核密度估计图 (KDE plot):显示数据分布的平滑曲线 (图中数据点左侧的曲线)

代码放文末了,大家欣赏一下

第二题

上难度,一次性复刻、输出 4 张图表

来源:《Benchmarking Supervised Machine Learning Models for the Classification of Primary Graft Dysfunction》

Kimi

看了下,其样例数据很简单,第四幅图没有完美复刻

Qwen-3-235B-A22B

没理解意思,且只生成了一张,出现 bug

没想到它居然还不如 kimi。。。

Claude-3.7-sonnet第四幅图没有绘制成功,报错是颜色问题

让其修复颜色问题后,输出如下,第四幅图没有依然没有完美复刻

GPT-4.1

绘制失败,换了 GPT-4o 依然失败

Gemini 2.5 Pro

第四张绘制失败

第三题

换个简单点的

省点事儿,直接让大模型用 R 复刻

R _复刻_了一张图,附代码

Obsidian 2025-05-14 09.49.07.png

Kimi

复刻失败

Qwen-3-235B-A22B

还行,有点丑

Claude-3.7-sonnet

“径向条形图”或“放射状条形图”(Radial Bar Chart)

GPT-4.1

复刻失败

Gemini 2.5 Pro

接近完美复刻

Gemini-2.5-Pro 绘制的云雨图代码


    
    
    
  import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
import numpy as np

# 1. 生成模拟数据
# 根据图片估算 R 和 rho 的数据特征
np.random.seed(0) # 为了结果可复现

# R 的数据
r_mean = 0.78
r_std = 0.02 # 根据 1 SD 范围 (0.76-0.80) 估算
r_data = np.random.normal(loc=r_mean, scale=r_std, size=100)
# 限制数据在图中大致范围内
r_data = np.clip(r_data, 0.72, 0.82)


# rho 的数据
rho_mean = 0.77
rho_std = 0.02 # 根据 1 SD 范围 (0.75-0.79) 估算
rho_data = np.random.normal(loc=rho_mean, scale=rho_std, size=100)
# 限制数据在图中大致范围内
rho_data = np.clip(rho_data, 0.70, 0.81)


# 将数据整合到 Pandas DataFrame 中,方便 seaborn 处理
df_r = pd.DataFrame({'value': r_data, 'category': 'R'})
df_rho = pd.DataFrame({'value': rho_data, 'category': 'ρ'})
df_combined = pd.concat([df_r, df_rho])

# 2. 绘制图表
fig, ax = plt.subplots(figsize=(8, 6))

# 使用 seaborn 绘制
# 为了实现雨云图的效果,我们会组合 stripplot, boxplot, 和 violinplot (只显示一半)

# 定义颜色
colors = {"R": "green", "ρ": "blue"}

# 绘制 R
# 散点 (左移一点,给箱线图和 KDE 留空间)
sns.stripplot(x='category', y='value', data=df_r, order=['R'],
              color=colors['R'], alpha=0.7, jitter=0.2, size=5, ax=ax, dodge=True, label='_nolegend_')

# 箱线图 (居中)
sns.boxplot(x='category', y='value', data=df_r, order=['R'],
            color=colors['R'], width=0.3, showfliers=False, ax=ax,
            boxprops=dict(alpha=0.5), medianprops=dict(color='black'))

# 小提琴图/KDE (右移一点,只画一半)
# Seaborn 的 violinplot 可以通过 cut=0 和 inner=None 以及调整位置来实现类似效果
# 或者更精确地使用 KDE 图并手动定位
from scipy import stats
kde_r = stats.gaussian_kde(df_r['value'])
x_vals_r = np.linspace(df_r['value'].min(), df_r['value'].max(), 100)
y_vals_r = kde_r(x_vals_r)
# 将 KDE 曲线画在散点图的左边
# 需要计算合适的横坐标位置,这里简化处理,通常雨云图库会处理这个对齐
ax.plot(0 - 0.35 - y_vals_r / (y_vals_r.max()*3) , x_vals_r, color=colors['R'], lw=2) # 调整分母控制宽度


# 绘制 ρ
# 散点
sns.stripplot(x='category', y='value', data=df_rho, order=['ρ'],
              color=colors['ρ'], alpha=0.7, jitter=0.2, size=5, ax=ax, dodge=True, label='_nolegend_')

# 箱线图
sns.boxplot(x='category', y='value', data=df_rho, order=['ρ'],
            color=colors['ρ'], width=0.3, showfliers=False, ax=ax,
            boxprops=dict(alpha=0.5), medianprops=dict(color='black'))

# 小提琴图/KDE for rho
kde_rho = stats.gaussian_kde(df_rho['value'])
x_vals_rho = np.linspace(df_rho['value'].min(), df_rho['value'].max(), 100)
y_vals_rho = kde_rho(x_vals_rho)
ax.plot(1 - 0.35 - y_vals_rho / (y_vals_rho.max()*3) , x_vals_rho, color=colors['ρ'], lw=2)


# 3. 添加图例和标签 (类似原图)
# R 的均值和标准差标注
mean_r_val = df_r['value'].mean()
std_r_val = df_r['value'].std()
ax.plot([0 + 0.15, 0.25 + 0.15], [mean_r_val + std_r_val, mean_r_val + std_r_val], color='black', lw=1)
ax.text(0.28 + 0.15, mean_r_val + std_r_val, f'{mean_r_val + std_r_val:.2f}(1 SD)', va='center')
ax.plot([0 + 0.15, 0.25 + 0.15], [mean_r_val, mean_r_val], color='black', lw=1, linestyle='--') # 均值线 (用星号表示)
ax.plot(0, mean_r_val, marker='*', markersize=10, color='black', markeredgecolor='white') # 原图是星号
ax.text(0.28 + 0.15, mean_r_val, f'{mean_r_val:.2f}(MEAN)', va='center')
ax.plot([0 + 0.15, 0.25 + 0.15], [mean_r_val - std_r_val, mean_r_val - std_r_val], color='black', lw=1)
ax.text(0.28 + 0.15, mean_r_val - std_r_val, f'{mean_r_val - std_r_val:.2f}(-1 SD)', va='center')

# ρ 的均值和标准差标注
mean_rho_val = df_rho['value'].mean()
std_rho_val = df_rho['value'].std()
ax.plot([1 + 0.15, 1.25 + 0.15], [mean_rho_val + std_rho_val, mean_rho_val + std_rho_val], color='black', lw=1)
ax.text(1.28 + 0.15, mean_rho_val + std_rho_val, f'{mean_rho_val + std_rho_val:.2f}(1 SD)', va='center')
ax.plot([1 + 0.15, 1.25 + 0.15], [mean_rho_val, mean_rho_val], color='black', lw=1, linestyle='--')
ax.plot(1, mean_rho_val, marker='*', markersize=10, color='black', markeredgecolor='white')
ax.text(1.28 + 0.15, mean_rho_val, f'{mean_rho_val:.2f}(MEAN)', va='center')
ax.plot([1 + 0.15, 1.25 + 0.15], [mean_rho_val - std_rho_val, mean_rho_val - std_rho_val], color='black', lw=1)
ax.text(1.28 + 0.15, mean_rho_val - std_rho_val, f'{mean_rho_val - std_rho_val:.2f}(-1 SD)', va='center')


# 图表标题和轴标签
ax.set_ylabel('R or ρ Range')
ax.set_xlabel('') # X 轴通常不显示标签,直接用类别名
ax.set_xticks([0, 1])
ax.set_xticklabels(['R', 'ρ'])
ax.set_ylim(0.65, 0.85) # 根据原图设定
ax.text(0.05, 0.95, '(d)', transform=ax.transAxes, fontsize=14, va='top') # 子图标签

# 添加图例 (模拟原图的图例)
from matplotlib.lines import Line2D
from matplotlib.patches import Patch
legend_elements = [
    Patch(facecolor='grey', alpha=0.3, edgecolor='black', label='25%~75%'),
    Line2D([0], [0], color='black', lw=2, label='Mean ± 1 SD', marker='|', markersize=5, linestyle='-'),
    Line2D([0], [0], color='black', lw=1, label='Median Line'),
    Line2D([0], [0], marker='*', color='w', label='Mean',
           markerfacecolor='black', markersize=10)
]
ax.legend(handles=legend_elements, loc='upper right', bbox_to_anchor=(1.0, 1.0))


plt.tight_layout()
plt.show()

Gemini-2.5-Pro 绘制南丁格尔玫瑰图代码


    
    
    
  # 安装和加载必要的包
# install.packages("ggplot2")
# install.packages("dplyr")
# install.packages("tidyr") # For pivot_longer if needed

library(ggplot2)
library(dplyr)

# 1. 准备数据
# 主模型数据
model_data <- data.frame(
  benchmark = factor(rep(c("HumanEval", "CodeArena", "EvalPlus", "BIRD-SQL", "CRUXEval-O", 
                           "Aider", "BigCodeBench", "McEval", "LiveCodeBench", "MBPP"), each = 4),
                     levels = c("HumanEval", "CodeArena", "EvalPlus", "BIRD-SQL", "CRUXEval-O", 
                                "Aider", "BigCodeBench", "McEval", "LiveCodeBench", "MBPP")),
  model = factor(rep(c("Qwen2.5-Coder-32B-Instruct", "DeepSeek-Coder-V2-Instruct", 
                       "DeepSeek-Coder-33B-Instruct", "CodeLlama-Instruct-22B"), times = 10),
                 levels = c("Qwen2.5-Coder-32B-Instruct", "DeepSeek-Coder-V2-Instruct", 
                            "DeepSeek-Coder-33B-Instruct", "CodeLlama-Instruct-22B")),
  value = c(
    # HumanEval
    92.7, 88.4, 79.3, 78.1,
    # CodeArena
    68.9, 57.4, 21.7, 16.8,
    # EvalPlus
    86.3, 83.8, 74.9, 73.5,
    # BIRD-SQL
    58.4, 51.9, 46.2, 45.6,
    # CRUXEval-O
    83.4, 75.1, 63.5, 50.6,
    # Aider
    73.7, 72.9, 59.4, 51.1,
    # BigCodeBench
    38.3, 36.3, 29.8, 29.4,
    # McEval
    65.9, 62.9, 54.3, 50.5,
    # LiveCodeBench
    31.4, 27.9, 22.6, 21.3,
    # MBPP
    90.2, 89.2, 81.2, 73.3
  )
)

# GPT-4o 背景数据 (定义每个 benchmark "轨道" 的最大值)
gpt4o_data <- data.frame(
  benchmark = factor(c("HumanEval", "CodeArena", "EvalPlus", "BIRD-SQL", "CRUXEval-O", 
                       "Aider", "BigCodeBench", "McEval", "LiveCodeBench", "MBPP"),
                     levels = levels(model_data$benchmark)),
  value = c(92.1, 69.1, 84.4, 54.2, 89.2, 71.4, 37.6, 65.8, 34.6, 86.8)
)

# 2. 定义颜色
# 顺序应与 model factor levels 对应: Blue, Green, Beige, Pink
color_palette <- c(
  "Qwen2.5-Coder-32B-Instruct" = "#2A7FFF", # 鲜艳的蓝色
  "DeepSeek-Coder-V2-Instruct" = "#7CFC00", # 亮绿色/酸橙绿
  "DeepSeek-Coder-33B-Instruct" = "#E0C097", # 米色/浅棕
  "CodeLlama-Instruct-22B" = "#FF1493", # 深粉色/品红
  "GPT-4o-Track" = "#4A4A3B" # 暗橄榄色 (用于背景轨道)
)


# 3. 创建图表
# 计算 benchmark 标签的位置
num_benchmarks <- length(levels(model_data$benchmark))
benchmark_labels_data <- data.frame(
  benchmark = levels(model_data$benchmark),
  angle = 90 - seq(0, 360 - 360/num_benchmarks, length.out = num_benchmarks) - (360/num_benchmarks)/2,
  hjust_val = ifelse( (90 - seq(0, 360 - 360/num_benchmarks, length.out = num_benchmarks) - (360/num_benchmarks)/2) < -90 | (90 - seq(0, 360 - 360/num_benchmarks, length.out = num_benchmarks) - (360/num_benchmarks)/2) > 90, 1, 0),
  angle_text = ifelse( (90 - seq(0, 360 - 360/num_benchmarks, length.out = num_benchmarks) - (360/num_benchmarks)/2) < -90 | (90 - seq(0, 360 - 360/num_benchmarks, length.out = num_benchmarks) - (360/num_benchmarks)/2) > 90, (90 - seq(0, 360 - 360/num_benchmarks, length.out = num_benchmarks) - (360/num_benchmarks)/2) + 180, (90 - seq(0, 360 - 360/num_benchmarks, length.out = num_benchmarks) - (360/num_benchmarks)/2) )
)
# 合并以获取 benchmark 的 x 值
benchmark_labels_data <- benchmark_labels_data %>%
  mutate(x_pos = as.numeric(factor(benchmark, levels = levels(model_data$benchmark))))


# 调整y轴上限以容纳标签
y_axis_max <- 115 #max(c(model_data$value, gpt4o_data$value)) * 1.15


p <- ggplot() +
  # A. 绘制 GPT-4o 背景 "轨道"
  # 使用 geom_col 为每个 benchmark 创建一个单独的背景条,宽度覆盖整个类别
  geom_col(data = gpt4o_data,
           aes(x = benchmark, y = value), # 使用 y = y_axis_max 来创建完整的扇区背景
           fill = color_palette["GPT-4o-Track"], # 使用预定义的颜色
           alpha = 0.8, # 透明度
           width = 0.95) + # 宽度,确保覆盖
  
  # B. 绘制模型数据条形
  geom_col(data = model_data, 
           aes(x = benchmark, y = value, fill = model),
           position = position_dodge2(width = 0.9, preserve = "single"), # 分组条形
           width = 0.85, # 条形宽度
           alpha = 0.9) + # 条形透明度
  
  # C. 在 GPT-4o 轨道上添加数值标签
  geom_text(data = gpt4o_data,
            aes(x = benchmark, y = value + 4, label = sprintf("%.1f", value)), # 标签位置略高于轨道末端
            color = "white", size = 2.5, fontface = "bold", vjust = 0.5) +
  
  # D. 在模型数据条形上添加数值标签
  geom_text(data = model_data,
            aes(x = benchmark, y = value + 2, label = sprintf("%.1f", value), group = model),
            position = position_dodge2(width = 0.9, preserve = "single"),
            color = "white", size = 2, vjust = 0.5, hjust=0.5, fontface="bold") +
  
  # E. 应用极坐标转换
  coord_polar(theta = "x", start = 0, direction = 1) +
  
  # F. 设置 Y 轴范围和刻度 (半径)
  # 移除默认的Y轴网格线和标签,因为它们在极坐标图中通常不直观
  scale_y_continuous(limits = c(-20, y_axis_max), breaks = c(0, 25, 50, 75, 100), labels = c("0", "25", "50", "75", "100")) +
  
  # G. 自定义颜色
  scale_fill_manual(values = color_palette, name = "Model") +
  
  # H. 添加 Benchmark 标签 (X轴标签)
  # 使用 annotate 或 geom_text 来手动放置 benchmark 标签
  # 这里我们使用 scale_x_discrete 并尝试通过主题调整,但自定义 geom_text 通常效果更好
  geom_text(data = benchmark_labels_data,
            aes(x = x_pos, y = y_axis_max * 0.95, label = benchmark, angle = angle_text, hjust = hjust_val), # y值设在外部
            color = "white", size = 3.5, fontface = "bold") +
  
  # I. 设置主题和样式
  theme_minimal() +
  theme(
    plot.background = element_rect(fill = "black", color = "black"),
    panel.background = element_rect(fill = "black", color = "black"),
    panel.grid = element_blank(), # 移除主要网格线
    axis.title = element_blank(),
    axis.text.y = element_text(color = "white", size = 8), # Y轴刻度标签(半径)
    axis.text.x = element_blank(), # 移除默认的X轴标签,因为我们用geom_text自定义了
    legend.position = "bottom",
    legend.background = element_rect(fill = "black"),
    legend.title = element_text(color = "white", face = "bold"),
    legend.text = element_text(color = "white"),
    plot.title = element_text(color = "white", size = 20, hjust = 0.5, face = "bold", margin = margin(b = 20))
  ) +
  
  # J. 添加标题
  ggtitle("Qwen2.5-Coder-32B")

# 显示图表
print(p)

制作不易,如果这篇文章觉得对你有用,可否点个关注。给我个三连击:点赞、转发和在看。若可以再给我加个,谢谢你看我的文章,我们下篇再见!

搭建完美的写作环境:工具篇(12 章)
图解机器学习 - 中文版(72 张 PNG)
ChatGPT、大模型系列研究报告(50 个 PDF)
108 页 PDF 小册子:搭建机器学习开发环境及 Python 基础
116 页 PDF 小册子:机器学习中的概率论、统计学、线性代数
史上最全!371 张速查表,涵盖 AI、ChatGPT、Python、R、深度学习、机器学习等

相关推荐

方差分析简介(方差分析通俗理解)

介绍方差分析(ANOVA,AnalysisofVariance)是一种广泛使用的统计方法,用于比较两个或多个组之间的均值。单因素方差分析是方差分析的一种变体,旨在检测三个或更多分类组的均值是否存在...

正如404页面所预示,猴子正成为断网元凶--吧嗒吧嗒真好吃

吧嗒吧嗒,绘图:MakiNaro你可以通过加热、冰冻、水淹、模塑、甚至压溃压力来使网络光缆硬化。但用猴子显然是不行的。光缆那新挤压成型的塑料外皮太尼玛诱人了,无法阻挡一场试吃盛宴的举行。印度政府正...

Python数据可视化:箱线图多种库画法

概念箱线图通过数据的四分位数来展示数据的分布情况。例如:数据的中心位置,数据间的离散程度,是否有异常值等。把数据从小到大进行排列并等分成四份,第一分位数(Q1),第二分位数(Q2)和第三分位数(Q3)...

多组独立(完全随机设计)样本秩和检验的SPSS操作教程及结果解读

作者/风仕在上一期,我们已经讲完了两组独立样本秩和检验的SPSS操作教程及结果解读,这期开始讲多组独立样本秩和检验,我们主要从多组独立样本秩和检验介绍、两组独立样本秩和检验使用条件及案例的SPSS操作...

方差分析 in R语言 and Excel(方差分析r语言例题)

今天来写一篇实际中比较实用的分析方法,方差分析。通过方差分析,我们可以确定组别之间的差异是否超出了由于随机因素引起的差异范围。方差分析分为单因素方差分析和多因素方差分析,这一篇先介绍一下单因素方差分析...

可视化:前端数据可视化插件大盘点 图表/图谱/地图/关系图

前端数据可视化插件大盘点图表/图谱/地图/关系图全有在大数据时代,很多时候我们需要在网页中显示数据统计报表,从而能很直观地了解数据的走向,开发人员很多时候需要使用图表来表现一些数据。随着Web技术的...

matplotlib 必知的 15 个图(matplotlib各种图)

施工专题,我已完成20篇,施工系列几乎覆盖Python完整技术栈,目标只总结实践中最实用的东西,直击问题本质,快速帮助读者们入门和进阶:1我的施工计划2数字专题3字符串专题4列表专题5流程控制专题6编...

R ggplot2常用图表绘制指南(ggplot2绘制折线图)

ggplot2是R语言中强大的数据可视化包,基于“图形语法”(GrammarofGraphics),通过分层方式构建图表。以下是常用图表命令的详细指南,涵盖基本语法、常见图表类型及示例,适合...

Python数据可视化:从Pandas基础到Seaborn高级应用

数据可视化是数据分析中不可或缺的一环,它能帮助我们直观理解数据模式和趋势。本文将全面介绍Python中最常用的三种可视化方法。Pandas内置绘图功能Pandas基于Matplotlib提供了简洁的绘...

Python 数据可视化常用命令备忘录

本文提供了一个全面的Python数据可视化备忘单,适用于探索性数据分析(EDA)。该备忘单涵盖了单变量分析、双变量分析、多变量分析、时间序列分析、文本数据分析、可视化定制以及保存与显示等内容。所...

统计图的种类(统计图的种类及特点图片)

统计图是利用几何图形或具体事物的形象和地图等形式来表现社会经济现象数量特征和数量关系的图形。以下是几种常见的统计图类型及其适用场景:1.条形图(BarChart)条形图是用矩形条的高度或长度来表示...

实测,大模型谁更懂数据可视化?(数据可视化和可视化分析的主要模型)

大家好,我是Ai学习的老章看论文时,经常看到漂亮的图表,很多不知道是用什么工具绘制的,或者很想复刻类似图表。实测,大模型LaTeX公式识别,出乎预料前文,我用Kimi、Qwen-3-235B...

通过AI提示词让Deepseek快速生成各种类型的图表制作

在数据分析和可视化领域,图表是传达信息的重要工具。然而,传统图表制作往往需要专业的软件和一定的技术知识。本文将介绍如何通过AI提示词,利用Deepseek快速生成各种类型的图表,包括柱状图、折线图、饼...

数据可视化:解析箱线图(box plot)

箱线图/盒须图(boxplot)是数据分布的图形表示,由五个摘要组成:最小值、第一四分位数(25th百分位数)、中位数、第三四分位数(75th百分位数)和最大值。箱子代表四分位距(IQR)。IQR是...

[seaborn] seaborn学习笔记1-箱形图Boxplot

1箱形图Boxplot(代码下载)Boxplot可能是最常见的图形类型之一。它能够很好表示数据中的分布规律。箱型图方框的末尾显示了上下四分位数。极线显示最高和最低值,不包括异常值。seaborn中...