百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

深度比较常见库中序列化和反序列化性能的性能差异

bigegpt 2024-08-07 17:47 3 浏览

背景和目的

本文介绍了几个常用的序列化和反序列化库,包括System.Text.Json、Newtonsoft.Json、 Protobuf-Net、MessagePack-Net,我们将对这些库进行性能测评

库名称介绍Github地址
System.Text.Json.NET Core 3.0及以上版本的内置JSON库,用于读写JSON文本。它提供了高性能和低分配的功能。System.Text.Json
Newtonsoft.Json也被称为Json.NET,是.NET中最常用的JSON序列化库之一。它提供了灵活的方式来转换.NET对象为JSON字符串,以及将JSON字符串转换为.NET对象。Newtonsoft.Json
Protobuf-Net.NET版本的Google's Protocol Buffers序列化库。Protocol Buffers是一种语言中立、平台中立、可扩展的序列化结构数据的方法。Protobuf-Net
MessagePack-NetMessagePack是一个高效的二进制序列化格式,它允许你在JSON-like的格式中交换数据,但是更小、更快、更简单。MessagePack-Net

性能测试

测评电脑配置

组件规格
CPU11th Gen Intel(R) Core(TM) i5-11320H
内存40 GB DDR4 3200MHz
操作系统Microsoft Windows 10 专业版
电源选项已设置为高性能
软件LINQPad 7.8.5 Beta
运行时.NET 7.0.10

准备工作

0、导入Nuget包

1、Bogus(34.0.2)
2、MessagePack(2.5.124) 3、Newtonsoft.Json(13.0.3)
4、protobuf-net(3.2.26)
5、System.Reactive(6.0.0)

1、性能测试函数

  1. IObservable<object> Measure(Action action, int times = 5)

  2. {

  3. return Enumerable.Range(1, times).Select(i =>

  4. {

  5. var sw = Stopwatch.StartNew();

  6. long memory1 = GC.GetTotalMemory(true);

  7. long allocate1 = GC.GetTotalAllocatedBytes(true);

  8. {

  9. action();

  10. }

  11. long allocate2 = GC.GetTotalAllocatedBytes(true);

  12. long memory2 = GC.GetTotalMemory(true);

  13. sw.Stop();

  14. return new

  15. {

  16. 次数 = i,

  17. 分配内存 = (allocate2 - allocate1).ToString("N0"),

  18. 内存提高 = (memory2 - memory1).ToString("N0"),

  19. 耗时 = sw.ElapsedMilliseconds,

  20. };

  21. }).ToObservable();

  22. }

这个测量函数的它的作用

多次执行指定的动作,并测量每次执行该动作时的内存分配和执行时间。

然后,对于每次操作,它创建并返回一个新的匿名对象,该对象包含以下属性:

次数:操作的次数。
分配内存:操作期间分配的内存量(操作结束后的已分配字节减去操作开始前的已分配字节)。
内存提高:操作期间内存的增加量(操作结束后的总内存减去操作开始前的总内存)。
耗时:操作的执行时间(以毫秒为单位)。

2、生成随机数据的函数

  1. IEnumerable<User> WriteData()

  2. {

  3. var data = new Bogus.Faker<User>()

  4. .RuleFor(x => x.Id, x => x.IndexFaker + 1)

  5. .RuleFor(x => x.Gender, x => x.Person.Gender)

  6. .RuleFor(x => x.FirstName, (x, u) => x.Name.FirstName(u.Gender))

  7. .RuleFor(x => x.LastName, (x, u) => x.Name.LastName(u.Gender))

  8. .RuleFor(x => x.Email, (x, u) => x.Internet.Email(u.FirstName, u.LastName))

  9. .RuleFor(x => x.BirthDate, x => x.Person.DateOfBirth)

  10. .RuleFor(x => x.Company, x => x.Person.Company.Name)

  11. .RuleFor(x => x.Phone, x => x.Person.Phone)

  12. .RuleFor(x => x.Website, x => x.Person.Website)

  13. .RuleFor(x => x.SSN, x => x.Person.Ssn())

  14. .GenerateForever().Take(6_0000);

  15. return data;

  16. }

Bogus 是一个非常有用的 C# 库,它可以帮助你生成伪造的数据,或者说“假数据”。这在测试或开发阶段非常有用,你可以使用它来填充数据库,或者在没有实际用户数据的情况下测试应用程序。

如果想详细了解使用请参考 这篇文章https://www.cnblogs.com/sdflysha/p/20190821-generate-lorem-data.html

3、数据实体类

  1. [MessagePackObject, ProtoContract]

  2. public class User

  3. {

  4. [Key(0), ProtoMember(1)]

  5. public int Id { get; set; }

  6. [Key(1), ProtoMember(2)]

  7. public int Gender { get; set; }

  8. [Key(2), ProtoMember(3)]

  9. public string FirstName { get; set; }

  10. [Key(3), ProtoMember(4)]

  11. public string LastName { get; set; }

  12. [Key(4), ProtoMember(5)]

  13. public string Email { get; set; }

  14. [Key(5), ProtoMember(6)]

  15. public DateTime BirthDate { get; set; }

  16. [Key(6), ProtoMember(7)]

  17. public string Company { get; set; }

  18. [Key(7), ProtoMember(8)]

  19. public string Phone { get; set; }

  20. [Key(8), ProtoMember(9)]

  21. public string Website { get; set; }

  22. [Key(9), ProtoMember(10)]

  23. public string SSN { get; set; }

  24. }


开始性能测试

以下测试代码会加入写入文件,以模拟真实的使用场景,性能怎么样

1、System.Text.Json 性能测试

序列化测试代码

  1. void TextJsonWrite()

  2. {

  3. var data = WriteData();

  4. Measure(() =>

  5. {

  6. string path = Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Desktop), "test-data1.json");

  7. using var file = File.Create(path);

  8. System.Text.Json.JsonSerializer.Serialize(file,data);

  9. })

  10. .Dump();

  11. }

文件大小:14.3MB

测试结果

次数分配内存内存提高耗时
11,429,688,20067,3922494
21,429,960,3523202610
31,429,596,25682615
41,430,126,504-642753
51,429,549,184-4322918

反序列化测试代码

  1. void TextJsonRead()

  2. {

  3. Measure(() =>

  4. {

  5. string path = Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Desktop), "test-data1.json");

  6. byte[] bytes = File.ReadAllBytes(path);

  7. System.Text.Json.JsonSerializer.Deserialize<List<User>>(bytes);

  8. }).Dump();

  9. }

测试结果

次数分配内存内存提高耗时
142,958,53643,728212
243,093,44848185
342,884,40824120
442,883,31224129
543,100,89624117

2、Newtonsoft.Json 性能测试

序列化测试代码

  1. void JsonNetWrite()

  2. {

  3. var data = WriteData();

  4. Measure(() =>

  5. {

  6. string path = Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Desktop), "test-data2.json");

  7. var jsonData = Newtonsoft.Json.JsonConvert.SerializeObject(data);

  8. File.WriteAllText(path, jsonData);

  9. })

  10. .Dump();

  11. }


文件大小:14.3MB

测试结果

次数分配内存内存提高耗时
11,494,035,69642,6082196
21,494,176,1443202289
31,494,684,672-242899
41,494,292,3762,1523393
51,495,260,472643499

反序列化测试代码

  1. void JsonNetRead()

  2. {

  3. Measure(() =>

  4. {

  5. string path = Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Desktop), "test-data2.json");

  6. var jsonData = File.ReadAllText(path);

  7. var data = Newtonsoft.Json.JsonConvert.DeserializeObject<List<User>>(jsonData);

  8. })

  9. .Dump();

  10. }


测试结果

次数分配内存内存提高耗时
192,556,92063,216275
292,659,78448314
392,407,73624245
492,616,91224276
592,416,12824305

3、ProtobufNet 性能测试

序列化测试代码

  1. void ProtobufNetWrite()

  2. {

  3. var data = WriteDataTwo();

  4. Measure(() =>

  5. {

  6. string path = Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Desktop), "test-data3.bin");

  7. using var file = File.Create(path);

  8. Serializer.Serialize(file, data);

  9. }).Dump();

  10. }


文件大小:7.71MB

测试结果

次数分配内存内存提高耗时
1712,168163,512170
26,760-192111
37,04028097
46,7602466
5244,200068

反序列化测试代码

  1. void ProtobufNetRead()

  2. {

  3. Measure(() =>

  4. {

  5. string path = Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Desktop), "test-data3.bin");

  6. using var file = File.OpenRead(path);

  7. Serializer.Deserialize<List<UserProtobuf>>(file);

  8. }

  9. ).Dump();

  10. }


测试结果

次数分配内存内存提高耗时
129,485,8881,084,240113
228,242,8564896
328,340,6722485
428,333,0882480
528,242,8562476

4、MessagePack-Net 性能测试

序列化测试代码

  1. void MessagePackNetWrite()

  2. {

  3. var data = WriteDataThreee();

  4. Measure(() =>

  5. {

  6. string path = Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Desktop), "UserMessagePackData.bin");

  7. using var file = File.Create(path);

  8. MessagePackSerializer.Serialize(file, data);

  9. }).Dump();

  10. }


文件大小:7.21MB

测试结果

次数分配内存内存提高耗时
180,5529,51252
27,4322446
37,4322445
4120,400-1,07246
57,4322448

反序列化测试代码

  1. void MessagePackNetRead()

  2. {

  3. Measure(() =>

  4. {

  5. string path = Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Desktop), "UserMessagePackData.bin");

  6. byte[] bytes = File.ReadAllBytes(path);

  7. MessagePackSerializer.Deserialize<List<UserMessagePack>>(bytes);

  8. }).Dump();

  9. }


测试结果

次数分配内存内存提高耗时
135,804,7282482
235,804,7282465
335,804,7282456
435,804,7283266
535,806,24884880

结论

序列化性能测试结果

性能测试名称分配内存平均数 (bytes)耗时平均数 (ms)文件大小 (MB)分配内存百分比 (%)耗时百分比 (%)文件大小百分比 (%)
Newtonsoft.Json1,494,489,8722,85514.3100100100
System.Text.Json1,429,784,0992,67814.39593.8100
ProtobufNet195,3851027.710.0133.553.9
MessagePack-Net44,649477.210.00291.650.4

反序列化性能测试结果

性能测试名称分配内存平均数 (bytes)耗时平均数 (ms)分配内存百分比 (%)耗时百分比 (%)
Newtonsoft.Json92,531,496283100100
System.Text.Json42,807,42015246.254.7
ProtobufNet28,529,0729030.831.8
MessagePack-Net35,805,0326938.624.3

注:

1、 分配内存比例、耗时比例和文件大小比例都以 Newtonsoft.Json 的数值为基准,计算出的百分比表示在相比于 Newtonsoft.Json 的表现。
2、 分配内存平均数、耗时平均数是通过将给定的五次测试结果取平均值得出的。
3、 文件大小是由测试代码生成的文件大小,计算出的百分比表示在相比于 Newtonsoft.Json 的表现。

基于上述表格,我们可以得出以下结论:

  1. 内存分配:在内存分配方面,ProtobufNet 和 MessagePack-Net 显著优于 System.Text.Json 和 Newtonsoft.Json。它们的内存分配仅为 Newtonsoft.Json 的 0.01% 和 0.003%,这表明它们在处理大数据时的内存效率非常高。

  2. 耗时:在耗时方面,ProtobufNet 和 MessagePack-Net 也表现出超过其他两个库的性能。ProtobufNet 的耗时为 Newtonsoft.Json 的 3.6%,而 MessagePack-Net 的耗时仅为 2.1%。这意味着它们在处理大量数据时的速度非常快。

  3. 文件大小:在生成的文件大小方面,ProtobufNet 和 MessagePack-Net 的文件大小明显小于 System.Text.Json 和 Newtonsoft.Json。ProtobufNet 和 MessagePack-Net 的文件大小分别为 Newtonsoft.Json 文件大小的 53.9% 和 50.4%。这说明它们的序列化效率更高,能够生成更小的文件。

  4. System.Text.Json vs Newtonsoft.Json:在比较这两个库时,System.Text.Json 在内存分配和耗时方面都稍微优于 Newtonsoft.Json,但差距不大。在文件大小方面,它们的表现相同。

综上所述,如果考虑内存分配、处理速度和文件大小,ProtobufNet 和 MessagePack-Net 的性能明显优于 System.Text.Json 和 Newtonsoft.Json。

5、总结

基于上面的数据,个人一些看法,虽然我们平常用的是Newtonsoft.Json,但了解一些其他一些比较好的库的使用可以扩展视野,本次测试的库虽然加入了写入文件这方面的因素,但对性能影响不是很大,本以为ProtobufNet已经是性能最好的了,但上面的测试结果,显然 MessagePack-Net 性能最好,还有一个意外发现,针对NetCore 6.0,新出的库System.Text.Json性能比Newtonsoft.Json好5%



相关推荐

【Docker 新手入门指南】第十章:Dockerfile

Dockerfile是Docker镜像构建的核心配置文件,通过预定义的指令集实现镜像的自动化构建。以下从核心概念、指令详解、最佳实践三方面展开说明,帮助你系统掌握Dockerfile的使用逻...

Windows下最简单的ESP8266_ROTS_ESP-IDF环境搭建与腾讯云SDK编译

前言其实也没啥可说的,只是我感觉ESP-IDF对新手来说很不友好,很容易踩坑,尤其是对业余DIY爱好者搭建环境非常困难,即使有官方文档,或者网上的其他文档,但是还是很容易踩坑,多研究,记住两点就行了,...

python虚拟环境迁移(python虚拟环境conda)

主机A的虚拟环境向主机B迁移。前提条件:主机A和主机B已经安装了virtualenv1.主机A操作如下虚拟环境目录:venv进入虚拟环境:sourcevenv/bin/active(1)记录虚拟环...

Python爬虫进阶教程(二):线程、协程

简介线程线程也叫轻量级进程,它是一个基本的CPU执行单元,也是程序执行过程中的最小单元,由线程ID、程序计数器、寄存器集合和堆栈共同组成。线程的引入减小了程序并发执行时的开销,提高了操作系统的并发性能...

基于网络安全的Docker逃逸(docker)

如何判断当前机器是否为Docker容器环境Metasploit中的checkcontainer模块、(判断是否为虚拟机,checkvm模块)搭配学习教程1.检查根目录下是否存在.dockerenv文...

Python编程语言被纳入浙江高考,小学生都开始学了

今年9月份开始的新学期,浙江省三到九年级信息技术课将同步替换新教材。其中,新初二将新增Python编程课程内容。新高一信息技术编程语言由VB替换为Python,大数据、人工智能、程序设计与算法按照教材...

CentOS 7下安装Python 3.10的完整过程

1.安装相应的编译工具yum-ygroupinstall"Developmenttools"yum-yinstallzlib-develbzip2-develope...

如何在Ubuntu 20.04上部署Odoo 14

Odoo是世界上最受欢迎的多合一商务软件。它提供了一系列业务应用程序,包括CRM,网站,电子商务,计费,会计,制造,仓库,项目管理,库存等等,所有这些都无缝集成在一起。Odoo可以通过几种不同的方式进...

Ubuntu 系统安装 PyTorch 全流程指南

当前环境:Ubuntu22.04,显卡为GeForceRTX3080Ti1、下载显卡驱动驱动网站:https://www.nvidia.com/en-us/drivers/根据自己的显卡型号和...

spark+python环境搭建(python 环境搭建)

最近项目需要用到spark大数据相关技术,周末有空spark环境搭起来...目标spark,python运行环境部署在linux服务器个人通过vscode开发通过远程python解释器执行代码准备...

centos7.9安装最新python-3.11.1(centos安装python环境)

centos7.9安装最新python-3.11.1centos7.9默认安装的是python-2.7.5版本,安全扫描时会有很多漏洞,比如:Python命令注入漏洞(CVE-2015-2010...

Linux系统下,五大步骤安装Python

一、下载Python包网上教程大多是通过官方地址进行下载Python的,但由于国内网络环境问题,会导致下载很慢,所以这里建议通过国内镜像进行下载例如:淘宝镜像http://npm.taobao.or...

centos7上安装python3(centos7安装python3.7.2一键脚本)

centos7上默认安装的是python2,要使用python3则需要自行下载源码编译安装。1.安装依赖yum-ygroupinstall"Developmenttools"...

利用本地数据通过微调方式训练 本地DeepSeek-R1 蒸馏模型

网络上相应的教程基本都基于LLaMA-Factory进行,本文章主要顺着相应的教程一步步实现大模型的微调和训练。训练环境:可自行定义,mac、linux或者window之类的均可以,本文以ma...

【法器篇】天啦噜,库崩了没备份(天啦噜是什么意思?)

背景数据库没有做备份,一天突然由于断电或其他原因导致无法启动了,且设置了innodb_force_recovery=6都无法启动,里面的数据怎么才能恢复出来?本例采用解析建表语句+表空间传输的方式进行...