在 Rust 中使用 Serde 处理json
在 Rust 中使用 Serde 处理json
在本文中,我们将讨论 Serde、如何在 Rust 应用程序中使用它以及一些更高级的提示和技巧。
什么是serde?
Rust中的serde
crate用于高效地序列化和反序列化多种格式的数据。它通过提供两个可以使用的traits来实现这一点,这两个traits为 Deserialize
和 Serialize
。作为生态系统中最著名的 crate 之一,它目前支持 20 多种类型的序列化(反序列化)。
首先,您需要将 crate 安装到您的 Rust 应用程序中:
cargo add serde
使用serde
Deserializing and Serializing 数据
序列化和反序列化数据的简单方法是添加 serde derive
功能。这会添加一个宏,您可以使用它来自动实现 Deserialize
和 Serialize
traits - 您可以使用 --features
标志(短的 -F
来实现):
cargo add serde -F derive
然后我们可以将宏添加到我们想要实现 Deserialize
或 Serialize
的任何结构体或枚举中:
use serde::{Deserialize, Serialize};#[derive(Deserialize, Serialize)]
struct MyStruct {message: String,// ... the rest of your fields
}
这允许我们使用任何支持 serde
的crate 在所述格式之间进行转换。作为示例,让我们使用 serde-json
与 JSON 格式相互转换:
use serde_json::json;
use serde::{Deserialize, Serialize};#[derive(Deserialize, Serialize)]
struct MyStruct {message: String,
}fn to_and_from_json() {let json = json!({"message": "Hello world!"});let my_struct: MyStruct = serde_json::from_str(&json).unwrap();assert_eq!(my_struct, MyStruct { message: "Hello world!".to_string());assert!(serde_json::to_string(my_struct).is_ok());
}
如果您有兴趣在 Rust 应用程序中使用 serde-json
,我们有一篇讨论 JSON 解析库的文章,您可以在此处查看。
我们还可以对许多源进行反序列化和序列化,包括文件流 I/O、JSON 字节数组等。
自定义实现反序列化和序列化
为了更好地理解 serde
在底层是如何工作的,我们还可以自定义实现 Deserialize
和 Serialize
。这相当复杂,但现在我们将实现一个简单的。下面是序列化 i32
基元类型的简单实现:
use serde::{Serializer, Serialize};impl Serialize for i32 {fn serialize<S>(&self, serializer: S) -> Result<S::Ok, S::Error>whereS: Serializer,{serializer.serialize_i32(*self)}
}
为了能够转换类型, serde
内部要求我们使用实现 Serializer
的类型。要为不是原生(primitive)类型 实现 Serialize
,我们可以通过序列化为原生(primitive)类型来扩展它,然后从原生(primitive)类型转换为我们想要的任何类型。如果我们想要对结构进行自定义序列化,我们也可以使用 SerializeStruct
trait来执行相同的操作:
use serde::ser::{Serialize, Serializer, SerializeStruct};struct Color {r: u8,g: u8,b: u8,
}impl Serialize for Color {fn serialize<S>(&self, serializer: S) -> Result<S::Ok, S::Error>whereS: Serializer,{// 3 is the number of fields in the struct.let mut state = serializer.serialize_struct("Color", 3)?;state.serialize_field("r", &self.r)?;state.serialize_field("g", &self.g)?;state.serialize_field("b", &self.b)?;state.end()}
}
注意,要序列化字段,字段类型还需要实现 Serialize
。如果有未实现 Serialize
的自定义类型,则需要实现 Serialize
或使用 Serialize
derive宏(如果结构体/枚举 类型 包含所有实现 Serialize
的类型)。
The Deserialize
trait is a little bit different and is a fair bit more complicated to implement. To be able to deserialize to a type, the type itself needs to implement Sized
which means that there are a number of types which can’t use this trait (for example &str
) because they are unsized types. To deserialize a type, you also need to use a type that implements the Visitor
trait.
Deserialize
trait 有点不同,并且实现起来要复杂一些。为了能够反序列化为类型,类型本身需要实现 Sized
这意味着有许多类型不能使用此特征(例如 &str
),因为它们是unsized 类型。要反序列化类型,您还需要使类型实现 Visitor
trait。
Visitor
trait使用 Rust 中的 Visitor 设计模式。这意味着它封装了一种对相同大小的对象集合进行操作的算法。它允许您编写多种不同的算法来操作数据,而无需更改任何原始功能。您可以在这里了解更多相关信息。
下面是一个 MessageVisitor
类型的示例,该类型尝试将多种类型反序列化为 String:
use std::fmt;use serde::de::{self, Visitor};struct MessageVisitor;impl<'de> Visitor<'de> for MessageVisitor {type Value = String;fn expecting(&self, formatter: &mut fmt::Formatter) -> fmt::Result {formatter.write_str("A message that can either be deserialized from an i32 or String")}fn visit_string<E>(self, value: String) -> Result<Self::Value, E>whereE: de::Error,{Ok(value)}fn visit_str<E>(self, value: &str) -> Result<Self::Value, E>whereE: de::Error,{Ok(value.to_owned())}fn visit_i32<E>(self, value: i32) -> Result<Self::Value, E>whereE: de::Error,{Ok(value.to_string())}
}
正如您所看到的,实现的代码量相当大!然而,它也使我们能够使实现变得更加简单。通过实现 Visitor
特征,可以将实现它的类型传递给 Deserialize
方法,然后将 JSON 反序列化到我们的结构中:
use serde::{Deserialize, Deserializer};impl<'de> Deserialize<'de> for MyStruct {fn deserialize<D>(deserializer: D) -> Result<Self, D::Error>whereD: Deserializer<'de>,{// note: don't use unwrap in production!let message = deserializer.deserialize_string(MessageVisitor).unwrap();Ok(Self { message })}
}
您还可以在此处找到有关反序列化结构的文档。但是,一般来说,建议您使用 derive
功能宏,因为手动实现(如前面所示)代码量相当大。该实现主要涉及使用访问者来访问映射或序列,然后迭代元素以将其反序列化。
使用 serde 属性
当涉及到 serde 时,crate 还具有许多有用的属性宏,我们可以在类型上使用它们,以允许在反序列化字段或序列化为结构时进行字段重命名等操作。最好的例子之一是当您与用某种语言编写的 API 进行交互时,该语言的键可能是 Rust 中的保留关键字。您可以添加 #[serde(rename)]
属性宏,如下所示:
use serde::{Deserialize, Serialize};#[derive(Deserialize, Serialize)]
pub struct MyStruct {#[serde(rename = "type")]kind: String
}
这可以让您解决名称冲突的问题!
您还可以使用 rename_all
属性将所有字段重命名为另一个大小写:
use serde::{Deserialize, Serialize};#[derive(Deserialize, Serialize)]
#[serde(rename_all = "camelCase")]
pub struct MyStruct {my_message: String
}
现在,当您序列化此结构时, my_message
应该自动变成 myMessage
!非常适合使用以其他语言或不同约定编写的 API。
如果您不想将字段包装在 Option
中,您还可以使用 #[serde(default)]
实现默认值。这只是允许用默认值填充字段,而不是 报错。您还可以使用 #[serde(default = "path")]
来指向提供自动默认值的函数。例如,这个结构体和函数:
use serde::{Deserialize, Serialize};#[derive(Deserialize, Serialize)]
pub struct MyStruct {#[serde(path = "my_function")]my_message: String,
}fn my_function() -> String {"Hello world!".to_string()
}
serde
还提供其他有用的属性,例如能够在结构顶部使用 #[serde(deny_unknown_fields)]
拒绝未知字段。这使您可以确保序列化和反序列化时结构完全按原样。
Deserializing and Serializing enums
让我们看一下这个枚举类型:
use serde::{Deserialize, Serialize};#[derive(Deserialize, Serialize)]
enum MyEnum {Data { id: String, data: Value },SomeOtherData { id: i32, name: String }
}
请注意,在与此枚举进行转换时,可以采用两个选项:
- 名为
id
的字符串字段和data
这是一个 JSON 值(可以是map、值或Json
值可以保存的任何内容) - 名为
id
的i32
字段和名为name
的String
字段
然后,您可以匹配枚举变量以进行进一步处理。
当第一个枚举变体用 JSON 编写时,您可以看到它应该与此对应:
{"Data": {"id": "your_id_here","data": { .. }}
}
这种类型的数据是“外部标记的”——这意味着数据的特征是标识符位于 JSON 对象的外部。我们可以添加内联标记,以便标识符位于crate的内部 - 让我们看看它会是什么样子:
use serde::{Deserialize, Serialize};#[derive(Deserialize, Serialize)]
#[serde(tag = "type")]
enum MyEnum {Data { id: String, data: Value },SomeOtherData { id: i32, name: String }
}
现在 JSON 表示如下所示:
{"type": "Data","id": "your_id_here","data": { .. }
}
有兴趣内容吗? serde
文档有一个关于tag 的页面,您可以在此处Enum representations · Serde找到。
Crates that work well with Serde
serde_with
serde_with
是一个提供自定义反/序列化 帮助程序的包,可与 serde
的 with
注释一起使用。通常,您可以定义一个模块供(反)序列化器使用,该模块位于用于自定义(反)序列化的自定义模块之后:
#[derive(Deserialize, Serialize)]
pub struct MyStruct {#[serde(with = "my_module")]my_message: String
}
使用 serde_with
时,它的工作原理是用名为 serde_as
的新注释替换 with
注释。使用这个新的属性宏,您可以做很多事情:
- 使用
Display
和FromStr
traits反序列化类型。 - 支持大于 32 个元素的数组。
- 跳过序列化空选项类型。
- 将逗号分隔的列表反序列化为
Vec<String>
。
要使用 serde_with
,您需要手动或使用以下命令将其添加到 Cargo.toml 中:
cargo add serde_with
然后您需要将 serde_as
添加到您想要使用它的类型,如下所示:
use serde_with::{serde_as, DisplayFromStr};
#[serde_as]
#[derive(Deserialize, Serialize)]
struct MyStruct {// Serialize with Display, deserialize with FromStr#[serde_as(as = "DisplayFromStr")]my_number: u8,
}
该结构允许您与字符串相互转换,但 Rust 结构中的类型本身为 u8
!非常有用,对吧?
这个crate还附带了一个指南,您可以使用它来充分利用 serde_with
。总的来说,这是 serde
的一个强大的伴侣crate。
serde_bytes
serde_bytes
是一个允许优化处理 &[u8]
和 Vec<u8>
类型的包 - 而 serde
本身能够处理这些类型,某些格式可以更有效地反/序列化。使用起来非常简单 - 您只需将其添加到 Cargo.toml 中,然后通过 #[serde(with = "serde_bytes")]
注释添加它,如下所示:
use serde::{Deserialize, Serialize};#[derive(Deserialize, Serialize)]
struct MyStruct {#[serde(with = "serde_bytes")]byte_buf: Vec<u8>,
}
总的来说,这是一个易于使用且简单的 crate,无需太多知识即可提高性能。
尾声
我希望您喜欢阅读有关 Serde 的文章!它是一个非常强大的 Rust 包,构成了大多数 Rust 应用程序的基础。
Using Serde in Rust
相关文章:

在 Rust 中使用 Serde 处理json
在 Rust 中使用 Serde 处理json 在本文中,我们将讨论 Serde、如何在 Rust 应用程序中使用它以及一些更高级的提示和技巧。 什么是serde? Rust中的serde crate用于高效地序列化和反序列化多种格式的数据。它通过提供两个可以使用的traits来实现这一点&a…...

【数据库】数据库介绍
文章目录 一、数据库介绍二、SQL分类 一、数据库介绍 什么是数据库 存储数据用文件就可以了,为什么还要弄个数据库? 文件保存数据有以下几个缺点: 文件的安全性问题 文件不利于数据查询和管理 文件不利于存储海量数据 文件在程序中控制不方便 数据库存…...

python 第三方库(PyPinyin\shortuuid\json)
PyPinyin库 简介 PyPinyin库是一个支持中文转拼音输出的Python第三方库,它可以根据词组智能匹配最正确的拼音,并且支持多音字,简单的繁体, 注音,多种不同拼音/注音风格的转换。 安装 (framework-learn) C:\Users\zzg>pip …...

一文解读ISO26262安全标准:术语(二)
一文解读ISO26262安全标准:术语(二) 本文继续补充一些标准中的术语,方便后续文章内容的有效理解。 分支覆盖率 branch coverage 控制流分支覆盖的比率. 100%分支覆盖率意味着100%语句覆盖率,比如,一个if语句…...

【Datawhale学习笔记】从大模型到AgentScope
从大模型到AgentScope AgentScope是一款全新的Multi-Agent框架,专为应用开发者打造,旨在提供高易用、高可靠的编程体验! 高易用:AgentScope支持纯Python编程,提供多种语法工具实现灵活的应用流程编排,内置…...

QWebEngineView添加自定义网址协议UrlScheme
QWebEngineView可以和js交互需要使用QWebChannel,如果不使用的话,js可以请求自定义网址协议,相当于请求服务器,但是不用Qt专门做服务器,不占用系统端口。 如果结合系统自定义URL注册,可以达到访问自定义UR…...

react中使用腾讯地图
腾讯文档 申请好对应key 配置限额 https://lbs.qq.com/service/webService/webServiceGuide/webServiceQuota 代码 用到的服务端接口 1.逆地址解析 2.关键词输入提示 import React, { Component } from react; import styles from ./map.less import { Form, Row, Col, I…...

deepin23beta中SQLite3数据库安装与使用
SQLite 是一个嵌入式 SQL 数据库引擎,它实现了一个自包含、无服务器、零配置、事务性 SQL 数据库引擎。 SQLite 的代码属于公共领域,因此可以免费用于任何商业或私人目的。 SQLite 是世界上部署最广泛的数据库,其应用程序数量之多,…...

前后端分离项目环境搭建
1. 使用到的技术和工具 springboot vue项目的搭建 工具 idea,mavennodejs 2. 后端框架搭建 利用maven创建springboot项目 3. 前端项目搭建 1. 安装相关工具 nodejs: 一个开源、跨平台的 JavaScript 运行时环境,可以理解成java当中需要…...

HTML静态网页成品作业(HTML+CSS)——家乡漳州介绍设计制作(1个页面)
🎉不定期分享源码,关注不丢失哦 文章目录 一、作品介绍二、作品演示三、代码目录四、网站代码HTML部分代码 五、源码获取 一、作品介绍 🏷️本套采用HTMLCSS,未使用Javacsript代码,共有1个页面。 二、作品演示 三、代…...

世界第二对海信到底有多重要?
作者 | 辰纹 来源 | 洞见新研社 不久前,全球权威市场研究机构Omdia公布了2023年全球电视销量排名,数据显示TCL电视全球销量达到了2526万台,位居全球第二,中国第一。 可是,同样是根据Omdia的数据,海信的官…...

多站合一的音乐搜索下载助手PHP源码l亲测
源码获取方式 回复:031601 搭建教程: 将源码下载上传至宝塔面板,直接运行即可~ 说明: 该源码进行测试,测试成功源码无加密优化相关其他采集问题。...

webserver烂大街?还有必要做么?
目录 什么是 Web Server? 如何提供 HTTP 服务? HTTP协议 简介 工作原理 工作步骤 HTTP请求报文格式 HTTP响应报文格式 HTTP请求方法 HTTP状态码 总结 都说webserver是C选手人手必备的烂大街项目,那么webserver 还有必要做么&…...

3.Redis命令
Redis命令 Redis 根据命令所操作对象的不同, 可以分为三大类: 对 Redis 进行基础性操作的命令,对 Key 的操作命令,对 Value 的操作命令。 1.1 Redis 首先通过 redis-cli 命令进入到 Redis 命令行客户端,然后再运行下…...

xray问题排查,curl: (35) Encountered end of file(已解决)
经过了好几次排查,都没找到问题,先说问题的排查过程,多次确认了user信息,包括用户id和alterid,都没问题,头大的一逼 问题排查过程 确保本地的xray服务是正常的 [rootk8s-master01 xray]# systemctl stat…...

【数据库】Oracle内存结构与参数调优
Oracle内存结构与参数调优 Oracle 内存结构概览oracle参数配置概览重要参数(系统运行前配置):次要参数(可在系统运行后再优化调整): Oracle数据库服务器参数如何调整OLTP内存分配操作系统核心参数配置Disabling ASMM(禁…...

PS学习-抠图-蒙版-冰块酒杯等透明物体
选中图,ctrlA 全选 ctrlC复制 创建一个蒙版图层 选中蒙版Alt 点击进入 ctrlv 复制 ctrli 反转 原图层 ctrldelete填充为白色 添加一个背景,这个方法通用 首选创建一个 拖到最底部 给它填充颜色 这个可能是我图片的原因。视频是这样做的...

绝赞春招拯救计划 -- 操作系统,组成原理,计网
进程和线程 进程 一个在内存中运行的应用程序。每个进程都有自己独立的一块内存空间,一个进程可以有多个线程 线程 进程中的一个执行任务(控制单元),负责当前进程中程序的执行。一个进程至少有一个线程,一个进程可以…...

c语言:于龙加
于龙加 任务描述 于龙同学设计了一个特别的加法规则,加法被重新定义了,我们称为于龙加。 两个非负整数的于龙加的意义是将两个整数按前后顺序连接合并形成一个新整数。 于龙想编程解决于龙加问题,可是对下面的程序他没有思路! …...

AcWing 790:数的三次方根 ← 浮点数二分
【题目来源】https://www.acwing.com/problem/content/792/【题目描述】 给定一个浮点数 n,求它的三次方根。【输入格式】 共一行,包含一个浮点数 n。【输出格式】 共一行,包含一个浮点数,表示问题的解。 注意,结果保留…...

【LLM】LLama2模型(RMSNorm、SwiGLU、RoPE位置编码)
note 预训练语言模型除了自回归(Autoregressive)模型GPT,还有自编码模型(Autoencoding)BERT[1]、编-解码(Encoder-Decoder)模型BART[67],以及融合上述三种方法的自回归填空…...

【力扣白嫖日记】1934.确认率
前言 练习sql语句,所有题目来自于力扣(https://leetcode.cn/problemset/database/)的免费数据库练习题。 今日题目: 1934.确认率 表:Signups 列名类型user_idinttime_stampdatetime User_id是该表的主键。每一行都…...

TinTin Web3 动态精选:以太坊坎昆升级利好 Layer2,比特币减半进入倒计时
TinTin 快讯由 TinTinLand 开发者技术社区打造,旨在为开发者提供最新的 Web3 新闻、市场时讯和技术更新。TinTin 快讯将以周为单位, 汇集当周内的行业热点并以快讯的形式排列成文。掌握一手的技术资讯和市场动态,将有助于 TinTinLand 社区的开…...

PCL 高斯投影反算:高斯投影坐标转大地坐标(C++详细过程版)
目录 一、算法原理二、代码实现三、结果展示四、测试数据PCL 高斯投影反算:高斯投影坐标转大地坐标(C++详细过程版)由CSDN点云侠原创。如果你不是在点云侠的博客中看到该文章,那么此处便是不要脸的爬虫。 一、算法原理...

解决:IDEA编译Java程序时报编译失败
1、问题展示: 2、解决方法:...

vue+vite根据版本号清空用户浏览器缓存
项目生产环境发布新版本之后,用户可能会因为一些本地缓存的数据不一样而导致页面报错。这时候可以根据版本号去清空用户缓存。 1、在package.json文件中有一个管理版本号属性:version,在每次打包部署之前修改当前版本号。 2、在main.js文件中…...

AXI CANFD MicroBlaze 测试笔记
文章目录 前言测试用的硬件连接Vivado 配置Vitis MicroBlaze CANFD 代码测试代码测试截图Github Link 前言 官网: CAN with Flexible Data Rate (CAN FD) (xilinx.com) 特征: 支持8Mb/s的CANFD多达 3 个数据位发送器延迟补偿(TDC, transmitter delay compensation)32-deep T…...

操作系统——cpu、内存、缓存介绍
一、内存是什么 内存就是系统资源的代名词,它是其他硬件设备与 CPU 沟通的桥梁, 计算机中的所有程序都在内存中运行。其作用是暂时存放CPU的运算数据,以及与硬盘交换的数据。也是相当于CPU与硬盘沟通的桥梁。只要计算机在运行,CP…...

【理解机器学习算法】之岭回归Ridge - L2 Rgularization
Ridge 回归(Ridge Regression)也称作岭回归或脊回归,是一种专用于共线性数据分析的有偏估计回归方法。在多元线性回归中,如果数据集中的特征(自变量)高度相关,也就是说存在共线性(Multicollinea…...

【Linux进程状态】
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 目录 前言 一、直接谈论Linux的进程状态 看看Linux内核源代码怎么说 1.1、R状态 -----> 进程运行的状态 1.2、S状态 -----> 休眠状态(进程在等待“资源”就绪) 1.3、T状…...