当前位置: 首页 > article >正文

什么是序列化与反序列化

序列化与反序列化:概念、作用及应用

一、基本定义
  1. 序列化(Serialization)
    将 ** 对象的状态(数据、属性等)转换为可存储或传输的字节流(二进制或文本格式)** 的过程。

    • 目的:使对象能在网络中传输(如 RPC 调用)、存储到文件 / 数据库,或在内存中持久化保存。
    • 本质:将复杂的对象结构 “flatten” 为线性字节序列,便于跨平台、跨进程处理。
  2. 反序列化(Deserialization)
    将字节流恢复为原始对象的过程,是序列化的逆操作。

    • 目的:从存储介质或网络接收端重构对象,恢复其状态和功能。
二、核心作用
  1. 数据存储与持久化

    • 例:将内存中的对象(如用户信息、配置参数)保存到文件(如 JSON、XML、二进制文件)或数据库,以便后续重新加载。
    • 典型场景:缓存系统(如 Redis 存储对象)、日志记录、断点续传。
  2. 网络通信与跨进程交互

    • 在分布式系统中(如 RPC 框架、微服务),对象需通过网络传输时,必须先序列化为字节流,接收方再反序列化为对象。
    • 例:Hadoop 中 MapReduce 任务间传递数据时,自定义的Writable对象需实现序列化接口,确保节点间数据正确传输。
  3. 对象状态共享

    • 在分布式环境中,序列化可用于复制对象状态(如分布式锁、集群节点状态同步)。
三、常见应用场景
  1. 分布式系统

    • Hadoop/Spark:自定义数据类型(如TextIntWritable)需实现Writable接口,确保在 Map/Reduce 任务间序列化传输。
    • RPC 框架(如 gRPC、Thrift):通过序列化协议(如 Protocol Buffers、JSON)定义接口参数和返回值的格式。
  2. 数据交换格式

    • 文本格式:JSON、XML(可读性强,适合跨语言交互,但效率较低)。
    • 二进制格式:Protocol Buffers、Apache Avro、Thrift(体积小、解析快,适合高性能场景)。
    • 语言特定格式:Java 的ObjectOutputStream、Python 的pickle(仅适用于同语言环境,可能存在安全风险)。
  3. 缓存与持久化

    • Redis 支持序列化对象存储(需选择高效格式如 MsgPack)。
    • Java 对象序列化后可写入ObjectInputStream/ObjectOutputStream
四、不同语言的实现方式
语言序列化框架 / 接口特点
JavaSerializable接口、Kryo、Protostuff内置Serializable简单但效率低;Kryo 等第三方库性能更高。
Pythonpickledill、JSON、Protocol Bufferspickle支持复杂对象但不安全;JSON 跨语言友好,需手动转换数据类型。
C++Protobuf、FlatBuffers高性能二进制格式,需定义 IDL(接口描述语言)。
通用JSON、XML、Protobuf、Avro跨语言支持,适合微服务、API 数据交互。
五、关键技术点与注意事项
  1. 序列化协议的选择

    • 性能:二进制格式(如 Protobuf)比文本格式(如 JSON)更快、更紧凑,适合大数据量或高频交互场景。
    • 兼容性:需考虑版本变更时的向后兼容(如 Protobuf 允许新增字段,不破坏旧解析逻辑)。
    • 安全性:避免使用不安全的反序列化接口(如 Python 的pickle直接反序列化不可信数据可能导致代码执行攻击)。
  2. 自定义序列化逻辑

    • 当内置序列化机制无法满足需求时(如忽略敏感字段、压缩数据),需自定义序列化方法。
    • 例:Hadoop 中自定义Writable类型需实现write()(序列化)和readFields()(反序列化)方法,确保数据在集群中正确传输。
  3. 反序列化漏洞

    • 风险:若反序列化不可信数据,可能导致远程代码执行(如 Java 的反序列化漏洞 CVE-2015-4852)。
    • 防护:避免反序列化不可信数据,使用安全的序列化协议(如 Protobuf),或对输入数据进行严格校验。

相关文章:

什么是序列化与反序列化

序列化与反序列化:概念、作用及应用 一、基本定义 序列化(Serialization) 将 ** 对象的状态(数据、属性等)转换为可存储或传输的字节流(二进制或文本格式)** 的过程。 目的:使对象能…...

音视频学习:使用NDK编译FFmpeg动态库

1. 环境 1.1 基础配置 NDK 22b (r22b)FFmpeg 4.4Ubuntu 22.04 1.2 下载ffmpeg 官网提供了 .tar.xz 包,可以直接下载解压: wget https://ffmpeg.org/releases/ffmpeg-4.4.tar.xz tar -xvf ffmpeg-4.4.tar.xz cd ffmpeg-4.41.3 安装基础工具链 sudo …...

如何使用 Qwen3 实现 Agentic RAG?

今天,我们将学习如何部署由阿里巴巴最新Qwen 3驱动的Agentic RAG。 这里是我们的工具栈: CrewAI用于代理编排。 Firecrawl用于网络搜索。 LightningAI的LitServe用于部署。 顶部的视频展示了这一过程。 图表显示了我们的Agentic RAG流程&#xff1…...

相机、雷达标定工具,以及雷达自动标定的思路

本篇我们来看一下自动驾驶传感器配置一个非常重要的模块,也就是传感器的标定。这里主要是对我之前修改的功能包的使用进行一个介绍. 对应的资源也已经上传了,0积分下载 安装 首先整个项目是使用ros1来进行启动的,但是要想正常编译,需要先安装三个对应的…...

vsomeip环境搭建保姆级教程

vsomeip环境搭建保姆级教程 ubuntu环境搭建 {% links %} site: VMware搭建ubuntu保姆级教程 url: https://zhuanlan.zhihu.com/p/1903219373906327339 desc: flechazo image: https://q1.qlogo.cn/g?b=qq&nk=2861099&s=5 color: “#9d5b8b” {% endlinks %} vsomei…...

【工具记录分享】提取bilibili视频字幕

F12大法 教程很多 但方法比较统一 例快速提取视频字幕!适用B站、AI字幕等等。好用 - 哔哩哔哩 无脑小工具 哔哩哔哩B站字幕下载_在线字幕解析-飞鱼视频下载助手 把链接扔进去就会自动生成srt文件 需要txt可以配合: SRT转为TXT...

我的MCP相关配置记录

1.VSCode的Cline中的MCP {"mcpServers": {"github.com/modelcontextprotocol/servers/tree/main/src/github": {"autoApprove": [],"disabled": false,"timeout": 60,"command": "cmd","args&quo…...

systemd vs crontab:Linux 自动化运行系统的全面对比

在 Linux 系统运维和开发中,任务调度与服务管理 是不可或缺的一环。无论是定期备份、日志轮转,还是启动后台服务,自动化机制都能极大地提高系统的可靠性与效率。两种最常用的自动化工具是: crontab:传统的基于时间的任…...

我们来学nacos -- 集群nacos2.5.1mysql8.4

2.5.1集群搭建 架构下载解压到3个文件夹初始化数据库&数据迁移检查端口可用配置cluster.confapplication.properties 使用mysql8.4的jar启动db.num is null报错datasource错误成功 nginx反向代理集群查看 架构 其中包含3个nacos节点,然后一个负载均衡器代理3个…...

计算机网络核心技术解析:从基础架构到应用实践

计算机网络作为现代信息社会的基石,承载着全球数据交换与资源共享的核心功能。本文将从网络基础架构、核心协议、分层模型到实际应用场景,全面解析计算机网络的核心技术,并结合行业最新趋势,为读者构建系统的知识体系。 一、计算机…...

Spring Boot 基于 Cookie 实现单点登录:原理、实践与优化详解

前言 在多系统交互的应用场景中,单点登录(SSO)能够显著提升用户体验,减少重复登录的繁琐操作。基于 Cookie 的单点登录方案,凭借其简单直观、浏览器原生支持的特性,成为快速实现单点登录的有效方式。本文将…...

Rollup入门与进阶:为现代Web应用构建超小的打包文件

我们常常面临Webpack复杂配置或是Babel转译后的冗余代码,结果导致最终的包体积居高不下加载速度也变得异常缓慢,而在众多打包工具中Rollup作为一个轻量且高效的选择,正悄然改变着这一切,本文将带你深入了解这个令人惊艳的打包工具…...

pdf url 转 图片

背景&#xff1a;vue2.0需要把pdf转成图片&#xff0c;显示在url里面&#xff0c;使用pdfjs-dist来解决 步骤&#xff1a; 1、安装依赖包(我的项目是node12&#xff0c;安装太高版本会报错) npm i pdfjs-dist2.16.105 2、vue代码 <template><div class"main…...

专题四:综合练习( 找出所有子集的异或总和再求和)

以leetcode1863题为例 题目分析&#xff1a; 找到每个子集&#xff0c;然后子集中的元素异或之后全部相加 算法原理分析&#xff1a; 画决策树&#xff1a;第一层为这个子集有一个元素 第二层这个子集有两个元素 从上往下罗列&#xff0c;把所有子集都罗列出来&#xf…...

STM32 修炼手册

第一章 计算机体系结构(了解) 后续在板子上开发的时候&#xff0c;需要考虑是否有操作系统 方式一&#xff1a;有操作系统&#xff0c;通过c库通过os api操作硬件方式二&#xff1a;无操作系统&#xff0c; 通过c库通过固件库操作硬件 第二章 STM32开发板概述 板子/开发板&…...

缓存(2):数据一致性

概述 一致性就是数据保持一致,在分布式系统中,可以理解为多个节点中数据的值是一致的。 强一致性:这种一致性级别是最符合用户直觉的,它要求系统写入什么,读出来的也会是什么,用户体验好,但实现起来往往对系统的性能影响大弱一致性:这种一致性级别约束了系统在写入成功…...

什么是原码和补码

补码的本质确实是模运算&#xff08;Modular Arithmetic&#xff09;&#xff0c;这是理解补码为何能统一加减法的核心数学原理。下面用最通俗的语言和例子解释清楚&#xff1a; —### 1. 先理解什么是“模运算”- 模运算就是“周期性计数”&#xff0c;比如钟表&#xff1a; -…...

ppy/osu构建

下载 .NET (Linux、macOS 和 Windows) | .NET dotnet还行 构建&#xff1a;f5 运行&#xff1a;dotnet run --project osu.Desktop -c Debug...

基于几何布朗运动的股价预测模型构建与分析

基于几何布朗运动的股价预测模型构建与分析 摘要 本文建立基于几何布朗运动的股价预测模型&#xff0c;结合极大似然估计与蒙特卡洛模拟&#xff0c;推导股价条件概率密度函数并构建动态预测区间。实证分析显示模型在标普500指数预测中取得89%的覆盖概率&#xff0c;波动率估…...

使用交互式半自动化标注工具制作语义分割数据集

参考的初始资源&#xff1a; GitHub项目文档 B站视频 1.安装工具 打开Anaconda Prompt 1.创建虚拟环境 conda create -n isat_env python3.8 conda activate isat_env2.安装GPU版本pytorch 4070 Ti CUDN12.5 pip install torch torchvision torchaudio --index-url https:/…...

deepseek梳理java高级开发工程师微服务面试题

Java微服务高级面试题与答案 一、微服务架构设计 1. 服务拆分原则 Q1&#xff1a;微服务拆分时有哪些核心原则&#xff1f;如何解决拆分后的分布式事务问题&#xff1f; 答案&#xff1a; 服务拆分五大原则&#xff1a; 1. 单一职责原则&#xff08;SRP&#xff09;- 每个…...

二分查找算法的思路

二分查找思路总结 明确目标与单调性特点&#xff1a; 核心目标&#xff1a;寻找满足某种条件的答案&#xff08;如最小/最大值&#xff09;。单调性要求&#xff1a;需要证明你的判断函数具有单调性——即如果某个答案 T 可行&#xff0c;那么大于 T 的答案通常也是可行的&…...

(1)python开发经验

文章目录 1 安装包格式说明2 PySide支持Windows7 更多精彩内容&#x1f449;内容导航 &#x1f448;&#x1f449;Qt开发 &#x1f448;&#x1f449;python开发 &#x1f448; 1 安装包格式说明 PySide下载地址 进入下载地址后有多种安装包&#xff0c;怎么选择&#xff1a; …...

DAY05:深入解析生命周期与钩子函数

引言 在 Vue 开发中&#xff0c;生命周期和钩子函数是理解组件行为的关键。无论是初始化数据、操作 DOM&#xff0c;还是清理资源&#xff0c;生命周期钩子都提供了精确的控制点。本文将从基础理论出发&#xff0c;结合项目实战&#xff0c;详细剖析 Vue 3 的生命周期机制、组…...

python如何提取Chrome中的保存的网站登录用户名密码?

很多浏览器都贴心地提供了保存用户密码功能&#xff0c;用户一旦开启&#xff0c;就不需要每次都输入用户名、密码&#xff0c;非常方便。作为python脚本&#xff0c;能否拿到用户提前保存在浏览器中的用户名密码&#xff0c;用以自动登录呢&#xff1f;必须有&#xff0c;小爬…...

Redis实现分布式获取全局唯一自增ID的案例。

【1】简易自增版本(从 1 开始 1,2,3&#xff0c;...) 项目结构 下面是一个基于 RedisTemplate 实现的分布式全局唯一自增 ID 生成器的案例。适用于 Java Spring Boot 环境&#xff0c;利用 Redis 的原子操作 INCR 指令。 ✅ 原理说明 Redis 提供的 INCR 命令是原子性的&…...

人脸识别备案:筑牢人脸信息 “安全墙”

人脸识别备案制度主要依据《人脸识别技术应用安全管理办法》建立&#xff0c;人脸识别技术广泛应用于安防、金融、门禁、交通等领域&#xff0c;带来便利高效的同时&#xff0c;人脸信息安全问题也引发担忧。为规范技术应用、保护个人信息权益&#xff0c;人脸识别备案制度应运…...

基于RT-Thread的STM32F4开发第三讲——DAC

文章目录 前言一、DAC是什么&#xff1f;二、RT-Thread工程创建三、DAC函数编写1.DAC.c2.DAC.h3.main.c 四、结果测试五、工程分享 前言 本章利用RT-Thread最新的驱动5.1.0开发DAC模块&#xff0c;使用的开发板是正点原子的STM32F4探索者。很多配置和上文重复&#xff0c;本文…...

UE5通过C++实现TcpSocket连接

在 Unreal Engine 5 的 C 项目中&#xff0c;实现一个具备消息监听、心跳检测和断线重连功能的 TCP 客户端&#xff0c;可以参考以下完整示例。 准备工作 1、模块依赖 在 YourModule.Build.cs 文件中&#xff0c;添加对 Sockets 和 Networking 模块的依赖&#xff1a; Publ…...

网络状态可以通过hutool.HttpStatus获取

网络状态可以通过hutool.HttpStatus获取 全部都是静态int类型...