当前位置：首页 > news >正文

深度学习自编码器 - 随机编码器和解码器篇

news 2026/1/2 7:45:24

序言

在深度学习领域，自编码器作为一种无监督学习技术，凭借其强大的特征表示能力，在数据压缩、去噪、异常检测及生成模型等多个方面展现出独特魅力。其中，随机编码器和解码器作为自编码器的一种创新形式，进一步拓宽了其应用边界。随机编码器通过引入随机性，如噪声注入或概率性映射，使得编码过程不再拘泥于固定的转换规则，而是能够捕捉数据中的潜在随机性和多样性。这一特性对于处理复杂多变的现实世界数据尤为关键，因为它允许模型在编码时保留更多的不确定性信息，为后续处理或生成任务提供丰富的素材。

随机编码器和解码器（Stochastic Encoders and Decoders）

自编码器仅仅是一个前馈网络，可以使用与传统前馈网络相同的损失函数和输出单元。
如深度网络现代实践 - 深度前馈网络之基于梯度的学习篇 - 其他的输出类型中描述，设计前馈网络的输出单元和损失函数普遍策略是定义一个输出分布 $p(\boldsymbol{y}\mid\boldsymbol{x})$ 并最小化负对数似然 $-\log p(\boldsymbol{y}\mid\boldsymbol{x})$ 。在这种情况下， $\boldsymbol{y}$ 是关于目标的向量（如类标）。
在自编码器中， $\boldsymbol{x}$ 既是输入也是目标。
- 然而，我们仍然可以使用与之前相同的架构。
- 给定一个隐藏编码 $\boldsymbol{h}$ ，我们可以认为解码器提供了一个条件分布 $p_{\text{model}}(\boldsymbol{x}\mid\boldsymbol{h})$ 。
- 接着我们根据最小化 $-\log p_{\text{decoder}}(\boldsymbol{x}\mid\boldsymbol{h})$ 来训练自编码器。
- 损失函数的具体形式视 $p_{\text{decoder}}$ 的形式而定。
- 就传统的前馈网络来说，我们通常使用线性输出单元参数化高斯分布的均值（如果 $\boldsymbol{x}$ 是实的）。
- 在这种情况下，负对数似然对应均方误差准则。
- 类似地，二值 $\boldsymbol{x}$ 对应参数由 $\text{sigmoid}$ 单元确定的Bernoulli 分布，离散的 $\boldsymbol{x}$ 对应 $\text{softmax}$ 分布等等。
- 为了便于计算概率分布，我们通常认为输出变量与给定 $\boldsymbol{h}$ 是条件独立的，但一些技术（如混合密度输出）可以解决输出相关的建模。
为了更彻底地区别之前看到的前馈网络，我们也可以将编码函数 ( $\text{encoding function}$ ) $f (x)$ 的概念推广为编码分布 ( $\text{encoding distribution}$ ) $p_{\text{encoder}}(\boldsymbol{h}\mid\boldsymbol{x})$ ，如图例1中所示。
- 以及一个随机解码器：
  $p_{\text{decoder}}(\boldsymbol{x}\mid\boldsymbol{h})=p_{\text{model}}(\boldsymbol{x}\mid\boldsymbol{h})$ $\quad\textbf{---\footnotesize{公式1}}$
一般情况下，编码器和解码器的分布没有必要与一个唯一的联合分布 $p_{\text{model}}(\boldsymbol{x}\mid\boldsymbol{h})$ 的条件分布相容。 $\text{Alain et al. (2015)}$ 指出将编码器和解码器作为去噪自编码器训练，能使它们渐近地相容（有足够的容量和样本）。

图例1：随机自编码器的结构，其中编码器和解码器包括一些噪声注入，而不是简单的函数。
- 随机自编码器的结构，其中编码器和解码器包括一些噪声注入，而不是简单的函数。
- 说明：
  - 这意味着可以将它们的输出视为来自分布的采样（对于编码器是 $p_{\text{encoder}}(\boldsymbol{h}\mid\boldsymbol{x})$ ，对于解码器是 $p_{\text{decoder}}(\boldsymbol{x}\mid\boldsymbol{h})$ 。

总结

随机编码器和解码器的引入，为深度学习自编码器家族增添了新的活力与可能性。它们不仅增强了自编码器处理复杂数据的能力，还促进了生成模型的发展，使得生成的数据样本更加自然、多样。通过随机性的巧妙运用，这些模型能够在保持数据主要特征的同时，有效模拟真实世界中的不确定性，为图像生成、文本创作乃至更广泛的AI创作领域开辟了新路径。
未来，随着技术的不断进步和算法的优化，随机自编码器有望在更多领域展现其独特价值，推动人工智能技术的持续创新与发展。

往期内容回顾

深度学习自编码器 - 引言篇
深度学习自编码器 - 欠完备自编码器篇
深度学习自编码器 - 正则自编码器篇
深度网络现代实践 - 深度前馈网络之基于梯度的学习篇

深度学习自编码器 - 随机编码器和解码器篇

序言

随机编码器和解码器（Stochastic Encoders and Decoders）

总结

往期内容回顾

相关文章：

深度学习自编码器 - 随机编码器和解码器篇

Spring IoC DI

[数据集][目标检测]无人机飞鸟检测数据集VOC+YOLO格式6647张2类别

Vue 中 watch 的使用方法及注意事项

情指行一体化平台建设方案和必要性-———未来之窗行业应用跨平台架构

窗口框架frame(HTML前端)

51单片机——数码管

`re.compile(r“(＜.*?＞)“)` 如何有效地从给定字符串中提取出所有符合 `＜...＞` 格式的引用

算法打卡：第十一章图论part01

为C#的PetaPoco组件增加一个批量更新功能(临时表模式)

Spring实战——入门讲解

MTK芯片机型的“工程固件” 红米note9 5G版资源预览写入以及改写参数相关步骤解析

[Golang] Context

【JAVA集合总结-壹】

Mysql梳理7——分页查询

智能制造与工业互联网公益联播∣企企通副总经理杨华：AI的浪潮下，未来智慧供应链迭代方向

《深度学习》—— 卷积神经网络(CNN)的简单介绍和工作原理

数据结构：线性表

Ansible PlayBook实践案例

Tomcat后台弱口令部署war包

IDEA运行Tomcat出现乱码问题解决汇总

观成科技：隐蔽隧道工具Ligolo-ng加密流量分析

（十）学生端搭建

多场景 OkHttpClient 管理器 - Android 网络通信解决方案

基于uniapp+WebSocket实现聊天对话、消息监听、消息推送、聊天室等功能，多端兼容

新能源汽车智慧充电桩管理方案：新能源充电桩散热问题及消防安全监管方案

linux 下常用变更-8

【RockeMQ】第2节｜RocketMQ快速实战以及核⼼概念详解（二）

基于TurtleBot3在Gazebo地图实现机器人远程控制

保姆级教程：在无网络无显卡的Windows电脑的vscode本地部署deepseek