当前位置：首页 > article >正文

【笔记】对抗训练-GAN

article 2026/2/7 18:36:33

对抗训练-GAN

深度学习中 GAN 的对抗目标函数详解与最优解推导
- 一、GAN 的基本对抗目标函数
- 二、判别器与生成器的博弈目标
- 三、判别器的最优解推导
- 四、最优判别器的含义
- 五、总结
- 六、WGAN 的动机（为后续铺垫）

深度学习中 GAN 的对抗目标函数详解与最优解推导

生成对抗网络（GAN）是深度生成模型中的经典方法，其核心思想是两个网络之间的博弈：生成器 $G$ 试图“伪造”样本，而判别器 $D$ 尽力分辨真伪。本篇博客将从 GAN 的基本目标函数出发，逐步推导出判别器的最优形式，并分析其背后的数学含义。

一、GAN 的基本对抗目标函数

GAN 的原始目标是一个 min-max 游戏：

$\min_G \max_D \left( \mathbb{E}_{x \sim P_r}[\log D(x)] + \mathbb{E}_{z \sim P_z}[\log(1 - D(G(z)))] \right)$

其中：

$P_r(x)$ 表示真实数据的分布；
$P_z(z)$ 是先验噪声分布（如高斯）；
$G (z)$ 是生成器生成的假样本；
$D (x)$ 是判别器输出 $x$ 为真实样本的概率。

二、判别器与生成器的博弈目标

判别器 D 的目标：让 $D (x)$ 趋近于 1， $D (G (z))$ 趋近于 0，即正确分辨真实与生成样本。

对应目标函数为最大化：

$\mathbb{E}_{x \sim P_r}[\log D(x)] + \mathbb{E}_{z \sim P_z}[\log(1 - D(G(z)))]$
生成器 G 的目标：生成样本让 $D (G (z))$ 尽量大，即“骗过”判别器。

对应目标函数为最小化：

$\mathbb{E}_{z \sim P_z}[\log(1 - D(G(z)))]$

这是一个典型的零和对抗过程。

三、判别器的最优解推导

我们接下来推导：在固定生成器 $G$ 的前提下，判别器 $D$ 的最优形式是怎样的？

令目标函数为：

$\int_x P_r(x) \log D(x) + P_g(x) \log(1 - D(x)) \, dx$

对每个 $x$ ，令：

$f(D(x)) = P_r(x) \log D(x) + P_g(x) \log(1 - D(x))$

对 $D (x)$ 求导并令导数为 0：

$\frac{d f}{d D(x)} = \frac{P_r(x)}{D(x)} - \frac{P_g(x)}{1 - D(x)} = 0$

解得最优判别器为：

$D^*(x) = \frac{P_r(x)}{P_r(x) + P_g(x)}$

四、最优判别器的含义

$D^*(x)$ 的输出值反映了 样本 $x$ 来自真实分布的概率。
- 如果 $P_r(x) = P_g(x)$ ，则 $D^*(x) = \frac{1}{2}$ ；
- 如果 $P_r(x) \gg P_g(x)$ ，则 $D^*(x) \approx 1$ ；
- 如果 $P_g(x) \gg P_r(x)$ ，则 $D^*(x) \approx 0$ 。
将 $D^*$ 代入 GAN 原始目标函数：

$V(D^*) = \mathbb{E}_{x \sim P_r}[\log D^*(x)] + \mathbb{E}_{x \sim P_g}[\log(1 - D^*(x))]$

可推导出最终目标：

$\min_G V(D^*) = -\log 4 + 2 \cdot \text{JS}(P_r \parallel P_g)$

即：GAN 实质上是在最小化真实分布 $P_r$ 与生成分布 $P_g$ 之间的 Jensen-Shannon 散度。

五、总结

内容	含义
$D^*(x) = \frac{P_r(x)}{P_r(x) + P_g(x)}$	判别器在每个样本点处的最优输出
GAN 的优化目标	最小化 JS 散度
最优时的结果	当 $P_r = P_g$ 时，GAN 达到最优， $D (x) = 0.5$ ，分不出真假

六、WGAN 的动机（为后续铺垫）

由于 Jensen-Shannon 散度在 $P_r$ 与 $P_g$ 没有交集时不连续（导致梯度消失），Wasserstein GAN（WGAN）改用 Wasserstein 距离替代 JS 散度，并要求判别器满足 1-Lipschitz 条件，这会在后续单独展开讲解。

【笔记】对抗训练-GAN

对抗训练-GAN

深度学习中 GAN 的对抗目标函数详解与最优解推导

一、GAN 的基本对抗目标函数

二、判别器与生成器的博弈目标

三、判别器的最优解推导

四、最优判别器的含义

五、总结

六、WGAN 的动机（为后续铺垫）

相关文章：

【笔记】对抗训练-GAN

（二十三）安卓开发中数据存储之Room详解

AIoT 智变浪潮演讲实录 | 刘浩然：让硬件会思考：边缘大模型网关助力硬件智能革新

【Windows】系统安全移除移动存储设备指南：告别「设备被占用」弹窗

C++运算符重载全面总结

ArmSoM Sige5 CM5：RK3576 上 Ultralytics YOLOv11 边缘计算新标杆

【计算机网络】什么是路由？核心概念与实战详解

【ubuntu】linux开机自启动

dnf install openssl失败的原因和解决办法

Java 在人工智能领域的突围：从企业级架构到边缘计算的技术革新

操作系统导论——第19章分页：快速地址转换（TLB）

计算机网络：流量控制与可靠传输机制

SaaS、Paas、IaaS、MaaS、BaaS五大云计算服务模式

计算机网络 - 三次握手相关问题

通过使用 include 语句加载并执行一个CMake脚本来引入第三方库

架构生命周期（高软57）

JMeter使用

Ant Design Vue 表格复杂数据合并单元格

Fiddler为什么可以看到一次HTTP请求数据？

第十九讲 | XGBoost 与集成学习：精准高效的地学建模新范式

基于 GoFrame 框架的电子邮件发送实践：优势、特色与经验分享

ECharts 如何实现柱状图悬停时，整个背景区域均可触发点击事件

金融简单介绍及金融诈骗防范

cursor+高德MCP：制作一份旅游攻略

软件版本命名规范Semantic Versioning

Uniapp: 大纲

Kubernetes控制平面组件：API Server Webhook 授权机制详解

【KWDB 创作者计划】_产品技术解读_1

Python Cookbook-6.2 定义常量

【Python爬虫】简单案例介绍2