当前位置：首页 > article >正文

pytorch实现变分自编码器

article 2026/5/9 1:56:07

人工智能例子汇总：AI常见的算法和例子-CSDN博客

变分自编码器（Variational Autoencoder, VAE）是一种生成模型，属于深度学习中的无监督学习方法。它通过学习输入数据的潜在分布（Latent Distribution），生成与输入数据相似的新样本。VAE 可以用于数据生成、降维、异常检测等任务。

VAE 的关键思想是在传统的自编码器（Autoencoder）的基础上，引入了变分推断（Variational Inference）和概率模型，使得网络能够学习到数据的潜在分布，而不仅仅是数据的映射。

VAE 的结构：

编码器（Encoder）：将输入数据映射到潜在空间的分布。不同于传统的自编码器直接将数据映射到一个固定的潜在向量，VAE 通过输出潜在变量的均值和方差来描述一个概率分布，这样潜在空间中的每个点都有一个概率分布。
潜在空间（Latent Space）：表示数据的潜在特征。在 VAE 中，潜在空间的表示是一个分布而不是固定的值。通常，采用正态分布来作为潜在空间的先验分布。
解码器（Decoder）：从潜在空间的样本中重构输入数据。解码器通过将潜在空间的点映射回数据空间来生成样本。

VAE 的目标函数：

VAE 的目标是最大化变分下界（Variational Lower Bound，简称 ELBO），即通过优化以下两部分的加权和：

重构误差（Reconstruction Loss）：衡量生成的数据和输入数据之间的差异，通常使用均方误差（MSE）或交叉熵（Cross-Entropy）。
KL 散度（KL Divergence）：衡量潜在空间的分布与先验分布（通常是标准正态分布）之间的差异。

其最终的目标是使生成的数据尽可能接近真实数据，同时使潜在空间的分布接近先验分布。

优点：

VAE 能够生成具有多样性的样本，尤其适用于图像、音频等数据的生成。
潜在空间通常具有良好的结构，可以进行插值、样本生成等操作。

应用：

生成任务：如图像生成、文本生成等。
数据重构：如去噪、自编码等。
半监督学习：VAE 可以结合有标签和无标签的数据进行训练，提升模型的泛化能力。

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import Dataset, DataLoader
import matplotlib.pyplot as plt# 生成圆形图像的函数（使用PyTorch）
def generate_circle_image(size=64):image = torch.zeros((1, size, size))  # 使用 PyTorch 创建空白图像center = size // 2radius = size // 4for y in range(size):for x in range(size):if (x - center) ** 2 + (y - center) ** 2 <= radius ** 2:image[0, y, x] = 1  # 在圆内的点设置为白色return image# 生成方形图像的函数（使用PyTorch）
def generate_square_image(size=64):image = torch.zeros((1, size, size))  # 使用 PyTorch 创建空白图像padding = size // 4image[0, padding:size - padding, padding:size - padding] = 1  # 设置方形区域为白色return image# 自定义数据集：圆形和方形图像
class ShapeDataset(Dataset):def __init__(self, num_samples=1000, size=64):self.num_samples = num_samplesself.size = sizeself.data = []# 生成数据：一半是圆形图像，一半是方形图像for i in range(num_samples // 2):self.data.append(generate_circle_image(size))self.data.append(generate_square_image(size))def __len__(self):return len(self.data)def __getitem__(self, idx):return self.data[idx].float()  # 直接返回 PyTorch Tensor 格式的数据# VAE模型定义
class VAE(nn.Module):def __init__(self, latent_dim=2):super(VAE, self).__init__()self.latent_dim = latent_dim# 编码器self.fc1 = nn.Linear(64 * 64, 400)self.fc21 = nn.Linear(400, latent_dim)  # 均值self.fc22 = nn.Linear(400, latent_dim)  # 方差# 解码器self.fc3 = nn.Linear(latent_dim, 400)self.fc4 = nn.Linear(400, 64 * 64)def encode(self, x):h1 = torch.relu(self.fc1(x.view(-1, 64 * 64)))return self.fc21(h1), self.fc22(h1)  # 返回均值和方差def reparameterize(self, mu, logvar):std = torch.exp(0.5 * logvar)eps = torch.randn_like(std)return mu + eps * stddef decode(self, z):h3 = torch.relu(self.fc3(z))return torch.sigmoid(self.fc4(h3)).view(-1, 1, 64, 64)  # 重构图像def forward(self, x):mu, logvar = self.encode(x)z = self.reparameterize(mu, logvar)return self.decode(z), mu, logvar# 损失函数：重构误差 + KL 散度
def loss_function(recon_x, x, mu, logvar):BCE = nn.functional.binary_cross_entropy(recon_x.view(-1, 64 * 64), x.view(-1, 64 * 64), reduction='sum')# KL 散度return BCE + 0.5 * torch.sum(torch.exp(logvar) + mu ** 2 - 1 - logvar)# 设置超参数
batch_size = 128
epochs = 10
latent_dim = 2
learning_rate = 1e-3# 数据加载
train_loader = DataLoader(ShapeDataset(num_samples=2000), batch_size=batch_size, shuffle=True)# 创建模型和优化器
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model = VAE(latent_dim).to(device)
optimizer = optim.Adam(model.parameters(), lr=learning_rate)# 训练模型
def train(epoch):model.train()train_loss = 0for batch_idx, data in enumerate(train_loader):data = data.to(device)optimizer.zero_grad()recon_batch, mu, logvar = model(data)loss = loss_function(recon_batch, data, mu, logvar)loss.backward()train_loss += loss.item()optimizer.step()if batch_idx % 100 == 0:print(f'Train Epoch: {epoch} [{batch_idx * len(data)}/{len(train_loader.dataset)}] Loss: {loss.item() / len(data):.6f}')print(f'Train Epoch: {epoch} Average loss: {train_loss / len(train_loader.dataset):.4f}')# 测试并显示一些真实图像和生成的图像
def test():model.eval()with torch.no_grad():# 获取一批真实的图像（原始图像）real_images = next(iter(train_loader))[:64]  # 只取前64个图像real_images = real_images.cpu().numpy()# 从潜在空间随机生成一些样本sample = torch.randn(64, latent_dim).to(device)generated_images = model.decode(sample).cpu().numpy()# 显示真实图像和生成的图像，分别标明fig, axes = plt.subplots(8, 8, figsize=(8, 8))axes = axes.flatten()for i in range(64):if i < 32:  # 前32个显示真实图像axes[i].imshow(real_images[i].squeeze(), cmap='gray')axes[i].set_title('Real', fontsize=8)else:  # 后32个显示生成图像axes[i].imshow(generated_images[i - 32].squeeze(), cmap='gray')axes[i].set_title('Generated', fontsize=8)axes[i].axis('off')plt.tight_layout()plt.show()# 训练模型
for epoch in range(1, epochs + 1):train(epoch)# 训练完成后，显示生成的图像
test()

解释：

真实图像 (real_images)：我们通过 next(iter(train_loader)) 获取一批真实图像，并将其转换为 NumPy 数组，以便 matplotlib 显示。
生成图像 (generated_images)：通过模型生成的图像，使用 decode() 方法生成潜在空间的样本。
图像展示：前 32 张图像展示真实图像，后 32 张图像展示生成的图像。每个图像上方都有 Real 或 Generated 标注。

结果：

前32个图像：显示真实图像，并标注为 Real。
后32个图像：显示通过训练后的 VAE 生成的图像，并标注为 Generated。

pytorch实现变分自编码器

人工智能例子汇总：AI常见的算法和例子-CSDN博客变分自编码器（Variational Autoencoder, VAE）是一种生成模型，属于深度学习中的无监督学习方法。它通过学习输入数据的潜在分布（Latent Distribution）&…...

编程日记 2026/3/8 18:11:58

使用 Numpy 自定义数据集，使用pytorch框架实现逻辑回归并保存模型，然后保存模型后再加载模型进行预测，对预测结果计算精确度和召回率及F1分数

1. 导入必要的库首先，导入我们需要的库：Numpy、Pytorch 和相关工具包。 import numpy as np import torch import torch.nn as nn import torch.optim as optim from sklearn.metrics import accuracy_score, recall_score, f1_score2. 自定义数据集 …...

编程日记 2026/3/26 6:20:47

JVM方法区

一、栈、堆、方法区的交互关系二、方法区的理解: 尽管所有的方法区在逻辑上属于堆的一部分，但是一些简单的实现可能不会去进行垃圾收集或者进行压缩，方法区可以看作是一块独立于Java堆的内存空间。方法区(Method Area)与Java堆一样，是各个…...

编程日记 2026/5/8 11:31:54

【Python】第七弹---Python基础进阶：深入字典操作与文件处理技巧

✨个人主页： 熬夜学编程的小林 💗系列专栏： 【C语言详解】【数据结构详解】【C详解】【Linux系统编程】【MySQL】【Python】目录 1、字典 1.1、字典是什么 1.2、创建字典 1.3、查找 key 1.4、新增/修改元素 1.5、删除元素 1.6、遍历…...

编程日记 2026/5/2 5:11:15

指导初学者使用Anaconda运行GitHub上One - DM项目的步骤

以下是指导初学者使用Anaconda运行GitHub上One - DM项目的步骤： 1. 安装Anaconda 下载Anaconda： 让初学者访问Anaconda官网（https://www.anaconda.com/products/distribution），根据其操作系统（Windows、M…...

编程日记 2026/5/4 2:39:28

在实际开发中，如何正确使用 INT(1) 和 INT(10)

在实际开发中，如何正确使用 INT(1) 和 INT(10) 前言在数据库设计和开发过程中，数据类型的选择至关重要。最近，我在工作中遇到了一个关于MySQL中INT类型的误解问题，这让我意识到很多开发者对INT类型的理解存在误区。本文将深…...

编程日记 2026/5/2 9:10:23

像接口契约文档这种工件，在需求分析设计工作流里面属于哪一个工作流

οゞ浪漫心情ゞο(20***328) 2016/2/18 10:26:47 请教一下，像接口契约文档这种工件，在需求分析设计工作流里面属于哪一个工作流？ 潘加宇(35***47) 17:17:28 你这相当于问用例图、序列图属于哪个工作流，看内容。如果你的&quo…...

编程日记 2026/5/2 15:06:16

GAMES101学习笔记（六）：Geometry 几何（基本表示方法、曲线与曲面、网格处理）

文章目录几何的表示方法隐式几何 Implicit Geometry代数曲面(Algebraic surface)构造实体几何CSG(Constructive Solid Geometry)距离函数(Distance Function)水平集方法(Level Set Methods)分型几何(Fractal) 显式几何 Explicit Geometry点云(Point Cloud)多边形网格(Polygon …...

编程日记 2026/5/3 4:42:12

【Numpy核心编程攻略：Python数据处理、分析详解与科学计算】1.24 随机宇宙：生成现实世界数据的艺术

1.24 随机宇宙：生成现实世界数据的艺术目录 #mermaid-svg-vN1An9qZ6t4JUcGa {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-vN1An9qZ6t4JUcGa .error-icon{fill:#552222;}#mermaid-svg-vN1An9qZ6t4JUc…...

编程日记 2026/5/2 11:52:25

深入解析：一个简单的浮动布局 HTML 示例

深入解析：一个简单的浮动布局 HTML 示例示例代码解析代码结构分析1. HTML 结构2. CSS 样式核心功能解析1. 浮动布局（Float）2. 清除浮动（Clear）3. 其他样式效果展示代码优化与扩展总结在网页设计中，浮动…...

编程日记 2026/2/28 15:33:28

爬虫基础（三）Session和Cookie讲解

目录一、前备知识点 （1）静态网页 （2）动态网页 （3）无状态HTTP 二、Session和Cookie 三、Session 四、Cookie （1）维持过程 （2）结构正式开始说 Sessi…...

编程日记 2026/5/6 17:14:52

HTMLCSS ：下雪了

这段代码创建了一个动态的雪花飘落加载动画，通过 CSS 技术实现了雪花的下落和消失效果，为页面添加了视觉吸引力和动态感。大家复制代码时，可能会因格式转换出现错乱，导致样式失效。建议先少量复制代码进行测试，若未能…...

编程日记 2026/5/7 2:06:54

力扣 84. 柱状图中最大的矩形

🔗 https://leetcode.cn/problems/largest-rectangle-in-histogram 题目给一个数组 num 表示位置 i 上圆柱的高度，求圆柱可以勾勒出的矩形的最大面积思路枚举圆柱 i，以该圆柱为高，计算其可以组成的矩形的最大面积。记录这过…...

编程日记 2026/5/2 10:14:42

【Windows Server实战】生产环境云和NPS快速搭建

前置条件本文假定你已达成以下前提条件： 有域控DC。有证书服务器（AD CS）。已使用Microsoft Intune或者GPO为客户机申请证书。服务器上至少有两张网卡（如果用虚拟机做的测试环境，可以用一张HostOnly网卡做测试&#…...

编程日记 2026/5/5 6:01:58

RHCSA——搭建FTP文件共享服务器

一、实验目的 1、掌握vsftpd服务器的配置方法 2、熟悉FTP客户端工具的使用 3、掌握常见的FTP服务器的故障排除二、实验项目背景某企业像架构一台FTP服务器，为企业局域网中的计算机提供文件传送的任务，为财务部门、销售部门和OA系统提供异地数据备…...

编程日记 2026/5/8 22:29:54

IM 即时通讯系统-50-[特殊字符]cim(cross IM) 适用于开发者的分布式即时通讯系统

IM 开源系列 IM 即时通讯系统-41-开源野火IM 专注于即时通讯实时音视频技术，提供优质可控的IMRTC能力 IM 即时通讯系统-42-基于netty实现的IM服务端,提供客户端jar包,可集成自己的登录系统 IM 即时通讯系统-43-简单的仿QQ聊天安卓APP IM 即时通讯系统-44-仿QQ即…...

编程日记 2026/5/3 16:16:01

SSH代理實用指南

SSH是一種安全的遠程訪問協議，用於遠程登錄和代理工具，是一種通過SSH協議實現的網路代理，常用於將網路流量通過安全的SSH通道進行轉發。與傳統的HTTP代理不同，SSH代理能夠在多種協議下工作（如HTTP、HTTPS、FTP等&#…...

编程日记 2026/2/9 0:21:41

Python在线编辑器

from flask import Flask, render_template, request, jsonify import sys from io import StringIO import contextlib import subprocess import importlib import threading import time import ast import reapp Flask(__name__)RESTRICTED_PACKAGES {tkinter: 抱歉&…...

编程日记 2026/5/3 7:06:45

pytorch实现变分自编码器

VAE 的结构：

VAE 的目标函数：

优点：

应用：

解释：

结果：

相关文章：

pytorch实现变分自编码器

使用 Numpy 自定义数据集，使用pytorch框架实现逻辑回归并保存模型，然后保存模型后再加载模型进行预测，对预测结果计算精确度和召回率及F1分数

JVM方法区

【Python】第七弹---Python基础进阶：深入字典操作与文件处理技巧

指导初学者使用Anaconda运行GitHub上One - DM项目的步骤

在实际开发中，如何正确使用 INT(1) 和 INT(10)

像接口契约文档这种工件，在需求分析设计工作流里面属于哪一个工作流

GAMES101学习笔记（六）：Geometry 几何（基本表示方法、曲线与曲面、网格处理）

【Numpy核心编程攻略：Python数据处理、分析详解与科学计算】1.24 随机宇宙：生成现实世界数据的艺术

深入解析：一个简单的浮动布局 HTML 示例

爬虫基础（三）Session和Cookie讲解

HTMLCSS ：下雪了

力扣 84. 柱状图中最大的矩形

【Windows Server实战】生产环境云和NPS快速搭建

RHCSA——搭建FTP文件共享服务器

IM 即时通讯系统-50-[特殊字符]cim(cross IM) 适用于开发者的分布式即时通讯系统

SSH代理實用指南

Python在线编辑器

ZZNUOJ(C/C++)基础练习1041——1050(详解版)

JavaScript系列（51）--解释器实现详解

浅析DDOS攻击及防御策略

深度学习 Pytorch 神经网络的学习

【回溯】目标和字母大小全排列

Linux系统上安装与配置 MySQL（ CentOS 7 ）

Miniconda 安装及使用

记录一次，PyQT的报错，多线程Udp失效，使用工具如netstat来检查端口使用情况。

kamailio-ACC_JSON模块详解【后端语言go】

群晖NAS安卓Calibre 个人图书馆

android主题设置为..DarkActionBar.Bridge时自定义DatePicker选中日期颜色

pytorch实现基于Word2Vec的词嵌入