当前位置：首页 > article >正文

pytorch生成对抗网络

article 2026/5/8 19:59:04

人工智能例子汇总：AI常见的算法和例子-CSDN博客

生成对抗网络（GAN，Generative Adversarial Network）是一种深度学习模型，由两个神经网络组成：生成器（Generator）和判别器（Discriminator）。这两个网络通过对抗过程共同训练，从而使生成器能够生成越来越真实的假数据。

GAN的基本工作原理：

生成器（G）：它的任务是生成与真实数据相似的假数据。生成器通常从一个随机噪声（例如，均匀分布或高斯分布的噪声）开始，经过多层神经网络的处理，输出伪造的数据样本。
判别器（D）：它的任务是区分输入数据是来自真实数据分布，还是生成器伪造的假数据。判别器通常是一个二分类器，其输出是一个表示“真实”或“假”的概率值。

训练过程：

对抗过程：生成器和判别器相互博弈。生成器希望生成尽可能像真的数据，以骗过判别器；而判别器希望准确区分真假数据。最终，生成器会通过优化损失函数，使得生成的数据与真实数据尽可能相似，判别器的性能则被提升到一个极限，使得它不能再轻易地区分真假数据。
数学公式：
判别器的目标是最大化其输出的正确分类概率，即区分真假数据。
生成器的目标是最小化其输出的“假数据”被判定为假的概率。

常见的GAN变种：

DCGAN（Deep Convolutional GAN）：使用卷积神经网络（CNN）来增强生成器和判别器的表现。
WGAN（Wasserstein GAN）：引入了Wasserstein距离，改进了训练稳定性。
CycleGAN：能够在没有成对样本的情况下进行图像到图像的转换，例如将马变成斑马。

以下是一个简化的PyTorch GAN实现的框架，生成一个语音的梅尔频谱（假设已经处理了音频并提取了梅尔频谱特征）

import torch
import torch.nn as nn
import torch.optim as optim
import torchaudio
import matplotlib.pyplot as plt# 生成器（Generator）
class Generator(nn.Module):def __init__(self, z_dim=100):super(Generator, self).__init__()self.fc = nn.Sequential(nn.Linear(z_dim, 128),nn.ReLU(),nn.Linear(128, 256),nn.ReLU(),nn.Linear(256, 512),nn.ReLU(),nn.Linear(512, 1024),nn.ReLU(),nn.Linear(1024, 80),  # 80表示梅尔频谱的时间步（例如：80个梅尔频率）nn.Tanh()  # 生成梅尔频谱，范围在[-1, 1]之间)def forward(self, z):return self.fc(z)# 判别器（Discriminator）
class Discriminator(nn.Module):def __init__(self):super(Discriminator, self).__init__()self.fc = nn.Sequential(nn.Linear(80, 512),  # 输入为梅尔频谱的时间步nn.LeakyReLU(0.2),nn.Linear(512, 256),nn.LeakyReLU(0.2),nn.Linear(256, 1),nn.Sigmoid()  # 输出判定是“真”还是“假”)def forward(self, x):return self.fc(x)# 初始化生成器和判别器
z_dim = 100
generator = Generator(z_dim)
discriminator = Discriminator()# 优化器
lr = 0.0002
g_optimizer = optim.Adam(generator.parameters(), lr=lr, betas=(0.5, 0.999))
d_optimizer = optim.Adam(discriminator.parameters(), lr=lr, betas=(0.5, 0.999))# 损失函数
criterion = nn.BCELoss()# 加载数据（假设已经提取了梅尔频谱特征，取一个示例）
def load_example_mel_spectrogram():# 假设这是一个真实梅尔频谱的示例，实际数据应从音频文件中提取mel = torch.rand((80))  # 生成一个假的梅尔频谱数据return mel.unsqueeze(0)  # 扩展维度以适应网络# 训练GAN
num_epochs = 1000
for epoch in range(num_epochs):# 真实数据real_data = load_example_mel_spectrogram()real_labels = torch.ones(real_data.size(0), 1)  # 标签为1表示真实数据# 假数据z = torch.randn(real_data.size(0), z_dim)  # 随机噪声fake_data = generator(z)fake_labels = torch.zeros(real_data.size(0), 1)  # 标签为0表示假数据# 训练判别器discriminator.zero_grad()real_loss = criterion(discriminator(real_data), real_labels)fake_loss = criterion(discriminator(fake_data.detach()), fake_labels)d_loss = (real_loss + fake_loss) / 2d_loss.backward()d_optimizer.step()# 训练生成器generator.zero_grad()g_loss = criterion(discriminator(fake_data), real_labels)  # 生成器希望判别器判定为真实g_loss.backward()g_optimizer.step()if epoch % 100 == 0:print(f"Epoch [{epoch}/{num_epochs}], D Loss: {d_loss.item()}, G Loss: {g_loss.item()}")# 可视化生成的梅尔频谱（只显示最后一次生成的结果）if epoch == num_epochs - 1:plt.figure(figsize=(10, 4))plt.imshow(fake_data.detach().numpy(), aspect='auto', origin='lower')plt.title(f"Generated Mel Spectrogram - Epoch {epoch}")plt.colorbar()plt.show()# 测试阶段：使用训练好的生成器进行语音生成
z_test = torch.randn(1, z_dim)  # 创建一个新的随机噪声向量
generated_mel_spectrogram = generator(z_test)# 可视化生成的梅尔频谱
plt.figure(figsize=(10, 4))
plt.imshow(generated_mel_spectrogram.detach().numpy(), aspect='auto', origin='lower')
plt.title("Generated Mel Spectrogram from Test Data")
plt.colorbar()
plt.show()

解释：

测试阶段：
- 在训练完成后，我们使用一个新的随机噪声向量z_test来生成一个新的梅尔频谱。
- generated_mel_spectrogram = generator(z_test)是生成梅尔频谱的过程。
可视化：
- 使用plt.imshow()来可视化生成的梅尔频谱图，origin='lower'是确保频谱图正确显示。
- plt.colorbar()添加颜色条，以便更清晰地理解梅尔频谱的数值范围。

结果：

在训练过程中，你会看到每个epoch的损失值，并在最后一次epoch时显示生成的梅尔频谱。
在测试阶段，生成器会基于随机噪声生成一个新的梅尔频谱并进行可视化，帮助你观察最终模型生成的语音特征。

pytorch生成对抗网络

人工智能例子汇总：AI常见的算法和例子-CSDN博客生成对抗网络（GAN，Generative Adversarial Network）是一种深度学习模型，由两个神经网络组成：生成器（Generator）和判别器&#xff0…...

编程日记 2026/5/7 19:25:32

Baklib在企业知识管理领域的领先地位与三款竞品的深度剖析

内容概要在现代企业中，知识管理已成为提高工作效率和推动创新的重要手段。Baklib作为一款领先的知识中台，以其集成化和智能化的特性，帮助企业在这一领域取得了显著成就。该平台具备强大的知识收集、整理、存储和共享功能，通过构…...

编程日记 2026/4/29 17:50:36

2 MapReduce 1. MapReduce 介绍1.1 MapReduce 设计构思 2. MapReduce 编程规范3. Mapper以及Reducer抽象类介绍1.Mapper抽象类的基本介绍2.Reducer抽象类基本介绍 4. WordCount示例编写5. MapReduce程序运行模式6. MapReduce的运行机制详解6.1 MapTask 工作机制6.2 ReduceTask …...

编程日记 2026/4/29 17:50:35

人工智能学习（四）之机器学习基本概念

机器学习基本概念详细解析：从生活实例轻松入门在当今数字化时代，机器学习作为人工智能领域的核心技术之一，正深刻地改变着我们的生活和工作方式。从智能语音助手到图像识别系统，从个性化推荐引擎到自动驾驶汽车，机器…...

编程日记 2026/4/26 2:24:45

大模型openai范式接口调用方法

本文将介绍如下内容： 一、为什么选择 OpenAI 范式接口？二、调用 Openai 接口官方调用 Demo 示例三、自定义调用 Openai 接口一、为什么选择 OpenAI 范式接口？ OpenAI 范式接口因其简洁、统一和高效的设计，成为了与大型语言模型…...

编程日记 2026/2/24 1:39:24

DeepSeek API接口中的openAI是什么意思？

老六哥的小提示：我们可能不会被AI轻易淘汰，但是会被“会使用AI的人”淘汰。 DeepSeek是一款基于先进推理技术的大型语言模型，能够根据用户提供的简洁提示词生成高质曾经有外媒评价说：DeepSeek盗用了openAI的技术，或者…...

编程日记 2026/2/26 16:43:12

重构字符串（767）

767. 重构字符串 - 力扣（LeetCode） 解法： class Solution { public:string reorganizeString(string s){string res;//因为1 < s.length < 500 ， uint64_t 类型足够uint16_t n s.size();if (n 0) {return res;}unordere…...

编程日记 2026/3/3 2:25:40

测压表压力表计量表针头针尾检测数据集VOC+YOLO格式4862张4类别

数据集格式：Pascal VOC格式YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数)：4862 标注数量(xml文件个数)：4862 标注数量(txt文件个数)：4862 …...

编程日记 2026/4/29 17:51:27

【C++语言】卡码网语言基础课系列----12. 位置互换

文章目录练习题目位置互换具体代码实现小白寄语诗词共勉练习题目位置互换题目描述： 给定一个长度为偶数位的字符串，请编程实现字符串的奇偶位互换。输入描述： 输入包含多组测试数据。输入的第一行是一个整数n，表示有测试…...

编程日记 2026/2/21 10:13:35

[权限提升] Windows 提权维持 — 系统错误配置提权 - PATH 环境变量提权

关注这个专栏的其他相关笔记：[内网安全] 内网渗透 - 学习手册-CSDN博客 0x01：PATH 环境变量提权原理在 Windows 操作系统中，Path 环境变量是一个包含多个目录路径的列表，系统通过这些路径来查找可执行文件（如 .exe、.bat 等）。当你在命令提示符或运行对话框中输入命令时…...

编程日记 2026/2/21 22:49:45

吴恩达深度学习——优化神经网络

本文来自https://www.bilibili.com/video/BV1FT4y1E74V，仅为本人学习所用。文章目录优化样本大小mini-batch 优化梯度下降法动量梯度下降法指数加权平均概念偏差纠正动量梯度下降法 RMSpropAdam优化算法优化学习率局部最优问题（了解） 优…...

编程日记 2026/5/8 1:56:51

揭秘算法课程导读

目录一、老师介绍二、课程目标三、课程安排一、老师介绍学问小小谢我是一个热爱分享知识的人，我深信知识的力量能够启迪思考，丰富生活。欢迎每一位对知识有渴望的朋友，如果你对我的创作感兴趣，或者我们有着共同的兴趣点&…...

编程日记 2026/4/29 8:44:22

17.[前端开发]Day17-形变-动画-vertical-align

1 transform CSS属性 - transform transform的用法表示一个或者多个不用记住全部的函数，只用掌握这四个常用的函数即可位移 - translate <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta ht…...

编程日记 2026/5/3 11:28:22

【单层神经网络】基于MXNet库简化实现线性回归

写在前面同最开始的两篇文章完整程序及注释导入使用的库# 基本 from mxnet import autograd, nd, gluon # 模型、网络 from mxnet.gluon import nn from mxnet import init # 学习 from mxnet.gluon import loss as gloss # 数据集 from mxnet.gluon…...

编程日记 2026/2/27 1:23:54

第1节课：算法初印象—开启算法世界的大门

目录一、算法是什么（一）官方定义（二）算法的五大特性（三）算法与程序的关系二、算法在生活中的奇妙体现（一）日常出行中的算法（二）购物消费中的算法&#xff0…...

编程日记 2026/2/23 0:47:18

[C语言日寄] ＜stdio.h＞头文件功能介绍

在C语言的世界里，<stdio.h> 是一个极其重要的头文件，它提供了标准输入输出功能，是C语言程序与用户交互的核心工具。今天，我们就来深入探讨 <stdio.h> 的功能、使用注意事项以及它的拓展应用。功能介绍 <stdio.h…...

编程日记 2026/4/14 6:42:23

Python的那些事第五篇：数据结构的艺术与应用

新月人物传记：人物传记之新月篇-CSDN博客目录一、列表（List）：动态的容器二、元组（Tuple）：不可变的序列三、字典（Dict）：键值对的集合四、集合&#xf…...

编程日记 2026/5/2 14:57:53

Linux：线程池和单例模式

一、普通线程池 1.1 线程池概念线程池：一种线程使用模式。线程过多会带来调度开销，进而影响缓存局部性和整体性能。而线程池维护着多个线程，等待着监督管理者分配可并发执行的任务。这避免了在处理短时间任务时创建与销毁线程的代价&…...

编程日记 2026/5/1 5:42:10

【算法-位运算】位运算遍历 LogTick 算法

文章目录 1. 引入2. LogTick 优化遍历过程3. 题目3.1 LeetCode3097 或值至少为 K 的最短子数组 II3.2 LeetCode2411 按位或最大的最小子数组长度3.3 LeetCode3209 子数组按位与值为 K 的数目3.4 LeetCode3171 找到按位或最接近 K 的子数组3.5 LeetCode1521 找到最接近目标值的函…...

编程日记 2026/5/5 19:22:41

【memgpt】letta 课程4：基于latta框架构建MemGpt代理并与之交互

Lab 3: Building Agents with memory 基于latta框架构建MemGpt代理并与之交互理解代理状态，例如作为系统提示符、工具和agent的内存查看和编辑代理存档内存MemGPT 代理是有状态的 agents的设计思路每个步骤都要定义代理行为 Letta agents persist information over time and…...

编程日记 2026/5/6 11:38:14

Python的那些事第九篇：从单继承到多继承的奇妙之旅

Python 继承：从单继承到多继承的奇妙之旅目录 Python 继承：从单继承到多继承的奇妙之旅一、引言二、继承的概念与语法三、单继承四、多继承五、综合代码示例六、总结一、引言在编程的世界里，继承就像是一场神奇的魔法&#…...

编程日记 2026/5/4 4:38:27

Excel to form ？一键导入微软表单

一句话痛点 “你的Excel越强大，手动复制到Forms就越痛苦。” 合并单元格崩溃成乱码、下拉菜单变纯文本、条件逻辑消失无踪——这些不是技术问题，而是低效工作模式的死刑判决书。直击解决方案：3分钟，3步，300%效率 1…...

编程日记 2026/3/20 1:55:26

pandas（三）Series使用

一、Series基础使用 import pandasd {x:100,y:200,z:300} s1 pandas.Series(d) #将dict转化为Series print(s1)print("") l1 [1, 2, 3] l2 [a, b, c] s2 pandas.Series(l1, indexl2) #list转为Series print(s2)print("") s3 pandas.Series([11…...

编程日记 2026/5/4 2:17:12

Windows电脑本地部署运行DeepSeek R1大模型（基于Ollama和Chatbox）

文章目录一、环境准备二、安装Ollama2.1 访问Ollama官方网站2.2 下载适用于Windows的安装包2.3 安装Ollama安装包2.4 指定Ollama安装目录2.5 指定Ollama的大模型的存储目录三、选择DeepSeek R1模型四、下载并运行DeepSeek R1模型五、使用Chatbox进行交互5.1 下载Chatbox安装包…...

编程日记 2026/5/8 17:25:20

从零开始学 HTML：构建网页的基本框架与技巧

系列文章目录 01-从零开始学 HTML：构建网页的基本框架与技巧文章目录系列文章目录前言一、HTML 文档的基本框架1.1 <!DOCTYPE html>、<html>、<head>、<body> 标签解析1.1.1 <!DOCTYPE html> 标签1.1.2 <html> 标签1.1.3 &l…...

编程日记 2026/4/2 11:14:23

如何用微信小程序写春联

生活没有模板，只需心灯一盏。如果笑能让你释然，那就开怀一笑；如果哭能让你减压，那就让泪水流下来。如果沉默是金，那就不用解释；如果放下能更好地前行，就别再扛着。一、引入 Vant UI 1、通过 npm 安装 npm i @vant/weapp -S --production 2、修改 app.json …...

编程日记 2026/5/7 13:47:43

2025最新在线模型转换工具onnx转换ncnn，mnn，tengine等

文章目录引言最新网址地点一、模型转换1. 框架转换全景图2. 安全的模型转换3. 网站全景图二、转换说明三、模型转换流程图四、感谢引言在yolov5，yolov8，yolov11等等模型转换的领域中，时间成本常常是开发者头疼的问题。最近发现一个超棒的…...

编程日记 2026/5/5 14:18:00

算法每日双题精讲 —— 前缀和（【模板】一维前缀和，【模板】二维前缀和）

在算法竞赛与日常编程中，前缀和是一种极为实用的预处理技巧，能显著提升处理区间和问题的效率。今天，我们就来深入剖析一维前缀和与二维前缀和这两个经典模板。一、【模板】一维前缀和题目描述给定一个长度为 n n n 的整数数组 a a a&…...

编程日记 2026/5/1 1:49:45

C++泛型编程指南03-CTAD

文章目录 C17 自定义类型推断指引（CTAD）深度解析一、基础概念1. 核心作用2. 工作原理二、标准库中的 CTAD 应用1. 容器类型推导2. 智能指针推导3. 元组类型推导三、自定义推导指引语法1. 基本语法结构2. 典型应用场景四、推导指引设计模式1. 迭代器范…...

编程日记 2026/4/29 4:47:34

记8（高级API实现手写数字识别

目录 1、Keras：2、Sequential模型：2.1、建立Sequential模型：modeltf.keras.Sequential()2.2、添加层：model.add(tf.keras.layers.层)2.3、查看摘要：model.summary()2.4、配置训练方法：model.compile(loss,o…...

编程日记 2026/5/7 19:56:31

GAN的基本工作原理：

训练过程：

数学公式：

常见的GAN变种：

解释：

结果：

相关文章：