当前位置：首页 > news >正文

G2 基于生成对抗网络（GAN）人脸图像生成

news 2026/2/8 21:11:52

🍨 本文为🔗365天深度学习训练营中的学习记录博客
🍖 原作者：K同学啊

基于生成对抗网络（GAN）人脸图像生成

这周将构建并训练一个生成对抗网络（GAN）来生成人脸图像。

GAN 原理概述

生成对抗网络通过两个神经网络的对抗性结构来实现目标：

生成器（G）：输入随机噪声，通过学习数据的分布模式生成类似真实图像的输出。
判别器（D）：用来判断输入的图像是真实的还是生成器生成的。

训练过程中，生成器尝试欺骗判别器，生成逼真的图像，而判别器则不断优化，以区分真实图像与生成图像。这种对抗过程最终使生成器的生成能力逐渐逼近真实图像。

环境准备

首先导入相关库并设置随机种子以确保结果的可复现性。

import random
import os
import torch
import torch.nn as nn
import torch.optim as optim
import torch.utils.data
import torchvision.datasets as dset
import torchvision.transforms as transforms
import torchvision.utils as vutils
import matplotlib.pyplot as plt
import numpy as np

超参数设置

在训练GAN之前，首先定义一些关键的超参数：

batch_size：每个批次的样本数。
image_size：图像的大小，用于调整输入数据的尺寸。
nz：潜在向量大小，即生成器的输入维度。
ngf 和 ndf：分别控制生成器和判别器中的特征图数量。
num_epochs：训练的总轮数。
lr：学习率。

batch_size = 128
image_size = 64
nz = 100
ngf = 64
ndf = 64
num_epochs = 50
lr = 0.0002
beta1 = 0.5

数据加载

通过torchvision.datasets.ImageFolder加载数据，并使用 torch.utils.data.DataLoader 进行批量处理。数据加载时，通过转换函数调整图像大小，并对其进行归一化处理。

dataroot = "data/GANdata"
dataset = dset.ImageFolder(root=dataroot,transform=transforms.Compose([transforms.Resize(image_size),transforms.CenterCrop(image_size),transforms.ToTensor(),transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)),]))
dataloader = torch.utils.data.DataLoader(dataset, batch_size=batch_size, shuffle=True)

网络结构定义

1. 生成器

生成器将随机噪声（潜在向量）通过一系列转置卷积层转换为图像。每层使用ReLU激活函数，最后一层用Tanh激活函数，将输出限制在 [-1, 1]。

class Generator(nn.Module):def __init__(self):super(Generator, self).__init__()self.main = nn.Sequential(nn.ConvTranspose2d(nz, ngf * 8, 4, 1, 0, bias=False),nn.BatchNorm2d(ngf * 8),nn.ReLU(True),nn.ConvTranspose2d(ngf * 8, ngf * 4, 4, 2, 1, bias=False),nn.BatchNorm2d(ngf * 4),nn.ReLU(True),nn.ConvTranspose2d(ngf * 4, ngf * 2, 4, 2, 1, bias=False),nn.BatchNorm2d(ngf * 2),nn.ReLU(True),nn.ConvTranspose2d(ngf * 2, ngf, 4, 2, 1, bias=False),nn.BatchNorm2d(ngf),nn.ReLU(True),nn.ConvTranspose2d(ngf, 3, 4, 2, 1, bias=False),nn.Tanh())def forward(self, input):return self.main(input)

2. 判别器

判别器为卷积网络，通过一系列卷积层提取图像特征。每层使用LeakyReLU激活函数，最终输出一个值（真实为1，生成为0）。

class Discriminator(nn.Module):def __init__(self):super(Discriminator, self).__init__()self.main = nn.Sequential(nn.Conv2d(3, ndf, 4, 2, 1, bias=False),nn.LeakyReLU(0.2, inplace=True),nn.Conv2d(ndf, ndf * 2, 4, 2, 1, bias=False),nn.BatchNorm2d(ndf * 2),nn.LeakyReLU(0.2, inplace=True),nn.Conv2d(ndf * 2, ndf * 4, 4, 2, 1, bias=False),nn.BatchNorm2d(ndf * 4),nn.LeakyReLU(0.2, inplace=True),nn.Conv2d(ndf * 4, ndf * 8, 4, 2, 1, bias=False),nn.BatchNorm2d(ndf * 8),nn.LeakyReLU(0.2, inplace=True),nn.Conv2d(ndf * 8, 1, 4, 1, 0, bias=False),nn.Sigmoid())def forward(self, input):return self.main(input)

训练过程

训练分为两个部分：判别器和生成器的更新。

1. 判别器的训练

判别器首先接收真实图像样本，计算输出与真实标签的误差。然后判别器接收生成器生成的假图像，再计算输出与假标签的误差。最终判别器的损失是两者的总和。

output = netD(real_cpu).view(-1)
errD_real = criterion(output, label)
errD_real.backward()fake = netG(noise)
output = netD(fake.detach()).view(-1)
errD_fake = criterion(output, label.fill_(fake_label))
errD_fake.backward()

2. 生成器的训练

生成器的目标是欺骗判别器，因此其损失函数基于判别器将生成图像误识为真实的概率值。

output = netD(fake).view(-1)
errG = criterion(output, label.fill_(real_label))
errG.backward()

训练监控与可视化

在这里插入图片描述

训练时，我们记录生成器和判别器的损失，并生成一些样本图像来查看生成器的效果。

plt.figure(figsize=(10, 5))
plt.title("Generator and Discriminator Loss During Training")
plt.plot(G_losses, label="G")
plt.plot(D_losses, label="D")
plt.xlabel("iterations")
plt.ylabel("Loss")
plt.legend()
plt.savefig('Generator and Discriminator Loss During Training.png')

在这里插入图片描述

结果可视化

训练结束后，我们将真实图像与生成图像对比，以检验生成器的效果。

plt.figure(figsize=(15, 15))
plt.subplot(1, 2, 1)
plt.axis("off")
plt.title("Real Images")
plt.imshow(np.transpose(vutils.make_grid(real_batch[0].to(device)[:64], padding=5, normalize=True).cpu(), (1, 2, 0)))plt.subplot(1, 2, 2)
plt.axis("off")
plt.title("Fake Images")
plt.imshow(np.transpose(img_list[-1], (1, 2, 0)))
plt.savefig('Fake Images.png')
plt.show()

在这里插入图片描述

总结

这周学习构建了一个深度卷积生成对抗网络（DCGAN），用于生成逼真的人脸图像，通过这周学习对对抗网路的构建有了更深的了解与运用

G2 基于生成对抗网络（GAN）人脸图像生成

🍨 本文为🔗365天深度学习训练营中的学习记录博客🍖 原作者：K同学啊基于生成对抗网络（GAN）人脸图像生成这周将构建并训练一个生成对抗网络（GAN）来生成人脸图像。 GAN 原理概述 …...

编程日记 2024/10/30 14:22:16

R学习笔记-单因素重复测量方差分析

R语言之重复测量方差分析——ezANOVA的使用与解析 - 知乎单因素重复测量方差分析(One-Way Repeated Measures ANOVA)——R软件实现 - 梦特医数通 ### 清空environment rm(list ls()) ### 加载包 if (!require("tidyverse")) install.packages("tidyverse&quo…...

编程日记 2024/10/30 14:21:13

HTML练习题:彼岸的花(web)

展示效果: 代码: <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>彼岸の花</title><style…...

编程日记 2024/10/30 14:18:09

（蓝桥杯C/C++）——常用库函数

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档目录一、二分查找 1.二分查找的前提 2.binary_ search函数 3.lower_bound和upper_bound 二、排序 1.sort概念 2.sort的用法 3.自定义比较函数三、全排列 1.next p…...

编程日记 2024/10/30 14:16:07

GPT-Sovits-2-微调模型

1. 大致步骤上一步整理完数据集后，此步输入数据, 微调2个模型VITS和GPT，位置在 <<1-GPT-SoVITS-tts>>下的<<1B-微调训练>> 页面的两个按钮分别执行两个文件: <./GPT_SoVITS/s2_train.py> 这一步微调VITS的预训练模型…...

编程日记 2024/10/30 14:15:06

【数据结构 | PTA】懂蛇语

懂蛇语在《一年一度喜剧大赛》第二季中有一部作品叫《警察和我之蛇我其谁》，其中“毒蛇帮”内部用了一种加密语言，称为“蛇语”。蛇语的规则是，在说一句话 A 时，首先提取 A 的每个字的首字母，然后把整句话替换为另一…...

编程日记 2024/10/30 14:14:05

Python——自动化发送邮件

在数字化时代，电子邮件是商务沟通和个人联络的重要工具。自动化邮件发送可以节省时间，提高效率。Python，作为一种强大且灵活的编程语言，提供了多种库来支持邮件的自动化发送。本文将详细介绍如何使用Python的smtplib和email库来编…...

编程日记 2024/10/30 14:13:04

MTKLauncher_布局页面分析

文章目录前言遇到的困难点针对性解决困难需求相关资料Launcher3 源码目录简单介绍Launcher3 简介及页面布局分析UI整体架构数据加载布局加载布局加载核心思想device_profiles.xml 加载InvariantDeviceProfileinitGrid(context, gridName)getPredefinedDeviceProfilesinvDist…...

编程日记 2024/10/30 14:10:01

C#实现隐藏和显示任务栏

实现步骤为了能够控制Windows任务栏，我们需要利用Windows API提供的功能。具体来说，我们会使用到user32.dll中的两个函数：FindWindow和ShowWindow。这两个函数可以帮助我们找到任务栏窗口，并对其执行显示或隐藏的操作引入命名空…...

编程日记 2024/10/30 14:07:59

基于springboot+vue实现的公司财务管理系统（源码+L文+ppt）4-102

基于springbootvue实现的公司财务管理系统（源码L文ppt）4-102 摘要本系统是基于SpringBoot框架开发的公司财务管理系统,该系统包含固定资产管理、资产申领管理、资产采购管理、员工工资管理等功能。公司财务管理系统是一种帮助公司进行有效资金管理、会…...

编程日记 2024/10/30 14:06:58

rnn/lstm

tip：本人比较小白，看到july大佬的文章受益匪浅，现在其文章基础上加上自己的归纳、理解，以及gpt的答疑，如果有侵权会删。 july大佬文章来源：如何从RNN起步，一步一步通俗理解LSTM_rnn lstm-CSDN博…...

编程日记 2024/10/30 14:05:57

袋鼠云产品功能更新报告12期｜让数据资产管理更高效

本期，我们更新和优化了数据资产平台相关功能，为您提供更高效的产品能力。以下为第12期袋鼠云产品功能更新报告，请继续阅读。一、【元数据】重点更新 ｜01 元数据管理优化，支持配置表生命周期之前系统中缺少一个可以…...

编程日记 2024/10/30 14:04:56

MATLAB——入门知识

内容源于b站清风数学建模目录 1.帮助文档 2.注释 3.特殊字符 4.设置MATLAB数值显示格式 4.1.临时更改 4.2.永久改 5.常用函数 6.易错点 1.帮助文档 doc sum help sum edit sum 2.注释 ctrl R/T 3.特殊字符 4.设置MATLAB数值显示格式 4.1.临时更改 format lon…...

编程日记 2024/10/30 14:03:55

这是书本中第四个unity Lab 在这次实验中,将学习如何搭建一个开始界面分数系统点击球,会增加分数 public void ClickOnBall(){Score;}在OneBallBehaviour类添加下列方法 void OnMouseDown(){GameController controller Camera.main.GetComponent<GameController>();…...

编程日记 2024/10/30 14:02:53

Axure PR 9 多级下拉清除选择器设计交互

大家好，我是大明同学。 Axure选择器是一种在交互设计中常用的组件，这期内容，我们来探讨Axure中选择器设计与交互技巧。 OK，这期内容正式开始下拉列表选择输入框元件创建选择输入框所需的元件 1.在元件库中拖出一个矩形元件。…...

编程日记 2024/10/30 14:00:51

分布式项目pom配置

1. 父项目打包方式为 pom <packaging>pom</packaging> 2. 父项目版本配置 <properties><maven.compiler.source>17</maven.compiler.source><maven.compiler.target>17</maven.compiler.target><project.build.sourceEncod…...

编程日记 2024/10/30 13:59:50

2. Flink快速上手

文章目录 1. 环境准备1.1 系统环境1.2 安装配置Java 8和Scala 2.121.3 使用集成开发环境IntelliJ IDEA1.4 安装插件2. 创建项目2.1 创建工程2.1.1 创建Maven项目2.1.2 设置项目基本信息2.1.3 生成项目基本框架2.2 添加项目依赖2.2.1 添加Flink相关依赖2.2.2 添加slf4j-nop依赖2…...

编程日记 2024/10/30 13:56:46

Java-I/O框架06：常见字符编码、字符流抽象类

视频链接：16.16 字符流抽象类_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1Tz4y1X7H7?spm_id_from333.788.videopod.episodes&vd_sourceb5775c3a4ea16a5306db9c7c1c1486b5&p16 1.常见字符编码 IOS-8859-1收录了除ASCII外，还包括西欧…...

编程日记 2024/10/30 13:55:46

计算机网络-MSTP的基础概念

前面我们大致了解了MSTP的由来，是为了解决STP/RSTP只有一根生成树导致的VLAN流量负载分担与次优路径问题，了解MSTP采用实例映射VLAN的方式实现多实例生成树，MSTP有很多的理论概念需要知道，其实与其它的知识一样理论复杂配置还好的…...

编程日记 2024/10/30 13:54:45

P1037 [NOIP2002 普及组] 产生数

[NOIP2002 普及组] 产生数题目描述给出一个整数 n n n 和 k k k 个变换规则。规则： 一位数可变换成另一个一位数。规则的右部不能为零。例如： n 234 , k 2 n234,k2 n234,k2。有以下两个规则： 2 ⟶ 5 2\longrightarrow 5 2⟶5。 …...

编程日记 2024/10/30 13:51:42

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目：3442. 奇偶频次间的最大差值 I 思路 ：哈希，时间复杂度0(n)。用哈希表来记录每个字符串中字符的分布情况，哈希表这里用数组即可实现。 C版本： class Solution { public:int maxDifference(string s) {int a[26]…...

编程新知 2026/2/7 23:18:31

PPT|230页| 制造集团企业供应链端到端的数字化解决方案：从需求到结算的全链路业务闭环构建

制造业采购供应链管理是企业运营的核心环节，供应链协同管理在供应链上下游企业之间建立紧密的合作关系，通过信息共享、资源整合、业务协同等方式，实现供应链的全面管理和优化，提高供应链的效率和透明度，降低供应链的成…...

编程新知 2026/1/30 22:07:56

服务器硬防的应用场景都有哪些？

服务器硬防是指一种通过硬件设备层面的安全措施来防御服务器系统受到网络攻击的方式，避免服务器受到各种恶意攻击和网络威胁，那么，服务器硬防通常都会应用在哪些场景当中呢？ 硬防服务器中一般会配备入侵检测系统和预防系统&#x…...

编程新知 2025/11/9 19:17:07

376. Wiggle Subsequence

376. Wiggle Subsequence 代码 class Solution { public:int wiggleMaxLength(vector<int>& nums) {int n nums.size();int res 1;int prediff 0;int curdiff 0;for(int i 0;i < n-1;i){curdiff nums[i1] - nums[i];if( (prediff > 0 && curdif…...

编程新知 2026/2/8 10:51:38

如何在看板中有效管理突发紧急任务

在看板中有效管理突发紧急任务需要：设立专门的紧急任务通道、重新调整任务优先级、保持适度的WIP（Work-in-Progress）弹性、优化任务处理流程、提高团队应对突发情况的敏捷性。其中，设立专门的紧急任务通道尤为重要，这能…...

编程新知 2026/2/3 22:50:06

Ascend NPU上适配Step-Audio模型

1 概述 1.1 简述 Step-Audio 是业界首个集语音理解与生成控制一体化的产品级开源实时语音对话系统，支持多语言对话（如中文，英文，日语），语音情感（如开心，悲伤）&#x…...

编程新知 2026/1/31 4:37:39

Maven 概述、安装、配置、仓库、私服详解

目录 1、Maven 概述 1.1 Maven 的定义 1.2 Maven 解决的问题 1.3 Maven 的核心特性与优势 2、Maven 安装 2.1 下载 Maven 2.2 安装配置 Maven 2.3 测试安装 2.4 修改 Maven 本地仓库的默认路径 3、Maven 配置 3.1 配置本地仓库 3.2 配置 JDK 3.3 IDEA 配置本地 Ma…...

编程新知 2026/2/8 1:58:01

python爬虫——气象数据爬取

一、导入库与全局配置 python 运行 import json import datetime import time import requests from sqlalchemy import create_engine import csv import pandas as pd作用： 引入数据解析、网络请求、时间处理、数据库操作等所需库。requests：发送 …...

编程新知 2025/12/16 7:53:39

华为OD机试-最短木板长度-二分法(A卷,100分)

此题是一个最大化最小值的典型例题， 因为搜索范围是有界的，上界最大木板长度补充的全部木料长度，下界最小木板长度； 即left0,right10^6; 我们可以设置一个候选值x(mid)，将木板的长度全部都补充到x，如果成功…...

编程新知 2026/2/4 17:42:50

LangFlow技术架构分析

🔧 LangFlow 的可视化技术栈前端节点编辑器底层框架：基于 （一个现代化的 React 节点绘图库） 功能： 拖拽式构建 LangGraph 状态机实时连线定义节点依赖关系可视化调试循环和分支逻辑与 LangGraph 的深…...

编程新知 2025/6/10 21:26:51

基于生成对抗网络（GAN）人脸图像生成

GAN 原理概述

环境准备

超参数设置

数据加载

网络结构定义

1. 生成器

2. 判别器

训练过程

1. 判别器的训练

2. 生成器的训练

训练监控与可视化

结果可视化

总结

相关文章：