当前位置：首页 > news >正文

生成对抗网络（GAN）手写数字生成

news 2025/7/8 3:14:01

文章目录

一、前言
二、前期工作
- 1. 设置GPU（如果使用的是CPU可以忽略这步）
二、什么是生成对抗网络
- 1. 简单介绍
- 2. 应用领域
三、网络结构
四、构建生成器
五、构建鉴别器
六、训练模型
- 1. 保存样例图片
- 2. 训练模型
七、生成动图

一、前言

我的环境：

语言环境：Python3.6.5
编译器：jupyter notebook
深度学习环境：TensorFlow2.4.1

往期精彩内容：

卷积神经网络（CNN）实现mnist手写数字识别
卷积神经网络（CNN）多种图片分类的实现
卷积神经网络（CNN）衣服图像分类的实现
卷积神经网络（CNN）鲜花识别
卷积神经网络（CNN）天气识别
卷积神经网络（VGG-16）识别海贼王草帽一伙
卷积神经网络（ResNet-50）鸟类识别
卷积神经网络（AlexNet）鸟类识别
卷积神经网络(CNN)识别验证码
卷积神经网络（Inception-ResNet-v2）交通标志识别

来自专栏：机器学习与深度学习算法推荐

二、前期工作

1. 设置GPU（如果使用的是CPU可以忽略这步）

import tensorflow as tfgpus = tf.config.list_physical_devices("GPU")if gpus:tf.config.experimental.set_memory_growth(gpus[0], True)  #设置GPU显存用量按需使用tf.config.set_visible_devices([gpus[0]],"GPU")# 打印显卡信息，确认GPU可用
print(gpus)

from tensorflow.keras import layers, datasets, Sequential, Model, optimizers
from tensorflow.keras.layers import LeakyReLU, UpSampling2D, Conv2Dimport matplotlib.pyplot as plt
import numpy             as np
import sys,os,pathlib

img_shape  = (28, 28, 1)
latent_dim = 200

二、什么是生成对抗网络

1. 简单介绍

生成对抗网络（GAN） 包含生成器和判别器，两个模型通过对抗训练不断学习、进化。

生成器(Generator)：生成数据（大部分情况下是图像），目的是“骗过”判别器。
鉴别器(Discriminator)：判断这张图像是真实的还是机器生成的，目的是找出生成器生成的“假数据”。

2. 应用领域

GAN 的应用十分广泛，它的应用包括图像合成、风格迁移、照片修复以及照片编辑，数据增强等等。

1）风格迁移

图像风格迁移是将图像A的风格转换到图像B中去，得到新的图像。

2）图像生成

GAN 不但能生成人脸，还能生成其他类型的图片，比如漫画人物。

三、网络结构

简单来讲，就是用生成器生成手写数字图像，用鉴别器鉴别图像的真假。二者相互对抗学习（卷），在对抗学习（卷）的过程中不断完善自己，直至生成器可以生成以假乱真的图片（鉴别器无法判断其真假）。结构图如下：

在这里插入图片描述

GAN步骤：

1.生成器（Generator）接收随机数并返回生成图像。
2.将生成的数字图像与实际数据集中的数字图像一起送到鉴别器（Discriminator）。
3.鉴别器（Discriminator）接收真实和假图像并返回概率，0到1之间的数字，1表示真，0表示假。

四、构建生成器

def build_generator():# ======================================= ##     生成器，输入一串随机数字生成图片# ======================================= #model = Sequential([layers.Dense(256, input_dim=latent_dim),layers.LeakyReLU(alpha=0.2),               # 高级一点的激活函数layers.BatchNormalization(momentum=0.8),   # BN 归一化layers.Dense(512),layers.LeakyReLU(alpha=0.2),layers.BatchNormalization(momentum=0.8),layers.Dense(1024),layers.LeakyReLU(alpha=0.2),layers.BatchNormalization(momentum=0.8),layers.Dense(np.prod(img_shape), activation='tanh'),layers.Reshape(img_shape)])noise = layers.Input(shape=(latent_dim,))img = model(noise)return Model(noise, img)

五、构建鉴别器

def build_discriminator():# ===================================== ##   鉴别器，对输入的图片进行判别真假# ===================================== #model = Sequential([layers.Flatten(input_shape=img_shape),layers.Dense(512),layers.LeakyReLU(alpha=0.2),layers.Dense(256),layers.LeakyReLU(alpha=0.2),layers.Dense(1, activation='sigmoid')])img = layers.Input(shape=img_shape)validity = model(img)return Model(img, validity)

# 创建判别器
discriminator = build_discriminator()
# 定义优化器
optimizer = tf.keras.optimizers.Adam(1e-4)
discriminator.compile(loss='binary_crossentropy',optimizer=optimizer,metrics=['accuracy'])# 创建生成器 
generator = build_generator()
gan_input = layers.Input(shape=(latent_dim,))
img = generator(gan_input)# 对生成的假图片进行预测
validity = discriminator(img)
combined = Model(gan_input, validity)
combined.compile(loss='binary_crossentropy', optimizer=optimizer)

六、训练模型

1. 保存样例图片

def sample_images(epoch):"""保存样例图片"""row, col = 4, 4noise = np.random.normal(0, 1, (row*col, latent_dim))gen_imgs = generator.predict(noise)fig, axs = plt.subplots(row, col)cnt = 0for i in range(row):for j in range(col):axs[i,j].imshow(gen_imgs[cnt, :,:,0], cmap='gray')axs[i,j].axis('off')cnt += 1fig.savefig("images/%05d.png" % epoch)plt.close()

2. 训练模型

train_on_batch：函数接受单批数据，执行反向传播，然后更新模型参数，该批数据的大小可以是任意的，即，它不需要提供明确的批量大小，属于精细化控制训练模型。

def train(epochs, batch_size=128, sample_interval=50):# 加载数据(train_images,_), (_,_) = tf.keras.datasets.mnist.load_data()# 将图片标准化到 [-1, 1] 区间内   train_images = (train_images - 127.5) / 127.5# 数据train_images = np.expand_dims(train_images, axis=3)# 创建标签true = np.ones((batch_size, 1))fake = np.zeros((batch_size, 1))# 进行循环训练for epoch in range(epochs): # 随机选择 batch_size 张图片idx = np.random.randint(0, train_images.shape[0], batch_size)imgs = train_images[idx]      # 生成噪音noise = np.random.normal(0, 1, (batch_size, latent_dim))# 生成器通过噪音生成图片，gen_imgs的shape为：(128, 28, 28, 1)gen_imgs = generator.predict(noise)# 训练鉴别器 d_loss_true = discriminator.train_on_batch(imgs, true)d_loss_fake = discriminator.train_on_batch(gen_imgs, fake)# 返回loss值d_loss = 0.5 * np.add(d_loss_true, d_loss_fake)# 训练生成器noise = np.random.normal(0, 1, (batch_size, latent_dim))g_loss = combined.train_on_batch(noise, true)print ("%d [D loss: %f, acc.: %.2f%%] [G loss: %f]" % (epoch, d_loss[0], 100*d_loss[1], g_loss))# 保存样例图片if epoch % sample_interval == 0:sample_images(epoch)

train(epochs=30000, batch_size=256, sample_interval=200)

七、生成动图

如果报错：ModuleNotFoundError: No module named 'imageio' 可以使用：pip install imageio 安装 imageio 库。

import imageiodef compose_gif():# 图片地址data_dir = "images_old"data_dir = pathlib.Path(data_dir)paths    = list(data_dir.glob('*'))gif_images = []for path in paths:print(path)gif_images.append(imageio.imread(path))imageio.mimsave("test.gif",gif_images,fps=2)compose_gif()

生成对抗网络（GAN）手写数字生成

文章目录一、前言二、前期工作1. 设置GPU（如果使用的是CPU可以忽略这步） 二、什么是生成对抗网络1. 简单介绍2. 应用领域三、网络结构四、构建生成器五、构建鉴别器六、训练模型1. 保存样例图片2. 训练模型七、生成动图一、前言我的环境&#xff1…...

编程日记 2023/12/2 0:12:54

LeetCode Hot100 31.下一个排列

题目： 整数数组的一个排列就是将其所有成员以序列或线性顺序排列。例如，arr [1,2,3] ，以下这些都可以视作 arr 的排列：[1,2,3]、[1,3,2]、[3,1,2]、[2,3,1] 。整数数组的下一个排列是指其整数的下一个字典序更大的排列…...

编程日记 2023/12/2 0:11:53

Redis主从与哨兵架构详解

目录主从架构主从环境搭建主从复制流程 1. 全量复制 2. 部分复制主从风暴哨兵架构概念哨兵环境搭建主从架构主从环境搭建 1. 复制一份redis.conf文件, 修改下面几行配置 port 6380 pidfile /var/run/redis_6380.pid logfile "6380.log" dir /usr/…...

编程日记 2023/12/2 0:09:51

Linux：docker的数据管理（6）

数据管理操作*方便查看容器内产生的数据 *多容器间实现数据共享两种管理方式数据卷数据卷容器 1.数据卷数据卷是一个供容器使用的特殊目录，位于容器中，可将宿主机的目录挂载到数据卷上，对数据卷的修改操作立刻可见，并且更新数…...

编程日记 2023/12/2 0:07:48

深入理解Zookeeper系列-1.初识Zoookeeper

👏作者简介：大家好，我是爱吃芝士的土豆倪，24届校招生Java选手，很高兴认识大家📕系列专栏：Spring源码、JUC源码、Kafka原理、分布式技术原理🔥如果感觉博主的文章还不错的话&#xff…...

编程日记 2023/12/2 0:05:47

芯片技术探索：了解构芯片的设计与制造之旅

芯片技术探索：了解构芯片的设计与制造之旅一、引言随着现代科技的飞速发展，芯片作为信息技术的核心，已经渗透到我们生活的方方面面。从智能手机、电视、汽车到医疗设备和工业控制系统，芯片在各个领域都发挥着至关重要的作用。然而，对于大多数人来说，芯片仍然是一个神秘…...

编程日记 2023/12/2 0:02:45

STM32 超声波模块（HC-SR04）

HC-SR04介绍典型工作电压：5v （如果你的超声波模块没有工作，可以看一下是不是电压不够）超小静态工作电流：<2mA 感应角度：<15 （超声波模块，是一个范围式的探…...

编程日记 2023/12/2 0:01:44

ELK+Filebeat

Filebeat概述 1.Filebeat简介 Filebeat是一款轻量级的日志收集工具，可以在非JAVA环境下运行。因此，Filebeat常被用在非JAVAf的服务器上用于替代Logstash，收集日志信息。实际上，Filebeat几乎可以起到与Logstash相同的作用&…...

编程日记 2023/12/1 23:57:40

MySql之锁表、锁行解决方案

查询正在使用的表，没有跑业务，一般情况下是锁表了 show open tables where in_use > 0 ;查看进程，可以看到Command类型（Sleep为阻塞线程） show processlist;kill事务，kill 进程Id kill 8193583;其他 …...

编程日记 2023/12/1 23:53:36

2023年第十六届山东省职业院校技能大赛中职组“网络安全”赛项竞赛正式试题

第十六届山东省职业院校技能大赛中职组 “网络安全”赛项竞赛试题目录一、竞赛时间二、竞赛阶段三、竞赛任务书内容 （一）拓扑图 （二）A模块基础设施设置/安全加固（200分） （三&#xf…...

编程日记 2023/12/1 23:52:35

JAVA 整合 AWS S3(Amazon Simple Storage Service)文件上传,分片上传,删除,下载

依赖因为aws需要发送请求上传、下载等api，所以需要加上httpclient相关的依赖 <dependency><groupId>com.amazonaws</groupId><artifactId>aws-java-sdk-s3</artifactId><version>1.11.628</version> </dependency&…...

编程日记 2023/12/1 23:49:33

记录：Unity脚本的编写9.0

目录射线一些准备工作编写代码突然发现好像没有写过关于射线的内容，我就说怎么总感觉好像少了什么东西（心虚那就在这里写一下关于射线的内容吧，将在这里实现射线检测鼠标点击的功能射线射线是一种在Unity中检测碰撞器或触发器的方法&am…...

编程日记 2023/12/1 23:48:32

共享单车停放（简单的struct结构运用）

本来不想写这题的，但是想想最近沉迷玩雨世界，班长又问我这题，就草草写了一下代码如下： #include<stdio.h> #include<math.h> struct parking{int distance;int remain;int speed;int time;int jud; }parking[50]; …...

编程日记 2023/12/1 23:44:29

【Java8系列07】Java8日期处理

💝💝💝欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan 的首页,持续学…...

编程日记 2023/12/1 23:39:24

为什么做CSGO搬砖的不直接去炒股呢？

首先，CS2并非只有一个交易平台，阿阳个人觉得像IGXE等交易平台一样是交易，况且我记得很早的时候我就开始用IGXE了，我记得最早的时候还是机器人发货，后来因为V社对于很多开箱网站的管控，所以让这种发货的方式…...

编程日记 2023/12/1 23:37:22

12月01日，每日信息差//阿里国际发布3款AI设计生态工具//美团买菜升级为“小象超市”//外国人永居证换新、6国游客免签来华

_灵感 🎖 阿里国际发布3款AI设计生态工具 🎄 AITO问界系列11月交付新车18827辆 🌍 美团买菜升级为“小象超市” 🌋 全球首个金融风控大模型国际标准出炉，由腾讯牵头制定 🎁 支付宝：支持外国人…...

编程日记 2023/12/1 23:36:21

ChatGPT探索：提示工程详解—程序员效率提升必备技能【文末送书】

文章目录一.人工智能-ChatGPT1.1 ChatGPT简介1.2 ChatGPT探索：提示工程详解1.2 提示工程的优势二.提示工程探索2.1 提示工程实例：2.2 英语学习助手2.3 Active-Prompt思维链（CoT）方法2.4 提示工程总结三.文末推荐与福利3.1《Cha…...

编程日记 2023/12/1 23:34:19

Pytest做性能测试？

Pytest其实也是可以做性能测试或者基准测试的。是非常方便的。可以考虑使用Pytest-benchmark类库进行。安装pytest-benchmark 首先，确保已经安装了pytest和pytest-benchmark插件。可以使用以下命令安装插件： pip install pytest pytest-benchmark …...

编程日记 2023/12/1 23:33:18

Swagger各版本访问地址

2.9.x 访问地址: http://ip:port/{context-path}/swagger-ui.html 3.0.x 访问地址: http://ip:port/{context-path}/swagger-ui/index.html 3.0集成knife4j 访问地址: http://ip:port/{context-path}/doc.html...

编程日记 2023/12/1 23:32:17

docker-compose；私有镜像仓库harbor搭建；镜像推送到私有仓库harbor

docker-compose；私有镜像仓库harbor搭建；镜像推送到私有仓库harbor 文章目录 docker-compose；私有镜像仓库harbor搭建；镜像推送到私有仓库harbordocker-compose私有镜像仓库harbor搭建镜像推送到私有仓库harbor docker-compose D…...

编程日记 2023/12/1 23:31:16

Chapter03-Authentication vulnerabilities

文章目录 1. 身份验证简介1.1 What is authentication1.2 difference between authentication and authorization1.3 身份验证机制失效的原因1.4 身份验证机制失效的影响 2. 基于登录功能的漏洞2.1 密码爆破2.2 用户名枚举2.3 有缺陷的暴力破解防护2.3.1 如果用户登录尝试失败次…...

编程新知 2025/7/7 11:09:40

深入浅出Asp.Net Core MVC应用开发系列-AspNetCore中的日志记录

ASP.NET Core 是一个跨平台的开源框架，用于在 Windows、macOS 或 Linux 上生成基于云的新式 Web 应用。 ASP.NET Core 中的日志记录 .NET 通过 ILogger API 支持高性能结构化日志记录，以帮助监视应用程序行为和诊断问题。可以通过配置不同的记录提供程…...

编程新知 2025/7/7 23:29:41

智慧医疗能源事业线深度画像分析（上）

引言医疗行业作为现代社会的关键基础设施，其能源消耗与环境影响正日益受到关注。随着全球"双碳"目标的推进和可持续发展理念的深入，智慧医疗能源事业线应运而生，致力于通过创新技术与管理方案，重构医疗领域的能源使用模式。这一事业线融合了能源管理、可持续发…...

编程新知 2025/7/7 20:59:23

React第五十七节 Router中RouterProvider使用详解及注意事项

前言在 React Router v6.4 中，RouterProvider 是一个核心组件，用于提供基于数据路由（data routers）的新型路由方案。它替代了传统的 <BrowserRouter>，支持更强大的数据加载和操作功能（如 loader 和…...

编程新知 2025/7/4 13:58:19

2025年能源电力系统与流体力学国际会议 (EPSFD 2025)

2025年能源电力系统与流体力学国际会议（EPSFD 2025）将于本年度在美丽的杭州盛大召开。作为全球能源、电力系统以及流体力学领域的顶级盛会，EPSFD 2025旨在为来自世界各地的科学家、工程师和研究人员提供一个展示最新研究成果、分享实践经验及…...

编程新知 2025/7/7 15:45:25

macOS多出来了：Google云端硬盘、YouTube、表格、幻灯片、Gmail、Google文档等应用

文章目录问题现象问题原因解决办法问题现象 macOS启动台（Launchpad）多出来了：Google云端硬盘、YouTube、表格、幻灯片、Gmail、Google文档等应用。问题原因很明显，都是Google家的办公全家桶。这些应用并不是通过独立安装的…...

编程新知 2025/7/6 15:26:24

在web-view 加载的本地及远程HTML中调用uniapp的API及网页和vue页面是如何通讯的？

uni-app 中 Web-view 与 Vue 页面的通讯机制详解一、Web-view 简介 Web-view 是 uni-app 提供的一个重要组件，用于在原生应用中加载 HTML 页面： 支持加载本地 HTML 文件支持加载远程 HTML 页面实现 Web 与原生的双向通讯可用于嵌入第三方网页或 H5 应…...

编程新知 2025/6/21 2:45:17