当前位置：首页 > news >正文

G4 - 可控手势生成 CGAN

news 2026/5/17 13:31:00

🍨 本文为🔗365天深度学习训练营中的学习记录博客
🍖 原作者：K同学啊

代码

关于CGAN的原理上节已经讲过，这次主要是编写代码加载上节训练后的模型来进行指定条件的生成

图像的生成其实只需要使用Generator模型，判别器模型是在训练过程中才用的。

# 库引入
from torch.autograd import Variable
from torchvision.utils import save_image, make_grid
import matplotlib.pyplot as plt
import torch.nn as nn
import torch.optim as optim
import torchdevice = torch.device('cuda' if torch.cuda.is_available() else 'cpu')# 超参数
latent_dim = 100
n_classes = 3
embedding_dim = 100# 工具函数
def weights_init(m):classname = m.__class__.__name__if classname.find('Conv') != -1:torch.nn.init.normal_(m.weight, 0.0, 0.02)elif classname.find('BatchNorm') != -1:torch.nn.init.normal_(m.weight, 1.0, 0.02)torch.nn.init.zeros_(m.bias)# 模型
class Generator(nn.Module):def __init__(self):super().__init__()self.label_conditioned_generator = nn.Sequential(nn.Embedding(n_classes, embedding_dim),nn.Linear(embedding_dim, 16))self.latent = nn.Sequential(nn.Linear(latent_dim, 4*4*512),nn.LeakyReLU(0.2, inplace=True))self.model = nn.Sequential(nn.ConvTranspose2d(513, 64*8, 4, 2, 1, bias=False),nn.BatchNorm2d(64*8, momentum=0.1, eps=0.8),nn.ReLU(True),nn.ConvTranspose2d(64*8, 64*4, 4, 2, 1, bias=False),nn.BatchNorm2d(64*4, momentum=0.1, eps=0.8),nn.ReLU(True),nn.ConvTranspose2d(64*4, 64*2, 4, 2, 1, bias=False),nn.BatchNorm2d(64*2, momentum=0.1, eps=0.8),nn.ReLU(True),nn.ConvTranspose2d(64*2, 64*1, 4, 2, 1, bias=False),nn.BatchNorm2d(64*1, momentum=0.1, eps=0.8),nn.ReLU(True),nn.ConvTranspose2d(64*1, 3, 4, 2, 1, bias=False),nn.Tanh())def forward(self, inputs):noise_vector, label = inputslabel_output = self.label_conditioned_generator(label)label_output = label_output.view(-1, 1, 4, 4)latent_output = self.latent(noise_vector)latent_output = latent_output.view(-1, 512, 4, 4)concat = torch.cat((latent_output, label_output), dim=1)image = self.model(concat)return imagegenerator = Generator().to(device)
generator.apply(weights_init)
print(generator)

Generator((label_conditioned_generator): Sequential((0): Embedding(3, 100)(1): Linear(in_features=100, out_features=16, bias=True))(latent): Sequential((0): Linear(in_features=100, out_features=8192, bias=True)(1): LeakyReLU(negative_slope=0.2, inplace=True))(model): Sequential((0): ConvTranspose2d(513, 512, kernel_size=(4, 4), stride=(2, 2), padding=(1, 1), bias=False)(1): BatchNorm2d(512, eps=0.8, momentum=0.1, affine=True, track_running_stats=True)(2): ReLU(inplace=True)(3): ConvTranspose2d(512, 256, kernel_size=(4, 4), stride=(2, 2), padding=(1, 1), bias=False)(4): BatchNorm2d(256, eps=0.8, momentum=0.1, affine=True, track_running_stats=True)(5): ReLU(inplace=True)(6): ConvTranspose2d(256, 128, kernel_size=(4, 4), stride=(2, 2), padding=(1, 1), bias=False)(7): BatchNorm2d(128, eps=0.8, momentum=0.1, affine=True, track_running_stats=True)(8): ReLU(inplace=True)(9): ConvTranspose2d(128, 64, kernel_size=(4, 4), stride=(2, 2), padding=(1, 1), bias=False)(10): BatchNorm2d(64, eps=0.8, momentum=0.1, affine=True, track_running_stats=True)(11): ReLU(inplace=True)(12): ConvTranspose2d(64, 3, kernel_size=(4, 4), stride=(2, 2), padding=(1, 1), bias=False)(13): Tanh())
)

from numpy.random import randint, randn
from numpy import linspace
from matplotlib import pyplot, gridspec# 加载训练好的权重
generator.load_state_dict(torch.load('generator_epoch_300.pth'), strict=False)
# 关闭梯度积累
generator.eval()# 生成随机变量
interpolated = randn(100)
interpolated = torch.tensor(interpolated).to(device).type(torch.float32)# 生成条件变量
label = 0 # 生成第0个分类的图像
labels = torch.ones(1) * label
labels = labels.to(device).unsqueeze(1).long()# 执行生成
predictions = generator((interpolated, labels))
predictions = predictions.permute(0, 2, 3, 1).detach().cpu()# 屏蔽警告
import warnings
warnings.filterwarnings('ignore')# 设置中文字体
plt.rcParams['font.sans-serif'] = ['SimHei']
# 防止负号无法显示
plt.rcParams['axes.unicode_minus']= False
# 设置图的分辨率
plt.rcParams['figure.dpi'] = 100# 绘图
plt.figure(figsize=(8, 3))
pred = (predictions[0, :, :, :] + 1) * 127.5
pred = np.array(pred)
plt.imshow(pred.astype(np.uint8))
plt.show()

生成分类0
我们将分类修改为1重新生成一次

生成分类1

总结与心得

在本次实验的过程中，我了解了CGAN模型在训练完成后，后续如何使用的步骤：

保存训练好的生成器的权重
使用生成器加载
生成随机分布变量用于生成图像
生成指定的标签，并转换成控制向量
执行生成操作

另外关于警告和matplotlib设置中文字体的方式也是经常会用到的技巧。

G4 - 可控手势生成 CGAN

🍨 本文为🔗365天深度学习训练营中的学习记录博客🍖 原作者：K同学啊目录代码总结与心得代码关于CGAN的原理上节已经讲过，这次主要是编写代码加载上节训练后的模型来进行指定条件的生成图像的生成其实只需要使用…...

编程日记 2024/5/31 22:42:50

使用 DuckDuckGo API 实现多种搜索功能

在日常生活中，我经常使用搜索引擎来查找信息，如谷歌和百度。然而，当我想通过 API 来实现这一功能时，会发现这些搜索引擎并没有提供足够的免费 API 服务。如果有这样的免费 API, 就能定时获取“关注实体”的相关内容，并…...

编程日记 2024/5/31 22:41:49

【DrissionPage爬虫库 1】两种模式分别爬取Gitee开源项目

文章目录 DrissionPage爬虫库简介1. 浏览器操控模式（类似于游戏中的后台模拟鼠标键盘）2. 数据包收发模式（类似于游戏中的协议封包） 实战中学习需求：爬取Gitee开源项目的标题与描述解决方案1：用数据包方式获…...

编程日记 2024/5/31 22:40:48

leetcode 115.不同的子序列

思路：LCS类dp 这道题的思考思路其实就是把以两个字符串结尾作为状态方程。 dp[i][j]的意义就是在s字符串在以s[i]结尾的字符串的情况下，所能匹配出t字符串以t[j]结尾的字符串个数。本质上其实是一个LCS类的状态方程，只不过是意义不一样了…...

编程日记 2024/5/31 22:39:46

二叉树的顺序实现-堆

一、什么是堆在数据结构中，堆（Heap）是一种特殊的树形数据结构，用数组存储，通常被用来实现优先队列。堆具有以下特点： 堆是一棵完全二叉树（Complete Binary Tree），即…...

编程日记 2024/5/31 22:38:45

【Maven】Maven主要知识点目录整理

1. Maven的基本概念作者相关文章链接： 1、【Maven】简介_下载安装-CSDN博客定义：Maven是Apache的一个开源项目，是Java开发环境中用于管理和构建项目，以及维护依赖关系的强大软件项目管理工具。作用：简化了项目依赖…...

编程日记 2024/5/31 22:37:43

Coolmuster Android Assistant: 手机数据管理的全能助手

在数字化时代，智能手机不仅是通讯工具，更是个人数据的中心。随着数据量的不断增加，如何有效管理和保护这些数据成为了一个重要议题。Coolmuster Android Assistant应运而生，它是一款专为安卓用户设计的综合数据管理软件&#xff0…...

编程日记 2024/5/31 22:36:41

03-树3 Tree Traversals Again(浙大数据结构PTA习题）

03-树3 Tree Traversals Again 分数 25 作者陈越 An inorder binary tree traversal can be implemented in a non-recursive way with a stack. For example, suppose that when a 6-node binary tree (with the keys numbered from 1 to 6) is traversed, th…...

编程日记 2024/5/31 22:35:40

Java项目对接redis，客户端是选Redisson、Lettuce还是Jedis？

JAVA项目对接redis，客户端是选Redisson、Lettuce还是Jedis？ 一、客户端简介1. Jedis介绍2. Lettuce介绍3. Redisson介绍二、横向对比三、选型说明在实际的项目开发中，对于一个需要对接Redis的项目来说，就面临着选择合适的Redis客…...

编程日记 2024/5/31 22:32:37

AngularJS Web前端框架：深入探索与应用实践

AngularJS Web前端框架：深入探索与应用实践 AngularJS，作为一款强大的Web前端框架，为开发者提供了丰富的功能和工具，使得构建复杂且交互性强的Web应用变得更为便捷。本文将从四个方面、五个方面、六个方面和七个方面对AngularJS进…...

编程日记 2024/5/31 22:30:36

SQL 入门：使用 MySQL 进行数据库操作

SQL 入门：使用 MySQL 进行数据库操作目录引言SQL 基础 SQL 语言概述MySQL 简介数据库设计基础数据库与表的设计常见数据类型 MySQL 安装与配置安装 MySQL基本配置与连接基本 SQL 语句数据库的创建与删除表的创建、修改与删除数据插入、更新与删除数据查询…...

编程日记 2024/5/31 22:29:34

window安装ffmpeg播放本地摄像头视频

1、安装ffmpeg ffmpeg官方网站：FFmpeg 下载后解压文件夹名为ffmpeg 2、设置环境变量目录 1、安装ffmpeg 设置环境变量以F:\software\after\ffmpeg\bin为例在命令行中输入ffmpeg出现下方代表安装成功 3、通过ffmpeg播放本地电脑摄像头鼠标右击开始按钮&…...

编程日记 2024/5/31 22:28:33

【嵌入式DIY实例】-OLED显示网络时钟

OLED显示网络时钟文章目录 OLED显示网络时钟1、硬件准备与接线2、代码实现在上一个ESP8266 NodeMCU文章中，我们用DS3231 RTC芯片和SSD1306 OLED制作了一个简单的实时时钟，时间和日期显示在SSD1306屏幕上，并且可以通过两个按钮进行设置。在本中，我们将使用ESP 8266 NodeMC…...

编程日记 2024/5/31 22:27:32

【线程相关知识】

今日内容概要开启线程的两种方式TCP服务端实现并发效果线程对象的join方法线程间数据共享线程对象属性及其他方法守护线程线程互斥锁GIL全局解释器锁多进程与多线程的实际应用场景今日内容详细开启线程的两种方式 # import time # from multiprocessing import Process #…...

编程日记 2024/5/31 22:25:29

鸿蒙ArkTS声明式开发：跨平台支持列表【透明度设置】通用属性

透明度设置设置组件的透明度。说明： 开发前请熟悉鸿蒙开发指导文档： gitee.com/li-shizhen-skin/harmony-os/blob/master/README.md点击或者复制转到。从API Version 7开始支持。后续版本如有新增内容，则采用上角标单独标记该内容的起始版…...

编程日记 2024/5/31 22:23:27

【SQL学习进阶】从入门到高级应用（九）

文章目录子查询什么是子查询where后面使用子查询from后面使用子查询select后面使用子查询exists、not existsin和exists区别 union&union alllimit 🌈你好呀！我是山顶风景独好 💕欢迎来到我的博客，很高兴能够在这里和您见面…...

编程日记 2024/5/31 22:22:26

Web前端三大主流框架技术分享

在当今快速发展的互联网时代，Web前端技术作为连接用户与服务的桥梁，其重要性不言而喻。随着技术的不断进步，为了提升开发效率、优化用户体验，一系列强大的前端框架应运而生。其中，Angular、React和Vue.js作为当前最为主…...

编程日记 2024/5/31 22:21:24

dockers安装mysql

1.dockerhub上搜索自己需要安装得镜像版本 dockerhub网址：https://hub-stage.docker.com docker pull mysql:5.7 #下载自己需要得版本2.启动容器实例，并且挂载容器数据卷 docker run -d -p 3306:3306 --privilegedtrue \ -v /home/mysql/log:/var/log/…...

编程日记 2024/5/31 22:20:23

100道面试必会算法-27-美团2024面试第一题-前缀和矩阵

100道面试必会算法-27-美团2024面试第一题-前缀和矩阵问题解读给定一个 n x n 的二进制矩阵，每个元素是 0 或 1。我们的任务是计算矩阵中所有边长为 k 的子矩阵中，包含特定数量 1 的情况。例如，我们希望找到所有边长为 k 的子矩阵中包含 k…...

编程日记 2024/5/31 22:18:21

从摇一摇到弹窗，AD无处不在？为了不再受打扰，推荐几款好用的屏蔽软件，让手机电脑更清爽

当我们沉浸在智能手机带来的便捷与乐趣中时，内置AD如同不速之客，时常打断我们的体验。尤其是手机上那些“摇一摇”跳转，稍有不慎就会跳转到其他应用，令人不胜其烦。同样，电脑上的内置AD也如影随形，影响了我…...

编程日记 2024/5/31 22:17:19

Zotero插件市场：三步快速上手的插件管理神器

Zotero插件市场：三步快速上手的插件管理神器【免费下载链接】zotero-addons Zotero Add-on Market | Zotero插件市场 | Browsing, installing, and reviewing plugins within Zotero 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-addons 想象一下&a…...

编程新知 2026/5/17 10:01:30

NS-USBLoader：Switch游戏管理终极指南 - 如何实现一键安装与系统引导？

NS-USBLoader：Switch游戏管理终极指南 - 如何实现一键安装与系统引导？ 【免费下载链接】ns-usbloader Awoo Installer and GoldLeaf uploader of the NSPs (and other files), RCM payload injector, application for split/merge files. 项目地址: ht…...

编程新知 2026/5/17 8:19:39

开源银行API模拟器Bankr Buddy：金融科技开发的本地化测试解决方案

1. 项目概述：一个为开发者准备的银行API模拟器如果你正在开发一个需要与银行账户数据打交道的应用，无论是个人财务管理工具、预算分析软件，还是企业级的财务聚合服务，你肯定遇到过同一个难题：如何在不触碰真实用户敏感…...

编程新知 2026/5/17 8:02:19

猫抓扩展完整指南：三步掌握浏览器视频嗅探与下载技巧

猫抓扩展完整指南：三步掌握浏览器视频嗅探与下载技巧【免费下载链接】cat-catch 猫抓浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 猫抓（Cat-Catch&#…...

编程新知 2026/5/17 7:51:55

开源技能库构建指南：Git+Markdown+Docsify打造个人技术知识体系

1. 项目概述：一个开源技能库的诞生与价值在技术领域，尤其是软件开发、运维和数据分析等方向，我们每天都在与海量的工具、框架和命令打交道。时间一长，一个很现实的问题就摆在了面前：那些曾经花了好几个小时才调通的复杂…...

编程新知 2026/5/17 7:47:53

零基础实操：小龙虾 AI OpenClaw 接入 Kimi 详细步骤

前置准备获取小龙虾open claw一键安装包（www.totom.top）并安装电脑端已成功安装并正常运行OpenClaw客户端，顶部 Gateway 状态保持在线设备网络通畅，可正常访问 Kimi 开放平台拥有可正常登录的 Kimi 月之暗面 Moonshot 账号账号提…...

编程新知 2026/5/17 6:57:20

别再只会Commit了！用Git Desktop搞定分支合并与冲突解决（附真实开发场景）

别再只会Commit了！用Git Desktop搞定分支合并与冲突解决（附真实开发场景） 当你第一次接触Git时，可能觉得它就是个"保存按钮"——每次改完代码就commit一下。但随着项目规模扩大，特别是多人协作时&#xff0c…...

编程新知 2026/5/17 5:27:29

开源技能安全仪表盘：从架构解析到CI/CD集成的DevSecOps实践

1. 项目概述：一个面向技能开发者的安全仪表盘最近在折腾一些智能设备上的技能开发，发现一个挺普遍但容易被忽视的问题：我们花大量时间在功能实现和用户体验上，但技能本身的安全性评估，往往只能等到上线后，通…...

编程新知 2026/5/17 5:25:27

大语言模型分步推理与自我验证框架：提升AI生成准确性的工程实践

1. 项目概述：当AI学会“自我验证”最近在开源社区里，一个名为“Lets-Verify-Step-by-Step”的项目引起了我的注意。这个项目直指当前大语言模型（LLM）应用中的一个核心痛点：如何让模型在生成复杂答案时，能像…...

编程新知 2026/5/17 4:00:33

基于容器技术的在线代码沙盒：架构设计与安全实践

1. 项目概述：一个开箱即用的在线代码运行沙盒最近在折腾一些需要快速验证代码片段、或者给团队做技术分享的场景，我发现一个痛点：环境配置太麻烦了。你想让新人跑个Python脚本，他可能得先装Python、配环境变量、装依赖库&#xff…...

编程新知 2026/5/17 3:58:32

目录

代码

总结与心得

相关文章：