当前位置：首页 > news >正文

昇思25天学习打卡营第19天|DCGAN生成漫画头像

news 2026/5/24 23:04:13

在这里插入图片描述

DCGAN生成漫画头像总结

实验概述

本实验旨在利用深度卷积生成对抗网络（DCGAN）生成动漫头像，通过设置网络、优化器以及损失函数，使用MindSpore进行实现。

实验目的

学习和掌握DCGAN的基本原理和应用。
熟悉使用MindSpore进行图像生成的代码编写。
理解数据处理和模型训练的流程。

GAN基础原理

生成对抗网络（GAN）是一种通过两个网络（生成器和判别器）相互竞争进行训练的模型，目的是生成与真实数据分布相似的样本。

DCGAN原理

DCGAN是GAN的扩展，特别适用于图像生成。与传统GAN不同，DCGAN在生成器和判别器中均使用卷积层和转置卷积层，增强了模型对图像特征的学习能力。该模型通过以下结构实现：

判别器：由卷积层、BatchNorm层和LeakyReLU激活层组成，输入为3x64x64的图像，输出为该图像为真实的概率。
生成器：由转置卷积层、BatchNorm层和ReLU激活层组成，输入为随机生成的隐向量，输出为3x64x64的RGB图像。

数据准备与处理

数据集下载

使用的动漫头像数据集包含70171张图片，统一缩放为96x96像素。数据下载后，目录结构如下：

./faces/faces
├── 0.jpg
├── 1.jpg
...
└── 70170.jpg

数据处理

参数设置：定义批量大小、图像尺寸、通道数、隐向量长度等超参数。
数据增强：对训练集进行随机裁剪、翻转和归一化处理，以增加数据多样性。
数据加载：使用MindSpore的MindDataset接口读取和解析数据集。

模型构建

生成器

生成器负责将隐向量映射到数据空间，通过转置卷积层生成与真实图像相同大小的RGB图像。模型使用ReLU激活函数，最后通过tanh函数调整输出范围。

判别器

判别器是一个二分类网络，通过卷积、BatchNorm和LeakyReLU处理输入图像，最后通过Sigmoid激活函数输出真实概率。

模型训练与测试

训练策略

损失函数：使用二进制交叉熵损失函数（BCELoss）来评估生成器和判别器的性能。
优化器：分别为生成器和判别器设置Adam优化器，学习率为0.0002，beta1为0.5。

模型评估

在训练过程中，定期打印损失值，并在每个epoch后在测试集上计算精度。通过训练，模型能够生成高质量的动漫头像。

结果展示

通过可视化工具展示生成的图像，观察到随着训练次数的增加，生成图像的质量逐渐提升。在训练周期超过50次时，生成的图片与真实数据集中的样本相似度显著提高。

总结

本实验成功实现了使用DCGAN生成动漫头像的任务，涵盖了数据处理、模型构建、训练和推理的全过程。通过对动漫头像数据集的分析，验证了DCGAN在图像生成任务中的有效性，为后续研究提供了基础和经验。实验展示了深度学习在图像生成中的应用潜力，并强调了数据处理与模型优化的重要性。

昇思25天学习打卡营第19天|DCGAN生成漫画头像

DCGAN生成漫画头像总结实验概述本实验旨在利用深度卷积生成对抗网络（DCGAN）生成动漫头像，通过设置网络、优化器以及损失函数，使用MindSpore进行实现。实验目的学习和掌握DCGAN的基本原理和应用。熟悉使用MindSpore进行图像…...

编程日记 2024/7/29 20:40:20

排序题目：按照频率将数组升序排序

文章目录题目标题和出处难度题目描述要求示例数据范围解法思路和算法代码复杂度分析题目标题和出处标题：按照频率将数组升序排序出处：1636. 按照频率将数组升序排序难度 3 级题目描述要求给定一个整数数组 nums \texttt{nums} nums&a…...

编程日记 2024/7/29 20:34:14

实分析与测度论问题的分类

实分析主要研究实数、实数序列、实数极限以及实值函数的分析，而度量空间则是一个具有距离函数的集合，其分类可以从多个角度进行。实分析实分析主要关注实数、实数序列、实数极限以及实值函数的分析。它涉及到多个重要的概念和理论，包括但…...

编程日记 2024/7/29 20:33:12

动态代理更改Java方法的返回参数（可用于优化feign调用后R对象的统一处理）

动态代理更改Java方法的返回参数（可用于优化feign调用后R对象的统一处理） 需求原始解决方案优化后方案1.首先创建AfterInterface.java2.创建InvocationHandler处理代理方法3. 调用实际运行场景拓展需求某些场景，调用别人的方法&#xff0…...

编程日记 2024/7/29 20:31:09

Redis缓存数据库进阶——Redis与分布式锁（6）

分布式锁简介 1. 什么是分布式锁分布式锁是一种在分布式系统环境下，通过多个节点对共享资源进行访问控制的一种同步机制。它的主要目的是防止多个节点同时操作同一份数据，从而避免数据的不一致性。线程锁： 也被称为互斥锁（Mu…...

编程日记 2024/7/29 20:28:06

网络芯片（又称为PHY网络芯片）

Realtek RTL8152B是一种常见的主板集成网络芯片（又称为PHY网络芯片）。PHY芯片是指将网络控制芯片的运算部分交由处理器或南桥芯片处理，以简化线路设计，从而降低成本。 https://www.realtek.com/Download/List?cate_id585 Realt…...

编程日记 2024/7/29 20:27:05

01 Go Web基础_20240728 课程笔记

概述如果您没有Golang的基础，应该学习如下前置课程。基础不好的同学每节课的代码最好配合视频进行阅读和学习，如果基础比较扎实，则阅读本教程巩固一下相关知识点即可，遇到不会的知识点再看视频。视频课程最近发现越来越多…...

编程日记 2024/7/29 20:26:04

嵌入式学习Day12---C语言提升

目录一、指针数组 1.1.什么是指针数组 2.2. 格式 2.3.存储 2.4.与字符型二维数组相比 2.5.什么时候使用指针数组 2.6.练习二、数组指针 2.1.什么是数组指针 2.2.格式 2.3.一维数组 2.3.特点 2.4.什么时候使用三、指针和数组的关系 3.1.一维数组和指针 …...

编程日记 2024/7/29 20:25:03

6.6 使用dashboard商城搜索导入模板

本节重点介绍 : 模板商城中搜索模板导入模板修改模板大盘模板商城地址免费的地址 https://grafana.com/grafana/dashboards 搜索模板技巧详情导入dashboard 两种导入模式 url导入id导入json文件导入导入 node_exporter模板 https://grafana.com/grafana/dashboa…...

编程日记 2024/7/29 20:24:02

一文讲透useMemo和useCallback

在React项目中是经常会使用到useMemo，useCallBack的，这是两个优化性能的方法，那么useMemo，useCallBack到底是什么呢？什么时候用呢？ 下面将给打击分享相关知识，希望对大家有所帮助同时欢迎讨论指…...

编程日记 2024/7/29 20:22:01

【环境变量】安装了一个软件，如何配置环境变量？

配置环境变量为啥？ 方便地在任何文件夹下调用某一指定目录下的文件。配置步骤以jdk17为例。 1.打开环境变量配置页面 2.新建一个变量，变量名为JAVA_HOME，内容为jdk的path路径 3.打开path变量，新建一个%JAVA_HOME%\bin&#x…...

编程日记 2024/7/29 20:20:59

重生之我当程序猿外包

第一章个人介绍与收入历程我出生于1999年，在大四下学期进入了一家互联网公司实习。当时的实习工资是3500元，公司还提供住宿。作为一名实习生，这个工资足够支付生活开销，每个月还能给父母转1000元，自己留2500元用来吃…...

编程日记 2024/7/29 20:19:58

我想给 git 分支换一个名字，应该怎么做？

Git中重命名分支的操作步骤如下: 确保你在要重命名的分支上。可以使用git branch或git status命令查看当前所在分支[1][2]. 使用以下命令重命名当前分支: git branch -m new-branch-name例如,将当前分支重命名为"feature-xyz": git branch -m feature-xyz-m参数是&q…...

编程日记 2024/7/29 20:18:57

echarts多stack的legend点选

echarts支持点击legend，实现显示和隐藏legend对应的数据，具体就是option里series里,name为legend值的数据。如果配置了多个stack，那么可能你可能设置了多组legend，你点选的是多个legend组中的某组中的一个，那么如果不…...

编程日记 2024/7/29 20:17:55

搭建自己的金融数据源和量化分析平台（四）：自动化更新上市公司所属一级、二级行业以及股票上市状态

前面做了更新沪深交易所的上市股票列表的读取和更新，但一旦股票退市则需要在数据库里将该股票状态更新为退市，同时附上退市日期，将股票名更改为XX退。此外深交所下载的xls解析出来是没有上市公司所属的二级行业的，因此还需要建立…...

编程日记 2024/7/29 20:15:54

科创板重启IPO上会！募投审核新方向？思看科技等优化募投项目

撰稿 | 多客来源 | 贝多财经根据上交所项目审核动态最新公告，思看科技（杭州）股份有限公司（简称“思看科技”）将于8月2日上会，标志着时隔50天后科创板重新迎来首家上会企业，也标志着思看科技…...

编程日记 2024/7/29 20:13:51

深入解析损失函数：从基础概念到YOLOv8的应用

深入解析损失函数：从基础概念到YOLOv8的应用在机器学习和深度学习中，损失函数是至关重要的组件，它们衡量模型的预测值与真实值之间的差距，从而指导模型的优化过程。本文将详细探讨损失函数的基本概念，及其在YOLOv8中…...

编程日记 2024/7/29 20:11:49

2.11.ResNet

ResNet 动机：我们总是想加更多层，但加更多层并不总是能改进精度可以看出F1到F6模型越来越大，但F6距离最优解却总变远了，反而效果不好，通俗的来说就是学偏了，实际上我们希望是这样的： 更大…...

编程日记 2024/7/29 20:10:47

GitLab添加TortoiseGIT生成SSH Key

文章目录前言一、PuTTYgen二、GitLab 前言 GitLab是一个用于托管代码仓库和项目管理的Web平台，公司搭建自己的gitlab来管理代码，我们在clone代码的时候可以选择http协议，也可以选择ssh协议来拉取代码。 SSH (Secure Shell)是一种通过网络进…...

编程日记 2024/7/29 20:09:46

参考： MMBench：基于ChatGPT的全方位多模能力评测体系_哔哩哔哩_bilibili https://en.wikipedia.org/wiki/Levenshtein_distance cider: https://zhuanlan.zhihu.com/p/698643372 GitHub - open-compass/opencompass: OpenCompass is an LLM evalua…...

编程日记 2024/7/29 20:07:44

漏洞研究工作流：从CVE追踪到实战提升的闭环方法论

1. 这不是“资源列表”，而是一套可落地的漏洞研究工作流很多人一看到“在线资源全攻略”就下意识点开收藏，然后扔进浏览器书签夹吃灰。我见过太多安全从业者——包括刚入行的蓝队新人、想补实战短板的渗透测试员、甚至部分做红队支撑的工程师——把CVE编…...

编程新知 2026/5/24 21:55:35

在 Taotoken 控制台中如何进行 API Key 的创建权限管理与操作审计

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度在 Taotoken 控制台中如何进行 API Key 的创建权限管理与操作审计对于需要将大模型能力集成到多个应用或分配给不同团队成员的开发…...

编程新知 2026/5/24 21:53:14

【读书笔记】《更富有、更睿智、更快乐》

《更富有、更睿智、更快乐》精读笔记作者威廉格林历时25年，贴身采访全球40余位顶级投资大师，包括芒格、巴菲特等人，总结出一套投资与人生的双赢哲学。核心命题顶级投资者本质上是一类实践哲学家——他们不谈空理论，只追求世俗智慧…...

编程新知 2026/5/24 21:34:21

2026这6款封神降AI率工具大起底，一键把AIGC率降至安全线！

步入 2026 年，学术界的风向早已悄然转变。曾经的"降重复率"焦虑已经成了过去式，如今摆在每位学子和科研人面前的，是更棘手的"降 AI 率"挑战。随着各大高校对 AI 内容检测系统的全面升级，审核标准也愈发严苛。…...

编程新知 2026/5/24 21:06:45

Gofile极速下载器：Python多线程并发下载的完整实现指南

Gofile极速下载器：Python多线程并发下载的完整实现指南【免费下载链接】gofile-downloader Download files from https://gofile.io 项目地址: https://gitcode.com/gh_mirrors/go/gofile-downloader Gofile作为流行的文件共享平台，其官方下载机…...

编程新知 2026/5/24 21:00:32

终极指南：如何将普通智能音箱改造成AI语音助手

终极指南：如何将普通智能音箱改造成AI语音助手【免费下载链接】mi-gpt 🏠 将小爱音箱接入 ChatGPT 和豆包，改造成你的专属语音助手。项目地址: https://gitcode.com/GitHub_Trending/mi/mi-gpt 您是否想过，家中那台只会简…...

编程新知 2026/5/24 20:17:15

5分钟快速上手：DouYinBot抖音无水印视频解析工具终极指南

5分钟快速上手：DouYinBot抖音无水印视频解析工具终极指南【免费下载链接】DouYinBot 该项目仅自用，不提供抖音视频下载项目地址: https://gitcode.com/gh_mirrors/do/DouYinBot 在短视频创作火爆的今天，你是否曾为抖音视频上的水印而…...

编程新知 2026/5/24 19:41:15

2026破圈！5款一键生成论文工具亲测，打破思路枯竭，初稿半天搞定

对于学生、科研工作者而言，论文写作往往面临诸多挑战：文献资料繁杂难寻、格式排版反复调整、重复率居高不下、逻辑结构难以梳理，这些痛点严重制约了写作效率与研究成果的呈现质量。随着2026年AI技术的不断突破与优化，各类AI论文写…...

编程新知 2026/5/24 19:31:10

Agent协议标准化：互操作性的未来

Agent协议标准化：互操作性的未来一、引言钩子：你是否遇到过这些Agent协作的痛点？你花了3天时间基于OpenAI GPT-4开发了一个客户需求分析Agent，能自动解析用户对话生成需求文档，但当你想把生成的需求文档同步给公司内部基于Llama 3部署的产品排期Agent时，却发现两个A…...

编程新知 2026/5/24 19:29:08

【限时开放】Gemini CSR活动策划黄金模板包（含GDPR+AI Act双合规checklist、多语言志愿者管理看板、ESG叙事脚本生成器）

更多请点击： https://intelliparadigm.com 第一章：Gemini CSR活动策划黄金模板包概览 Gemini CSR活动策划黄金模板包是一套面向企业社会责任（CSR）项目全生命周期管理的结构化工具集，专为科技型企业、公益组织及ESG战略…...

编程新知 2026/5/24 18:17:40