当前位置：首页 > news >正文

[oneAPI] 手写数字识别-GAN

news 2026/2/11 0:34:42

[oneAPI] 手写数字识别-GAN

手写数字识别
- 参数与包
- 加载数据
- 模型
- 训练过程
- 结果
oneAPI

比赛：https://marketing.csdn.net/p/f3e44fbfe46c465f4d9d6c23e38e0517
Intel® DevCloud for oneAPI：https://devcloud.intel.com/oneapi/get_started/aiAnalyticsToolkitSamples/

手写数字识别

使用了pytorch以及Intel® Optimization for PyTorch，通过优化扩展了 PyTorch，使英特尔硬件的性能进一步提升，让手写数字识别问题更加的快速高效
在这里插入图片描述

使用MNIST数据集，该数据集包含了一系列以黑白图像表示的手写数字，每个图像的大小为28x28像素，数据集组成如下：

训练集：包含60,000个图像和标签，用于训练模型。
测试集：包含10,000个图像和标签，用于测试模型的性能。

每个图像都被标记为0到9之间的一个数字，表示图像中显示的手写数字。这个数据集常常被用来验证图像分类模型的性能，特别是在计算机视觉领域。

参数与包

import os
import torch
import torchvision
import torch.nn as nn
from torchvision import transforms
from torchvision.utils import save_imageimport intel_extension_for_pytorch as ipex# Device configuration
device = torch.device('xpu' if torch.cuda.is_available() else 'cpu')# Hyper-parameters
latent_size = 64
hidden_size = 256
image_size = 784
num_epochs = 200
batch_size = 100
sample_dir = 'samples'

加载数据

# Create a directory if not exists
if not os.path.exists(sample_dir):os.makedirs(sample_dir)# Image processing
# transform = transforms.Compose([
#                 transforms.ToTensor(),
#                 transforms.Normalize(mean=(0.5, 0.5, 0.5),   # 3 for RGB channels
#                                      std=(0.5, 0.5, 0.5))])
transform = transforms.Compose([transforms.ToTensor(),transforms.Normalize(mean=[0.5],  # 1 for greyscale channelsstd=[0.5])])# MNIST dataset
mnist = torchvision.datasets.MNIST(root='./data/',train=True,transform=transform,download=True)# Data loader
data_loader = torch.utils.data.DataLoader(dataset=mnist,batch_size=batch_size,shuffle=True)

模型

# Discriminator
D = nn.Sequential(nn.Linear(image_size, hidden_size),nn.LeakyReLU(0.2),nn.Linear(hidden_size, hidden_size),nn.LeakyReLU(0.2),nn.Linear(hidden_size, 1),nn.Sigmoid())# Generator 
G = nn.Sequential(nn.Linear(latent_size, hidden_size),nn.ReLU(),nn.Linear(hidden_size, hidden_size),nn.ReLU(),nn.Linear(hidden_size, image_size),nn.Tanh())

训练过程

# Device setting
D = D.to(device)
G = G.to(device)# Binary cross entropy loss and optimizer
criterion = nn.BCELoss()
d_optimizer = torch.optim.Adam(D.parameters(), lr=0.0002)
g_optimizer = torch.optim.Adam(G.parameters(), lr=0.0002)'''
Apply Intel Extension for PyTorch optimization against the model object and optimizer object.
'''
D, d_optimizer = ipex.optimize(D, optimizer=d_optimizer)
G, g_optimizer = ipex.optimize(G, optimizer=g_optimizer)def denorm(x):out = (x + 1) / 2return out.clamp(0, 1)def reset_grad():d_optimizer.zero_grad()g_optimizer.zero_grad()# Start training
total_step = len(data_loader)
for epoch in range(num_epochs):for i, (images, _) in enumerate(data_loader):images = images.reshape(batch_size, -1).to(device)# Create the labels which are later used as input for the BCE lossreal_labels = torch.ones(batch_size, 1).to(device)fake_labels = torch.zeros(batch_size, 1).to(device)# ================================================================== ##                      Train the discriminator                       ## ================================================================== ## Compute BCE_Loss using real images where BCE_Loss(x, y): - y * log(D(x)) - (1-y) * log(1 - D(x))# Second term of the loss is always zero since real_labels == 1outputs = D(images)d_loss_real = criterion(outputs, real_labels)real_score = outputs# Compute BCELoss using fake images# First term of the loss is always zero since fake_labels == 0z = torch.randn(batch_size, latent_size).to(device)fake_images = G(z)outputs = D(fake_images)d_loss_fake = criterion(outputs, fake_labels)fake_score = outputs# Backprop and optimized_loss = d_loss_real + d_loss_fakereset_grad()d_loss.backward()d_optimizer.step()# ================================================================== ##                        Train the generator                         ## ================================================================== ## Compute loss with fake imagesz = torch.randn(batch_size, latent_size).to(device)fake_images = G(z)outputs = D(fake_images)# We train G to maximize log(D(G(z)) instead of minimizing log(1-D(G(z)))# For the reason, see the last paragraph of section 3. https://arxiv.org/pdf/1406.2661.pdfg_loss = criterion(outputs, real_labels)# Backprop and optimizereset_grad()g_loss.backward()g_optimizer.step()if (i + 1) % 200 == 0:print('Epoch [{}/{}], Step [{}/{}], d_loss: {:.4f}, g_loss: {:.4f}, D(x): {:.2f}, D(G(z)): {:.2f}'.format(epoch, num_epochs, i + 1, total_step, d_loss.item(), g_loss.item(),real_score.mean().item(), fake_score.mean().item()))# Save real imagesif (epoch + 1) == 1:images = images.reshape(images.size(0), 1, 28, 28)save_image(denorm(images), os.path.join(sample_dir, 'real_images.png'))# Save sampled imagesfake_images = fake_images.reshape(fake_images.size(0), 1, 28, 28)save_image(denorm(fake_images), os.path.join(sample_dir, 'fake_images-{}.png'.format(epoch + 1)))# Save the model checkpoints 
torch.save(G.state_dict(), 'G.ckpt')
torch.save(D.state_dict(), 'D.ckpt')

结果

在这里插入图片描述

oneAPI

import intel_extension_for_pytorch as ipex# Device configuration
device = torch.device('xpu' if torch.cuda.is_available() else 'cpu')# Device setting
D = D.to(device)
G = G.to(device)# Binary cross entropy loss and optimizer
criterion = nn.BCELoss()
d_optimizer = torch.optim.Adam(D.parameters(), lr=0.0002)
g_optimizer = torch.optim.Adam(G.parameters(), lr=0.0002)'''
Apply Intel Extension for PyTorch optimization against the model object and optimizer object.
'''
D, d_optimizer = ipex.optimize(D, optimizer=d_optimizer)
G, g_optimizer = ipex.optimize(G, optimizer=g_optimizer)

[oneAPI] 手写数字识别-GAN

[oneAPI] 手写数字识别-GAN 手写数字识别参数与包加载数据模型训练过程结果 oneAPI 比赛：https://marketing.csdn.net/p/f3e44fbfe46c465f4d9d6c23e38e0517 Intel DevCloud for oneAPI：https://devcloud.intel.com/oneapi/get_started/aiAnalyticsToolki…...

编程日记 2023/8/17 14:20:40

爬虫逆向实战（十五）--阿某某营登录

一、数据接口分析主页地址：阿某某营 1、抓包通过抓包可以发现登录接口是Users/Login 2、判断是否有加密参数请求参数是否加密？ 通过查看“载荷”模块可以发现有一个s加密参数请求头是否加密？ 无响应是否加密？ 无cookie是…...

编程日记 2023/8/17 14:19:38

【计组】校验码（奇偶校验码、海明校验码、CRC）

前言 1、小提示：本篇博文是参考王道，在复习 ASCII 码的基础上，总结校验码的相关学习知识点，并在最后搭配习题（含408真题）进行巩固练习。（对重点内容进行划线、标色） 2、适用人群&…...

编程日记 2023/8/17 14:18:37

File Inclusion

File Inclusion 服务器执行PHP文件时，可以通过文件包含函数加载另一个文件中的PHP代码，并且当PHP来执行，这会为开发者节省大量的时间。这意味着您可以创建供所有网页引用的标准页眉或菜单文件。当页眉需要更新时，您只更新一个包含…...

编程日记 2023/8/17 14:17:36

函数性能探测：更简单高效的 Serverless 规格选型方案

作者：拂衣、丛霄 2019 年 Berkeley 预测 Serverless 将取代 Serverful 计算成为云计算新范式。Serverless 为应用开发提供了一种全新系统架构。借助 2023 年由 OpenAI 所带来的 AIGC 风潮，以阿里云函数计算 FC、AWS Lambda 为代表的 Serverless 以其更高…...

编程日记 2023/8/17 14:16:33

嵌入式Linux Qt5 (C++)开发栏目概述

本栏目开始介绍Linux系统下的Qt C程序开发，资源是以嵌入式为切入点（现在Linux系统下的Qt C程序开发好像就是应用于嵌入式），那就跟着一起学习Linux系统下的Qt C程序开发知识，再扩展一下嵌入式的知识吧。我这里默认已经熟…...

编程日记 2023/8/17 14:15:32

C语言“牵手”微店商品详情数据方法，微店商品详情API接口申请指南

微店平台的商品详情通常包括以下信息： 商品名称：展示商品的名称，用于描述商品的特性和分类。商品图片：展示商品的图片，可以有多张图片以展示不同角度和细节。商品价格：显示商品的销售价格，可…...

编程日记 2023/8/17 14:14:30

C++ volatile

volatile 一、volatile 使用场景 volatile 是 C 和 C 中的一个关键字，用于告诉编译器不要对标记为 volatile 的变量进行优化，以确保每次访问都从内存中读取变量的最新值。主要用于以下情况： 硬件寄存器和内存映射设备：在访问硬…...

编程日记 2023/8/17 14:13:30

空洞卷积学习笔记

文章目录 1. 扩张卷积的提出2. 理解的难点本片博客的主题思路来自于这篇文章——如何理解Dilated Convolutions(空洞卷积)，但是作者似乎是很久之前写的，文字的排版很混乱，自己来写一个新的。 1. 扩张卷积的提出 Multi-Scale Context Aggre…...

编程日记 2023/8/17 14:12:28

WPF中的UseLayoutRounding和SnapsToDevicePixels

WPF中的UseLayoutRounding和SnapsToDevicePixels 最近在调试项目中的UI时发现几个诡异问题： Grid容器里的GridSplitter设置粗细一样， 但截屏放大后发现线条不一样粗并且明暗不一致，导致打印出来有问题。自定义控件的边缘在某些窗体中显示模…...

编程日记 2023/8/17 14:11:26

Windows权限维持—自启动映像劫持粘滞键辅助屏保后门WinLogon

Windows权限维持—自启动&映像劫持&粘滞键&辅助屏保后门&WinLogon 1. 前置2. 自启动2.1. 路径加载2.1.1. 放置文件2.1.2. 重启主机 2.2. 服务加载2.2.1. 创建服务2.2.2. 查看服务2.2.3. 重启主机 2.3. 注册表加载2.3.1. 添加启动项2.3.2. 查看注册表2.3.3. 重启…...

编程日记 2023/8/17 14:10:25

Mysql之explain详解

1. explain作用使用explain可以展示出sql语句的执行计划，再根据sql的执行计划去判断这条sql有哪些点可以进行优化，从而让sql的效率达到最大化。 2. 执行计划各列含义 （1）id：id列是select的序列号，这个…...

编程日记 2023/8/17 14:09:24

每天一道leetcode：1926. 迷宫中离入口最近的出口（图论中等广度优先遍历）

今日份题目： 给你一个 m x n 的迷宫矩阵 maze （下标从 0 开始），矩阵中有空格子（用 . 表示）和墙（用表示）。同时给你迷宫的入口 entrance ，用 entrance [entrancerow, …...

编程日记 2023/8/17 14:08:23

Mysql_5.7下载安装与配置基础操作教程

目录一、Mysql57下载与安装二、尝试登录Mysql 三、配置Mysql环境变量一、Mysql57下载与安装首先，进入Mysql下载官网：MySQL Community Downloads 随后，选择版本5.7.43，系统选择Windows，随后下方会出现两个下载选…...

编程日记 2023/8/17 14:07:22

【业务功能篇68】电商项目相关核心设计

https证书 http 超文本传输协议： 超文本：包括：文字，图片，音频，视频等。传输：客户端向服务端发东西，服务端向客户端发东西。协议：三方协议。怎么传，错误…...

编程日记 2023/8/17 14:06:21

微信开发之一键退出群聊的技术实现

简要描述： 退出群聊请求URL： http://域名地址/quitChatRoom 请求方式： POST 请求头Headers： Content-Type：application/jsonAuthorization：login接口返回参数： 参数名必选类型说明wI…...

编程日记 2023/8/17 14:05:20

〔012〕Stable Diffusion 之中文提示词自动翻译插件篇

✨ 目录 🎈 翻译插件🎈 下载谷歌翻译🎈 谷歌翻译使用方法🎈 谷歌翻译使用效果 🎈 翻译插件在插件列表中搜索 Prompt Translator可以看到有2个插件选项：一个是基于谷歌翻译〔推荐〕、一个基于百度和deepl…...

编程日记 2023/8/17 14:04:19

【C++】一文带你初识C++继承

食用指南：本文在有C基础的情况下食用更佳 🍀本文前置知识： C类 ♈️今日夜电波：napori—Vaundy 1:21 ━━━━━━️💟──────── 3:23 …...

编程日记 2023/8/17 14:03:18

SDK是什么，SDK和API有什么区别

SDK（Software Development Kit）是一种开发工具包，通常由软件开发公司或平台提供，用于帮助开发人员构建、测试和集成特定平台或软件的应用程序。SDK 包含一系列的库、工具、示例代码和文档，旨在简化开发过程并提供所需的…...

编程日记 2023/8/17 14:02:16

golang中使用chan控制协程并发简单事例

func main() {processNum : 5ch : make(chan struct{}, processNum)for true {ch <- struct{}{}go func() {defer func() {<-ch}()fmt.Println("我是协程", time.Now().UnixNano())time.Sleep(time.Second * 5)}()} } 可以看到，这里每5s会执行一次带…...

编程日记 2023/8/17 14:01:15

测试微信模版消息推送

进入“开发接口管理”--“公众平台测试账号”，无需申请公众账号、可在测试账号中体验并测试微信公众平台所有高级接口。获取access_token: 自定义模版消息： 关注测试号：扫二维码关注测试号。发送模版消息： import requests da…...

编程新知 2026/2/8 4:37:13

label-studio的使用教程(导入本地路径)

文章目录 1. 准备环境2. 脚本启动2.1 Windows2.2 Linux 3. 安装label-studio机器学习后端3.1 pip安装(推荐)3.2 GitHub仓库安装 4. 后端配置4.1 yolo环境4.2 引入后端模型4.3 修改脚本4.4 启动后端 5. 标注工程5.1 创建工程5.2 配置图片路径5.3 配置工程类型标签5.4 配置模型5.…...

编程新知 2026/2/7 20:40:53

.Net框架，除了EF还有很多很多......

文章目录 1. 引言2. Dapper2.1 概述与设计原理2.2 核心功能与代码示例基本查询多映射查询存储过程调用 2.3 性能优化原理2.4 适用场景 3. NHibernate3.1 概述与架构设计3.2 映射配置示例Fluent映射XML映射 3.3 查询示例HQL查询Criteria APILINQ提供程序 3.4 高级特性3.5 适用场…...

编程新知 2026/2/1 19:26:16

页面渲染流程与性能优化

页面渲染流程与性能优化详解（完整版） 一、现代浏览器渲染流程（详细说明） 1. 构建DOM树浏览器接收到HTML文档后，会逐步解析并构建DOM（Document Object Model）树。具体过程如下： (…...

编程新知 2026/1/31 11:58:35

生成 Git SSH 证书

🔑 1. 生成 SSH 密钥对在终端（Windows 使用 Git Bash，Mac/Linux 使用 Terminal）执行命令： ssh-keygen -t rsa -b 4096 -C "your_emailexample.com" 参数说明： -t rsa&#x…...

编程新知 2025/9/18 11:31:13

Linux-07 ubuntu 的 chrome 启动不了

文章目录问题原因解决步骤一、卸载旧版chrome二、重新安装chorme三、启动不了，报错如下四、启动不了，解决如下总结问题原因在应用中可以看到chrome，但是打不开(说明：原来的ubuntu系统出问题了，这个是备用的硬盘&a…...

编程新知 2026/1/29 17:56:19

WordPress插件：AI多语言写作与智能配图、免费AI模型、SEO文章生成

厌倦手动写WordPress文章？AI自动生成，效率提升10倍！ 支持多语言、自动配图、定时发布，让内容创作更轻松！ AI内容生成 → 不想每天写文章？AI一键生成高质量内容！多语言支持 → 跨境电商必备&am…...

编程新知 2026/1/30 17:24:20

【服务器压力测试】本地PC电脑作为服务器运行时出现卡顿和资源紧张（Windows/Linux）

要让本地PC电脑作为服务器运行时出现卡顿和资源紧张的情况，可以通过以下几种方式模拟或触发： 1. 增加CPU负载运行大量计算密集型任务，例如： 使用多线程循环执行复杂计算（如数学运算、加密解密等）。运行图…...

编程新知 2025/11/30 10:30:15

用docker来安装部署freeswitch记录

今天刚才测试一个callcenter的项目，所以尝试安装freeswitch 1、使用轩辕镜像 - 中国开发者首选的专业 Docker 镜像加速服务平台编辑下面/etc/docker/daemon.json文件为 {"registry-mirrors": ["https://docker.xuanyuan.me"] }同时可以进入轩…...

编程新知 2026/2/1 3:20:44

【无标题】路径问题的革命性重构：基于二维拓扑收缩色动力学模型的零点隧穿理论

路径问题的革命性重构：基于二维拓扑收缩色动力学模型的零点隧穿理论一、传统路径模型的根本缺陷在经典正方形路径问题中（图1）： mermaid graph LR A((A)) --- B((B)) B --- C((C)) C --- D((D)) D --- A A -.- C[无直接路径] B -…...

编程新知 2025/10/21 1:07:59

[oneAPI] 手写数字识别-GAN

手写数字识别

参数与包

加载数据

模型

训练过程

结果

oneAPI

相关文章：