当前位置：首页 > news >正文

keras图片数字识别入门AI机器学习

news 2026/2/9 6:36:03

通过使用mnist（AI界的helloworld）手写数字模型训练集，了解下AI工作的基本流程。

本例子，要基于mnist数据集（该数据集包含了【0-9】的模型训练数据集和测试数据集）来完成一个手写数字识别的小demo。

mnist数据集，图片大小是28*28的黑白。包含了6w 训练数据和1w验证数据。

麻雀虽小五脏俱全。通过这个CV类型的demo需求，我们会学到神经网络模型。

从数据加载，到数据预处理，再到训练模型，保存模型。然后再通过模型来预测我们输入的图片数字。

通过整个过程下来，对于像我这样初识AI深度学习者来说，可以有一个非常好的体感。

我们通过keras+tensorflow2.0来上手。

数据加载

keras 框架，提供了现成的方法来获取mnist数据集

(x_train_image, y_train_label), (x_test_image, y_test_label) = mnist.load_data()

这个方法会返回两组数据集
train_image，train_label ，训练数据集、分类标签
x_test_image, y_test_label，验证数据集、分类标签

要想让机器识别一个图片，需要对图片进行像素化，将像素数据转换成张量矩阵数据。

mnist.load_data() 返回的就是已经转换好的张量矩阵数据。

（在python中，通过NumPy多维数组表示。）

数据预处理

我们这个demo属于AI for CV 方向。

CV信息首先要像素化处理，拿到张量信息。

# 转换成一维向量 28*28=784
x_train = x_train_image.reshape(60000, 784)
x_test = x_test_image.reshape(10000, 784)# 标准化0-1
x_Test_normalize = x_test.astype('float32') / 255
x_Train_normalize = x_train.astype('float32') / 255

通过reshape方法将三维转换成二维，同时通过量化将计算数据缩小但是不影响模型训练识别。
（mnist图片数据是黑白，位深为8位，0-255表示像素信息）。

mnist

通过可视化，我们能大概看到图片的数字特征是怎么被感知到的。

同时将label标签数据转换成0-1的矩阵。

# 将训练集和测试集标签都进行独热码转化
y_TrainOneHot = np_utils.to_categorical(y_train_label)
y_TestOneHot = np_utils.to_categorical(y_test_label)

构建模型

# 建立Sequential 模型
model = Sequential()
# 建立输入层、隐藏层
model.add(Dense(units=256,input_dim=784,kernel_initializer='normal',activation='relu'))
# 建立输出层
model.add(Dense(units=10,kernel_initializer='normal',activation='softmax'))# 定义模型训练参数
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

定义神经网络模型参数。这里每一个参数都是一个非常深的学科，但是工程使用了解下就可以了。

训练模型

# 开始训练
train_history = model.fit(x=x_Train_normalize, y=y_TrainOneHot,validation_split=0.2, epochs=10, batch_size=200, verbose=2)
# 显示训练过程
show_train_history(train_history, 'accuracy', 'val_accuracy')

mnist

随着训练次数不断增加，整个精确度也越来越高。

我们看下训练过程的日志。

Epoch 1/10
240/240 - 3s - loss: 0.1211 - accuracy: 0.8309 - val_loss: 0.0564 - val_accuracy: 0.9228 - 3s/epoch - 11ms/step
Epoch 2/10
240/240 - 1s - loss: 0.0492 - accuracy: 0.9312 - val_loss: 0.0392 - val_accuracy: 0.9470 - 831ms/epoch - 3ms/step
Epoch 3/10
240/240 - 1s - loss: 0.0360 - accuracy: 0.9495 - val_loss: 0.0313 - val_accuracy: 0.9570 - 890ms/epoch - 4ms/step
Epoch 4/10
240/240 - 1s - loss: 0.0286 - accuracy: 0.9598 - val_loss: 0.0278 - val_accuracy: 0.9610 - 900ms/epoch - 4ms/step
Epoch 5/10
240/240 - 1s - loss: 0.0239 - accuracy: 0.9675 - val_loss: 0.0243 - val_accuracy: 0.9679 - 1s/epoch - 5ms/step
Epoch 6/10
240/240 - 1s - loss: 0.0204 - accuracy: 0.9723 - val_loss: 0.0224 - val_accuracy: 0.9698 - 1s/epoch - 5ms/step
Epoch 7/10
240/240 - 1s - loss: 0.0177 - accuracy: 0.9772 - val_loss: 0.0210 - val_accuracy: 0.9714 - 1s/epoch - 4ms/step
Epoch 8/10
240/240 - 1s - loss: 0.0155 - accuracy: 0.9805 - val_loss: 0.0201 - val_accuracy: 0.9729 - 984ms/epoch - 4ms/step
Epoch 9/10
240/240 - 1s - loss: 0.0137 - accuracy: 0.9833 - val_loss: 0.0189 - val_accuracy: 0.9742 - 1s/epoch - 5ms/step
Epoch 10/10
240/240 - 1s - loss: 0.0122 - accuracy: 0.9861 - val_loss: 0.0182 - val_accuracy: 0.9751 - 975ms/epoch - 4ms/step

可以看到，每一轮训练，loss 的值在逐步变小，accuracy 在逐步增加。

每一次训练，模型中的损失函数在计算出一个参数给到优化器进行反向传播，不断的调整神经元的权重。

模型训练好之后，需要用测试数据集来验证模型的准确度。

scores = model.evaluate(x_Test_normalize, y_TestOneHot)
print('accuracy=', scores[1])

accuracy= 0.975600004196167

保存模型

mode.save()
model.save('model.h5') #也可以保存到具体的文件中

保存的模型里面具体是什么，了解神经网络原理之后，大概能明白。其实模型里最重要的是 神经元的权重值
这个demo的模型我放到这里了。
（https://gitee.com/wangqingpei/blogimages/blob/master/mnist-helloworld/test/model-mnist/model.h5）

预测数据

我们准备几个手写的数字测试下。
mnist

读取本地图片文件

def get_local_image():img = Image.open('3.png')img = img.convert('L').resize((28, 28))img_array = np.array(img)# 将像素值转换为0-1之间的浮点数img_array = img_array.astype('float32') / 255.0img_array_result = np.reshape(img_array, (1, 784))return img_array_result

mnist

加载模型进行预测

def autoNumberWord():model = load_model("/Users/wangqingpei/Downloads/test/model-mnist/model.h5")img = get_local_image()prediction = model.predict(img)prediction_result = np.argmax(prediction)print('本地文件预测：', prediction_result)

240/240 - 1s - loss: 0.0130 - accuracy: 0.9843 - val_loss: 0.0183 - val_accuracy: 0.9755 - 848ms/epoch - 4ms/step
Epoch 10/10
240/240 - 1s - loss: 0.0116 - accuracy: 0.9866 - val_loss: 0.0177 - val_accuracy: 0.9761 - 873ms/epoch - 4ms/step
313/313 [==============================] - 1s 2ms/step - loss: 0.0167 - accuracy: 0.9767
accuracy= 0.9767000079154968
1/1 [==============================] - 0s 116ms/step
Backend MacOSX is interactive backend. Turning interactive mode on.
本地文件预测： 3

学会使用AI数字助手 chartGPT

在学习过程中，遇到问题要改变习惯，用chartGPT。～_～

在学习这个demo的时候，关于加载本地图片的地方我搞了半天不行，后来求助chartGPT，还是很方便的。

mnist
mnist
mnist

未来AI工具肯定是越来越产品化，易使用。
但是，要想跟AI对话，需要对特定的领域有一定的理解。Prompt Engineer 也一定是趋势。

keras图片数字识别入门AI机器学习

通过使用mnist（AI界的helloworld）手写数字模型训练集，了解下AI工作的基本流程。本例子，要基于mnist数据集（该数据集包含了【0-9】的模型训练数据集和测试数据集）来完成一个手写数字识别的小demo。 mnist…...

编程日记 2023/3/10 1:21:35

使用qt编写一个程序，伪造一个ip访问一个网站。

你好，这是Bing。😊 根据网络搜索结果，使用qt编写一个程序，伪造一个ip访问一个网站的方法可能有以下几种： - 使用X-Forwarded-For请求头来伪造客户端的真实ip地址。这种方法需要在发送请求时添加X-Forwarded-For: 伪造…...

编程日记 2023/3/10 1:20:32

探访人工智能领跑者：纷享销客携手30+TOP高科技企业走进旷视科技

拥有全球规模领先的计算机视觉研究院； 揽获28项世界顶级AI竞赛冠军； 世界级人工智能公司； 没错，它就是人工智能行业的务实者和领跑者，旷视科技。 3月3日，北京软件和信息服务业协会联合纷享销客，…...

编程日记 2023/3/10 1:19:29

UTC、TimeZone、TimeStamp

UTC ：Universal Time Coordinated，世界协调时，又称世界标准时间。与UTC time对应的是各个时区的local time，东N区的时间比UTC时间早N个小时，因此UTC time N小时即为东N区的本地时间；而西N区时间比UTC时间…...

编程日记 2023/3/10 1:18:24

探究SMC局部代码加密技术以及在CTF中的运用

前言近些日子在很多线上比赛中都遇到了smc文件加密技术,比较出名的有Hgame杭电的比赛,于是我准备实现一下这项技术，但是在网上看了很多文章，发现没有讲的特别详细的，或者是无法根据他们的方法进行实现这项技术，因此本篇文章就是…...

编程日记 2023/3/10 1:17:19

免费集装箱箱号识别API，人工智能企业CIMCAI集装箱识别检测人工智能平台全球4千企业用户，支持API集成二次开发人工智能企业

免费集装箱箱号识别API，人工智能企业CIMCAI集装箱识别检测人工智能平台全球4千企业用户，支持API集成二次开发。箱信息识别及铅封号识别功能免费，顶尖AI集装箱识别率99.98%，全球No.1集装箱人工智能企业CIMCAI打造。中国上海人工智能…...

编程日记 2023/3/10 1:16:16

pdf多页合并为一页方法总结，你觉得哪个最好？

PDF格式的文件在现代办公中是不可或缺的，许多人在工作中需要频繁处理PDF文档。然而，当我们需要阅读多个PDF文件时，不断切换不同的文件并一个一个地打开查阅会非常麻烦。为了提高阅读效率，人们一般会将pdf多页合并为一页。那么&…...

编程日记 2023/3/10 1:15:13

每日一读【基金/股票投资的常识和纪律】

个人投资的几点总结，我时常拿来阅读，警示自己: ＊基于常识，独立思考。 ＊投资以年为单位，5年一周期。 ＊下跌时的信心比金子还贵，永远要记住：风险是涨上去的，机会…...

编程日记 2023/3/10 1:14:11

阶段二12_面向对象高级_继承3

知识点内容： 抽象类模板设计模式 final关键字一.抽象类 (1)抽象类概述抽象方法：将共性的行为（方法）抽取到父类之后，发现该方法的实现逻辑无法在父类中给出具体明确，该方法就可以定义为抽象方法。抽…...

编程日记 2023/3/10 1:13:08

C++ STL：string类的概述及常用接口说明

目录一. 什么是STL 二. string类的概述三. string类的常用接口说明 3.1 字符串对象创建相关接口（构造函数） 3.2 字符串长度和容量相关接口 3.3 字符访问相关接口函数 3.4 字符串删改相关接口函数 3.5 字符查找和子串相关接口函数 3.6 迭代器相…...

编程日记 2023/3/10 1:12:04

java Math类和 System类详解（通俗易懂）

Math类介绍Math类常用方法及演示System类简介System类常用方法及演示一、前言本节内容是我们《API-常用类》专题的第四小节了。本节内容主要讲Math类和System类， 内容包括Math类介绍、Math类常用方法、System类介绍，System类常用方法。该小节内容基本不涉…...

编程日记 2023/3/10 1:10:59

软件回归测试是什么?

一、软件回归测试是什么? 软件回归测试作为软件生命周期的一个组成部分，在整个软件测试过程中占有很大的工作量比重，软件开发的各个阶段都会进行多次回归测试。回归测试是指修改了旧代码后，重新进行测试以确认修改没有引入新的错误或导致其…...

编程日记 2023/3/10 1:09:54

TwinCAT3中ModbusTCP Server和C# Client连接

目录一、硬件环境 1、设置PLC的ip地址 2、ModbusTCP软件安装 3、PLC操作系统防火墙设置 4、网络助手连接PLC 二、创建PLC工程 1、创建寄存器读写变量 2、添加ModbusTCP授权 3、激活和运行工程三、ModbusTCP数据协议说明 1、写单个寄存器 2、读寄存器 （1&…...

编程日记 2023/3/10 1:08:50

【上传项目代码到Git详细步骤】

1.下载安装Git到电脑上（这里我之前已经安装好了，就不细说了）2.进入控制台安装好后右键点击桌面空白部分会多出两个菜单选项，点击第二个Git Bash Here（点击第一个你会爆炸）会弹出一个git控制台，如…...

编程日记 2023/3/10 1:07:48

C++回顾（十五）—— 类模板

15.1 为什么要有类模板类模板用于实现类所需数据的类型参数化类模板在表示如数组、表、图等数据结构显得特别重要，这些数据结构的表示和算法不受所包含的元素类型的影响 15.2 单个类模板语法注意：类模板的创建对象一定要显示调用（指明类型…...

编程日记 2023/3/10 1:06:45

【JavaEE初阶】第四节.文件操作和 IO （下篇）

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言三、文件内容的操作 3.1 读文件 3.1.1 使用字节流读文件 3.2 写文件 3.2.1 使用字节流写文件 …...

编程日记 2023/4/11 7:36:43

华为OD机试用Python实现 -【分解质因数】 2023Q1A

华为OD机试题本篇题目：分解质因数题目示例 1输入输出示例 2输入输出Code代码编写思路最近更新的博客华为od 2023 | 什么是华为od，od 薪资待遇，od机试题清单华为OD机试真题大全，用 Python 解华为机试题 | 机试宝典【华为OD机试】全流程解析+经验分享,题型分享,防作弊指南...

编程日记 2023/4/11 7:36:40

博客项目

文章目录1. 创建项目2. 数据库设计3. 前置任务3.1 拦截器3.2 统一数据格式3.3 创建一个 Constant3.4 统一异常处理3.5 密码加密4. 功能实现4.1 登录功能4.2 注册功能4.3 博客列表页 （功能实现）4.3.1 左侧框4.3.2 右侧框 (分页功能页面显示)4.4 博客详情…...

编程日记 2023/4/11 7:36:36

C++基础了解-20-C++类对象

C 类 & 对象一、C 类 & 对象 C 在 C 语言的基础上增加了面向对象编程，C 支持面向对象程序设计。类是 C 的核心特性，通常被称为用户定义的类型。类用于指定对象的形式，它包含了数据表示法和用于处理数据的方法。类中的数据和方法…...

编程日记 2023/4/11 7:36:33

多态与虚（函数）表

前言续接上回（继承），我们了解了继承是如何通过虚基表，来解决派生类和父类有相同的成员变量的情况，但是类和对象中可不只有成员变量，如果成员函数也有同名，更或者如果我们想在访问不同情况&#…...

编程日记 2023/4/11 7:36:30

华为云AI开发平台ModelArts

华为云ModelArts：重塑AI开发流程的“智能引擎”与“创新加速器”！ 在人工智能浪潮席卷全球的2025年，企业拥抱AI的意愿空前高涨，但技术门槛高、流程复杂、资源投入巨大的现实，却让许多创新构想止步于实验室。数据科学家…...

编程新知 2026/2/8 4:37:19

智慧医疗能源事业线深度画像分析（上）

引言医疗行业作为现代社会的关键基础设施，其能源消耗与环境影响正日益受到关注。随着全球"双碳"目标的推进和可持续发展理念的深入，智慧医疗能源事业线应运而生，致力于通过创新技术与管理方案，重构医疗领域的能源使用模式。这一事业线融合了能源管理、可持续发…...

编程新知 2026/2/8 20:41:46

UE5 学习系列（三）创建和移动物体

这篇博客是该系列的第三篇，是在之前两篇博客的基础上展开，主要介绍如何在操作界面中创建和拖动物体，这篇博客跟随的视频链接如下： B 站视频：s03-创建和移动物体如果你不打算开之前的博客并且对UE5 比较熟的话按照以…...

编程新知 2026/1/24 10:00:31

Linux --进程控制

本文从以下五个方面来初步认识进程控制： 目录进程创建进程终止进程等待进程替换模拟实现一个微型shell 进程创建在Linux系统中我们可以在一个进程使用系统调用fork()来创建子进程，创建出来的进程就是子进程，原来的进程为父进程。…...

编程新知 2026/1/30 15:27:25

GitHub 趋势日报 (2025年06月06日)

📊 由 TrendForge 系统生成 | 🌐 https://trendforge.devlive.org/ 🌐 本日报中的项目描述已自动翻译为中文 📈 今日获星趋势图今日获星趋势图 590 cognee 551 onlook 399 project-based-learning 348 build-your-own-x 320 ne…...

编程新知 2026/1/29 5:21:31

MySQL 8.0 事务全面讲解

以下是一个结合两次回答的 MySQL 8.0 事务全面讲解，涵盖了事务的核心概念、操作示例、失败回滚、隔离级别、事务性 DDL 和 XA 事务等内容，并修正了查看隔离级别的命令。 MySQL 8.0 事务全面讲解一、事务的核心概念（ACID） 事务是…...

编程新知 2025/9/19 22:12:36

WebRTC从入门到实践 - 零基础教程

WebRTC从入门到实践 - 零基础教程目录 WebRTC简介基础概念工作原理开发环境搭建基础实践三个实战案例常见问题解答 1. WebRTC简介 1.1 什么是WebRTC？ WebRTC（Web Real-Time Communication）是一个支持网页浏览器进行实时语音…...

编程新知 2026/1/5 0:33:43

Proxmox Mail Gateway安装指南：从零开始配置高效邮件过滤系统

💝💝💝欢迎莅临我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐：「storms…...

编程新知 2026/1/17 14:57:41

Kafka主题运维全指南：从基础配置到故障处理

#作者：张桐瑞文章目录主题日常管理1. 修改主题分区。2. 修改主题级别参数。3. 变更副本数。4. 修改主题限速。5.主题分区迁移。6. 常见主题错误处理常见错误1：主题删除失败。常见错误2：__consumer_offsets占用太多的磁盘。主题日常管理 …...

编程新知 2025/6/10 21:14:43

Python 高效图像帧提取与视频编码：实战指南

Python 高效图像帧提取与视频编码：实战指南在音视频处理领域，图像帧提取与视频编码是基础但极具挑战性的任务。Python 结合强大的第三方库（如 OpenCV、FFmpeg、PyAV），可以高效处理视频流，实现快速帧提取、压缩编码等关键功能。本文将深入介绍如何优化这些流程，提高处理…...

编程新知 2025/8/31 18:02:53

数据加载

数据预处理

构建模型

训练模型

保存模型

预测数据

学会使用AI数字助手 chartGPT

相关文章：