当前位置：首页 > news >正文

机器学习（2）-- KNN算法之手写数字识别

news 2026/2/8 16:25:42

KNN算法

KNN（K-Nearest Neighbor，K最近邻）算法是一种用于分类和回归的非参数统计方法，尤其在分类问题中表现出色。在手写数字识别领域，KNN算法通过比较测试样本与训练样本之间的距离，找到最近的K个邻居，并根据这些邻居的类别来预测测试样本的类别。

接下来，让我们详细了解了解，knn怎么进行手写数字识别：

数字识别

对于数字识别我们进行三个方面来完成它：

训练模型：得到模型
测试模型：测试模型识别的准确率
测试新的数据：查看实用效果

训练模型

收集数据

在这里插入图片描述

读取图片数据

使用opencv处理图片，将图片的像素数值读取进来，并返回的是一个三维（高，宽，颜色）numpy数组

 pip install opencv-python==3.4.11.45

import cv2
img = cv2.imread("digits.png")

转化灰度图

将图片转化为灰度图，从而让三维数组变成二位的数组：

gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

处理图像

对图片进行处理：将其先垂直切分（横向）成50份，再将每一份水平切分（竖向）成100份,这样我们的每份图片的像素值都为20*20（训练的图片比较规范）共500个,比如：

在这里插入图片描述

cells = [np.hsplit(row,100) for row in np.vsplit(gray,50)] #列表生成式

装进array数组

将切分的每一份图片像素数据都装进array数组中：

x = np.array(cells)

分隔数据

将数据竖着分隔一半，一半作为训练集，一般作为测试集：

train = x[:,:50]
test = x[:,50:100]

调整数据结构

由于我们最后要将数据放在KNN算法中训练，我们得将数据结构调整为适合KNN算法训练的结构，KNN要求输入的数据为二维数组，那么我们就来改变每份图片数组的维度：reshape：

train_new = train.reshape(-1,400).astype(np.float32)

分配标签

我们训练着那么多的数据，却没有给他们具体的类别标签（图像的实际值），因为我们之前的图像处理都是在寻找图像特征，但是并没有给他们一个具体对应的类别，只有空荡荡的特征，无法分类，所以我们得给切分的每份图片打上它们对应的标签：

#repeat用于重复数组中数值，此处重复250次，因为训练集中表示每个类别的图片只有250个，要将它们一一对应打上标签
#np.newaxis用于在数组中创建一个新的维度，即将每个标签单独放
#原本[00000……1111……] ----> [[0][0]……[1][1]……]
k = np.arange(10)
train_mark = np.repeat(k,250)[:,np.newaxis]

训练模型

在训练时，将训练集与标签一一对应训练：

#通过cv2创建一个knn模型
knn = cv2.ml.KNearest_create()
#cv2.ml.ROW_SAMPLE：告诉opencv将训练的数据与类别按行一一对应训练
knn.train(train_new,cv2.ml.ROW_SAMPLE,train_mark)

这样我们就训练好的这份简单的数据内容，训练了一个可以识别数字0~9的模型，模型训练完了，我们总得知道它到底能不能识别数字吧？识别数字成功的准确率能达到多少呢？

测试模型

评估性能：测试模型帮助评估模型的准确性、效率、鲁棒性和其他性能指标。
识别问题：通过测试，可以及早发现和定位模型或产品中的缺陷、错误或不足之处。
优化和改进：测试模型提供的数据和反馈是优化和改进模型或产品的关键依据。基于测试结果，可以调整模型参数、改进算法设计、优化系统架构等，以提升模型或产品的性能和质量。

那么我们来测试我们刚刚训练出的模型：

前面说了，图片中的数据一半作为训练集，一半作为测试集，将测试集数据也进行以上操作：

test_new = test.reshape(-1,400).astype(np.float32) #调整数据结构
test_labels = np.repeat(k,250)[:,np.newaxis] #分配标签

处理好测试集的数据之后，我们来测试模型：

#将测试集放入模型测试
ret,result,neighbours,dist = knn.findNearest(test_new,k=3)#ret:表示操作是否成功#result：表示测试样本的预测标签（浮点数组）#neighbours：表示与测试样本最近的k个邻居的索引（整数数组）#dist：表示测试样本与每个最近邻居之间的距离（浮点数组）

#通过测试集校验准确率
matches = result==test_labels #将模型对测试集的预测结果（result）与实际的测试标签（test_labels）进行比较。
correct = np.count_nonzero(matches) #计算 matches 数组中 True（即正确预测）的数量
accuracy = correct*100.0/result.size #result.size 返回 result 数组中的元素总数
print("当前准确率为：",accuracy)

模型测试完成后，我们要尝试它在实际中的使用效果，查看其实用性。

测试新的数据

在画图软件中，画几个像素值20*20的图片，让其进入模型看看测试结果：比如：

在这里插入图片描述

这个测试数据已经进行了一部分的处理：

#处理图片
try_img = cv2.imread("4.png")  #读取图片
try_gray = cv2.cvtColor(try_img,cv2.COLOR_BGR2GRAY) #转为灰度图，二维
z = np.array(try_gray) #装入二维数组
try_new = z.reshape(-1,400).astype(np.float32) #调整结构，适用于KNN

#测试结果
ret,result,neighbours,dist = knn.findNearest(try_new,k=3)
print(result)  #查看测试结果，显示分类类别
------------------
[[4.]]  #测试结果正确

总结

本篇介绍了如何使用KNN算法进行手写数字识别：

训练模型：收集数据 – 读取图片数据 – 转化灰度图 – 处理图像 – 装进array数组 – 调整数据结构 – 分配标签 – 训练模型
测试模型：评估性能 – 识别问题 – 优化和改进
测试数据：查看实用性

机器学习（2）-- KNN算法之手写数字识别

KNN算法 KNN（K-Nearest Neighbor，K最近邻）算法是一种用于分类和回归的非参数统计方法，尤其在分类问题中表现出色。在手写数字识别领域，KNN算法通过比较测试样本与训练样本之间的距离，找到最近的K个邻居&am…...

编程日记 2024/8/17 3:54:32

【机器人】关于钉钉机器人如何进行自定义开发问答【详细清晰】

目标：当用户输入问题并钉钉机器人，钉钉机器人进行相应的回答，达到一种交互问答的效果开发文档参考：https://open.dingtalk.com/document/orgapp/robot-overview 首先进行登录企业，后面如果没有进行登录，会…...

编程日记 2024/8/17 3:51:27

Qt：exit,quit,close的用法及区别

前言虽然能从单词的字面意思大致理解这些函数的意思，但是总感觉不出来它们的区别以及用法，特地去研究一下正文在 Qt 中，quit、exit 和 close 都是用于终止程序或关闭窗口的方法 1. QApplication::quit() 注意：注意quit() …...

编程日记 2024/8/17 3:50:26

Linux——进程地址空间

前言在操作系统中，内存分为以下几个区域，从下往上按照从小到大排列一、程序地址的分布代码 #include <stdio.h> #include <stdlib.h> int noval; int val 1;int main(int argc,char*argv[],char*env[]){printf("code addr %p\n&q…...

编程日记 2024/8/17 3:49:25

信创(国产化)方案

信创信创，即信息技术应用创新，旨在实现信息技术自主可控openEuler openEuler是一款开源、免费的操作系统，由openEuler社区运作，前身为运行在华为公司通用服务器上的操作系统EulerOS。openEuler作为一款开源、免费的操作系统，由开放原子开源基金会（OpenAtom Foundation）…...

编程日记 2024/8/17 3:47:23

EasyRecovery17中文版永久汉化版电脑数据恢复工具下载

🎈🎉安利时间到！今天要跟大家分享的是——EasyRecovery17中文版的最新功能！🎉🎈 🌟✨ “数据恢复小能手” ✨🌟 让我来介绍一下这款软件的主打特点。 EasyRecovery17中文版是一款强…...

编程日记 2024/8/17 3:46:22

Cesium倾斜相机视角观察物体

先看效果： 在cesium中，我们有时需要倾斜相机视角去观察物体，如相机俯视45观察物体。 cesium的api提供了倾斜相机视角的配置，但是直接使用cesium的api不能达到我们想要的效果。函数如下： function flyToBox() {let l…...

编程日记 2024/8/17 3:43:19

C/C++开发---全篇

1、统筹学习目标： C/C、python精通。就业匹配方向：专精一个领域，延长职业生涯。 （1）适配行业； （2）量化； （3）安全； （4&…...

编程日记 2024/8/17 3:42:18

Android全面解析之context机制（二）：从源码角度分析context创建流程（上）

前言这篇文章从源码角度分析context创建流程。在上一篇Android全面解析之Context机制(一) :初识context一文中讲解了context的相关实现类。经过前面的讨论，读者对于context在心中有了一定的理解。但始终觉得少点什么：activity是什么时候被创建的&…...

编程日记 2024/8/17 3:37:13

WPS真题题库导入刷题小程序：百思考个人使用经验分享

这篇文章的诞生，是因为我即将踏上一场超级有趣的挑战——备考全国计算机等级二级WPS Office高级应用与设计的冒险之旅！ WPS的分值： 单项选择题20分(含公共基础知识部分10分)。 WPS处理文字文档操作题30分。 WPS处理电子表格操作题30分。 …...

编程日记 2024/8/17 3:36:12

拯救者双系统问题 Verifiying shim SBAT data failed: Security Policy Violation

Verifiying shim SBAT data failed: Security Policy Violation Something has gone seriously wrong: SBAT self-check failed: Security Policy Violation windows更新的问题 https://forums.linuxmint.com/viewtopic.php?t427297 https://github.com/Metabolix/HackBGRT/…...

编程日记 2024/8/17 3:35:11

ThreeJs学习笔记--坐标系，光源，相机控件

坐标系一、创建添加坐标系给场景添加坐标系THREE.AxesHelper()的参数表示坐标系坐标轴线段尺寸大小，你可以根据需要改变尺寸 const axesHelper new THREE.AxesHelper(200)//数值是坐标的尺寸 scene.add(axesHelper)//添加到场景里坐标系包含三个坐标轴&…...

编程日记 2024/8/17 3:33:09

基于 Android studio 实现停车场管理系统--原创

目录一、项目演示二、开发环境三、项目页面四、项目详情五、项目完整源码一、项目演示二、开发环境三、项目详情 1.启动页这段代码是一个简单的Android应用程序启动活动（Activity），具体功能如下： 1. **延迟进入登…...

编程日记 2024/8/17 3:32:08

8 个最佳 Java IDE 和文本编辑器

从 2024 年使用的最佳 Java IDE 和代码编辑器中进行选择，并提高您的 Java 生产力。 Java 是世界上最流行的编程语言之一，于 1995 年首次推出，它确实践行了“编写一个，随处运行”的座右铭。该语言用途广泛，可用于构建从…...

编程日记 2024/8/17 3:29:06

【2024最新版版】PyCharm安装教程

简介由于Python语法简单容易入门，并且Python在办公自动化等领域的功能非常强大，所以现在越来越多非IT行业的人也开始学起了Python，要学习和使用一门编程语言，一个好用的IDE是必不可少的，而对于Python来说&#xff0c…...

编程日记 2024/8/17 3:27:04

奥运科技观察：AI PC，如何成为当代体育精神的数字捍卫者？

作者 | 曾响铃文 | 响铃说数字孪生帮助体育馆建设、超高清直播……这届奥运会科技感拉满，几乎所有前沿技术都能在奥运的赛事运营中发现。而AI大时代，AI如何帮助帮助奥运会顺利举办、如何帮助运动员拥有更好的表现，同样值得业界关注&…...

编程日记 2024/8/17 3:25:02

Java进阶篇之包的概念及其应用

引言在前面的文章中，我们介绍了抽象类和抽象方法（Java进阶篇之抽象类和抽象方法），在Java编程中，包（Package）是管理类和接口的重要工具。包不仅提供了一种层次化的命名空间机制，还可…...

编程日记 2024/8/17 3:17:54

短剧出海，赚钱新途径，掌握海外短剧CPS分销的秘诀

国内短剧发展的如日中天，需要的资质也是越来越严格，不少人已经将目标瞄向海外短剧市场，海外短剧这块相对来说并没有那么严格，但很多人在海外推广的道路上举步维艰，推广异常困难，重点讲下目前海外短剧的推广…...

编程日记 2024/8/17 3:15:51

uniapp小程序openid和unionId

1. openid 1. 用户的openid在小程序中的固定不变的； 2. 用户在不同的小程序里的openid是不一样的； 3. 只要appid不变，openid就不变。获取openid 1. 使用uni.login获取code 2. 使用code调接口换取用户唯一标识 OpenID 、用户在微信开放平台…...

编程日记 2024/8/17 3:12:48

前端工程化-04.Vue项目简介

一.Vue项目-创建 1.使用如图两种方式创建Vue项目 2.在此创建新项目点击创建项目创建成功！ 二.Vue项目-目录结构三.Vue项目-运行启动后直接在下方找到连接端口成功启动项目这个项目即为Vue中的自带项目Vue.app。修改其中的Home为Vue Home。ctals保存发…...

编程日记 2024/8/17 3:10:46

Mac软件卸载指南，简单易懂！

刚和Adobe分手，它却总在Library里给你写"回忆录"？卸载的Final Cut Pro像电子幽灵般阴魂不散？总是会有残留文件，别慌！这份Mac软件卸载指南，将用最硬核的方式教你"数字分手术"&#xff0…...

编程新知 2026/2/7 0:48:56

06 Deep learning神经网络编程基础激活函数 --吴恩达

深度学习激活函数详解一、核心作用引入非线性：使神经网络可学习复杂模式控制输出范围：如Sigmoid将输出限制在(0,1)梯度传递：影响反向传播的稳定性二、常见类型及数学表达 Sigmoid σ ( x ) = 1 1 +...

编程新知 2025/11/17 21:48:26

【HTTP三个基础问题】

面试官您好！HTTP是超文本传输协议，是互联网上客户端和服务器之间传输超文本数据（比如文字、图片、音频、视频等）的核心协议，当前互联网应用最广泛的版本是HTTP1.1，它基于经典的C/S模型，也就是客…...

编程新知 2025/12/10 6:18:55

QT： `long long` 类型转换为 `QString` 2025.6.5

在 Qt 中，将 long long 类型转换为 QString 可以通过以下两种常用方法实现： 方法 1：使用 QString::number() 直接调用 QString 的静态方法 number()，将数值转换为字符串： long long value 1234567890123456789LL; …...

编程新知 2026/2/1 6:30:04

CMake控制VS2022项目文件分组

我们可以通过 CMake 控制源文件的组织结构，使它们在 VS 解决方案资源管理器中以“组”（Filter）的形式进行分类展示。 🎯 目标通过 CMake 脚本将 .cpp、.h 等源文件分组显示在 Visual Studio 2022 的解决方案资源管理器中。 ✅ 支持的方法汇总（共4种）方法描述是否推荐…...

编程新知 2025/12/4 15:47:17

浪潮交换机配置track检测实现高速公路收费网络主备切换NQA

浪潮交换机track配置项目背景高速网络拓扑网络情况分析通信线路收费网络路由收费汇聚交换机相应配置收费汇聚track配置项目背景在实施省内一条高速公路时遇到的需求，本次涉及的主要是收费汇聚交换机的配置，浪潮网络设备在高速项目很少，通…...

编程新知 2026/2/6 13:10:51

C#学习第29天：表达式树（Expression Trees）

目录什么是表达式树？ 核心概念 1.表达式树的构建 2. 表达式树与Lambda表达式 3.解析和访问表达式树 4.动态条件查询表达式树的优势 1.动态构建查询 2.LINQ 提供程序支持： 3.性能优化 4.元数据处理 5.代码转换和重写适用场景代码复杂性…...

编程新知 2025/10/20 9:03:01

MySQL 8.0 事务全面讲解

以下是一个结合两次回答的 MySQL 8.0 事务全面讲解，涵盖了事务的核心概念、操作示例、失败回滚、隔离级别、事务性 DDL 和 XA 事务等内容，并修正了查看隔离级别的命令。 MySQL 8.0 事务全面讲解一、事务的核心概念（ACID） 事务是…...

编程新知 2025/9/19 22:12:36

wpf在image控件上快速显示内存图像

wpf在image控件上快速显示内存图像https://www.cnblogs.com/haodafeng/p/10431387.html 如果你在寻找能够快速在image控件刷新大图像（比如分辨率3000*3000的图像）的办法，尤其是想把内存中的裸数据（只有图像的数据，不包…...

编程新知 2026/1/31 9:25:11

使用SSE解决获取状态不一致问题

使用SSE解决获取状态不一致问题 1. 问题描述2. SSE介绍2.1 SSE 的工作原理2.2 SSE 的事件格式规范2.3 SSE与其他技术对比2.4 SSE 的优缺点 3. 实战代码 1. 问题描述目前做的一个功能是上传多个文件，这个上传文件是整体功能的一部分，文件在上传的过程中…...

编程新知 2026/1/27 17:00:20

KNN算法

数字识别

训练模型

测试模型

测试新的数据

总结

相关文章：