当前位置: 首页 > news >正文

【Python机器学习】支持向量机——手写数字识别问题

基于SVM的数字识别步骤:

1、收集数据:提供的文本文件

2、准备数据:基于二值图像构造向量

3、分析数据:对图像向量进行目测

4、训练算法:采用两种不同的核函数,并对径向基核函数采用不同的设置来运行SMO算法

5、测试算法:编写一个函数来测试不同的核函数并计算错误率

6、使用算法:一个图像识别的完整应用还需要一些图像处理的知识。

构建一个系统去测试手写数字上的分类器:

def img2vector(filename):returnVect=zeros((1,1024))fr=open(filename)for i in range(32):lineStr=fr.readline()for j in range(32):returnVect[0,32*i+j]=int(lineStr[j])return returnVectdef loadImages(dirName):from os import listdirhwLabels=[]trainingFileList=listdir(dirName)m=len(trainingFileList)trainingMat=zeros((m,1024))for i in range(m):fileNameStr=trainingFileList[i]fileStr=fileNameStr.split('.')[0]classNumStr=int(fileStr.split('_')[0])if classNumStr==9:hwLabels.append(-1)else:hwLabels.append(1)trainingMat[i,:]=img2vector('%s/%s'%(dirName,fileNameStr))return trainingMat,hwLabelsdef testDigits(kTup=('rbf',10)):dataArr,labelArr=loadImages('trainingDigits')b,alphas=svm_11.smoP(dataArr,labelArr,200,0.0001,10000,kTup)dataMat=mat(dataArr)labelMat=mat(labelArr).transpose()svInd=nonzero(alphas.A>0)[0]sVs=dataMat[svInd]labelSV=labelMat[svInd]print('there are %d Support Vectors' % shape(sVs)[0])m,n=shape(dataMat)errorCount=0for i in range(m):kernelEval=svm_11.kernelTrans(sVs,dataMat[i,:],kTup)predict=kernelEval.T*multiply(labelSV,alphas[svInd])+bif sign(predict)!=sign(labelArr[i]):errorCount=errorCount+1print('训练集错误率:',(float(errorCount)/m))dataArr,labelArr=loadImages()errorCount = 0dataMat=mat(dataArr)labelMat=mat(labelArr).transpose('testDigits')m,n=shape(dataMat)for i in range(m):kernelEval = svm_11.kernelTrans(sVs, dataMat[i, :], kTup)predict = kernelEval.T * multiply(labelSV, alphas[svInd]) + bif sign(predict) != sign(labelArr[i]):errorCount = errorCount + 1print('测试集错误率:', (float(errorCount) / m))testDigits()

函数loadImages()是作为k近邻算法中的一部分出现的。它已经被重构为自身的一个函数。其中最大的区别在于,支持向量机中类别标签为-1和+1,,因此,一旦碰到数字9,则输出类别标签-1,否则输出+1,。本质上,支持向量机是一个二类分类器,其分类结果不是+1就是-1。

testDigits()和testRbf()几乎一样,区别在于它调用了loadImages()函数来获得类别标签和数据。kTup是输入参数。

上述代码运行结果:

相关文章:

【Python机器学习】支持向量机——手写数字识别问题

基于SVM的数字识别步骤: 1、收集数据:提供的文本文件 2、准备数据:基于二值图像构造向量 3、分析数据:对图像向量进行目测 4、训练算法:采用两种不同的核函数,并对径向基核函数采用不同的设置来运行SMO算法…...

学习笔记-Cookie、Session、JWT

目录 一、验证码的生成与校验 1. 创建生成验证码的工具类 2. 写一个 Controller 3. 实现验证码验证 1. 获取验证码 2. 验证码请求过程 3. 验证码的校验 4. 原理说明 5. 验证 6. 总结 二、JWT登录鉴权 1. 为什么要做登录鉴权? 2. 什么是 JWT 3. JWT相比…...

题海战术,面试必胜秘诀

目录 1.Java 的优势是什么?2.什么是 Java 的多态特性?3.Java 中的参数传递是按值还是按引用?4.为什么 Java 不支持多重继承?5.什么是 Java 中的不可变类?总结 题目 来自面试鸭刷题神器 1.Java 的优势是什么? Java 的跨平台性、垃圾回收机制以及其强…...

设计模式详解(十九)——命令模式

命令模式简介 命令模式定义 命令模式(Command Pattern)是一种在面向对象程序设计中常用的行为型设计模式。命令模式的核心思想在于将请求封装成一个对象,从而使发出请求的责任和执行请求的责任分割开。它可以让请求发送者和请求接收者之间消…...

实战:MySQL数据同步神器之Canal

1.概叙 场景一:数据增量实时同步 项目中业务数据量比较大,每类业务表都达到千万级别,虽然做了分库分表,每张表数据控制在300W以下,但是效率还是达不到要求,为了提高查询效率,打算使用ES进行数…...

5.6软件工程-运维

运维 系统转换系统维护系统评价练习题 系统转换 新老系统的转换 系统转换是指:新系统开发完毕,投入运行,取代现有系统的过程,需要考虑多方面的问题,以实现与老系统的交接,有一下三种转换计划: …...

在JavaScript中如何确保构造函数只被new调用

构造函数是一个特殊的函数,用于初始化一个新创建的对象。它是在创建对象时自动调用的。构造函数通常用于为对象的属性赋值,或者执行其他必要的设置。 使用函数名大写字母开头,这是一种命名约定,用于区分构造函数和普通函数。如何…...

【数据结构算法经典题目刨析(c语言)】反转链表(图文详解)

💓 博客主页:C-SDN花园GGbond ⏩ 文章专栏:数据结构经典题目刨析(c语言) 目录 一、题目描述 二、思路分析 三、代码实现 一、题目描述: 二、思路分析 : 通过三个指针n1,n2,n3来实现链表的反转 1.首先初始化 n1为…...

机器学习之争:Python vs R,谁更胜一筹?

一、引言 随着人工智能和大数据的迅速发展,机器学习已成为现代科技的重要组成部分。在医疗、金融、零售、制造等多个领域,机器学习技术的应用无处不在。从数据分析到预测建模,再到深度学习,机器学习正在改变我们的工作和生活方式…...

Vulnhub靶机:JANGOW_ 1.0.1

目录 前言: 一、安装虚拟机Jangow:1.0.1靶机 二、Web部分 前言: 难度:简单,本文使用VirtualBox打开,下载地址: https://download.vulnhub.com/jangow/jangow-01-1.0.1.ova 一、安装虚拟机J…...

Python脚本实现USB自动复制文件

USB驱动器作为常见的数据存储设备,经常用于数据传输和备份。 然而,我们在手动处理文件复制可能效率低下且容易出错。 因此,我们可以利用Python编写脚本来自动化这一过程,提高效率和数据安全性。 准备工作 首先,我们需…...

【C++学习第19天】最小生成树(对应无向图)

一、最小生成树 二、代码 1、Prim算法 #include <cstring> #include <iostream> #include <algorithm>using namespace std;const int N 510, INF 0x3f3f3f3f;int n, m; int g[N][N]; int dist[N]; bool st[N];int prim() {memset(dist, 0x3f, sizeof di…...

第一个 Flask 项目

第一个 Flask 项目 安装环境创建项目启动程序访问项目参数说明Flask对象的初始化参数app.run()参数 应用程序配置参数使用 Flask 的 config.from_object() 方法使用 Flask 的 config.from_pyfile() 方法使用 Flask 的 config.from_envvar() 方法步骤 1: 设置环境变量步骤 2: 编…...

利用 Angular 发挥环境的力量

一.介绍 您是否曾想过如何在不同的环境中为同一应用设置不同的颜色、标题或 API 调用&#xff1f;可以肯定的是&#xff0c;生产 API 和测试 API 是不同的&#xff0c;应谨慎使用。部署时&#xff0c;我们不会在项目的所有地方手动更改所有 API 调用。不应这样做&#xff0c;因…...

Vue3+TypeScript+printjs 实现标签批量打印功能

前言&#xff1a;临时性需求没怎么接触过前端&#xff0c;代码实现有问题及优化点希望大佬可以留言告知一下 开发工具&#xff1a;VS CODE 界面开发&#xff1a;Vue3TypeScriptElementPlus 打印组件&#xff1a;Print-JS 前端打印入口图&#xff1a; 标签页面&#xff1a; …...

微信文件如何直接打印及打印功能在哪里设置?

在数字化时代&#xff0c;打印需求依旧不可或缺&#xff0c;但传统打印店的高昂价格和不便操作常常让人头疼。幸运的是&#xff0c;琢贝打印作为一款集便捷、经济、高效于一体的网上打印平台&#xff0c;正逐渐成为众多用户的首选。特别是通过微信小程序下单&#xff0c;更是让…...

dataX -20240804-master分支

1、相关报错 Error: java.io.IOException: java.lang.RuntimeException: ORC split generation failed with exception: org.apache.orc.impl.SchemaEvolution$IllegalEvolutionException: ORC does not support type conversion from file type struct<nanos:int> (10)…...

【网络】传输层

传输层 一、预备知识1、端口号1、端口号范围划分2、知名端口号3、两个问题4、netstat && iostate5、pidof6、谈下面协议始终铭记两个问题 二、UDP协议&#xff08;简单&#xff09;1、UDP协议端格式2、UDP的特点3、面向数据报4、UDP缓冲区 三、TCP协议&#xff08;重点…...

学生管理系统之更新和删除、筛选

学生管理系统之更新和删除 建立新的窗口 添加组件 进行布局 使用Widget把二个放在一块,作为一列,然后全选进行栅格布局,最后添加弹簧进行微调。 编写增加的槽函数 在主函数中调用对话框...

教您一键批量下载拼多多批发图片信息,节省时间

图片是电商的核心展示手段&#xff0c;高质量、吸引人的图片能显著提升商品吸引力&#xff0c;增强用户体验&#xff0c;促进购买决策。良好的视觉呈现有助于品牌形象的塑造&#xff0c;提高转化率和客户满意度&#xff0c;对电商平台的流量和销售业绩具有直接影响。 使用图快…...

Arm架构直线推测漏洞解析与防护方案

1. Arm架构中的直线推测漏洞解析在处理器设计中&#xff0c;推测执行&#xff08;Speculative Execution&#xff09;是现代高性能CPU的核心优化技术之一。它通过预测程序执行路径&#xff0c;提前执行可能需要的指令来隐藏指令流水线的延迟。Arm架构作为移动和嵌入式领域的主导…...

Vue2项目里给wangEditor加数学公式,我踩过的坑和完整配置流程

Vue2项目中集成wangEditor数学公式的完整避坑指南 作为一名长期奋战在前端开发一线的工程师&#xff0c;我深知在Vue2项目中集成富文本编辑器并添加数学公式功能时可能遇到的各种"坑"。本文将分享我在实际项目中为wangEditor v3/v2添加数学公式支持的全过程&#xff…...

Polars中的累积计算:如何实现高效的垂直折叠/扫描

在数据处理和分析中,我们经常需要对数据进行累积计算,比如计算累积和、累积积等。Polars作为一个高效的数据处理框架,虽然提供了一些内置的累积操作函数,但对于一些复杂的自定义累积计算,比如纵向的折叠/扫描操作,还没有直接的支持。今天,我们将探讨如何在Polars中实现这…...

动态解码技术AutoDeco:语言模型生成策略的智能进化

1. 从静态解码到动态解码&#xff1a;语言模型生成技术的范式转变在语言模型的实际应用中&#xff0c;我们常常遇到一个看似矛盾的现象&#xff1a;尽管模型被冠以"端到端"的美名&#xff0c;但生成质量却高度依赖人工调校的解码超参数。这种现象在数学推理任务中尤为…...

负载箱的规划、部署与长期运营:用户全周期实践参考

负载箱从采购意向的萌生到设备服役期满退役&#xff0c;是一条跨越多年的时间线。这条线上的每一个决策节点——需求定义、方案比选、安装部署、日常使用、维护校准、升级改造——都影响着设备能否以合理的成本稳定地完成测试任务。对于用户而言&#xff0c;建立一套覆盖负载箱…...

EPLAN 2.9破解版安装后,第一张电路图怎么画?端子排、符号库实战教学

EPLAN 2.9实战入门&#xff1a;从零绘制第一张电路图 刚安装完EPLAN 2.9的工程师常会遇到一个尴尬局面——软件界面复杂得让人无从下手。别担心&#xff0c;今天我们就用最直白的方式&#xff0c;带你完成第一个包含端子排的完整电路图。忘记那些枯燥的理论&#xff0c;直接动手…...

Taotoken模型广场如何帮助开发者根据场景与预算选择合适模型

Taotoken模型广场如何帮助开发者根据场景与预算选择合适模型 1. 模型广场的核心功能 Taotoken模型广场聚合了多家主流厂商的大语言模型&#xff0c;以统一界面展示关键参数。开发者进入控制台后&#xff0c;可在「模型广场」标签页查看所有可用模型的详细信息。每个模型卡片包…...

终极Awesome Cheatsheets:一站式技术速查解决方案,让开发效率提升300%

终极Awesome Cheatsheets&#xff1a;一站式技术速查解决方案&#xff0c;让开发效率提升300% 【免费下载链接】awesome-cheatsheets &#x1f469;‍&#x1f4bb;&#x1f468;‍&#x1f4bb; Awesome cheatsheets for popular programming languages, frameworks and devel…...

搜索了多款去水印工具,我终于发现了真正的「去水印黑科技」

目录 一、搜出来的前排工具,90%都是废物 1. Magic Eraser:名气大,效果拉胯(喜欢标注小字的封面慎用) 2. Dewatermark:过度删除重灾区(喜欢标注小字的封面慎用) 3. 开拍:免费次数少,效果还一般 4. 360去水印:效果差就算了,下载还要会员 5. Canva:效果勉强及格,痕迹…...

ncmdump终极指南:3分钟解锁网易云音乐加密文件的完整解决方案

ncmdump终极指南&#xff1a;3分钟解锁网易云音乐加密文件的完整解决方案 【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 你是否曾为网易云音乐的NCM加密格式而烦恼&#xff1f;想要在车载音响、其他播放器或不同设备上播放下载的音…...