当前位置：首页 > news >正文

机器学习-SVM

news 2026/2/8 20:12:32

线性感知机分类
支持向量机

线性感知机（Perceptron）

感知机是线性二值分类器。

注意：什么是线性？线性分割面就是，就是在分割面中，任意两个的连线也在分割面中，这个分割面，就是线性分割面。

f(x,w,b)=sign(wx+b)

wx+b>0, f=1

wx+b<0, f=-1

为什么分割面能写成 wx+b=0？w 一个向量。

对于普通的方程 y=kx+b,那么我们可以写成 kx-y+b=0,写成向量方程就是：

当k=1时，w(1,-1) 如下图知，w 是分割面的法向量。

感知机--目标函数

最小化错误率：

I 函数是：当预测值 f() 与实际值 y 不相等时，I=1，相等是 I=0 。所以求和为错误的样本数。

我们可以转换成后边的函数，sign 函数是：wx+b>0 是函数值为1，wx+b<=0 时函数值为-1.

那么如果分对：sign 与 y 符号相同，相减为 0，如果分错，sign 与 y 符号相反，那么相减为2 或者 -2 所以需要除以2，就是分错样本数了。

由于sign() 函数不是处处可导，给算法设计带来困难。所以我们换一个容易的策略。

函数 ①

这个函数只统计分错样本，所以如果全分对L=0，如果有分错样本时L>0 (<0,所以函数前边有个负号）

结论：线性可分时，最小化 L 等价于最小化错误率。

注意：如果不是线性不可分时，这个结论不成立。

如：w1xi+b=0.2 分错

w1xj+b=0.3 分错 L1=0.5

w2xk+b=0.6 分错： L2=0.6

当为 w1 是有两个样本点分错了错误率为2，L1=0.5 ，但是当为 w2 时有一个样本点分错了错误率为1， L2=0.6>L1

现在我们要最小化函数 ①，那么我对函数① 分别对w 和 b 求偏导。（-xiyi,-yi）

我们用梯度下降法来找函数① 的极值。

w = w + p*y_i*x_i

b = b + p*y_i

是学习率。

算法步骤：

随机设定：w ，b 的值
用当前（w，b）轮流对所有的样本点分类，如果分错，更新(w,b) 的，继续。
重复步骤2直到所有的点都被分对

感知机的不足：

有无穷多个可行解
由于感知机是贪婪算法，所以结果依赖初始值和误分点的顺序。
线性限制（对于线性不可分的特征空间，线性感知机无能为力）

不足 1 不足 3

线性感知机有这些不足，接下来我们看看在支持向量中是怎么弥补的。

支持向量机（Support Vector Machine）

线性可分：硬间隔SVM
适用于线性不可分：软间隔SVM
SVM对偶问题和解的性质
非线性：Kernel SVM

硬间隔 SVM

图 1 图 2 图 3

看图1，这里有两个分割线，到底哪个好呢？对于新数据（哪个方框）到底应该属于哪一类呢？我看到超平面不同，对新数据的影响不同。

看图2，间隔：分界面到最近样本距离（的两倍）。

我们认为使间隔最大的分界面是最好的分界面，因为间隔最大，将来落在间隔内的新数据更够跟准确的分到所属的类中。

最大间隔分类器是使得间隔宽度最大的线性分类器。

看图3 要求：对正样本wx+b>=1

对负样本wx+b<=-1

原因：由于wx+b>0 那么肯定存在一个非常接近0的ε 使 wx+b>=ε ,两边同时除以 ε 得 wx/ε+b/ε>=1，那么我将w/ε=w,b/ε=b(先的未知数),于是就有wx+b>=1,同理wx+b<=-1

求间隔（margin）：

M 由向量投影公式：投影=向量与投影方向单位向量的内积。

（第二个式子是根据直角三角形计算出来的）将conθ 带入二式就得到了M的值。

wx+b>=1 , y=1

wx+b<=1 , y=-1 所以：y(wx+b)>=1

我们要最大，就等价于最小化，因为：，而是一个单调递增函数，最小化的也就是最小化 x ，同理最小化化，优化问题，前边加一个1/2 系数，对优化问题没有影响，添加一个1/2 系数是为了对二次求导有一个2系数相消。

这样就转化为一个关于 w 和 b 的二次规划问题：

软间隔 SVM

感知机是有无穷多个可行解，现在硬间隔SVM 通过最大间隔，有唯一解。那么目前还有什么缺点？对噪音的处理。现在都是要求线性可分，如果存在噪音，那么将会出现震荡。那么我们接下来，看看软间隔ＳＶＭ是怎么解决噪音问题的。

　如果存在噪音点。

软间隔ＳＶＭ　通过引入松弛变量ξi，使得错分样本得到惩罚（注意：当还没有找到最优解时，一些非噪音点也会遭到惩罚）。

最小化松弛项，同时最大化间隔。

minimize 错分样本对应的 ξi>=1,所以：Σiξi>=错误样本个数。

硬间隔 VS 软间隔

　　

硬间隔ＳＶＭ软间隔ＳＶＭ

拉格朗日函数

为什么要引入拉格朗日函数呢?对于一般函数我们要极值，我们只需求导等于零即可。那么对于带约束的函数求导，我们怎么求他的极值。我们用拉格朗日乘子，将目标函数和约束函数写到一个新函数中，对这个新函数我们求导等于零即可。

优化问题

对每个约束引入拉格朗日乘子 ai,ui 得到：

且 a>=0,u>=0

这个拉个朗函数，根据 α和u 求最大，然后根据：w，b， ξ 求最小。

那么经这转换，最后求出解还是原问题的解吗？

分析：内部最大化：当不成立，也就是小于 0 ，根据式子值，α的系数是正数且 α>=0，那么这时根据 α 求拉格朗日函数的最大值为正无穷。

同理当不成立时，且 u>=0 ，拉格朗日函数最大值为正无穷。

当成立时，，α的系数是负数，且α>=0 ,所以只有 α=0 时，拉个朗日函数的最大值为0.

当成立时，，u 的系数是负数，且u>=0 ,所以只有 u=0 时，拉个朗日函数的最大值为0.

结论：当成立时，拉格朗日函数根据 a,u求得最大值为0，则此在根据w，b,ξ 求最小值，就是原函数的最小值

当不成立时，，拉格朗日函数根据 a,u求得最大值为正无穷，则此在根据w，b,ξ 求最小值，没有意义。

图1 图2

原问题就像图1

朗格朗日函数就像图2

拉个朗日的对偶问题：

且ai>=0,ui>=0

对偶函数只是将最大化和最小化交换了一下位置。那么优化对偶函数的解和拉格朗日函数的解是一致的吗？

凸优化是一样的。因为凸规划满足KKD条件。凸规划问题就是：约束是凸集，目标函数是凸函数。

求极值问题，L对 w,b,ξ 求导等于零。

式（1）得到：，带入L：

需满足式2,3和对偶条件：

ai>=0
ui>=0
C-ai-ui=0
Σyiai=0

使用ui=C-ai 消掉ui，得到最终的对偶问题：

由于，预测函数变为：

求b：满足 0<ai<C 的i 对应的支持向量，解yif(xi)=1得到b

对偶问题有点，只需内积，不需 x 具体值。这样也就可以用核函数了。

KKT 条件

最优化问题，最后变成求KKT条件。只要满足KKT 条件的解，就是原问题的最优解。

非线性SVM

对于线性可分数据，线性SVM表现很好了。

如果训练数据本身存在复杂非线性关系（在给定的特征空间中），很难用线性模型较好的处理。

解决办法：通过一个函数，将原来的特征空间中的样本，映射到高维的特征空间中:

将原来的数据的平方作为第二维。

原始空间中任意形状的两个区域，总是可以在某些高维特征空间中映射成线性可分的区域。

将到原点的距离最为第四维的数据。

核函数：

之前我们讲过，SVM分类器的训练和预测都仅依赖于样本对的内积值 K（xi,xj）=xi^Txj

核函数对应某个特征空间中的内积。

核函数例子：

线性：（这就是内积定义，就是映射的还是原来的空间）
p次多项式：
高斯核（RBF核）（特征空间是无限维空间，此核可以用来逼近任意复杂的分类面）（σ 参数需要自己调）
Sigmoir：

注意：引入Kernel 的同时带来高计算复杂度：

Kernel SVM 中，支持向量个数随样本数增多。
Kernel SVM 问题求解至少是n^2 复杂度。（因为我们需要计算每个特性向量与其他特征向量的内积）

最著名的两个工具包

LIBSVM:

http://www.csie.ntu.edu.tw/~cjlin/libsvm/

SVM Light:

http://www.cs.cornell.edu/People/tj/svm_light/

liblinear-1.93：这个是针对线性可分的数据，做了很多优化，比libsvm-3.17　快很多。

相关文章：

机器学习-SVM

线性感知机分类支持向量机线性感知机（Perceptron） 感知机是线性二值分类器。注意：什么是线性？线性分割面就是，就是在分割面中，任意两个的连线也在分割面中，这个分割面，就是线…...

编程日记 2024/9/28 8:21:44

翻译器在线翻译：开启多语言交流新时代

随着国际交流、商务合作、文化交融以及互联网的飞速发展，人们对于跨越语言鸿沟的需求日益迫切。翻译工具成为了我们必备的一个工具，这篇文章我们一起来探讨一些好用的翻译器在线翻译工具吧。 1.在线福昕翻译链接直达>>https://fanyi.pdf365.cn/…...

编程日记 2024/9/28 8:20:43

网络编程（10）——json序列化

十、day10 今天学习如何使用jsoncpp将json数据解析为c对象，将c对象序列化为json数据。jsoncp经常在网络通信中使用，也就是服务器和客户端的通信一般使用json（可视化好）；而protobuf一般在服务器之间的通信中使用 json…...

编程日记 2024/9/28 8:18:41

基于FreeRTOS的STM32多功能手表设计

在智能穿戴设备迅速发展的今天，多功能手表因其便携性和实用性而受到广泛关注。本项目旨在设计一款基于FreeRTOS操作系统的STM32多功能手表，通过实时多任务处理，实现时间显示、多级菜单、万年历、模拟手电筒、温湿度显示、电子闹钟和设置等功能…...

编程日记 2024/9/28 8:17:39

18.Linux-配置DNF仓库

DNF仓库产生背景在现实的场景中，我们经常要安装一些软件包，但由于现场不提供网络。需要使用光盘或文件下载的方式去安装。对于linux有两种离线安装方式：二进制文件安装和源码安装其中二进制文件是比较简单的安装方式，不同的l…...

编程日记 2024/9/28 8:15:38

GeoPB：高效处理地理空间数据的Protobuf解决方案

在地理信息系统（GIS）和地理空间数据处理的领域，数据的交换和存储格式至关重要。随着技术的不断发展，如何高效、安全地处理和转换地理空间数据成为了一个核心问题。本文将详细介绍GeoPB——一个基于Protobuf（Protocol B…...

编程日记 2024/9/28 8:12:35

华为仓颉语言入门（6）：if条件表达式

解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界仓颉语言中的 if 表达式用于根据条件的值来决定是否执行相关代码逻辑。if 表达式有三种形式：单分支的 if 表达式、双分支的 if 表达式和嵌套的 if 表达式。单分支的 if 表达式单分支的 …...

编程日记 2024/9/28 8:09:31

openlayers中一些问题的解决方案

一、使用地图时可能会出现的需求 1、定位：需要将地图的中心视野，定位到研究区域的中心点； 2、地图蒙版：只研究特定区域，将其他部分区域用蒙层遮罩，突显重点； 3、变色：设置整体的地图…...

编程日记 2024/9/28 8:07:29

java通过redis完成幂等性操作

4 幂等产生 “重复数据或数据不一致”（ 假定程序业务代码没问题 ），绝大部分就是发生了重复的请求，重复请求是指"同一个请求因为某些原因被多次提交"。导致这个情况会有几种场景： 微服务场景，在…...

编程日记 2024/9/28 8:06:28

48 旋转图像

解题思路： \qquad 这道题同样需要用模拟解决，原地算法要求空间复杂度尽量小，最好为 O ( 1 ) O(1) O(1)。模拟的关键是找到旋转的内在规律，即旋转前后的位置坐标的变化规律。 \qquad 正方形矩阵类似洋葱，可以由不同大小…...

编程日记 2024/9/28 8:05:27

TDengine 签约青山钢铁，实现冶金全流程质量管控智能化

在不锈钢生产领域，企业面临着信息孤岛和数据分散的挑战，尤其在冶炼、连铸和轧钢等关键工艺以及能源管理上，这种现象导致生产要素（人、机、料、法、环）的分析管理模型难以全面、深入地实施。为了应对这一挑战&#xff0…...

编程日记 2024/9/28 8:04:26

pycache文件夹

__pycache__ 文件夹是 Python 在运行时自动生成的目录，用于存储已编译的字节码文件。这些字节码文件以 .pyc 扩展名结尾，用于加速程序的启动时间，因为不需要每次运行时都重新编译源代码。主要特点自动生成：__pycache__ 文件夹…...

编程日记 2024/9/28 8:03:24

利用 Local Data 导入文件到 OceanBase 的方法

背景在很多传统方法中，数据的传输常依赖于csv格式。为了提高传输效率，属于同一张表的多个csv文件往往会被打包成gz文件进行传输。当gz文件从上游传递到下游后，为了将其中的csv数据导入数据库，一种直接的做法是： 1…...

编程日记 2024/9/28 8:01:22

改变安全策略的五大实践

随着网络威胁形势的加剧，网络安全计划必须不断发展以保护组织的使命。为了管理这种持续的网络安全发展，应遵循五项关键的安全计划变更管理实践： 1. 识别并吸引受安全风险影响的业务利益相关者随着新的网络安全风险被发现，受影…...

编程日记 2024/9/28 7:59:20

在MacOS上安装MongoDB数据库

一、安装方法 1.1 安装包安装首先，打开MongoDB 官网下载安装包，下载链接：https://www.mongodb.com/try/download/community。根据自己的系统环境自行选择下载的版本。将下载好的 MongoDB 安装包解压缩，并将文件夹名改为 mon…...

编程日记 2024/9/28 7:58:19

负载均衡--会话保持失败原因及解决方案（五）

会话保持失败可能由多种因素导致，以下是一些主要原因及其解释： 一、服务器及网络问题服务器故障： 服务器出现故障或不稳定，导致无法正确处理会话信息。这可能是由于硬件故障、网络问题或软件错误等引起的。网络问题&#xff1a…...

编程日记 2024/9/28 7:57:18

24 Vue3之集成TailwindCSS

Tailwind CSS Tailwind CSS是一个由js编写的CSS 框架他是基于postCss 去解析的官网地址Tailwind CSS 中文文档 - Tailwind CSS - 只需书写 HTML 代码，无需书写 CSS，即可快速构建美观的网站。 | TailwindCSS中文文档 | TailwindCSS中文网对于PostCSS…...

编程日记 2024/9/28 7:54:14

iOS OC 底层原理之 category、load、initialize

文章目录 category底层结构runtime 执行 category 底层原理添加成员变量 load调用形式系统调用形式的内部原理源码实现逻辑 initialize调用形式源码核心函数（由上到下依次调用）如果分类实现了 initialize category 底层结构本质是结构体。struct _cat…...

编程日记 2024/9/28 7:51:11

另外知识与网络总结

一、重谈NAT（工作在网络层） 为什么会有NAT 为了解决ipv4地址太少问题，到了公网的末端就会有运营商路由器来构建私网，在不同私网中私有IP可以重复，这就可以缓解IP地址太少问题，但是这就导致私有IP是重复的…...

编程日记 2024/9/28 7:49:09

怎样用云手机进行TikTok矩阵运营？

在运营TikTok矩阵时，许多用户常常面临操作复杂、设备过多等问题。如果你也感到操作繁琐，不妨考虑使用云手机。云手机具备丰富的功能，能够帮助电商卖家快速打造高效的TikTok矩阵。接下来，我们将详细解析这些功能如何提升你的运营效…...

编程日记 2024/9/28 7:48:08

大数据学习栈记——Neo4j的安装与使用

本文介绍图数据库Neofj的安装与使用，操作系统：Ubuntu24.04，Neofj版本：2025.04.0。 Apt安装 Neofj可以进行官网安装：Neo4j Deployment Center - Graph Database & Analytics 我这里安装是添加软件源的方法最新版…...

编程新知 2026/2/8 4:37:08

SkyWalking 10.2.0 SWCK 配置过程

SkyWalking 10.2.0 & SWCK 配置过程 skywalking oap-server & ui 使用Docker安装在K8S集群以外，K8S集群中的微服务使用initContainer按命名空间将skywalking-java-agent注入到业务容器中。 SWCK有整套的解决方案，全安装在K8S群集中。具体可参…...

编程新知 2025/8/23 5:51:08

论文解读：交大港大上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化学习框架（二）

HoST框架核心实现方法详解 - 论文深度解读（第二部分）《Learning Humanoid Standing-up Control across Diverse Postures》系列文章：论文深度解读 + 算法与代码分析（二）作者机构：上海AI Lab, 上海交通大学, 香港大学, 浙江大学, 香港中文大学论文主题：人形机器人…...

编程新知 2026/1/20 19:54:35

django filter 统计数量按属性去重

在Django中，如果你想要根据某个属性对查询集进行去重并统计数量，你可以使用values()方法配合annotate()方法来实现。这里有两种常见的方法来完成这个需求： 方法1：使用annotate()和Count 假设你有一个模型Item，并且你想…...

编程新知 2026/1/11 2:37:51

【单片机期末】单片机系统设计

主要内容：系统状态机，系统时基，系统需求分析，系统构建，系统状态流图一、题目要求二、绘制系统状态流图题目：根据上述描述绘制系统状态流图，注明状态转移条件及方向。三、利用定时器产生时…...

编程新知 2026/1/31 12:27:36

Robots.txt 文件

什么是robots.txt？ robots.txt 是一个位于网站根目录下的文本文件（如：https://example.com/robots.txt），它用于指导网络爬虫（如搜索引擎的蜘蛛程序）如何抓取该网站的内容。这个文件遵循 Robots…...

编程新知 2025/9/9 5:38:23

LLM基础1_语言模型如何处理文本

基于GitHub项目：https://github.com/datawhalechina/llms-from-scratch-cn 工具介绍 tiktoken：OpenAI开发的专业"分词器" torch：Facebook开发的强力计算引擎，相当于超级计算器理解词嵌入：给词语画"…...

编程新知 2025/9/25 5:16:24

初学 pytest 记录

安装 pip install pytest用例可以是函数也可以是类中的方法 def test_func():print()class TestAdd: # def __init__(self): 在 pytest 中不可以使用__init__方法 # self.cc 12345 pytest.mark.api def test_str(self):res add(1, 2)assert res 12def test_int(self):r…...

编程新知 2026/1/21 19:46:26

使用Spring AI和MCP协议构建图片搜索服务

目录使用Spring AI和MCP协议构建图片搜索服务引言技术栈概览项目架构设计架构图服务端开发 1. 创建Spring Boot项目 2. 实现图片搜索工具 3. 配置传输模式 Stdio模式（本地调用） SSE模式（远程调用） 4. 注册工具提…...

编程新知 2026/1/25 14:31:47

华为OD最新机试真题-数组组成的最小数字-OD统一考试（B卷）

题目描述给定一个整型数组，请从该数组中选择3个元素组成最小数字并输出 (如果数组长度小于3，则选择数组中所有元素来组成最小数字)。输入描述行用半角逗号分割的字符串记录的整型数组，0<数组长度<= 100，0<整数的取值范围<= 10000。输出描述由3个元素组成…...

编程新知 2025/9/21 23:43:15