当前位置: 首页 > news >正文

【机器学习】12.十大算法之一支持向量机(SVM - Support Vector Machine)算法原理讲解

【机器学习】12.十大算法之一支持向量机(SVM - Support Vector Machine)算法原理讲解

  • 一·摘要
  • 二·个人简介
  • 三·基本概念
  • 四·支持向量与超平面
      • 4.1 超平面(Hyperplane)
      • 4.2 支持向量(Support Vectors)
      • 4.3 核技巧(Kernel Trick)
      • 4.4 软间隔与正则化
  • 五·SVM算法原理
      • 5.1 点到超平面的距离公式
      • 5.2 最大间隔的优化模型
  • 六·松弛变量
      • 6.1 松弛变量的定义
      • 6.2 优化模型的修改
      • 6.3 软间隔与硬间隔
      • 6.4 核技巧与松弛变量
  • 七·核函数
      • 7.1 核函数的基本概念
      • 7.2 常用的核函数
      • 7.3 核函数的作用

一·摘要

在这里插入图片描述

支持向量机(SVM)是一种高效的监督学习算法,广泛应用于分类和回归问题。它通过在特征空间中寻找一个最优的超平面来区分不同类别的数据点,目标是最大化两类数据点之间的间隔,从而提高模型的泛化能力。SVM的关键概念包括超平面、间隔、支持向量以及核函数,其中核函数允许SVM处理非线性问题,通过将数据映射到更高维的空间来寻找线性可分的超平面。此外,软间隔和正则化技术用于处理数据的非完全线性可分性,同时控制模型复杂度,防止过拟合。SVM的实现涉及选择合适的核函数,构建并求解一个凸二次规划问题,以及评估和应用训练好的模型。它的优点在于模型简单、易于实现,且具有良好的泛化能力,但计算复杂度高,对核函数和参数选择敏感,且在处理大规模数据集时可能会遇到性能瓶颈。

二·个人简介

🏘️🏘️个人主页:以山河作礼。
🎖️🎖️:Python领域新星创作者,CSDN实力新星认证,CSDN内容合伙人,阿里云社区专家博主,新星计划导师,在职数据分析师。

💕💕悲索之人烈焰加身,堕落者不可饶恕。永恒燃烧的羽翼,带我脱离凡间的沉沦。

在这里插入图片描述

🐘 希望大家能持续支持,共同向前迈进!😁
如果您觉得文章有价值,
欢迎留言💬,点赞👍,收藏🔖并关注我们➕🤝。
🪐💫💫💫💫💫💫💫热门专栏💫💫💫💫💫💫💫🪐
类型专栏
Python基础Python基础入门—详解版
Python进阶Python基础入门—模块版
Python高级Python网络爬虫从入门到精通🔥🔥🔥
Web全栈开发Django基础入门
Web全栈开发HTML与CSS基础入门
Web全栈开发JavaScript基础入门
Python数据分析Python数据分析项目🔥🔥
机器学习机器学习算法🔥🔥
人工智能人工智能

三·基本概念

支持向量机(Support Vector Machine, SVM)是一种强大的机器学习算法,主要用于解决分类和回归问题。它基于统计学习理论中的结构风险最小化原则,通过在特征空间中寻找一个最优的决策边界,即超平面,来区分不同的数据类别。这个超平面的选择旨在最大化数据点到超平面的最短距离,这个距离被称为间隔(margin)。间隔越大,模型的泛化能力通常越好。

SVM的核心是支持向量,这是一组对确定超平面位置和方向至关重要的数据点,它们是距离超平面最近的点。如果数据不是线性可分的,SVM通过引入核函数将原始数据映射到一个更高维的空间,在这个新空间中寻找线性可分的超平面。常用的核函数包括线性核、多项式核、径向基函数(RBF)核等。

为了处理数据中的噪声和异常点,SVM引入了软间隔的概念,允许一些数据点被错误分类,以换取更好的泛化性能。同时,通过正则化项控制模型的复杂度,避免过拟合。SVM的训练过程通常涉及到求解一个凸二次规划问题,以找到最优的超平面参数。

见下图,在一个二维环境中,其中点R,S,G点和其它靠近中间黑线的点可以看作为支持向量,它们可以决定分类器,也就是黑线的具体参数。
在这里插入图片描述

四·支持向量与超平面

支持向量和超平面是支持向量机(SVM)算法中的核心概念。下面我将详细解释这两个概念:

4.1 超平面(Hyperplane)

在数学中,超平面是一个线性子空间,其维度比它所在的空间低一维。例如,在二维空间中,超平面是一条直线;在三维空间中,它是平面;在更高维空间中,它仍然是一个线性边界,但可能难以直观理解。

在SVM中,超平面用于将数据分为不同的类别。对于二维空间,你可以想象超平面是一条直线,将空间分为两部分,每部分包含一个类别的数据点。对于更高维度的空间,超平面是一个更高维的线性边界,同样用于分隔数据点。

4.2 支持向量(Support Vectors)

支持向量是那些位于距离超平面最近的数据点。它们是SVM在训练过程中用来确定超平面位置的关键数据点。如果从这些点中移除任何一个,都会改变超平面的位置和方向。

支持向量之所以重要,是因为它们定义了数据点之间的边界(即间隔)。SVM的目标是找到这样一个超平面,使得最近的这些支持向量(即距离超平面最近的数据点)与超平面之间的距离(间隔)最大化。这个间隔的大小是衡量模型泛化能力的一个重要指标。

4.3 核技巧(Kernel Trick)

在实际应用中,数据可能不是线性可分的。这时,SVM可以使用核技巧来处理非线性问题。核函数可以将原始数据映射到一个更高维的空间,在新的空间中寻找一个线性可分的超平面。常用的核函数包括线性核、多项式核、径向基函数(RBF)核等。

4.4 软间隔与正则化

在处理实际数据时,可能无法找到一个完美的超平面来完全分开所有数据点。这时,SVM引入了软间隔的概念,允许一些数据点被错误分类,以换取更好的泛化能力。同时,通过正则化项(通常是法向量的范数)来控制模型的复杂度,避免过拟合。

在这里插入图片描述

五·SVM算法原理

5.1 点到超平面的距离公式

点到超平面的距离公式用于计算一个点到给定超平面的最短距离。超平面在n维空间中可以用以下方程式表示:
在这里插入图片描述
其中:
w 是一个n维的法向量,垂直于超平面。
x 是一个n维的点,位于空间中。
b 是超平面的偏置项。
点 x 到这个超平面的垂直距离 d 可以通过以下公式计算:
在这里插入图片描述
这个公式的几何意义是:从点 𝑥 向超平面作垂线,垂足到点 𝑥的距离就是𝑑这个距离也代表了点 𝑥到超平面的“间隔”。在支持向量机中,间隔的大小是非常重要的,因为它与模型的泛化能力有关。SVM的目标是找到这样一个超平面,使得间隔最大化,即所有数据点到这个超平面的距离之和最大。

5.2 最大间隔的优化模型

线性可分情况下的优化模型
当数据是线性可分的,即存在一个超平面能够完美地将不同类别的数据点分开,SVM的目标是找到一个超平面,使得距离最近的两个数据点(即支持向量)到超平面的距离最大化。这个距离被称为间隔(margin)。
超平面可以表示为:
在这里插入图片描述
最大间隔优化问题
SVM的目标函数是最大化间隔,可以表示为:
在这里插入图片描述
在这里插入图片描述引入拉格朗日乘子
在这里插入图片描述
对偶问题
在这里插入图片描述

六·松弛变量

在支持向量机(SVM)中,松弛变量(Slack Variables)是引入的一种机制,用于处理数据集中的非线性可分情况。在理想情况下,如果数据是线性可分的,SVM可以找到一个超平面将不同类别的数据点完全分开,同时最大化间隔。然而,在现实世界中,很多数据集并不是完全线性可分的,这就需要使用松弛变量来允许一些数据点被错误分类,从而提高模型的泛化能力。在这里插入图片描述

6.1 松弛变量的定义

在这里插入图片描述

6.2 优化模型的修改

在这里插入图片描述
这里的 𝐶是一个正的调节参数,用于控制模型对误分类的惩罚程度。𝐶的值越大,模型对误分类的惩罚越重,越倾向于找到没有误分类的解;𝐶的值越小,模型对误分类的容忍度越高,越容易找到间隔更大的解,即使这意味着更多的误分类。

6.3 软间隔与硬间隔

  • 硬间隔(Hard Margin):没有引入松弛变量的SVM,要求所有数据点都在间隔边界的外侧或边界上,即不允许任何误分类。
  • 软间隔(Soft Margin):引入了松弛变量的SVM,允许一些数据点在间隔边界的内侧,即允许一定程度的误分类。 核技巧与松弛变量.

6.4 核技巧与松弛变量

即使在非线性可分的情况下,通过使用核技巧将数据映射到高维空间,结合松弛变量,SVM仍然可以找到具有最大间隔的超平面。

七·核函数

核函数(Kernel Function)是支持向量机(SVM)中的一种重要工具,它允许SVM在高维空间中有效地处理非线性问题。核函数的基本思想是通过映射将原始数据从低维空间映射到高维空间,在这个高维空间中寻找数据的线性可分性。
在这里插入图片描述

7.1 核函数的基本概念

在这里插入图片描述

7.2 常用的核函数

在这里插入图片描述

7.3 核函数的作用

  1. 处理非线性问题:通过映射到高维空间,核函数使得原本在低维空间中线性不可分的数据在高维空间中线性可分。
  2. 提高模型表达能力:不同的核函数可以捕捉数据的不同特征,提高模型的表达能力。
  3. 减少计算复杂度:使用核函数可以避免直接在高维空间中进行计算,从而减少计算复杂度。

相关文章:

【机器学习】12.十大算法之一支持向量机(SVM - Support Vector Machine)算法原理讲解

【机器学习】12.十大算法之一支持向量机(SVM - Support Vector Machine)算法原理讲解 一摘要二个人简介三基本概念四支持向量与超平面4.1 超平面(Hyperplane)4.2 支持向量(Support Vectors)4.3 核技巧&…...

使用 `useAppConfig` :轻松管理应用配置

title: 使用 useAppConfig :轻松管理应用配置 date: 2024/7/11 updated: 2024/7/11 author: cmdragon excerpt: 摘要:本文介绍了Nuxt开发中useAppConfig的使用,它便于访问和管理应用配置,支持动态加载资源、环境配置切换、权限…...

中国内陆水体氮沉降数据集(1990s-2010s)

全球大气氮沉降急剧增加对内陆水生态系统产生不良影响。中国是全球三大氮沉降热点地区之一,为了充分了解氮沉降对中国内陆水体的影响,制定合理的水污染治理方案,我们需要清楚的量化内陆水体的氮沉降通量。为此,我们利用LMDZ-OR-IN…...

qml 实现一个带动画的switch 按钮

一.效果图 》 二.qml 代码 import QtQuick 2.12 import QtQuick.Controls 2.12Switch {id: controlimplicitWidth: 42implicitHeight: 20indicator: Rectangle {id: bkRectangleanchors.fill: parentx: control.leftPaddingy: parent.height / 2 - height / 2radius: height …...

C语言基本概念

C语言是什么? 1.人与人之间 自然语言 2.人与计算机之间 计算机语言 例如C、Java、Go、Python 在计算机语言中 1.解释型语言:Python 2.编译型语言:C/C 编译和链接 C语言源代码都是文本文件.c,必须通过编译器的编译和链接器的…...

同轴多芯旋转电连接器1

什么是旋转电连接器? 旋转电连接器,亦称电气旋转接头或滑环,主要用于电气工程领域。其作用是在固定部件与旋转部件之间传输电信号、电源或数据,从而避免因旋转而引起的电线拉伤或缠结问题。这类连接器对于需要在旋转的同时进行电…...

android 消除内部保存的数据

在Android中,有多种方式可以消除应用内部保存的数据。这些数据可能存储在SharedPreferences、SQLite数据库、文件(包括缓存文件)或Content Providers中。以下是几种常见的方法来消除这些数据: SharedPreferences: 要删…...

vue3 ts 报错:无法找到模块“../views/index/Home.vue”的声明文件

解决办法: env.d.ts 新增代码片段: declare module "*.vue" {import type { DefineComponent } from "vue";// eslint-disable-next-line typescript-eslint/no-explicit-any, typescript-eslint/ban-typesconst component: Define…...

finalshell发布前端项目到阿里云

ssh连接...

纹波电流与ESR:解析电容器重要参数与应用挑战

电解电容纹波电流与ESR(Equivalent Series Resistance)是电容器的重要参数,用来描述电容器对交流信号的响应能力和能量损耗。电解电容纹波电流是指电容器在工作时承受的交流信号电流,而ESR则是电容器内部等效电阻,影响…...

算法——二分法

目录 基本介绍实现后继定义举例代码 前驱定义举例代码 基本介绍 二分法是 每次都排除半个区间,然后在剩余的半个区间内寻找解 的方法,排除半个区间的前提是:区间是有序的,这样一来,当解 小于 区间中点时,就…...

「PaddleOCR」 模型应用优化流程

PaddleOCR 算是OCR算法里面较好用的,支持的内容多,而且社区维护的好(手把手教你,生怕你学不会),因此在国内常采用。目前已经更新到 2.8版本了,功能更加丰富、强大;目前支持通用OCR、表格识别、图片信息提取…...

VUE2 子组件传多个参数,父组件函数接收所有入参并加自定义参数

需求中有个场景是需要在子组件中传多个参数&#xff0c;让父组件接收所有入参&#xff0c;并且父组件也要加自己的参数 1.子组件传多个参数给父组件 子组件 // 子组件 ChildComponent.vue <template><button click"sendDataToParent">传递数据给父组件…...

less和sass有啥区别哪个更加好

Less 和 Sass&#xff08;特别是其最流行的变体 SCSS&#xff09;都是 CSS 预处理器&#xff0c;它们扩展了 CSS 的功能&#xff0c;如变量、嵌套规则、混合&#xff08;Mixins&#xff09;、函数等&#xff0c;以编程方式生成 CSS。它们之间的主要区别在于语法、功能和工具生态…...

Qt Design Studio 4.5现已发布

Qt Design Studio现已强势回归&#xff0c;生产力和可用性均得到大幅提升。无论是直观的3D编辑界面&#xff0c;还是与Figma和Qt Creator的无缝连接&#xff0c;新版Qt Design Studio将为您带来更好的产品开发体验。快来深入了解Qt Design Studio的全新功能吧&#xff01; 为3…...

GCN-LSTM实现时空预测

简介:现有的预测模型越来考虑时间和空间的相关性,统称为时空预测。这种预测模型往往比简单的序列模型(例如RNN、LSTM、GRU及其变体)、Transformer等效果更好。我使用Keras实现了该GCN-LSTM代码,因为Keras相比于torch更容易入手和理解。我实现了一个基于Keras的GCN网络层,…...

《算法笔记》总结No.6——贪心

一.简单贪心 贪心法是求解一类最优化问题的方法&#xff0c;它总是考虑在当前状态下局部最优(或较优)之后&#xff0c;来使全局的结果达到最优(或较优)的策略。显然&#xff0c;如果采取较优而非最优的策略(最优策略可能不存在或是不易想到)&#xff0c;得到的全局结果也无法是…...

久期分析与久期模型

目录 一、久期分析的理论原理 二、数据准备 三、Stata 程序代码及解释 四、代码运行结果 一、久期分析的理论原理 久期&#xff08;Duration&#xff09;是衡量债券价格对利率变动敏感性的重要指标。它不仅仅是一个简单的时间概念&#xff0c;更是反映了债券现金流回收的平均…...

MybatisPlus 使用教程

MyBatisPlus使用教程 文章目录 MyBatisPlus使用教程1、使用方式1.1 引入依赖1.2 构建mapper接口 2、常用注解2.1 TableName2.2 TableId2.3 TableField MyBatisPlus顾名思义便是对MyBatis的加强版&#xff0c;但两者本身并不冲突(只做增强不做改变)&#xff1a; 引入它并不会对原…...

bash: redi-cli: 未找到命令...

问题描述 在执行命令&#xff1a;redi-cli --bigkeys 提示&#xff1a;bash: redi-cli: 未找到命令... 确定服务器是否有Redis进程 ps -ef | grep redis查找Redis 文件信息 find / -name "redis-*"进入到当前目录 cd /usr/bin/再次执行命令 涉及redis-cli 连…...

linux 内核 红黑树接口说明

红黑树(rbtree)在linux内核中使用非常广泛,cfs调度任务管理&#xff0c;vma管理等。本文不会涉及关于红黑树插入和删除时的各种case的详细描述,感兴趣的读者可以查阅其他资料。本文主要聚焦于linux内核中经典rbtree和augment-rbtree操作接口的说明。 1、基本概念 二叉树:每个…...

【ELK】filebeat 和logstash区别

Filebeat 和 Logstash 都是 Elastic Stack (也称为 ELK Stack) 的重要组件&#xff0c;用于日志数据的收集、处理和传输。它们有不同的功能和使用场景&#xff1a; Filebeat 角色: 轻量级日志收集器。功能: 从指定的日志文件中读取日志数据。可以从多个源&#xff08;如文件、…...

CNN -1 神经网络-概述

CNN -1 神经网络-概述 一:芯片科技发展介绍了解1> 芯片科技发展趋势2> 芯片使用领域3> 芯片介绍1. 神经网络芯片2. 神经网络处理单元NPU(Neural Processing Unit)二:神经网络1> 什么是神经网络2> 神经元3> 人工神经网络三:卷积神经网络(CNN)入门讲解一…...

插片式远程IO模块:Profinet总线耦合器在STEP7配置

XD9000是Profinet总线耦合器&#xff0c;单个耦合器最多可扩展32个I/O模块&#xff01;本文将深入探讨插片式远程IO模块的应用&#xff0c;并揭秘Profinet总线耦合器在STEP7配置过程中的技巧与注意事项。 STEP7-MicroWINSMART软件组态步骤&#xff1a; 1、按照下图指示安装GSD…...

python3读取shp数据

目录 1 介绍 1 介绍 需要tmp.shp文件和tmp.dbf文件&#xff0c;需要安装geopandas第三方库&#xff0c;python3代码如下&#xff0c; import geopandas as gpdshp_file_path "tmp.shp" shp_data gpd.read_file(shp_file_path) for index, row in shp_data.iterro…...

pytorch实现水果2分类(蓝莓,苹果)

1.数据集的路径&#xff0c;结构 dataset.py 目的&#xff1a; 输入&#xff1a;没有输入&#xff0c;路径是写死了的。 输出&#xff1a;返回的是一个对象&#xff0c;里面有self.data。self.data是一个列表&#xff0c;里面是&#xff08;图片路径.jpg&#xff0c;标签&…...

Redis实践经验

优雅的Key结构 Key实践约定&#xff1a; 遵循基本格式&#xff1a;[业务名称]:[数据名]:id例&#xff1a;login:user:10长度步超过44字节&#xff08;版本不同&#xff0c;上限不同&#xff09;不包含特殊字符 优点&#xff1a; 可读性强避免key冲突方便管理节省内存&#x…...

分类题解清单

目录 简介MySQL题一、聚合函数二、排序和分组三、高级查询和连接四、子查询五、高级字符串函数 / 正则表达式 / 子句 算法题一、双指针二、滑动窗口三、模拟四、贪心五、矩阵六、排序七、链表八、设计九、前缀和十、哈希表十一、字符串十二、二叉树十三、二分查找十四、回溯十五…...

QUdpSocket 的bind函数详解

QUdpSocket 是 Qt 框架中用于处理 UDP 网络通信的类。bind 函数是此类中的一个重要方法&#xff0c;它用于将 QUdpSocket 对象绑定到一个特定的端口上&#xff0c;以便在该端口上接收 UDP 数据包。 函数原型 在 Qt 中&#xff0c;bind 函数的原型通常如下所示&#xff1a; b…...

[spring] Spring MVC - security(下)

[spring] Spring MVC - security&#xff08;下&#xff09; callback 一下&#xff0c;当前项目结构如下&#xff1a; 这里实现的功能是连接数据库&#xff0c;大范围和 [spring] rest api security 重合 数据库连接 - 明文密码 第一部分使用明文密码 设置数据库 主要就是…...