SVM(支持向量机)-机器学习
支持向量机(Support Vector Machine,SVM)是一种用于分类和回归分析的监督学习算法。它属于机器学习中的一类强大而灵活的模型,广泛应用于模式识别、图像分类、自然语言处理等领域。

基本原理:
SVM的基本原理是通过找到能够有效分隔不同类别的超平面来进行分类。在二维空间中,这个超平面就是一条直线,而在更高维空间中,它是一个超平面。SVM的目标是找到这个超平面,使得距离超平面最近的训练样本点(支持向量)到超平面的距离尽可能远,这个距离被称为间隔(margin)。
支持向量:
支持向量是指离超平面最近的那些训练样本点,它们对于定义超平面和间隔至关重要。在训练过程中,SVM主要关注这些支持向量,而其他样本点对于模型的影响较小。
核函数:
SVM可以通过核函数将输入空间映射到更高维的特征空间。这允许SVM在非线性问题上进行处理,通过将非线性问题转化为高维线性问题来解决。常用的核函数包括线性核、多项式核、径向基函数(Radial Basis Function,RBF)等。
核函数是支持向量机(SVM)中的一个重要概念,它用于将输入空间映射到更高维的特征空间。这个映射使得SVM在原始的输入空间中线性不可分的问题变得在高维特征空间中线性可分。核函数的引入是为了处理非线性问题,使得SVM能够更好地适应各种数据分布。
在SVM中,核函数的作用是计算两个样本之间的相似度或内积。通过核函数,我们可以在高维空间中隐式地表示数据点,而无需显式计算数据点在高维空间中的坐标。这种技巧被称为"核技巧"(kernel trick)。
常用的核函数有几种类型:
-
线性核函数(Linear Kernel):
K ( x , y ) = x T y K(x, y) = x^Ty K(x,y)=xTy这是最简单的核函数,它表示在原始的输入空间中进行线性分类。
-
多项式核函数(Polynomial Kernel):
K ( x , y ) = ( x T y + c ) d K(x, y) = (x^Ty + c)^d K(x,y)=(xTy+c)d多项式核函数引入了多项式的概念,其中 d d d是多项式的次数, c c c是一个常数。它允许SVM在原始空间中处理多项式特征。
-
径向基函数(Radial Basis Function,RBF)或高斯核函数(Gaussian Kernel):
K ( x , y ) = e − ∣ ∣ x − y ∣ ∣ 2 2 σ 2 K(x, y) = e^{-\frac{||x-y||^2}{2\sigma^2}} K(x,y)=e−2σ2∣∣x−y∣∣2RBF核函数是最常用的核函数之一,它通过将数据映射到无穷维的特征空间,从而适应更为复杂的非线性关系。 σ \sigma σ是控制函数宽度的参数。
-
sigmoid核函数(Sigmoid Kernel):
K ( x , y ) = tanh ( α x T y + c ) K(x, y) = \tanh(\alpha x^Ty + c) K(x,y)=tanh(αxTy+c)Sigmoid核函数也是一种常见的核函数,它通过类似于神经网络的激活函数(双曲正切函数)来进行非线性映射。
选择合适的核函数通常依赖于具体问题的性质和数据的分布。在实践中,RBF核函数是默认选择,因为它在很多情况下表现良好。核函数的选择也可能受到调参的影响,因为核函数参数的不同取值可能导致模型性能的差异。
软间隔和硬间隔:
在实际应用中,数据可能不是线性可分的,或者存在噪音。为了处理这些情况,SVM引入了软间隔,允许一些样本点出现在间隔内。这就是软间隔支持向量机,相对于严格线性可分的硬间隔支持向量机。

应用:
SVM在许多领域都有广泛的应用,包括文本分类、图像识别、生物信息学、金融预测等。由于其强大的泛化性能和对高维数据的适应能力,SVM在实际问题中取得了很好的效果。
总体而言,SVM是一种强大而灵活的机器学习算法,特别适用于处理复杂的非线性问题。
Question:
Q1:能够画出多少条线对样本点进行区分?
答:线是有无数条可以画的,区别就在于效果好不好,每条线都可以叫做一个划分超平面。比如上面的绿线就不好,蓝线还凑合,红线看起来就比较好。我们所希望找到的这条效果最好的线就是具有 “最大间隔的划分超平面”。
Q2:为什么要叫作“超平面”呢?
答:因为样本的特征很可能是高维的,此时样本空间的划分就不是一条线了。
Q3:画线的标准是什么?什么才叫这条线的效果好?哪里好?
答:SVM 将会寻找可以区分两个类别并且能使间隔(margin)最大的划分超平面。比较好的划分超平面,样本局部扰动时对它的影响最小、产生的分类结果最鲁棒、对未见示例的泛化能力最强。
Q4:间隔(margin)是什么?
答:对于任意一个超平面,其两侧数据点都距离它有一个最小距离(垂直距离),这两个最小距离的和就是间隔。比如下图中两条虚线构成的带状区域就是 margin,虚线是由距离中央实线最近的两个点所确定出来的(也就是由支持向量决定)。但此时 margin 比较小,如果用第二种方式画,margin 明显变大也更接近我们的目标。
相关文章:
SVM(支持向量机)-机器学习
支持向量机(Support Vector Machine,SVM)是一种用于分类和回归分析的监督学习算法。它属于机器学习中的一类强大而灵活的模型,广泛应用于模式识别、图像分类、自然语言处理等领域。 基本原理: SVM的基本原理是通过找到能够有效分…...
解决生成的insert语句内有单引号的情况
背景 因为Mybatis-Plus的saveBatch()方法的批量插入其实也是循环插入,而不是真正的一个SqlSession完成的批插,效率很低。所以我们在写批量插入的时候是自己实现了一个工具类去生成批量插入的sql再去执行,但是会遇到有些文本里有单引号导致插…...
【Linux 程序】1. 程序构建
文章目录 【 1. 配置 】【 2. 编译 】makefile编写的要点makefile中的全局自变量CMake编译依赖的库g编译 【 3. 安装 】 一般源代码提供的程序安装需要通过配置、编译、安装三个步骤; 配置。检查当前环境是否满足要安装软件的依赖关系,以及设置程序安装所…...
GLTF 编辑器实现逼真3D动物毛发效果
在线工具推荐: 3D数字孪生场景编辑器 - GLTF/GLB材质纹理编辑器 - 3D模型在线转换 - Three.js AI自动纹理开发包 - YOLO 虚幻合成数据生成器 - 三维模型预览图生成器 - 3D模型语义搜索引擎 要实现逼真的3D动物毛发效果,可以采用以下技术和方法&…...
【Go语言入门:Go语言的方法,函数,接口】
文章目录 4.Go语言的方法,函数,接口4.1. 方法4.1.1. 指针接受者4.1.2. 值接收者和指针接收者有什么区别?4.1.3. 方法 4.2. 接口4.2.1. 接口定义 4.3. 函数4.3.1. 函数介绍 4.Go语言的方法,函数,接口 4.1. 方法 4.1.1…...
vue-cli3/webpack打包时去掉console.log调试信息
文章目录 前言一、terser-webpack-plugin是什么?二、使用配置vue-cli项目 前言 开发环境下,console.log调试信息,有助于我们找到错误,但在生产环境,不需要console.log打印调试信息,所以打包时需要将consol…...
企业品牌推广在国外媒体投放的意义和作用何在?
海外广告投放是企业在国际市场推广的重要战略,具有多种形式,包括社交媒体广告、短视频广告、电视广告等。这些广告形式在传播信息、推动销售、塑造品牌形象等方面发挥着独特的作用。 其中软文发稿是一种注重叙事和信息传递的广告形式,对于企…...
ArcGIS批量计算shp面积并导出shp数据总面积(建模法)
在处理shp数据时, 又是我们需要知道许多个shp字段的批量计算,例如计算shp的总面积、面积平均值等,但是单个查看shp文件的属性进行汇总过于繁琐,因此可以借助建模批处理来计算。 首先准备数据:一个含有多个shp的文件夹。…...
代码质量评价及设计原则
1.评价代码质量的标准 1.1 可维护性 可维护性强的代码指的是: 在不去破坏原有的代码设计以及不引入新的BUG的前提下,能够快速的修改或者新增代码. 不易维护的代码指的是: 在添加或者修改一些功能逻辑的时候,存在极大的引入新的BUG的风险,并且需要花费的时间也很长. 代码可…...
编程笔记 html5cssjs 012 HTML分块
编程笔记 html5&css&js 012 HTML分块 一、HTML 块级元素二、HTML 内联元素三、HTML <div> 元素四、HTML <span> 元素五、HTML<article>元素六、<article>元素和<div>元素的区别与联系小结 像报纸排版一样,很多时候需要把平面…...
【持续更新ing】uniapp+springboot实现个人备忘录系统【前后端分离】
目录 (1)项目可行性分析 (2)需求描述 (3)界面原型 (4)数据库设计 (5)后端工程 接下来我们使用uniappspringboot实现一个简单的前后端分离的小项目----个…...
nginx+rsyslog+kafka+clickhouse+grafana 实现nginx 网关监控
需求 我想做一个类似腾讯云网关日志最终以仪表方式呈现,比如说qps、p99、p95的请求响应时间等等 流程图 数据流转就像标题 nginx ----> rsyslog ----> kafka —> clickhouse —> grafana 部署 kafka kafka 相关部署这里不做赘述,只要创…...
User maven 通过什么命令能查到那个包依赖了slf4j-simple-1.7.36.jar
要在 Maven 项目中查找哪个包依赖了 slf4j-simple-1.7.36.jar,您可以使用 Maven 的依赖树命令 mvn dependency:tree。这个命令会展示项目所有依赖的层次结构,包括传递依赖(即一个依赖的依赖)。然后,您可以搜索或过滤输…...
什么牌子冻干猫粮性价比高?性价比高的五款冻干猫粮牌子推荐
很多养猫的小伙伴们都磨刀霍霍准备给猫咪屯些猫冻干吧,特别是家里有挑食猫咪的家庭。有养猫的铲屎官们应该都知道,猫咪是对蛋白质的需求量很高,而且对植物蛋白的吸收效率比较低,所以蛋白质最好都是来自动物的优质蛋白。猫咪挑食就…...
扫描全能王启动鸿蒙原生应用开发,系HarmonyOS NEXT智能扫描领域首批
近期,“鸿蒙合作签约暨扫描全能王鸿蒙原生应用开发启动仪式”(简称“签约仪式”)正式举行。合合信息与华为达成鸿蒙合作,旗下扫描全能王将基于HarmonyOS NEXT正式启动鸿蒙原生应用开发。据悉,扫描全能王是鸿蒙在智能扫…...
[Angular] 笔记 8:list/detail 页面以及@Input
1. list 页面 list/detail 是重要的 UI 设计模式。 vscode terminal 运行如下命令生成 detail 组件: PS D:\Angular\my-app> ng generate component pokemon-base/pokemon-detail --modulepokemon-base/pokemon-base.module.ts CREATE src/app/pokemon-base/p…...
Zabbix“专家坐诊”第221期问答汇总
问题一 Q:使用官方docker模板Template App Docker,监控docker镜像,有一项监控项docker.data_usage有报错,不知道哪里问题:Cannot fetch data: Get “http://1.28/system/df”: context deadline exceeded (Client.Time…...
Netty—Reactor线程模型详解
文章目录 前言线程模型基本介绍线程模型分类Reactor线程模型介绍Netty线程模型: 传统阻塞IO的缺点Reactor线程模型单Reactor单线程模式单Reactor多线程模式主从Reactor多线程Reactor 模式小结 Netty 线程模型案例说明:Netty核心组件简介ChannelPipeline与…...
开源verilog模拟 iverilog verilator +gtkwave仿真及一点区别
开源的 iverilog verilator 和商业软件动不动几G几十G相比,体积小的几乎可以忽略不计。 两个都比较好用,各有优势。 iverilog兼容性好。 verilator速度快。 配上gtkwave 看波形,仿真工具基本就齐了。 说下基本用法 计数器 counter.v module…...
mysql中按字段1去重,按字段2降序排序
数据举例 sql语句 按字段field4降序排序,按字段field1去重 SELECT tt1.name2,tt1.field1,tt1.field2,tt1.field4 from ( select tt2.name2,tt2.field1,tt2.field2,tt2.field4 from t2 tt2 ORDER BY tt2.field4 DESC ) tt1 GROUP BY tt1.field1执行结果...
猫抓:让每个人都能掌控网络资源的开源媒体解析工具
猫抓:让每个人都能掌控网络资源的开源媒体解析工具 【免费下载链接】cat-catch 猫抓 chrome资源嗅探扩展 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 在数字内容爆炸的时代,网络上的视频、音频和图片资源日益丰富,但…...
实时手机检测模型应用场景:打电话检测、安防监控实战案例
实时手机检测模型应用场景:打电话检测、安防监控实战案例 1. 模型概述与技术优势 1.1 高性能检测框架DAMOYOLO 实时手机检测-通用模型基于DAMOYOLO-S框架开发,这是一种面向工业落地的高性能目标检测解决方案。相比传统YOLO系列方法,DAMOYO…...
Obsidian-i18n插件终极指南:一站式解决Obsidian插件国际化难题
Obsidian-i18n插件终极指南:一站式解决Obsidian插件国际化难题 【免费下载链接】obsidian-i18n 项目地址: https://gitcode.com/gh_mirrors/ob/obsidian-i18n 你是否曾为Obsidian插件的英文界面感到困扰?面对功能强大的插件却因为语言障碍而无法…...
深入RISC-V调试模块:从硬件设计视角看DM、DTM与抽象命令的实现
RISC-V调试模块硬件架构深度解析:从状态机到抽象命令的工程实现 1. RISC-V调试系统的硬件架构全景 在RISC-V生态系统中,调试模块(Debug Module, DM)作为连接外部调试器与处理器核心的关键枢纽,其硬件设计直接决定了芯片的可调试性。与传统的…...
PowerPaint-V1 Gradio 新手入门指南:3步搞定图片修复,小白也能变大神
PowerPaint-V1 Gradio 新手入门指南:3步搞定图片修复,小白也能变大神 1. 为什么选择PowerPaint-V1? 如果你经常需要处理图片中的瑕疵、水印或者想替换某些元素,PowerPaint-V1绝对是你的得力助手。这个由字节跳动与香港大学联合研…...
Wan2.1-umt5开发环境搭建:IDEA集成与调试技巧详解
Wan2.1-umt5开发环境搭建:IDEA集成与调试技巧详解 如果你是一名Java开发者,最近开始接触Wan2.1-umt5这类模型,可能会觉得有点无从下手。模型本身是用Python写的,各种脚本和命令行操作,跟咱们熟悉的Java开发环境完全是…...
ITIL服务战略:从成本中心到价值引擎的运维转型
1. 从成本中心到价值引擎:IT运维的认知革命 十年前我刚入行时,IT运维部门在大多数企业里就是个"修电脑的"。财务部年终核算,我们的预算表上永远只有支出项:服务器采购费、软件许可费、人员工资...直到某次公司战略会上&…...
舞台灯光DIY必备:手把手教你用开源DMX/RDM库驱动摇头灯(STM32平台)
舞台灯光DIY实战:基于STM32的DMX/RDM摇头灯开发指南 灯光艺术与嵌入式技术的碰撞总能激发创客们的无限灵感。想象一下,在自己的工作室里亲手打造一台可编程的摇头灯,通过代码精确控制光束的每一个舞动轨迹——这不仅是舞台灯光爱好者的终极乐…...
LiuJuan20260223Zimage与Typora协作:智能化Markdown文档创作
LiuJuan20260223Zimage与Typora协作:智能化Markdown文档创作 每次打开Typora,看着那个简洁到极致的界面,我都会有种创作的冲动。但冲动归冲动,真到了要写一篇技术博客、整理一份项目文档,或者梳理一堆零散笔记的时候&…...
AtlasOS终极指南:专业解决Windows安装错误2502/2503的完整方案
AtlasOS终极指南:专业解决Windows安装错误2502/2503的完整方案 【免费下载链接】Atlas 🚀 An open and lightweight modification to Windows, designed to optimize performance, privacy and security. 项目地址: https://gitcode.com/GitHub_Trendi…...
