当前位置：首页 > news >正文

SVM 监督学习

news 2026/2/9 15:01:35

一、分类问题

利用一条直线分类存在很多问题

二、SVM 支持向量机

其核心思想是通过在特征空间中找到一个最优的超平面来进行分类，并且间隔最大。分类面尽可能远离样本点，宽度越大越好。

适用于中小型复杂数据集的分类。

三、硬间隔和软间隔

硬：严格地让所有实例都不在最大间隔之间，并且位于正确的一边。

软：在保持最大间隔宽阔和限制间隔违例（即位于最大间隔之上，甚至在错误的一边的实例）之间找到良好的平衡。

四、使用SVM作为模型时，通常采用如下流程：

1）对样本数据进行归一化

2）应用核函数对样本进行映射（最常采用和核函数是RBF和Linear，在样本线性可分时，Linear效果要比RBF好)

3）用cross-validation和grid-search对超参数进行优选

4）用最优参数调练得到模型

5）测试

五、原理

SVM通过优化一个凸二次规划问题来求解最佳的超平面。可以理解为是用一个平面

对于非线性可分的情况，SVM可以通过核函数（Kernel Function）将输入特征映射到高维空间，使得原本线性不可分的数据在高维空间中变得线性可分。常用的核函数包括线性核、多项式核、高斯核等。

六、SVM的核函数

核函数：是将原始输入空间映射到新的特征空间，从而，使得原本线性不可分的样本可能在核空间可分。核函数并不是SVM特有的，核函数可以和其他算法也进行结合，只是核函数与SVM结合的优势非常大。

一个很好的理解空间映射和超平面的例子。

常见核函数：

线性核和多项式核：

1）这两种核的作用也是首先在属性空间中找到一些点，把这些点当做base，核函数的作用就是找与该点距离和角度满足某种关系的样本点。

2）样本点与该点的夹角近乎垂直时，两个样本的欧式长度必须非常长才能保证满足线性核函数大于0；而当样本点与base点的方向相同时，长度就不必很长；而当方向相反时，核函数值就是负的，被判为反类。即，它在空间上划分出一个梭形，按照梭形来进行正反类划分。

RBF核：

1）高斯核函数就是在属性空间中找到一些点，这些点可以是也可以不是样本点，把这些点当做base，以这些base为圆心向外扩展，扩展半径即为带宽，即可划分数据。

2）换句话说，在属性空间中找到一些超圆，用这些超圆来判定正反类。

Sigmoid核：

1）同样地是定义一些base，

2）核函数就是将线性核函数经过一个tanh函数进行处理，把值域限制在了-1到1上。

总之，都是在定义距离，大于该距离，判为正，小于该距离，判为负。至于选择哪一种核函数，要根据具体的样本分布情况来确定，以下是使用的指导规则：

1）如果Feature的数量很大，甚至和样本数量差不多时，往往线性可分，这时选用LR或者线性核Linear。

2）如果Feature的数量很小，样本数量正常，不算多也不算少，这时选用RBF核。

3）如果Feature的数量很小，而样本的数量很大，这时手动添加一些Feature，使得线性可分，然后选用LR或者线性核Linear。

4）多项式核一般很少使用，效率不高，结果也不优于RBF。

5）Linear核参数少，速度快；RBF核参数多，分类结果非常依赖于参数，需要交叉验证或网格搜索最佳参数，比较耗时。

6）应用最广的应该就是RBF核，无论是小样本还是大样本，高维还是低维等情况，RBF核函数均适用。

七、SVM损失函数

支持向量机（SVM）在分类问题中使用的损失函数是"hinge loss"（铰链损失），它通常被用于最大间隔分类，即寻找能够最大化分类间隔的超平面。而在SVM中，我们主要讨论三种损失函数：

SVM 监督学习

一、分类问题利用一条直线分类存在很多问题二、SVM 支持向量机其核心思想是通过在特征空间中找到一个最优的超平面来进行分类，并且间隔最大。分类面尽可能远离样本点，宽度越大越好。适用于中小型复杂数据集的分类。三、硬间隔和软间隔硬&#x…...

编程日记 2024/9/10 15:26:34

奖励模型的训练

文章目录训练方法训练策略代码实践由于 RLHF 的训练过程中需要依赖大量的人类偏好数据进行学习，因此很难在训练过程中要求人类标注者实时提供偏好反馈。为此，我们需要训练一个模型来替代人类在 RLHF 训练过程中实时提供反馈，这个模型被称为奖励模型。在训练开始前，我们需要…...

编程日记 2024/9/10 15:25:33

Ubuntu22.04之禁止内核自动更新(二百六十八)

简介： CSDN博客专家、《Android系统多媒体进阶实战》一书作者新书发布：《Android系统多媒体进阶实战》🚀 优质专栏： Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏： 多媒体系统工程师系列【…...

编程日记 2024/9/10 15:23:31

kaggle题-房价预测(Pytorch)，手把手教，全文代码解释

房价预测本题是经典的通过表格数据去预测最终值，主要分为几大步骤： 一.将数据集修改为可以代入到网络模型的数字，因为给的数据大部分都是str类型，是无法直接放到网络模型里跑的，例如下图，很多标签值为str类…...

编程日记 2024/9/10 15:21:29

PulseSensor心率传感器详解（STM32）

目录一、介绍二、传感器原理 1.接线图 2.引脚描述 3.工作原理：光电容积法原理 4.工作原理：心率采样数据处理算法三、程序设计 main.c文件 adcx.h文件 adc.c文件四、实验效果五、资料获取项目分享一、介绍 PulseSensor传感器是一种基…...

编程日记 2024/9/10 15:20:27

NISP 一级 | 3.1 网络基础知识

关注这个证书的其他相关笔记：NISP 一级 —— 考证笔记合集-CSDN博客 0x01：Internet 和 TCP/IP 协议因特网（Internet）通过 TCP/IP 协议将遍布在全世界各地的计算机互联，从而形成超级计算机网络。因特网为用户提供了非…...

编程日记 2024/9/10 15:19:02

模拟网络丢包常用方法以及工具

文章目录背景常用方法代码实现使用方法测试代码使用网络流量控制工具常用工具Clumsy 背景在软件开发过程中，经常需要模拟不同的网络环境来测试应用在不同条件下的表现。这些模拟可以采用多种方式进行，包括在代码中实现随机丢包、随机延时、乱序&am…...

编程日记 2024/9/10 15:14:29

ABC 370 E - Avoid K Partition

原题链接：E - Avoid K Partition 题意：给长度为n的数组，将数组划分成任意份，但是每一份的总和都不能是k，问有多少种分割方法。思路：dp，f[i]，代表前i个元素满足题意的划分的总和&a…...

编程日记 2024/9/10 15:12:17

C++: set与map容器的介绍与使用

本文索引前言1. 二叉搜索树1.1 概念1.2 二叉搜索树操作1.2.1 查找与插入1.2.2 删除1.2.3 二叉搜索树实现代码 2. 树形结构的关联式容器2.1 set的介绍与使用2.1.1 set的构造函数2.1.2 set的迭代器2.1.3 set的容量2.1.4 set的修改操作 2.2 map的介绍与使用2.2.1 map的构造函数2.…...

编程日记 2024/9/10 15:11:16

单片机-STM32 看门狗（八）

目录一、看门狗概念 1、定义： 二、单片机中的看门狗 1、功能描述： 2、看门狗设置部分预分频寄存器(IWDG_PR) 3、窗口看门狗特性： 4、看门狗配置： 一、看门狗概念看门狗--定时器（不属于基本定时器、通用定…...

编程日记 2024/9/10 15:10:15

iOS 18.1将上线新功能，可惜这波国内的小伙伴无缘了

在科技巨头苹果持续推动其生态系统全球化的进程中，最新的iOS 18.1、iPadOS 18.1及macOS 15.1开发者测试版发布，不仅为开发者们带来了新功能的预览，还悄然间对Apple智能功能的地区限制进行了微妙而重要的调整。这一变化，虽看似细…...

编程日记 2024/9/10 15:07:11

MySQL中DML操作（二）

默认值处理（DEFAULT） 在MySQL中可以使用DEFAULT为列设定一个默认值。如果在插入数据时并未指定该列的值，那么MySQL将默认值添加到该列中。创建表时指定列的默认值 CREATE TABLE 表名(列名类型 default 默认值......); 示例：…...

编程日记 2024/9/10 15:05:08

LLMs技术 | 整合Ollama实现本地LLMs调用

前言近两年AIGC发展的非常迅速，从刚开始的只有ChatGPT到现在的很百家争鸣。从开始的大参数模型，再到后来的小参数模型，从一开始单一的文本模型到现在的多模态模型等等。随着一起进步的不仅仅是模型的多样化，还有模型的使用方式。…...

编程日记 2024/9/10 15:04:07

【C-实践】文件服务器（3.0）

文件服务器1.0文件服务器2.0文件服务器4.0 概述使用了 tcp epoll 线程池生产者消费者模型，实现文件服务器有两个进程，主进程负责接收退出信号用来退出整个程序；子进程负责管理线程池、客户端连接以及线程池的退出子进程中的主线程生…...

编程日记 2024/9/10 15:03:06

LeetCode 2181.合并零之间的节点

题目描述给你一个链表的头节点 head ，该链表包含由 0 分隔开的一连串整数。链表的开端和末尾的节点都满足 Node.val 0 。对于每两个相邻的 0 ，请你将它们之间的所有节点合并成一个节点，其值是所有已合并节点的值之和。然后将所有 0 …...

编程日记 2024/9/10 15:02:04

千益畅行，共享旅游卡，引领旅游新潮流

千益畅行旅游卡是一款专为旅游爱好者打造的超值卡片。它就像一把神奇的钥匙，为您打开国内丰富多彩的旅游世界。我们的旅游卡拥有众多令人惊喜的特点。首先，它涵盖了国内 40 多条精心策划的旅游线路，无论您是向往历史文化名城的厚重底蕴&…...

编程日记 2024/9/10 15:01:02

K均值聚类

根据到给点样本的距离，来聚类。 1.曼哈顿距离、 2.欧几里得距离直线距离 3.切比雪夫距离 4.闵氏距离 5.余弦相似度对数据大小/长度等不关注，只关注相似度。 6.汉明距离二进制距离二、密度聚类 DBSCAN 前提是样本是根据紧密程度分布的。先用超参…...

编程日记 2024/9/10 14:58:59

【Ubuntu】安装常用软件包

安装java 直接输入java，如果没有安装的话会提醒你输入命令安装，类似 Command java not found, but can be installed with: sudo apt install jdkxxxxxxxxxxxxxx然后选一个版本安装就好，我这里选的jdk17,安装完确认一下 ubuntuVM-4-13-ubu…...

编程日记 2024/9/10 14:57:59

探索全光网技术 | 全光网产品解决方案整理-（宇洪科技）

探索全光网技术 |全光网产品解决方案整理-宇洪科技目录一、数据中心场景1、方案概述2、方案需求3、相关产品4、产品推荐5、方案价值二、教育场景1、方案概述2、方案需求3、相关产品4、方案价值三、医疗场景1、方案概述2、方案需求3、相关产品4、方案价值注：本文…...

编程日记 2024/9/10 14:56:57

资料分析(2)

C B 增长量不变就是1002020 上面是利滚利:按照20%当利息本题:涨跌幅度的意思就是增长率，本题是按照增长率不变的情况下进行计算D B 7551400X>1.2*100000 B B B 总体增量部分增量之和先进行计算固定通信业务收入的增长量移动通信业务实现收入的增长量增长量现期…...

编程日记 2024/9/10 14:54:55

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…...

编程新知 2026/2/7 23:18:39

51c自动驾驶~合集58

我自己的原文哦~ https://blog.51cto.com/whaosoft/13967107 #CCA-Attention 全局池化局部保留，CCA-Attention为LLM长文本建模带来突破性进展琶洲实验室、华南理工大学联合推出关键上下文感知注意力机制（CCA-Attention），…...

编程新知 2026/2/5 4:25:15

剑指offer20_链表中环的入口节点

链表中环的入口节点给定一个链表，若其中包含环，则输出环的入口节点。若其中不包含环，则输出null。数据范围节点 val 值取值范围 [ 1 , 1000 ] [1,1000] [1,1000]。节点 val 值各不相同。链表长度 [ 0 , 500 ] [0,500] [0,500]。 …...

编程新知 2026/1/31 6:09:22

React19源码系列之事件插件系统

事件类别事件类型定义文档 Event Event 接口表示在 EventTarget 上出现的事件。 Event - Web API | MDN UIEvent UIEvent 接口表示简单的用户界面事件。 UIEvent - Web API | MDN KeyboardEvent KeyboardEvent 对象描述了用户与键盘的交互。 KeyboardEvent - Web…...

编程新知 2026/2/7 8:31:55

【算法训练营Day07】字符串part1

文章目录反转字符串反转字符串II替换数字反转字符串题目链接：344. 反转字符串双指针法，两个指针的元素直接调转即可 class Solution {public void reverseString(char[] s) {int head 0;int end s.length - 1;while(head < end) {char temp …...

编程新知 2025/8/27 14:38:58

【决胜公务员考试】求职OMG——见面课测验1

2025最新版！！！6.8截至答题，大家注意呀！ 博主码字不易点个关注吧,祝期末顺利~~ 1.单选题(2分) 下列说法错误的是:（ B ） A.选调生属于公务员系统 B.公务员属于事业编 C.选调生有基层锻炼的要求 D…...

编程新知 2025/11/8 16:25:01

C++：多态机制详解

目录一. 多态的概念 1.静态多态（编译时多态） 二.动态多态的定义及实现 1.多态的构成条件 2.虚函数 3.虚函数的重写/覆盖 4.虚函数重写的一些其他问题 1）.协变 2）.析构函数的重写 5.override 和 final关键字 1&#…...

编程新知 2026/1/25 13:32:52

RSS 2025｜从说明书学习复杂机器人操作任务：NUS邵林团队提出全新机器人装配技能学习框架Manual2Skill

视觉语言模型（Vision-Language Models, VLMs），为真实环境中的机器人操作任务提供了极具潜力的解决方案。尽管 VLMs 取得了显著进展，机器人仍难以胜任复杂的长时程任务（如家具装配），主要受限于人…...

编程新知 2026/1/31 5:30:51

WebRTC从入门到实践 - 零基础教程

WebRTC从入门到实践 - 零基础教程目录 WebRTC简介基础概念工作原理开发环境搭建基础实践三个实战案例常见问题解答 1. WebRTC简介 1.1 什么是WebRTC？ WebRTC（Web Real-Time Communication）是一个支持网页浏览器进行实时语音…...

编程新知 2026/1/5 0:33:43

HTML前端开发：JavaScript 获取元素方法详解

作为前端开发者，高效获取 DOM 元素是必备技能。以下是 JS 中核心的获取元素方法，分为两大系列： 一、getElementBy... 系列传统方法，直接通过 DOM 接口访问，返回动态集合（元素变化会实时更新）。…...

编程新知 2025/10/6 18:44:24

相关文章：