K-Means和KNN
主要区别
从无序 —> 有序
从K-Means —> KNN
- KNN:监督学习,类别是已知的,对已知分类的数据进行训练和学习,找到不同类的特征,再对未分类的数据进行分类。
- K-Means:无监督学习,事先不知道数据有几类,通过聚类分析将数据聚合成几个群体。聚类不需要对数据进行训练和学习。
KNN
原理
将预测点与所有点的距离进行计算,然后保存并排序,选出前面K个值看看哪些类别比较多,则预测的点就属于哪一类。
KNN也可以用于回归预测
算法步骤
对未知类别属性的数据集中每个点依次执行以下操作:
- 计算已知类别数据集中的点与当前点之间的距离;
通常使用的是欧氏距离 - 按照距离递增次序排序;
- 选取与当前点距离最小的k个点;
如何确定k?
通过交叉验证,从选取一个较小的k值开始,不断增加k的值,然后计算验证集合的方差,最终找到一个比较合适的k值。 - 确定前k个点所在类别的出现频率;
- 返回前k个点出现频率最高的类别作为当前点的预测分类。
K-Means
原理
随机选取质心——计算各样本点和质心的距离后分类——再次选择新的质心
【扩展】
邻近度函数(即距离计算):
(1)曼哈顿距离:质心——中位数,目标函数——最小化对象到簇质心的距离和;
(2)平方欧几里得距离:质心——均值,目标函数——最小化对象到簇质心的距离的平方和;
(3)余弦距离:质心——均值,目标函数——最大化对象与其质心的余弦相似度和;
(4)Bregman散度:质心——均值,目标函数——最小化对象到簇质心的Bregman散度和。
算法步骤
- 随机选取k个质心(k值取决于想聚成几类);
- 计算样本到质心的距离,距离质心近的归为一类,分为k类;
- 求出分类后的每类的新质心;
- 再次计算样本到新质心的距离,距离质心距离近的归为一类;
- 判断新旧聚类是否相同,如果相同就代表已经聚类成功,如果没有则循环2-4。


相关文章:
K-Means和KNN
主要区别 从无序 —> 有序 从K-Means —> KNN KNN:监督学习,类别是已知的,对已知分类的数据进行训练和学习,找到不同类的特征,再对未分类的数据进行分类。K-Means:无监督学习,事先不知道…...
【Python】【Flask】flask_login的初始化
【背景】 想要更高效地用现有的Flask_login包来实现用户管理方面的常用功能会话管理等。不想再手搓了。 【要点】 首先引入flask_login from flask_login import LoginManager, login_user, login_required, logout_user,current_user然后进行app级别的设置和初始化 login…...
Spring Cloud之API网关(Gateway)
目录 API网关 好处 解决方案 Gateway 简介 特征 核心概念 Route(路由) Predicate(断言) Filter(过滤器) 工作流程 Route(路由) 路由配置方式 1.yml配置文件路由 2.bean进行配置 3.动态路由 动态路由 Predicate(断言) 特点 常见断言 示例 Filter(过滤器) …...
nodejs+vue 电子书阅读系统
本文首先介绍了电子书阅读系统的发展背景与发展现状,然后遵循软件常规开发流程,首先针对系统选取适用的语言和开发平台,随着网络技术的不断发展,多媒体技术应用渐渐的出现在教育领域中,电子书阅读已经成为社会的一个热…...
百度文心一言4.0抢先体验教程!
🍁 展望:关注我, AI学习之旅上,我与您一同成长! 一、 引言 想快速体验文心一言4.0,但又觉得技术难度太高?别担心,我来手把手教你! 🚀 10月17日,文心一言4.0…...
单目3D目标检测 方法综述——直接回归方法、基于深度信息方法、基于点云信息方法
本文综合整理单目3D目标检测的方法模型,包括:基于几何约束的直接回归方法,基于深度信息的方法,基于点云信息的方法。万字长文,慢慢阅读~ 直接回归方法 涉及到模型包括:MonoCon、MonoDLE、MonoFlex、CUPNet…...
oracle,CLOB转XML内存不足,ORA-27163: out of memory ORA-06512: at “SYS.XMLTYPE“,
通过kettle采集数据时,表输入的组件,查询报错。 ORA-27163: out of memory ORA-06512: at “SYS.XMLTYPE”, line 272 ORA-06512: at line 1 通过 ALTER SESSION SET EVENTS ‘31156 trace name context forever, level 0x400’; 修改会话配置 或直接修改…...
PHP与mysql数据库交互
PHP与mysql数据库交互 文章目录 PHP与mysql数据库交互方法速查建立与Mysql链接捕获连接错误SQL语句的执行SQL 错误SQL语句执行结果集对象方法速查 案例 方法速查 函数名 作用 mysqli_connect() 与MySQL 数据库建立连接。 mysqli_close() 关闭与MYSQL 数据库建…...
【广州华锐视点】VR飞行员驾驶模拟实训系统
VR飞行员驾驶模拟实训系统是一种基于虚拟现实技术的航空装备仿真测试技术,可以用于飞行员、乘务员和机务人员的训练。该系统可以模拟真实的飞行环境,包括天气、地形、飞机性能等,使被试者能够在虚拟环境中进行飞行操作,从而提高其…...
太烂的牌也要打完只为自己也不是为了其他什么原因。
day17_io02 1.上课代码敲一遍 2.读取一个文件,这个文件中有随机的一些数字字符,统计这些数字有几个偶数,几个奇数,并且追加写入到该文件末尾。 例如: a.txt文件: 3241256364789629090126581212515 奇数&…...
SDL窗口创建以及简单显示(1)
项目创建步骤 1. 使用Qt Creator创建一个C项目 2. 将SDL库文件放到源文件目录下 在项目pro文件中添加库文件 win32{INCLUDEPATH $$PWD/SDL2-2.0.10/includeLIBS $$PWD/SDL2-2.0.10/lib/x86/SDL2.lib } 使用SDL创建一个窗口 #include <stdio.h>#include <SDL.h>…...
【Html】交通灯问题
效果 实现方式 计时器:setTimeout或setInterval来计时。setInterval和 setTimeout 在某些情况下可能会出现计时不准确的情况。这通常是由于JavaScript的事件循环机制和其他代码执行所需的时间造成的。 问询:通过getCurrentLight将每个状态的持续时间设置…...
用IntelliJ远程打断点调试
前提当然是本地和远程部署的代码一样。 记录下步骤: 1,用token登录kuboard,找到目标容器的IP: 2, 用上一步找到的IP等信息创建Remote JVM Debug: 3,打断点,wkb说要把断点此属性改为线程。我试了下似乎…...
Spring-Bean的生命周期概述
Bean的生命周期概述 入门使用的Spring代码: ClassPathXmlApplicationContext context new ClassPathXmlApplicationContext("spring.xml"); UserService userService (UserService) context.getBean("userService"); userService.test(); …...
SENet 学习
ILSVRC 是一个比赛,全称是ImageNet Large-Scale Visual Recognition Challenge,平常说的ImageNet比赛指的是这个比赛。 使用的数据集是ImageNet数据集的一个子集,一般说的ImageNet(数据集)实际上指的是ImageNet的这个子…...
目前和未来的缓存构建
说起来可能有点反直觉,有时候不运行反而可以帮助我们加快速度,这正是网络浏览器运行的指导原则。不必在页面上加载所有内容,缓存的元素已经存在,不需要每次访问网站或网页时都重新加载。页面加载速度越快,浏览器的工作…...
aws亚马逊云免费账号代充值!!!什么是 AWS Lambda?
AWS Lambda 是一项计算服务,可使您无需预配置或管理服务器即可运行代码。 Lambda 在可用性高的计算基础设施上运行您的代码,执行计算资源的所有管理工作,其中包括服务器和操作系统维护、容量调配和弹性伸缩和记录。使用 Lambda,您…...
《从零开始大模型开发与微调 :基于PyTorch与ChatGLM》简介
内 容 简 介 大模型是深度学习自然语言处理皇冠上的一颗明珠,也是当前AI和NLP研究与产业中最重要的方向之一。本书使用PyTorch 2.0作为学习大模型的基本框架,以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,…...
【LeetCode】102. 二叉树的层序遍历
题目链接 文章目录 Python3方法一: 广度优先搜索 (BFS) ⟮ O ( n ) ⟯ \lgroup O(n) \rgroup ⟮O(n)⟯方法二: 深度优先搜索 (DFS) ⟮ O ( n ) ⟯ \lgroup O(n) \rgroup ⟮O(n)⟯ C方法一: 广度优先搜索 (BFS) ⟮ O ( n ) ⟯ \lgroup O(n…...
golang连接池检查连接失败时如何重试
在Go中,可以通过使用database/sql包的DB类型的Ping方法来检查数据库连接的可用性。如果连接检查失败,可以选择进行重试。以下是一个简单的示例代码,演示了如何在连接检查失败时进行重试: import ("database/sql""…...
如何改cad文件版本?盘点三个实用方法
在日常 CAD 绘图工作中,经常会遇到高版本 CAD 文件在低版本软件中无法打开、显示异常的问题。本文为大家整理了3 种实用的 CAD 版本转换方法,包含工具批量转换与两种代码实现方式,满足不同场景下的版本转换需求。方法一:汇帮 CAD …...
OpenClaw夜间任务方案:Qwen3.5-9B定时执行数据备份
OpenClaw夜间任务方案:Qwen3.5-9B定时执行数据备份 1. 为什么需要夜间自动化备份 作为一个长期被数据备份问题困扰的开发者,我经历过太多次硬盘损坏导致工作成果丢失的惨痛教训。手动备份不仅耗时耗力,还经常因为各种原因被搁置。直到发现O…...
万能引用和完美转发
1、万能引用:模板函数自动推动。#include <iostream> #include <vector> #include <utility>//使用std::move和std::forward等函数需要包含这个头文件using namespace std;template<typename T> void fun(T&& a)//这里就是一个万能…...
“德智米”齐聚港股!德适高研发高增长,领跑 AI 医疗新赛道
随着德适正式登陆港交所,北京智谱、上海 MiniMax、杭州德适组成的 “德智米”AI 三强正式齐聚港股,勾勒出中国 AI 产业从底层基建、C 端应用到 B 端垂直落地的完整版图。其中,德适以“医学影像大模型 医疗垂直场景 高增长商业化”的独特定位…...
推荐1个大小只有19K的小工具,绝对是GIF转图片神器!
聊一聊之前给大家分享了《视频转GIF》GIF动画在聊天过程中还是很受欢迎的。当然,不光是在聊天中受欢迎。特别是在分享领域,有时候一个方法不好表达,截图有时候也很肥人懂。这个时候GIF就能解决这个难题。GIF体积小,传输快。但有时…...
STM32 OLED三级菜单框架设计与实现
1. STM32 OLED菜单界面框架设计概述在嵌入式设备开发中,人机交互界面是连接用户与硬件的重要桥梁。基于STM32微控制器和OLED显示屏构建的菜单系统,因其低成本、低功耗和高对比度显示特性,在工业控制、智能家居和便携设备等领域广泛应用。本文…...
突破视频内容壁垒:B站视频转文字的智能解决方案
突破视频内容壁垒:B站视频转文字的智能解决方案 【免费下载链接】bili2text Bilibili视频转文字,一步到位,输入链接即可使用 项目地址: https://gitcode.com/gh_mirrors/bi/bili2text 在信息爆炸的时代,视频已成为知识传播…...
层叠与优先级介绍
层叠 层叠是 CSS 的核心机制,用于解决同一元素同一属性被多个样式声明设置时的冲突问题。浏览器按照严格的优先级规则,从低到高逐层比较,最终确定哪个声明生效。 术语解释 名次 解释 有三种层叠来源类型 用户代理样式表、用户样式表和作…...
实战演练:在快马平台构建并部署一个完整的云原生博客系统
实战演练:在快马平台构建并部署一个完整的云原生博客系统 最近在尝试云原生技术栈时,发现InsCode(快马)平台特别适合做全流程的实战演练。这里记录下如何用这个平台快速搭建一个包含前后端和数据库的博客系统,并实现自动化部署的全过程。 项…...
3分钟上手Hysteria2:从安装到连接的超简单教程
3分钟上手Hysteria2:从安装到连接的超简单教程 Hysteria2是一款高效的网络加速工具,通过一键安装脚本即可快速部署,特别适合新手用户。本教程将带你在3分钟内完成从安装到连接的全过程,让你轻松享受高速网络体验。 准备工作&#…...
