【机器学习】机器学习四大类第01课
一、机器学习四大类
有监督学习 (Supervised Learning)
有监督学习是通过已知的输入-输出对(即标记过的训练数据)来学习函数关系的过程。在训练阶段,模型会根据这些示例调整参数以尽可能准确地预测新的、未见过的数据点的输出。 实例:垃圾邮件分类器。训练数据集包含一系列电子邮件及其对应的标签(垃圾邮件或非垃圾邮件)。通过学习这些特征与标签之间的关联,模型可以用于识别新的邮件是否为垃圾邮件。
无监督学习 (Unsupervised Learning)
在无监督学习中,没有给定特定的输出标签,算法需要自己发现数据中的内在结构、模式或集群。它的目标通常是将数据进行分组或降维,以便更好地理解数据分布。 实例:客户细分。假设我们有一组客户的行为数据(如购买历史、访问频率等),但没有明确的类别标签。使用聚类算法(例如K-means)可以将相似行为模式的客户自动划分为不同的群体。
半监督学习 (Semi-supervised Learning)
半监督学习
介于有监督学习和无监督学习之间,它利用一部分带有标签的数据和大量未标记的数据进行学习。通常在标注数据有限的情况下,这种学习方式可以帮助提高模型性能。 实例:图像分类。如果只有部分图像被人工标注了类别,而剩余大部分图像没有标签,模型可以通过分析图像间的相似性,在已知标签图像的帮助下,推断出未标记图像的类别。
强化学习 (Reinforcement Learning, RL)
强化学习
是一种序列决策过程的学习方法,智能体通过与环境交互获得奖励或惩罚,并根据这些反馈调整其策略以最大化长期累积奖励。 实例:AlphaGo(围棋AI)。AlphaGo在每次走棋时都会得到一个即时的奖励信号(赢棋或输棋的最终结果,以及过程中每一步棋的相对价值估计),通过不断对弈学习最优策略,逐步提高棋艺水平。
二、具体解释以上四种学习
细节概念:
输入 (Input): 输入是指模型接收到的数据或信息。这些数据通常以**特征【属性与特征区别:属性可以理解为路程,特征可以理解为路程是1公里,特征有具体值。】**的形式呈现,可以帮助模型理解和分析问题。例如,在房价预测的任务中,输入可能包括房屋的面积、卧室数量、地理位置、建成年份等特征。
实例:设想一个简单的水果识别系统,这里的输入可能是一张包含水果的图片。这张图片会被转换为像素值等数字特征,作为模型判断“这是什么水果”的依据。
输出 (Output): 输出是模型根据输入数据经过处理后得出的结果。对于分类任务,输出是一个类别标签;回归任务则是一个连续数值;而强化学习中输出可能是采取某个动作的决策。
实例:
继续上面的水果识别系统例子,模型的输出将是识别出的水果种类,如苹果、香蕉或橙子。
在房价预测模型中,输出将是基于输入特征预测出的该房屋的价格(一个具体的数值)。
对于强化学习中的AlphaGo,每一步棋的输出则是它决定走的下一步棋的位置(即策略选择)。
整体细分
- 垃圾邮件分类器(有监督学习)
输入:模型接收到的是一封电子邮件的内容,包括邮件主题、正文、发件人信息等特征,这些特征被转化为数值向量表示。
处理过程:模型使用如逻辑回归、朴素贝叶斯、支持向量机或深度学习等算法,通过学习训练集中已标记为“垃圾邮件”或“非垃圾邮件”的邮件样本特征与标签之间的关联规律。
输出:模型预测给定新邮件是否为垃圾邮件,输出结果是一个概率值或者类别标签。例如,输出0.95可能意味着模型判断该邮件是垃圾邮件的概率为95%,而输出“垃圾邮件”则直接指明了邮件类型。
- 客户细分(无监督学习)
输入:模型接收一组客户的多维度数据,比如消费记录、浏览行为、购买频率、产品偏好等特征。
处理过程:应用聚类算法(如K-means或层次聚类),将相似特征的客户归入同一簇中,算法根据数据内在结构和模式自动划分集群,无需事先知道客户的具体类别。
输出:模型最终生成多个客户群体,并为每个客户提供一个所属的簇标识。例如,输出可能是客户A属于“高价值潜在用户”簇,客户B属于“频繁购物者”簇。
- 图像分类(半监督学习)
输入:一部分图像具有人工标注的类别标签,其余大部分图像没有标签。每张图片都转换为像素强度构成的数字矩阵作为特征。
处理过程:模型首先利用有限的带标签数据进行初步训练,然后在大量未标记的数据上运用自训练、迁移学习或生成对抗网络等方法来进一步提升模型性能。
输出:对于新的未知类别图像,模型能够预测出其所属类别。例如,输出一张未知猫狗照片的类别为“猫”。
- AlphaGo(强化学习)
输入:在每一轮游戏过程中,AlphaGo的输入是当前围棋棋盘的状态,即黑子白子的位置分布。
处理过程:AlphaGo基于深度神经网络(策略网络和价值网络)计算出各种可能下法的得分和局面评估值,并通过蒙特卡洛树搜索结合这两个网络的结果,确定最优走法。
输出:在每一步决策时,模型会输出它认为最佳的下一步落子位置,从而采取行动。随着游戏的进行,不断学习并优化策略以最大化最终获胜的可能性。
相关文章:

【机器学习】机器学习四大类第01课
一、机器学习四大类 有监督学习 (Supervised Learning) 有监督学习是通过已知的输入-输出对(即标记过的训练数据)来学习函数关系的过程。在训练阶段,模型会根据这些示例调整参数以尽可能准确地预测新的、未见过的数据点的输出。 实例&#x…...
下述默认构造函数有什么问题?
12.4 // points to string allocated by new // holds length of string 独立的、相同的数据,而不会重叠。由于同样的原因,必须定义赋值操作符。对于每一种情况,最终目的 都是执行深度复制,也就是说,复制实际的数据,而不仅仅是复制指向数据的指针。 对象的存储持续性为自动或…...
vite和mockjs配合使用
vite mockjs 当后端还没准备完成之前,前端可以使用 mock 模拟后端响应,提高开发效率 1、安装插件 使用 vite-plugin-mock 插件,配合mockjs完成项目的 mock 配置 npm install mockjs vite-plugin-mock2、vite配置插件 在 vite.config.js…...

【数据结构】常见八大排序算法总结
目录 前言 1.直接插入排序 2.希尔排序 3.选择排序 4.堆排序 5.冒泡排序 6.快速排序 6.1Hoare版本 6.2挖坑法 6.3前后指针法 6.4快速排序的递归实现 6.5快速排序的非递归实现 7.归并排序 8.计数排序(非比较排序) 9.补充:基数排序 10.总结…...
系统学英语 — 句法 — 常规句型
目录 文章目录 目录5 大基本句型复合句型主语从句宾语从句表语从句定语从句状语从句同位语从句补语从句 谓语句型 5 大基本句型 主谓:主语发出一个动作,例如:He cried.主谓宾:we study English.主系表:主语具有某些特…...

Github操作网络异常笔记
Github操作网络异常笔记 1. 源由2. 解决2.1 方案一2.2 方案二 3. 总结 1. 源由 开源技术在国内永远是“蛋疼”,这些"政治"问题对于追求技术的我们,形成无法回避的障碍。 $ git pull ssh: connect to host github.com port 22: Connection ti…...

Vue3新特性defineModel()便捷的双向绑定数据
官网介绍 传送门 配置 要求: 版本: vue > 3.4(必须!!!)配置:vite.config.js 使用场景和案例 使用场景:父子组件的数据双向绑定,不用emit和props的繁重代码 具体案例 代码实…...

vue列表飞入效果
效果 实现代码 <template><div><button click"add">添加</button><TransitionGroup name"list" tag"ul"><div class"list-item" v-for"item in items" :key"item.id">{{ i…...

C语言·预处理详解
1. 预定义符号 C语言设置了一些预定义符号,可以直接使用,预定义符号也是在预处理期间处理的 __FILE__ 进行编译的源文件 __LINE__ 文件当前的行号 __DATE__ 文件被编译的日期 __TIME__ 文件被编译的时间 __STDC__ 如果编译器遵循ANSI C,…...
服务器与普通电脑的区别,普通电脑可以当作服务器用吗?
服务器在我们日常应用中非常常见,手机APP、手机游戏、PC游戏、小程序、网站等等都需要部署在服务器上,为我们提供各种计算、应用服务。服务器也是计算机的一种,虽然内部结构相差不大,但是服务器的运行速度更快、负载更高、成本更高…...

数字身份所有权:Web3时代用户数据的掌控权
随着Web3时代的来临,数字身份的概念正焕发出崭新的光芒。在这个数字化的时代,用户的个人数据变得愈加珍贵,而Web3则为用户带来了数字身份所有权的概念,重新定义了用户与个人数据之间的关系。本文将深入探讨Web3时代用户数据的掌控…...
python爬虫如何写,有哪些成功爬取的案例
编写Python爬虫时,常用的库包括Requests、Beautiful Soup和Scrapy。以下是三个简单的Python爬虫案例,分别使用Requests和Beautiful Soup,以及Scrapy。 1. 使用Requests和Beautiful Soup爬取网页内容: import requests from bs4 …...

PLC物联网网关BL104实现PLC协议转MQTT、OPC UA、Modbus TCP
随着物联网技术的迅猛发展,人们深刻认识到在智能化生产和生活中,实时、可靠、安全的数据传输至关重要。在此背景下,高性能的物联网数据传输解决方案——协议转换网关应运而生,广泛应用于工业自动化和数字化工厂应用环境中。 无缝衔…...

explain工具优化mysql需要达到什么级别?
explain工具优化mysql需要达到什么级别? 一、explain工具是什么?二、explain查询后各字段的含义三、explain查询后type字段有哪些类型?四、type类型需要优化到哪个阶段? 一、explain工具是什么? explain是什么&#x…...

RHCE作业
架设一台NFS服务器,并按照以下要求配置 1、开放/nfs/shared目录,供所有用户查询资料 2、开放/nfs/upload目录,为192.168.xxx.0/24网段主机可以上传目录,并将所有用户及所属的组映射为nfs-upload,其UID和GID均为210 3、将/home/to…...

在Java中调企微机器人发送消息到群里
目录 如何使用群机器人 消息类型及数据格式 文本类型 markdown类型 图片类型 图文类型 文件类型 模版卡片类型 文本通知模版卡片 图文展示模版卡片 消息发送频率限制 文件上传接口 Java 执行语句 String url "webhook的Url"; String result HttpReque…...

鸿蒙开发(四)UIAbility和Page交互
通过上一篇的学习,相信大家对UIAbility已经有了初步的认知。在上篇中,我们最后实现了一个小demo,从一个UIAbility调起了另外一个UIAbility。当时我提到过,暂不实现比如点击EntryAbility中的控件去触发跳转,而是在Entry…...

K8s(七)四层代理Service
Service概述 Service在Kubernetes中提供了一种抽象的方式来公开应用程序的网络访问,并提供了负载均衡和服务发现等功能,使得应用程序在集群内外都能够可靠地进行访问。 每个Service都会自动关联一个对应的Endpoint。当创建一个Service时,Ku…...

鼎捷软件获评国家级智能制造“AAA级集成实施+AA级咨询设计”供应商
为贯彻落实《“十四五”智能制造发展规划》,健全智能制造系统解决方案供应商(以下简称“供应商”)分类分级体系,推动供应商规范有序发展,智能制造系统解决方案供应商联盟组织开展了供应商分类分级评定(第一批)工作,旨在遴选一批专…...

(循环依赖问题)学习spring的第九天
Bean实例的属性填充 Spring在属性注入时 , 分为如下几种情况 : 注入单向对象引用 : 如usersevice里注入userdao , userdao里没有注入其他属性 注入双向对象引用 : 如usersevice里注入userdao , userdao也注入usersevice属性 二 . 着重看循环依赖问题 (搞清原理即可) 问题提出…...
论文解读:交大港大上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化学习框架(一)
宇树机器人多姿态起立控制强化学习框架论文解析 论文解读:交大&港大&上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化学习框架(一) 论文解读:交大&港大&上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化…...

(转)什么是DockerCompose?它有什么作用?
一、什么是DockerCompose? DockerCompose可以基于Compose文件帮我们快速的部署分布式应用,而无需手动一个个创建和运行容器。 Compose文件是一个文本文件,通过指令定义集群中的每个容器如何运行。 DockerCompose就是把DockerFile转换成指令去运行。 …...

均衡后的SNRSINR
本文主要摘自参考文献中的前两篇,相关文献中经常会出现MIMO检测后的SINR不过一直没有找到相关数学推到过程,其中文献[1]中给出了相关原理在此仅做记录。 1. 系统模型 复信道模型 n t n_t nt 根发送天线, n r n_r nr 根接收天线的 MIMO 系…...

Yolov8 目标检测蒸馏学习记录
yolov8系列模型蒸馏基本流程,代码下载:这里本人提交了一个demo:djdll/Yolov8_Distillation: Yolov8轻量化_蒸馏代码实现 在轻量化模型设计中,**知识蒸馏(Knowledge Distillation)**被广泛应用,作为提升模型…...

推荐 github 项目:GeminiImageApp(图片生成方向,可以做一定的素材)
推荐 github 项目:GeminiImageApp(图片生成方向,可以做一定的素材) 这个项目能干嘛? 使用 gemini 2.0 的 api 和 google 其他的 api 来做衍生处理 简化和优化了文生图和图生图的行为(我的最主要) 并且有一些目标检测和切割(我用不到) 视频和 imagefx 因为没 a…...

使用LangGraph和LangSmith构建多智能体人工智能系统
现在,通过组合几个较小的子智能体来创建一个强大的人工智能智能体正成为一种趋势。但这也带来了一些挑战,比如减少幻觉、管理对话流程、在测试期间留意智能体的工作方式、允许人工介入以及评估其性能。你需要进行大量的反复试验。 在这篇博客〔原作者&a…...
【SSH疑难排查】轻松解决新版OpenSSH连接旧服务器的“no matching...“系列算法协商失败问题
【SSH疑难排查】轻松解决新版OpenSSH连接旧服务器的"no matching..."系列算法协商失败问题 摘要: 近期,在使用较新版本的OpenSSH客户端连接老旧SSH服务器时,会遇到 "no matching key exchange method found", "n…...

Selenium常用函数介绍
目录 一,元素定位 1.1 cssSeector 1.2 xpath 二,操作测试对象 三,窗口 3.1 案例 3.2 窗口切换 3.3 窗口大小 3.4 屏幕截图 3.5 关闭窗口 四,弹窗 五,等待 六,导航 七,文件上传 …...

免费数学几何作图web平台
光锐软件免费数学工具,maths,数学制图,数学作图,几何作图,几何,AR开发,AR教育,增强现实,软件公司,XR,MR,VR,虚拟仿真,虚拟现实,混合现实,教育科技产品,职业模拟培训,高保真VR场景,结构互动课件,元宇宙http://xaglare.c…...

C# 表达式和运算符(求值顺序)
求值顺序 表达式可以由许多嵌套的子表达式构成。子表达式的求值顺序可以使表达式的最终值发生 变化。 例如,已知表达式3*52,依照子表达式的求值顺序,有两种可能的结果,如图9-3所示。 如果乘法先执行,结果是17。如果5…...