【机器学习】机器学习四大类第01课
一、机器学习四大类
有监督学习 (Supervised Learning)
有监督学习是通过已知的输入-输出对(即标记过的训练数据)来学习函数关系的过程。在训练阶段,模型会根据这些示例调整参数以尽可能准确地预测新的、未见过的数据点的输出。 实例:垃圾邮件分类器。训练数据集包含一系列电子邮件及其对应的标签(垃圾邮件或非垃圾邮件)。通过学习这些特征与标签之间的关联,模型可以用于识别新的邮件是否为垃圾邮件。
无监督学习 (Unsupervised Learning)
在无监督学习中,没有给定特定的输出标签,算法需要自己发现数据中的内在结构、模式或集群。它的目标通常是将数据进行分组或降维,以便更好地理解数据分布。 实例:客户细分。假设我们有一组客户的行为数据(如购买历史、访问频率等),但没有明确的类别标签。使用聚类算法(例如K-means)可以将相似行为模式的客户自动划分为不同的群体。
半监督学习 (Semi-supervised Learning)
半监督学习
介于有监督学习和无监督学习之间,它利用一部分带有标签的数据和大量未标记的数据进行学习。通常在标注数据有限的情况下,这种学习方式可以帮助提高模型性能。 实例:图像分类。如果只有部分图像被人工标注了类别,而剩余大部分图像没有标签,模型可以通过分析图像间的相似性,在已知标签图像的帮助下,推断出未标记图像的类别。
强化学习 (Reinforcement Learning, RL)
强化学习
是一种序列决策过程的学习方法,智能体通过与环境交互获得奖励或惩罚,并根据这些反馈调整其策略以最大化长期累积奖励。 实例:AlphaGo(围棋AI)。AlphaGo在每次走棋时都会得到一个即时的奖励信号(赢棋或输棋的最终结果,以及过程中每一步棋的相对价值估计),通过不断对弈学习最优策略,逐步提高棋艺水平。
二、具体解释以上四种学习
细节概念:
输入 (Input): 输入是指模型接收到的数据或信息。这些数据通常以**特征【属性与特征区别:属性可以理解为路程,特征可以理解为路程是1公里,特征有具体值。】**的形式呈现,可以帮助模型理解和分析问题。例如,在房价预测的任务中,输入可能包括房屋的面积、卧室数量、地理位置、建成年份等特征。
实例:设想一个简单的水果识别系统,这里的输入可能是一张包含水果的图片。这张图片会被转换为像素值等数字特征,作为模型判断“这是什么水果”的依据。
输出 (Output): 输出是模型根据输入数据经过处理后得出的结果。对于分类任务,输出是一个类别标签;回归任务则是一个连续数值;而强化学习中输出可能是采取某个动作的决策。
实例:
继续上面的水果识别系统例子,模型的输出将是识别出的水果种类,如苹果、香蕉或橙子。
在房价预测模型中,输出将是基于输入特征预测出的该房屋的价格(一个具体的数值)。
对于强化学习中的AlphaGo,每一步棋的输出则是它决定走的下一步棋的位置(即策略选择)。
整体细分
- 垃圾邮件分类器(有监督学习)
输入:模型接收到的是一封电子邮件的内容,包括邮件主题、正文、发件人信息等特征,这些特征被转化为数值向量表示。
处理过程:模型使用如逻辑回归、朴素贝叶斯、支持向量机或深度学习等算法,通过学习训练集中已标记为“垃圾邮件”或“非垃圾邮件”的邮件样本特征与标签之间的关联规律。
输出:模型预测给定新邮件是否为垃圾邮件,输出结果是一个概率值或者类别标签。例如,输出0.95可能意味着模型判断该邮件是垃圾邮件的概率为95%,而输出“垃圾邮件”则直接指明了邮件类型。
- 客户细分(无监督学习)
输入:模型接收一组客户的多维度数据,比如消费记录、浏览行为、购买频率、产品偏好等特征。
处理过程:应用聚类算法(如K-means或层次聚类),将相似特征的客户归入同一簇中,算法根据数据内在结构和模式自动划分集群,无需事先知道客户的具体类别。
输出:模型最终生成多个客户群体,并为每个客户提供一个所属的簇标识。例如,输出可能是客户A属于“高价值潜在用户”簇,客户B属于“频繁购物者”簇。
- 图像分类(半监督学习)
输入:一部分图像具有人工标注的类别标签,其余大部分图像没有标签。每张图片都转换为像素强度构成的数字矩阵作为特征。
处理过程:模型首先利用有限的带标签数据进行初步训练,然后在大量未标记的数据上运用自训练、迁移学习或生成对抗网络等方法来进一步提升模型性能。
输出:对于新的未知类别图像,模型能够预测出其所属类别。例如,输出一张未知猫狗照片的类别为“猫”。
- AlphaGo(强化学习)
输入:在每一轮游戏过程中,AlphaGo的输入是当前围棋棋盘的状态,即黑子白子的位置分布。
处理过程:AlphaGo基于深度神经网络(策略网络和价值网络)计算出各种可能下法的得分和局面评估值,并通过蒙特卡洛树搜索结合这两个网络的结果,确定最优走法。
输出:在每一步决策时,模型会输出它认为最佳的下一步落子位置,从而采取行动。随着游戏的进行,不断学习并优化策略以最大化最终获胜的可能性。
相关文章:

【机器学习】机器学习四大类第01课
一、机器学习四大类 有监督学习 (Supervised Learning) 有监督学习是通过已知的输入-输出对(即标记过的训练数据)来学习函数关系的过程。在训练阶段,模型会根据这些示例调整参数以尽可能准确地预测新的、未见过的数据点的输出。 实例&#x…...

下述默认构造函数有什么问题?
12.4 // points to string allocated by new // holds length of string 独立的、相同的数据,而不会重叠。由于同样的原因,必须定义赋值操作符。对于每一种情况,最终目的 都是执行深度复制,也就是说,复制实际的数据,而不仅仅是复制指向数据的指针。 对象的存储持续性为自动或…...

vite和mockjs配合使用
vite mockjs 当后端还没准备完成之前,前端可以使用 mock 模拟后端响应,提高开发效率 1、安装插件 使用 vite-plugin-mock 插件,配合mockjs完成项目的 mock 配置 npm install mockjs vite-plugin-mock2、vite配置插件 在 vite.config.js…...

【数据结构】常见八大排序算法总结
目录 前言 1.直接插入排序 2.希尔排序 3.选择排序 4.堆排序 5.冒泡排序 6.快速排序 6.1Hoare版本 6.2挖坑法 6.3前后指针法 6.4快速排序的递归实现 6.5快速排序的非递归实现 7.归并排序 8.计数排序(非比较排序) 9.补充:基数排序 10.总结…...

系统学英语 — 句法 — 常规句型
目录 文章目录 目录5 大基本句型复合句型主语从句宾语从句表语从句定语从句状语从句同位语从句补语从句 谓语句型 5 大基本句型 主谓:主语发出一个动作,例如:He cried.主谓宾:we study English.主系表:主语具有某些特…...

Github操作网络异常笔记
Github操作网络异常笔记 1. 源由2. 解决2.1 方案一2.2 方案二 3. 总结 1. 源由 开源技术在国内永远是“蛋疼”,这些"政治"问题对于追求技术的我们,形成无法回避的障碍。 $ git pull ssh: connect to host github.com port 22: Connection ti…...

Vue3新特性defineModel()便捷的双向绑定数据
官网介绍 传送门 配置 要求: 版本: vue > 3.4(必须!!!)配置:vite.config.js 使用场景和案例 使用场景:父子组件的数据双向绑定,不用emit和props的繁重代码 具体案例 代码实…...

vue列表飞入效果
效果 实现代码 <template><div><button click"add">添加</button><TransitionGroup name"list" tag"ul"><div class"list-item" v-for"item in items" :key"item.id">{{ i…...

C语言·预处理详解
1. 预定义符号 C语言设置了一些预定义符号,可以直接使用,预定义符号也是在预处理期间处理的 __FILE__ 进行编译的源文件 __LINE__ 文件当前的行号 __DATE__ 文件被编译的日期 __TIME__ 文件被编译的时间 __STDC__ 如果编译器遵循ANSI C,…...

服务器与普通电脑的区别,普通电脑可以当作服务器用吗?
服务器在我们日常应用中非常常见,手机APP、手机游戏、PC游戏、小程序、网站等等都需要部署在服务器上,为我们提供各种计算、应用服务。服务器也是计算机的一种,虽然内部结构相差不大,但是服务器的运行速度更快、负载更高、成本更高…...

数字身份所有权:Web3时代用户数据的掌控权
随着Web3时代的来临,数字身份的概念正焕发出崭新的光芒。在这个数字化的时代,用户的个人数据变得愈加珍贵,而Web3则为用户带来了数字身份所有权的概念,重新定义了用户与个人数据之间的关系。本文将深入探讨Web3时代用户数据的掌控…...

python爬虫如何写,有哪些成功爬取的案例
编写Python爬虫时,常用的库包括Requests、Beautiful Soup和Scrapy。以下是三个简单的Python爬虫案例,分别使用Requests和Beautiful Soup,以及Scrapy。 1. 使用Requests和Beautiful Soup爬取网页内容: import requests from bs4 …...

PLC物联网网关BL104实现PLC协议转MQTT、OPC UA、Modbus TCP
随着物联网技术的迅猛发展,人们深刻认识到在智能化生产和生活中,实时、可靠、安全的数据传输至关重要。在此背景下,高性能的物联网数据传输解决方案——协议转换网关应运而生,广泛应用于工业自动化和数字化工厂应用环境中。 无缝衔…...

explain工具优化mysql需要达到什么级别?
explain工具优化mysql需要达到什么级别? 一、explain工具是什么?二、explain查询后各字段的含义三、explain查询后type字段有哪些类型?四、type类型需要优化到哪个阶段? 一、explain工具是什么? explain是什么&#x…...

RHCE作业
架设一台NFS服务器,并按照以下要求配置 1、开放/nfs/shared目录,供所有用户查询资料 2、开放/nfs/upload目录,为192.168.xxx.0/24网段主机可以上传目录,并将所有用户及所属的组映射为nfs-upload,其UID和GID均为210 3、将/home/to…...

在Java中调企微机器人发送消息到群里
目录 如何使用群机器人 消息类型及数据格式 文本类型 markdown类型 图片类型 图文类型 文件类型 模版卡片类型 文本通知模版卡片 图文展示模版卡片 消息发送频率限制 文件上传接口 Java 执行语句 String url "webhook的Url"; String result HttpReque…...

鸿蒙开发(四)UIAbility和Page交互
通过上一篇的学习,相信大家对UIAbility已经有了初步的认知。在上篇中,我们最后实现了一个小demo,从一个UIAbility调起了另外一个UIAbility。当时我提到过,暂不实现比如点击EntryAbility中的控件去触发跳转,而是在Entry…...

K8s(七)四层代理Service
Service概述 Service在Kubernetes中提供了一种抽象的方式来公开应用程序的网络访问,并提供了负载均衡和服务发现等功能,使得应用程序在集群内外都能够可靠地进行访问。 每个Service都会自动关联一个对应的Endpoint。当创建一个Service时,Ku…...

鼎捷软件获评国家级智能制造“AAA级集成实施+AA级咨询设计”供应商
为贯彻落实《“十四五”智能制造发展规划》,健全智能制造系统解决方案供应商(以下简称“供应商”)分类分级体系,推动供应商规范有序发展,智能制造系统解决方案供应商联盟组织开展了供应商分类分级评定(第一批)工作,旨在遴选一批专…...

(循环依赖问题)学习spring的第九天
Bean实例的属性填充 Spring在属性注入时 , 分为如下几种情况 : 注入单向对象引用 : 如usersevice里注入userdao , userdao里没有注入其他属性 注入双向对象引用 : 如usersevice里注入userdao , userdao也注入usersevice属性 二 . 着重看循环依赖问题 (搞清原理即可) 问题提出…...

Kotlin的数据类
引言 我们在做项目中涉及到各种数据类的处理,很多很杂乱。难免一个人的知识点有盲点,所以想着做个整理。 定义 在平时的使用中,我们会用到一些类来保持一些数据或状态,我们习惯上成为bean或者entity,也有的定义为mod…...

PTA 7-13 统计工龄
给定公司N名员工的工龄,要求按工龄增序输出每个工龄段有多少员工。 输入格式: 输入首先给出正整数N(≤105),即员工总人数;随后给出N个整数,即每个员工的工龄,范围在[0, 50]。 输出格式: 按工…...

算法常用思路总结
思路 1. 求数组中最大最小值思路代码 2. 计算阶乘思路:代码: 3. 得到数字的每一位思路代码 4. 计算时间类型5. 最大公约数、最小公倍数6. 循环数组的思想题目:猴子选大王代码 补充经典例题1. 复试四则运算题目内容题解 2. 数列求和题目内容题…...

Leetcode 3016. Minimum Number of Pushes to Type Word II
Leetcode 3016. Minimum Number of Pushes to Type Word II 1. 解题思路2. 代码实现 题目链接:3016. Minimum Number of Pushes to Type Word II 1. 解题思路 这道题的话思路其实还是蛮简单的,显然我们的目的是要令对给定的word在键盘上敲击的次数最小…...

node.js如何将webp转jpg图片
在Node.js中,可以使用一些库来实现将WebP图像转换为JPEG。一个常用的库是sharp,它是一个快速、高效的图像处理库。以下是一个简单的Node.js脚本示例,演示如何使用sharp库将WebP转换为JPEG: 首先,确保已经安装了sharp库…...

达梦数据库 忘记 SYSDBA 密码 处理方法
DM 提供数据库身份验证模式、基于操作系统的身份验证模式、外部身份验证模式和 UKEY 身份验证模式来保护对数据库访问的安全。数据库身份验证模式需要利用数据库口令, 即在创建或修改用户时指定用户口令,用户在登录时输入对应口令进行身份验证;基于操作 …...

SpringBoot ES 重建 Mapping
SpringBoot ES 重建 Mapping 1 复制数据2 删除老索引3 重建索引4 复制回数据 1 复制数据 POST http://elastic:123456127.0.0.1:9200/_reindex{"source": {"index": "老索引名称"},"dest": {"index": "备份索引名称&q…...

【51单片机】矩阵按键
0、前言 参考:普中 51 单片机开发攻略 1、硬件 2、软件 main.c #include <reg52.h> #include <intrins.h> #include "delayms.h"typedef unsigned int u16; //对数据类型进行声明定义 typedef unsigned char u8; #define GPIO_KEY P1 #d…...

Redis- AOF刷盘策略
在Redis中,appendfsync everysec 是一个与持久化相关的配置选项,它属于 Redis 的 AOF(Append Only File)持久化策略的一部分。 Redis支持两种主要的数据持久化方式:RDB(快照)和AOF(…...

标量、向量、矩阵和张量的区别?
标量、向量、矩阵和张量是数学和物理学中常用的概念,它们在多维数据表示和处理中扮演着关键角色。下面是这些概念的基本区别: 标量(Scalar): -标量是单个数字,用于表示单一的量。 -它没有方向。 -在数学中࿰…...