当前位置: 首页 > article >正文

AI学习第二天--监督学习 半监督学习 无监督学习

目录

1. 监督学习(Supervised Learning)

比喻:

技术细节:

形象例子:

2. 无监督学习(Unsupervised Learning)

比喻:

技术细节:

形象例子:

3. 半监督学习(Semi-Supervised Learning)

比喻:

技术细节:

形象例子:

4. 三者的对比与选择

表格总结:

5. 实际案例对比

案例:电商平台用户分群

6. 关键逻辑总结


1. 监督学习(Supervised Learning)

比喻

老师带着学生做题,每道题都有标准答案,学生通过练习学会解题方法。
核心有标签的数据(答案已知)。


技术细节
  • 数据形式:输入(X)+ 标签(Y)。
    • 例如:
      • 图像分类:图片(X) + 类别标签(Y,如“猫”或“狗”)。
      • 房价预测:房屋面积、位置(X) + 房价(Y)。
  • 目标:模型学习输入到标签的映射关系(如 f(X)=Yf(X)=Y)。
  • 常见算法线性回归、决策树、神经网络等。

形象例子

场景:学生学数学。

  1. 老师
    • 给出题目和答案(如“3+5=?” → 答案“8”)。
    • 学生通过大量练习(如1000道题+答案)掌握加法规律。
  2. 模型
    • 输入“3+5”,输出“8”。
    • 监督学习的关键:每一步都有明确的“正确答案”指导模型学习。

2. 无监督学习(Unsupervised Learning)

比喻

学生自己探索一堆物品,没有老师指导,只能通过观察找出物品的共同特征或分组
核心无标签的数据(没有答案,需自行发现模式)。


技术细节
  • 数据形式:仅有输入(X),无标签(Y)。
    • 例如:
      • 客户数据(年龄、收入、消费习惯) → 分群(如高收入用户群、低频购物群)。
      • 文本语料库 → 聚类为不同主题。
  • 目标:模型发现数据中的内在结构(如分组、降维)。
  • 常见算法K-Means聚类、PCA降维、自编码器等。

形象例子

场景:学生整理图书馆的书。

  1. 学生
    • 看到一堆书,但没有分类标签(如“科幻”“历史”)。
    • 通过观察书的内容、作者、关键词,将书分为“小说”“科技”“历史”等类别。
  2. 模型
    • 输入客户数据,输出“客户A属于高价值用户群”。
    • 无监督学习的关键:没有答案,模型自己“创造”规则。

3. 半监督学习(Semi-Supervised Learning)

比喻

学生大部分时间自己探索,但偶尔老师给出几个题目的答案,学生结合少量答案和大量无标签数据学习。
核心少量有标签数据 + 大量无标签数据


技术细节
  • 数据形式
    • 少量有标签数据(X, Y) + 大量无标签数据(仅X)。
    • 例如:
      • 医疗数据:100个标注的X光片(有疾病标签) + 10,000个未标注的X光片。
  • 目标:利用少量标签和大量无标签数据提升模型性能。
  • 常见方法
    • 标签传播:用少量标签数据推测无标签数据的标签。
    • 自训练:模型先用有标签数据训练,再预测无标签数据,将高置信度预测结果作为新标签。

形象例子

场景:学生学画画,但只有少量带标签的画作。

  1. 老师
    • 给出10张画作并标注“风景”“人物”等标签。
    • 其他1000张画作无标签。
  2. 学生
    • 先用10张带标签的画学习特征(如“人物画有五官”)。
    • 再观察无标签画作,推测它们的类别(如“这张画有山和树 → 可能是风景”)。
  3. 模型
    • 输入新画作,输出“风景”或“人物”。
    • 半监督学习的关键:用少量标签引导,大量无标签数据扩展知识。

4. 三者的对比与选择

表格总结
类型数据形式目标适用场景优缺点
监督学习X(输入) + Y(标签)学习输入到标签的映射分类、回归(如图像识别、房价预测)需大量标注数据,但模型性能通常更好。
无监督学习X(输入)无标签发现数据内在结构聚类、降维(如客户分群、文本主题分析)不需要标注数据,但结果可能需要人工解释。
半监督学习少量(X,Y) + 大量X结合有/无标签提升性能标注成本高但数据量大的场景(如医疗、图像)兼顾监督和无监督的优点,但实现复杂,需平衡两者。

5. 实际案例对比

案例:电商平台用户分群
  • 监督学习
    • 数据:用户行为数据(点击、购买) + 标签(“高价值用户”或“低价值用户”)。
    • 模型:训练分类器,预测新用户是否是高价值用户。
  • 无监督学习
    • 数据:用户行为数据(无标签)。
    • 模型:聚类为“高活跃用户群”“价格敏感用户群”等。
  • 半监督学习
    • 数据:100个标注用户(高/低价值) + 10,000个无标签用户。
    • 模型:用少量标签引导聚类,提升用户分群的准确性。

6. 关键逻辑总结

  • 监督学习有答案,学得准,但成本高
  • 无监督学习无答案,靠探索,成本低但需解释
  • 半监督学习少量答案+大量数据,性价比高,但需平衡

用一句话概括:
“监督学习是‘有答案的考试’,无监督学习是‘无答案的探险’,半监督学习是‘带着少量答案去探险’。”

相关文章:

AI学习第二天--监督学习 半监督学习 无监督学习

目录 1. 监督学习(Supervised Learning) 比喻: 技术细节: 形象例子: 2. 无监督学习(Unsupervised Learning) 比喻: 技术细节: 形象例子: 3. 半监督学…...

设计模式(创建型)-抽象工厂模式

摘要 在软件开发的复杂世界中,设计模式作为解决常见问题的最佳实践方案,一直扮演着至关重要的角色。抽象工厂模式,作为一种强大的创建型设计模式,在处理创建一系列或相关依赖对象的场景时,展现出了独特的优势和灵活性。它通过提供一个创建对象的接口,让开发者能够在不指定…...

linux系统 Ubuntu22.04安装Nvidia驱动,解决4060系列显卡重启黑屏方法

一、禁用Nouveau 1.查看nouveau lsmod | grep nouveau 2.编辑 blacklist.conf sudo gedit /etc/modprobe.d/blacklist.conf 3.在文件最后加入 blacklist nouveau options nouveau modeset0 4.保存并关闭文件 5.更新 sudo update-initramfs -u 6.重启之后,检…...

观察者模式详解:用 Qt 信号与槽机制深入理解

引言 你是否曾遇到这样的需求:一个对象的状态发生变化后,希望通知其他对象进行相应的更新?比如: 新闻订阅系统:当新闻发布后,所有订阅者都会收到通知。股票行情推送:股价变化时,所…...

OSWorld:开启多模态智能体的真实计算机环境革命

OSWorld:开启多模态智能体的真实计算机环境革命 在人工智能技术突飞猛进的今天,多模态智能体正逐步突破实验室的限制,试图融入人类的日常工作场景。然而,如何评估这些智能体在真实计算机环境中处理开放式任务的能力,成为学术界和产业界共同关注的难题。2024年,由xlang-ai…...

LabVIEW烟气速度场实时监测

本项目针对燃煤电站烟气流速实时监测需求,探讨了静电传感器结构与速度场超分辨率重建方法,结合LabVIEW多板卡同步采集与实时处理技术,开发出一个高效的烟气速度场实时监测系统。该系统能够在高温、高尘的复杂工况下稳定运行,提供高…...

电脑管家如何清理内存及垃圾,提升电脑性能

电脑在长时间使用后,常常会变得越来越卡顿,打开程序的速度变慢,甚至响应迟缓。这时,不少用户会选择使用电脑管家来进行内存清理和垃圾清理。那么,电脑管家是如何清理内存的?它又是如何清理垃圾的&#xff1…...

强化学习基础篇二:马尔可夫决策过程

写在前面 本文是对李沐等“动手学强化学习”教程的个人阅读总结,原文链接:动手学强化学习。 第3章 马尔可夫决策过程 3.1 重要性 马尔可夫决策过程是强化学习中的基础概念,强化学习中的环境就是一个马尔可夫决策过程,与多臂老虎…...

EtherCAT转profinet网关集成汽车变速箱制造生产线自动化升级

客户的汽车零部件制造商需要升级其变速箱齿轮加工生产线,面临的关键挑战是整合新引进的欧洲齿轮精密检测设备(基于EtherCAT协议)与现有使用profinet协议自动化系统通信。 企业核心控制平台基于西门子PLC,而现场各工位采用分布式I/…...

tongweb7控制台无法访问

tongweb7控制台无法访问 排查 1.首先确认版本,如果版本是轻量级版本,轻量版不支持会话(session)的备份和复制、管理控制台、APM 运维工具等企业级增量功能。 2.查看端口 命令:ss -tnlp 或者netstat -tnlp 确认控制台端口是否开启 3.在conf…...

Spring中的循环依赖问题是什么?

在使用Spring框架进行开发时,可能会遇到一个比较棘手的问题,那就是循环依赖。说到循环依赖,很多人可能会感到有些困惑,难道这个问题真的有那么复杂吗?其实,理解循环依赖并不是很难。我们可以从Spring的依赖…...

【STM32】从新建一个工程开始:STM32 新建工程的详细步骤

STM32 开发通常使用 Keil MDK、STM32CubeMX、IAR 等工具来创建和管理工程。此处是 使用 Keil MDK5 STM32CubeMX 创建 STM32 工程的详细步骤。 新建的标准库工程文件已上传至资源中,下载后即可直接使用。 标准库新建 STM32 工程的基本目录结构:STD_STM…...

基于“动手学强化学习”的知识点(五):第 18 章 离线强化学习(gym版本 >= 0.26)

第 18 章 离线强化学习(gym版本 > 0.26) 摘要SAC 算法部分CQL 算法CQL 总结与大函数意义CQL 总结CQL 类详细分析 摘要 本系列知识点讲解基于动手学强化学习中的内容进行详细的疑难点分析!具体内容请阅读动手学强化学习&#xff0…...

搞定python之九----常用内置模块

本文是《搞定python》系列文章的第九篇,介绍常用的内置模块的使用。到此为止python的基础用法就彻底说完了,大家可以在此基础上学习爬虫、web处理等框架了。 本文的代码相对比较多,大家注意看代码即可。python的文档我贴出来,毕竟…...

判断是不是完全二叉树(C++)

目录 1 问题描述 1.1 示例1 1.2 示例2 1.3 示例3 2 解题思路 3 代码实现 4 代码解析 4.1 定义队列,初始化根节点 4.2 层序遍历,处理每个节点 4.3 处理空节点 4.4 处理非空节点 5 总结 1 问题描述 给定一个二叉树,确定他是否是一…...

DeepSeek在学术研究方向初期工作提示词分享

目录 论文选题 研读文献 拟定提纲 大家好这里是AIWritePaper官方账号!更多内容👉AIWritePaper~在如今这个学术圈的“快车道”上,时间就像是一场永不停歇的赛跑,而论文质量则是那颗我们拼命追逐的“金苹果”。最近一款名为DeepS…...

神经外科手术规划的实现方案及未来发展方向

Summary: 手术规划软件 效果图,样例: 神经外科手术规划样例: 神经外科手术规划,三维重建,三维建模,三维可视化 Part1: 手术规划的定义与作用 一、手术规划的定义 手术规划是指在手术前,通过详…...

easypoi导入Excel兼容日期和字符串格式的日期和时间

问题场景 在使用easypoi导入Excel时,涉及到的常用日期会有yyyy-MM-dd HH:mm:ss、yyyy-MM-dd和HH:mm:ss,但是Excel上面的格式可不止这些,用户总会输入一些其他格式,如 如果在定义verify时用下面这种格式定义,那么总会…...

【计算机视觉】工业表计读数(2)--表计检测

1. 简介 工业表计(如压力表、电表、气表等)在工控系统、能源管理等领域具有重要应用。然而,传统人工抄表不仅工作量大、效率低,而且容易产生数据误差。近年来,基于深度学习的目标检测方法在工业检测中展现出极大优势&…...

Zbrush插件安装

安装目录在: ...\Zbrush2022\ZStartup\ZPlugs64...

LeRobot源码剖析——对机器人各个动作策略的统一封装:包含ALOHA ACT、Diffusion Policy、VLA模型π0

前言 过去2年多的深入超过此前7年,全靠夜以继日的勤奋,一天当两天用,抠论文 抠代码 和大模型及具身同事讨论,是目前日常 而具身库里,idp3、π0、lerobot值得反复研究,故,近期我一直在抠π0及l…...

OpenCV基础【图像和视频的加载与显示】

目录 一.创建一个窗口,显示图片 二.显示摄像头/多媒体文件 三.把摄像头录取到的视频存储在本地 四.鼠标回调事件 五.TrackBar滑动条 一.创建一个窗口,显示图片 import cv2img_path "src/fengjing.jpg" # 自己的图片路径 img cv2.imre…...

Visual Studio2022 中的键盘注释快捷方式

键盘快捷键 - Visual Studio (Windows) | Microsoft Learn 从官网查询: 注释选定内容CtrlKC [文本编辑器]编辑.注释选定内容 取消注释选定内容CtrlKU [文本编辑器]编辑.取消注释选定内容 官网显示版本2010应该也是用以上办法,本人还没尝试过。 使用注…...

【iOS】SwiftUI 路由管理(NavigationStack)

QDRouter.swift import SwiftUIMainActor class QDRouter: ObservableObject {Published var path NavigationPath()static let main QDRouter() // 单例private init() {}func open(_ url: String) {guard let url URL(string: url) else {return}UIApplication.shared.op…...

杨校老师课堂之编程入门与软件安装【图文笔记】

亲爱的同学们,热烈欢迎踏入青少年编程的奇妙世界! 我是你们的授课老师杨校 ,期待与大家一同开启编程之旅。 1. 轻松叩开编程之门 1.1 程序的定义及生活中的应用 程序是人与计算机沟通的工具。在日常生活中,像手机里的各类 APP、电…...

numpy学习笔记6:np.sin(a) 的详细解释

numpy学习笔记6:np.sin(a) 的详细解释 以下是关于 np.sin(a) 的详细解释: 1. 函数作用 np.sin(a) 是 NumPy 中用于计算数组(或标量)元素的正弦值的函数: 输入:数组 a(元素单位为弧度&#xff…...

Excel(函数篇):IF函数、FREQUNCY函数、截取函数、文本处理函数、日期函数、常用函数详解

目录 IF函数等于判断区间判断与AND函数、OR函数一同使用IFNA函数和IFERROR函数 FREQUNCY函数、分断统计LEFT、RIGHT、MID截取函数FIND函数、LEN函数SUBSTITUTE函数ASC函数、WIDECHAR函数实战:如何获取到表中所有工作簿名称文本处理函数TEXT函数TEXTJOIN函数 日期函数…...

利用大语言模型生成的合成数据训练YOLOv12:提升商业果园苹果检测的精度与效

之前小编分享过关于《YOLO11-CBAM集成:提升商业苹果园树干与树枝分割的精准度》,改进YOLO11算法后,进行苹果树的实例分割。本期文章我们将分享关于最新的YOLO12算法改进的苹果目标检测。 论文题目:Improved YOLOv12 with LLM-Gen…...

RabbitMQ 和 Redis 的选择

在处理大规模消息场景时,RabbitMQ 和 Redis 的选择需根据具体需求权衡。 大规模消息场景的关键考量 ​吞吐量需求: ​Redis:更适合 ​超高频写入​(如百万级/秒),但需牺牲部分可靠性。​RabbitMQ&#xff…...

整合百款经典街机游戏的模拟器介绍

对于80、90后而言,街机游戏承载着童年的欢乐记忆。今天要给大家介绍一款超棒的软件——「MXui街机厅经典游戏101款」,它能带你重回那段热血沸腾的街机时光。 「MXui街机厅经典游戏101款」是一款绿色免安装的街机模拟器,体积约1.39G。无需繁琐…...