当前位置: 首页 > news >正文

主动学习、半监督学习、它们之间的区别?

1、主动学习(Active Learning)

含义:

有的时候,有类标的数据比较稀少而没有类标的数据是相当丰富的,但是对数据进行人工标注又非常昂贵,这时候,学习算法可以主动地提出一些标注请求,将一些经过筛选的数据提交给专家进行标注。这个筛选过程也就是主动学习主要研究的地方了,怎么样筛选数据才能使得请求标注的次数尽量少而最终的结果又尽量好。

主动学习的过程大致是这样的,有一个已经标好类标的数据集K(初始时可能为空),和还没有标记的数据集U,通过K集合的信息,找出一个U的子集C,提出标注请求,待专家将数据集C标注完成后加入到K集合中,进行下一次迭代。

特点:

  • 交互性强:涉及与人类专家的交互来获得有价值的标签。
  • 高效利用:可以用较少的标注资源获得较好的模型性能。
  • 特定方向:主动选择最具挑战性或最有信息量的样本进行标注。

2、半监督学习(Semi-Supervised Learning)

半监督学习是一种介于监督学习和无监督学习之间的方法。它使用大量的无标签样本和少量的有标签样本共同训练模型。半监督学习的方法通常通过利用数据的分布、集群、流形等结构信息来推断无标签数据可能的标签,从而辅助模型的训练

特点

  • 自动利用:无需人工选择,自动利用无标签样本的潜在信息。
  • 结构挖掘:挖掘数据的内在结构和模式来辅助有标签样本的学习。
  • 不依赖交互:与主动学习不同,不需要与人类专家交互来获取更多的标签。

3、区别与联系

按wiki上所描述的看,主动学习也属于半监督学习的范畴了,但实际上是不一样的,半监督学习和主动学习,都属于利用未标记数据的学习技术,但基本思想还是有区别的。

主动学习的“主动”,指的是主动提出标注请求,也就是说,还是需要一个外在的能够对其请求进行标注的实体(通常就是相关领域人员),即主动学习是交互进行的

总结对比

  • 主动学习强调通过人机交互主动选择特定样本进行标注,以提高学习效率。
  • 半监督学习则自动利用无标签样本中的潜在结构,无需额外的人机交互。
  • 主动学习通常更关注样本选择策略,而半监督学习更注重利用无标签样本的整体结构信息。
  • 主动学习的效率可能更高,因为它可以更精确地定位到最有助于模型训练的样本,但需要人工参与;半监督学习可以自动进行,但可能不如主动学习精确。

主动学习与半监督学习Active-learning and Semi-supervised learning_从未被模仿一直被超越的博客-CSDN博客

相关文章:

主动学习、半监督学习、它们之间的区别?

1、主动学习(Active Learning): 含义: 有的时候,有类标的数据比较稀少而没有类标的数据是相当丰富的,但是对数据进行人工标注又非常昂贵,这时候,学习算法可以主动地提出一些标注请…...

linux快速安装Rabbitmq

linux快速安装Rabbitmq 准备yum仓库 # root执行rpm --import https://github.com/rabbitmq/signing-keys/releases/download/2.0/rabbitmq-release-signing-key.ascrpm --import https://packagecloud.io/rabbitmq/erlang/gpgkeyrpm --import https://packagecloud.io/ra…...

spconv1.2.1库的编译与安装

SpConv是一个稀疏卷积库,在点云相关的深度学习算法中用的比较多。由于目前官方升级到了2.0,然而有些算法(比如审稿人要我复现的Cylinder3D)仍需要用到1.2.1版本,因此本人花了亿点点时间折腾了一下。。。 本机安装cuda…...

java+springboot+mysql企业邮件管理系统

项目介绍: 使用javaspringbootmysql开发的企业邮件管理系统,系统包含超级管理员、管理员、员工角色,功能如下: 超级管理员:管理员管理;员工管理;反馈管理;系统公告;个人…...

[CKA]考试之一个 Pod 封装多个容器

由于最新的CKA考试改版,不允许存储书签,本博客致力怎么一步步从官网把答案找到,如何修改把题做对,下面开始我们的 CKA之旅 题目为: Task 创建一个Pod,名字为kucc1,这个Pod包含4容器&#xff…...

iphone备份用什么软件?好用的苹果数据备份工具推荐!

众所周知,如果要将iPhone的数据跟电脑进行传输备份的话,我们需要用到iTunes这个pc工具。但是对于iTunes,不少人都反映这个软件比较难用,用不习惯。于是,顺应时代命运的iPhone备份同步工具就出现了。那iphone备份用什么…...

一语道破 python 迭代器和生成器

简而言之:迭代器是一个抽象化的概念,在python中表示访问数据集合中元素的一种方式;生成器也是一个抽象化的概念,在python 中,边循环边生成所需数据,是一种时间换空间的方法。从访问数据方式上来看&#xff…...

有哪些开源和非开源的项目管理工具?

开源和非开源项目管理工具各有其特点和优势。下面是一些常见的开源和非开源项目管理工具以及它们的简要介绍。 开源项目管理工具: OpenProject:OpenProject 是一个功能强大、易于使用的开源项目管理工具。它提供了项目计划、任务管理、团队协作、文档管…...

实战 01|「编写互动式界面」

前言 实践是最好的学习方式,技术也如此。 文章目录 前言一、功能需求(一)1、功能需求描述2、知识点3、布局与程序设计 二、功能需求(二)1、功能需求描述2、知识点1)LinearLayout2)RelativeLayou…...

开源社区寻找八月创作之星!你准备好了吗~

活动页面:https://openlab.cosmoplat.com/createStarCampaign-202308​​​​​​卡奥斯开源社区定位打造工业互联网行业顶级开源社区生态平台,为开发者、企业等用户提供代码托管、技术交流/共享、硬件认证/接入、培训认证、大赛活动等服务,目…...

appuploader不是开发者账号

Appuploader是一款可以帮助开发者上传iOS应用到Apple App Store的工具。很多开发者都知道,在上传应用到App Store之前,需要创建开发者账号并获得苹果官方的认证才能进行上传。但是,有些开发者可能并不想去注册开发者账号,或者遇到…...

MySQL - 10、其他命令

描述表结构、使用数据库、设置变量、更改分隔符、导入SQL脚本、退出MySQL的操作: -- 描述表结构 DESCRIBE table_name;-- 使用特定数据库 USE database_name;-- 设置变量 SET variable_name value;-- 更改分隔符 DELIMITER //-- 执行SQL脚本文件 SOURCE /path/to/…...

输入框长度在XSS测试中如何绕过字符长度限制

大家好,这是我编写的第一篇文章,之所以会分享这个故事,是因为我花了几个晚上的时间,终于找到了解决某个问题的方法。故事如下: 几个月前,我被邀请参加一个非公共的漏洞悬赏项目,在初期发现了一些…...

JVM基础篇-直接内存

JVM基础篇-直接内存 什么是直接内存? 直接内存( 堆外内存 ) 指的是 Java 应用程序通过直接方式从操作系统中申请的内存,这块内存不属于jvm 传统方式读取文件 首先会从用户态切换到内核态,调用操作系统函数从磁盘读取文件,读取一部分到操作系统缓冲区…...

【Java可执行命令】(十四)脚本执行工具jrunscript :在命令行环境下交互式执行一些简单的脚本或测试代码片段~

Java可执行命令之jrunscript 1️⃣ 概念2️⃣ 优势和缺点3️⃣ 使用3.1 语法格式3.2 启动 jrunscript 直接执行脚本3.3 可选参数&#xff1a;-l < language>3.4 可选参数&#xff1a;-e < script>3.5 可选参数&#xff1a;-f < script file>3.6 注意事项 4️…...

eclipse Java Editor Templates

​ Window - Preferences - Java - Editor - Templates ​ date ${currentDate:date(yyyy.MM.dd)}...

vue SKU已知sku.tree算出sku.list类目值和id

已知sku.tree算出sku.list类目值和id <van-skuref"sku"v-model"showBase":close-on-click-overlay"closeOnClickOverlay":goods"skuData.goods_info":goods-id"skuData.goods_id":hide-stock"skuData.sku.hide_stoc…...

error C4430 缺少类型说明符 - 假定为 int。注意 C++ 不支持默认 int

出现原因&#xff1a;两个类头文件相互包含 使用声明类代替头文件包含...

Embedding入门介绍以及为什么Embedding在大语言模型中很重要

Embeddings技术简介及其历史概要 在机器学习和自然语言处理中&#xff0c;embedding是指将高维度的数据&#xff08;例如文字、图片、音频&#xff09;映射到低维度空间的过程。embedding向量通常是一个由实数构成的向量&#xff0c;它将输入的数据表示成一个连续的数值空间中…...

暑假刷题第20天--8/3

B-序列的与和_2023河南萌新联赛第&#xff08;四&#xff09;场&#xff1a;河南大学 (nowcoder.com)&#xff08;dfs&#xff09; #include<iostream> #include<string> using namespace std; #define ull unsigned long long int n,k; ull a[21]; ull ans0; int…...

收藏!小白程序员必看:如何低成本精准选型大模型,避免花冤枉钱?

选择大模型的关键在于匹配自身需求&#xff0c;需结合成本预算、技术能力、业务场景、合规要求四大维度进行筛选。文章提出先明确核心需求&#xff0c;拒绝参数崇拜&#xff0c;再根据个人开发者、小团队、垂直领域用户等不同类型给出具体选型建议。同时&#xff0c;文章还提醒…...

ABAP Cloud 测试这件事,别等开发收尾才想起来

很多团队一聊到测试,脑子里冒出来的还是上线前跑一遍功能、点几下 Fiori 页面、确认接口能通就算过关。真正到了 ABAP Cloud 项目里,这套做法很快就会露怯。原因不复杂,应用、服务、行为实现、业务事件、UI 层交织在一起,只要有一层没有被持续验证,回归问题就会像滚雪球一…...

彻底告别Windows Defender烦恼:开源控制工具让你的电脑真正属于你

彻底告别Windows Defender烦恼&#xff1a;开源控制工具让你的电脑真正属于你 【免费下载链接】defender-control An open-source windows defender manager. Now you can disable windows defender permanently. 项目地址: https://gitcode.com/gh_mirrors/de/defender-con…...

Android集成chineseocr_lite实战:4.7M超轻量级中文OCR完整指南

Android集成chineseocr_lite实战&#xff1a;4.7M超轻量级中文OCR完整指南 【免费下载链接】chineseocr_lite 超轻量级中文ocr&#xff0c;支持竖排文字识别, 支持ncnn、mnn、tnn推理 ( dbnet(1.8M) crnn(2.5M) anglenet(378KB)) 总模型仅4.7M 项目地址: https://gitcode.…...

Phi-4-mini-reasoning vLLM安全加固:输入SQL注入防护、XSS过滤、沙箱隔离

Phi-4-mini-reasoning vLLM安全加固&#xff1a;输入SQL注入防护、XSS过滤、沙箱隔离 1. 模型与部署概述 Phi-4-mini-reasoning 是一个基于合成数据构建的轻量级开源模型&#xff0c;专注于高质量、密集推理的数据处理能力。作为Phi-4模型家族的一员&#xff0c;它特别强化了…...

Vision Master 视觉软件应用-字符识别

我们读取如上字符串&#xff0c;需要的算子如下【字符识别算子】图像源--高精度匹配--位置修正--字符识别--格式化【操作】【高精度匹配】基本参数特征模板【位置修正】---点击执行---创建基准---点击执行【字符串识别】***基本参数***选择绘制---选择搜索范围****运行参数***【…...

3分钟极速上手:网盘下载加速神器全功能使用指南

3分钟极速上手&#xff1a;网盘下载加速神器全功能使用指南 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 &#xff0c;支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云盘 /…...

【小白学习大模型】第一天,本地服务器部署大模型

目前部署的Qwen2.5最新结果&#xff1a;(llm_lab) yukeweiinin5880-Virtual-Machine:~/test_qwen$ /home/yukewei/miniconda3/envs/llm_lab/bin/python /home/yukewei/test_qwen/test_qwen2.5_basic.py 正在从本地加载模型&#xff0c;请耐心等待... Failed to load /home/yuke…...

告别Appium!用这5个AI视觉自动化工具,让你的手机脚本不再怕App更新

告别Appium&#xff01;5个AI视觉自动化工具重塑手机脚本开发 每次应用更新后&#xff0c;那些精心编写的自动化测试脚本突然失效的场景&#xff0c;测试工程师们再熟悉不过了。传统基于元素定位的工具如Appium&#xff0c;让团队陷入无休止的脚本维护泥潭。而今天&#xff0c;…...

ncmdump:3个魔法时刻,让网易云音乐NCM格式转换变得如此简单

ncmdump&#xff1a;3个魔法时刻&#xff0c;让网易云音乐NCM格式转换变得如此简单 【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 开篇故事&#xff1a;被格式困住的音乐时光 想象一下这个场景&#xff1a;你花了整整一个下午&…...