当前位置: 首页 > news >正文

机器学习之自训练协同训练

前言

        监督学习往往需要大量的标注数据, 而标注数据的成本比较高 因此 利用大量的无标注数据来提高监督学习的效果有着十分重要的意义. 这种利用少量标注数据和大量无标注数据进行学习的方式称为 半监督学习 Semi-Supervised Learning, SSL ). 本文将介绍两种半监督学习算法 自训练和协同训练

自训练

        自训练(Self-training )是一种半监督学习的方法,它通过结合有标签数据和无标签数据来提高模型的性能。在自训练中,首先使用有标签数据进行初始模型的训练,然后使用该模型对无标签数据进行预测,并将置信度较高的预测结果作为伪标签加入到有标签数据集中,再重新训练模型。通过迭代这个过程,逐步扩充有标签数据集和改进模型。
自训练流程图

协同训练

        协同训练 Co-Training 是自训练的一种改进方法 通过两个基于不同 视角 view 的分类器来互相促进.
        由于不同视角的条件独立性, 在不同视角上训练出来的模型就相当于从不同视角来理解问题, 具有一定的互补性 协同训练就是利用这种互补性来进行自训练的一种方法.
        首先在训练集上根据不同视角分别训练两个模型𝑓 1 𝑓 2 ,然后用 𝑓 1 和 𝑓2 在无标注数据集上进行预测,各选取预测置信度比较高的样本加入训练集,重新训练两个不同视角的模型,并不断重复这个过程.
协同训练结构图

协同训练的基本框架如下:

1. 初始阶段:将有标签数据集随机分成两个子集,分别为视角 1 和视角 2 。使用视角 1 的特征训练模型 1 ,使用视角 2 的特征训练模型 2
2. 交替迭代:在每次迭代中,使用已训练好的模型对无标签数据进行预测,并选择置信度较高的样本加入到相应的视角的有标签数据集中。
3. 模型更新:使用扩充后的有标签数据集重新训练模型 1 和模型 2
4. 重复步骤 2 和步骤 3 ,直到满足停止条件(如达到最大迭代次数或模型性能不再提升)。

相关文章:

机器学习之自训练协同训练

前言 监督学习往往需要大量的标注数据, 而标注数据的成本比较高 . 因此 , 利用大量的无标注数据来提高监督学习的效果有着十分重要的意义. 这种利用少量标注数据和大量无标注数据进行学习的方式称为 半监督学习 ( Semi…...

ubuntu 通过apt-get快速安装 docker

在使用 apt-get 安装 Docker 之前,你需要确保你的系统已经准备好并且已经更新了软件包列表。以下是在 Ubuntu 系统上使用 apt-get 安装 Docker 的步骤: 更新软件包列表: sudo apt-get update 安装依赖软件包,以确保可以通过 HTTPS 使用存储库: sudo apt-get install apt-t…...

C++医院影像科PACS源码:三维重建、检查预约、胶片打印、图像处理、测量分析等

PACS连接DICOM接口的医疗器械(如CT、MRI、CR、DR、DSA、各种窥镜成像系统设备等),实现图像无损传输,实现DICOM胶片打印机回传打印功能,支持各种图像处理,可以进行窗技术调节,与登记台管理系统共…...

企业聊天应用程序使用 Kubernetes

1. 客户端-服务器工作流程 客户端:在我们的架构中,客户端可以分为三种类型:iOS 和 Android 移动应用程序以及 Web 聊天。移动应用程序首先通过 API 网关服务与服务器进行通信,其中客户端会生成一个访问令牌,该令牌将授…...

记录用命令行将项目打包成war包

记录用命令行将项目打包成war包 找到项目的pom.xml 在当前路径下进入cmd 输入命令 mvn clean package 发现报错了 Failed to execute goal org.apache.maven.plugins:maven-war-plugin:2.2:war (default-war) on project MMS: Error assembling WAR: webxml attribute is req…...

Linux基础知识笔记

Linux基础知识笔记 介绍/dev/null作用2>&1作用 介绍 记录linux基础知识,持续更新中… /dev/null作用 /dev/null 是一个特殊的设备文件,可以将数据重定向到这个文件中,从而实现将输出或错误信息丢弃的效果。在 Linux 系统中&#xf…...

Laya3.0 入门教程

点击play箭头 点击右边的开发者工具 就会弹出 chrome的调试窗口 然后定位到你自己的ts文件 直接在ts里断点即可 不需要js文件 如何自动生成代码? 比如你打开一个新项目 里面显示的是当前场景 只需要点击 UI运行时 右边的框就可以了 他会自动弹窗提示你 创建一个文…...

3D全景虚拟样板间展销系统扩展用户市场范围

VR样板间,能够真实还原现场,定制需要的场景。让一切比真实更真实。用户可以720度看房,自由行走在空间里,直观感受各空间的大小,看到自己家中的“未来样子”,同时通过操控手柄,控制整个智能家居系…...

如何编写lua扩展库

很多人都听过lua,也见过lua脚本,但可能不理解为什么lua脚本里面会有这么多没见过的函数, 而且这些函数功能是如此强大,能上天入地,无所不能 其实这些函数并不是lua自带的,都是由程序作者造出来的隐藏在了他们的主程序里 一般运行lua脚本,我们会使用自带的解释器,当你拿到一份…...

Java List 中存不同的数据类型

在最近的实践中&#xff0c;有人突然问了一个问题&#xff1a; 在 Java 的 List 中可以存不同的数据类型吗&#xff1f; 这个问题突然给问到了&#xff0c;我们都知道 Java 中的 List 中存的是对象&#xff0c;通常我们定义都会这样的定义&#xff1a; List<String> t…...

pyqt5:openpyxl 读取 Excel文件,显示在 QTableWidget 中

pip install openpyxl openpyxl-3.1.2-py2.py3-none-any.whl (249 kB) et_xmlfile-1.1.0-py3-none-any.whl (4.7 kB) 摘要&#xff1a;A Python library to read/write Excel 2010 xlsx/xlsm files pip install pyqt5; pip install pyqt5-tools; 编写 openpyxl_pyqt5.py 如…...

在RabbitMQ中使用新的MQTT 5.0功能

MQTT是物联网&#xff08;IoT&#xff09;的标准协议&#xff0c;是轻量级的&#xff0c;协议头很小&#xff0c;可以节省网络带宽。MQTT也很有效&#xff0c;与其他消息传递协议相比&#xff0c;客户端通过更短的握手进行连接和身份验证。 以下是本文介绍的MQTT 5.0功能列表&…...

flinkcdc 体验

0 flink版本 踩雷 java代码操作 flink Table/SQL API 和 DataStream API 编写程序后&#xff0c;打成jar包丢到flink集群运行&#xff0c;报错首选需要考虑flink集群版本和 jar包中maven依赖的版本是否一致。 目前网上flink、flinkcdc相关博文绝大部分是基于flink1.13、1.14编…...

Kafka知识补充

如何避免 Rebalance 最简单粗暴的就是 &#xff1a; 减少组成员数量发生变化 每个 Consumer 实例都会定期地向 Coordinator 发送心跳请求&#xff0c;表明它还存活着。如果某个 Consumer 实例不能及时地发送这些心跳请求&#xff0c;Coordinator 就会认为该 Consumer 已经“死…...

【MAC】升级 Mac os 后报错

背景 17 年买的 mac&#xff0c;发现很多软件都无法安装&#xff0c;于是升级 mac os 到 10.13&#xff0c;从官网下载 10.13 版本&#xff0c;之后升级&#xff0c;升级还算顺利。但使用 git 的时候发现出现问题了。 问题 使用 git 出现如下错误 xcrun: error: invalid ac…...

LeetCode(力扣)416. 分割等和子集Python

LeetCode416. 分割等和子集 题目链接代码 题目链接 https://leetcode.cn/problems/partition-equal-subset-sum/ 代码 class Solution:def canPartition(self, nums: List[int]) -> bool:sum 0dp [0]*10001for num in nums:sum numif sum % 2 1:return Falsetarget …...

Redis之缓存一致性

Redis之缓存一致性 1 缓存更新策略1.1 内存淘汰1.2 过期删除1.3 主动更新1.4 三种缓存更新策略的对比 2 更新缓存的两种方式3 缓存更新策略的实现方式3.1 先更新DB&#xff0c;后更新缓存3.2 先更新DB&#xff0c;后删除缓存3.3 先更新缓存&#xff0c;后更新DB3.4 先删除缓存&…...

LeetCode-199-二叉树的右视图

题目描述&#xff1a; 题目链接&#xff1a;LeetCode-199-二叉树的右视图 解题思路&#xff1a; 在 102 的基础之上进行改进&#xff0c;一维数组每次只保存 size1 时候的值 代码实现&#xff1a; class Solution {public List<Integer> rightSideView(TreeNode root) {i…...

二叉树的最近公共祖先

&#x1f388;个人主页:&#x1f388; :✨✨✨初阶牛✨✨✨ &#x1f43b;强烈推荐优质专栏: &#x1f354;&#x1f35f;&#x1f32f;C的世界(持续更新中) &#x1f43b;推荐专栏1: &#x1f354;&#x1f35f;&#x1f32f;C语言初阶 &#x1f43b;推荐专栏2: &#x1f354;…...

C++ 补充 反向迭代器的实现

阅前提要&#xff1a; 本文主要是对list和vector的实现的补充&#xff0c;以代码实现为主&#xff0c;注释为辅&#xff0c;如果对vector&#xff0c;list底层实现感兴趣的可以自行阅读&#xff0c;代码量有点大&#xff0c;请大家耐心查看&#xff0c;对理解语言很有帮助&…...

Deneyap Servo库:ESP32硬件PWM舵机精准控制方案

1. Deneyap Servo 库概述&#xff1a;面向 ESP32 系列平台的高精度舵机控制方案Deneyap Servo 是一个专为 Deneyap 系列开发板&#xff08;基于 ESP32、ESP32-S2、ESP32-C3 和 ESP32-S3&#xff09;设计的 Arduino 兼容舵机驱动库。该库并非简单封装 Arduino IDE 自带的Servo.h…...

Fay数字人语音识别模型评估指标:如何选择最佳ASR方案

Fay数字人语音识别模型评估指标&#xff1a;如何选择最佳ASR方案 【免费下载链接】Fay fay是一个帮助数字人&#xff08;2.5d、3d、移动、pc、网页&#xff09;或大语言模型&#xff08;openai兼容、deepseek&#xff09;连通业务系统的agent框架。 项目地址: https://gitcod…...

终极SocketRocket发布指南:从打包到CocoaPods推送的完整流程

终极SocketRocket发布指南&#xff1a;从打包到CocoaPods推送的完整流程 【免费下载链接】SocketRocket A conforming Objective-C WebSocket client library. 项目地址: https://gitcode.com/gh_mirrors/so/SocketRocket SocketRocket是一个符合标准的Objective-C WebS…...

小白程序员必收藏!Agent工程入门指南:轻松上手大模型,抓住AI时代红利

小白程序员必收藏&#xff01;Agent工程入门指南&#xff1a;轻松上手大模型&#xff0c;抓住AI时代红利 本文介绍了Agent工程的基础知识和大模型学习的核心逻辑&#xff0c;强调了从小白到掌握Agent和大模型的关键在于平衡AI的自主决策能力与流程规范。文章还提供了一份详细的…...

被OpenClaw的MCP协议彻底刷新认知:一个协议统一所有AI工具调用的底层逻辑

做AI Agent开发的同学&#xff0c;几乎都踩过工具调用的"天坑"&#xff1a;为了让大模型对接不同的外部能力&#xff0c;你需要为每一个API、每一套业务系统、每一类数据库写专属的适配代码&#xff1b;换一个大模型厂商&#xff0c;之前的工具调用逻辑几乎全部作废&…...

【TTS 语音】合成技术解析与开源方案全景

文章目录TTS 语音合成技术解析与开源方案全景一、引言二、TTS 技术架构演进2.1 三代架构对比2.2 关键技术组件解析三、主流开源方案技术解析3.1 Kokoro-82M3.2 F5-TTS3.3 CosyVoice 系列&#xff08;阿里巴巴 FunAudioLLM&#xff09;3.4 Spark-TTS&#xff08;0.5B&#xff09…...

服饰可持续设计:软萌拆拆屋支持环保材料拆解标识生成

服饰可持续设计&#xff1a;软萌拆拆屋支持环保材料拆解标识生成 1. 项目介绍与核心价值 软萌拆拆屋是一款基于SDXL架构与Nano-Banana拆解LoRA技术打造的智能服饰解构工具。它能够将复杂的服装结构转化为清晰、整齐的零件布局图&#xff0c;为服饰可持续设计提供可视化支持。…...

终极指南:3分钟掌握Silk v3音频转换,彻底解决微信QQ语音播放难题

终极指南&#xff1a;3分钟掌握Silk v3音频转换&#xff0c;彻底解决微信QQ语音播放难题 【免费下载链接】silk-v3-decoder [Skype Silk Codec SDK]Decode silk v3 audio files (like wechat amr, aud files, qq slk files) and convert to other format (like mp3). Batch con…...

终极抖音无水印下载指南:如何快速批量获取高质量视频素材

终极抖音无水印下载指南&#xff1a;如何快速批量获取高质量视频素材 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback su…...

Qwen3.5-9B应用场景:高校AI教学——图像题自动批改+实验报告生成

Qwen3.5-9B应用场景&#xff1a;高校AI教学——图像题自动批改实验报告生成 1. 高校教学场景的AI解决方案 在高校计算机和人工智能相关课程的教学中&#xff0c;教师常常面临两大挑战&#xff1a;一是需要批改大量学生提交的图像识别作业&#xff0c;二是需要指导学生完成规范…...