当前位置：首页 > news >正文

半监督学习与数据增强（论文复现）

news 2026/5/11 11:20:37

半监督学习与数据增强（论文复现）

本文所涉及所有资源均在传知代码平台可获取

文章目录

- 半监督学习与数据增强（论文复现）
- - - 概述
    - 算法原理
    - 核心逻辑
    - 效果演示
    - 使用方式

概述

本文复现论文提出的半监督学习方法，半监督学习（Semi-supervised Learning）是一种机器学习方法，它将少量的标注数据（带有标签的数据）和大量的未标注数据（不带标签的数据）结合起来训练模型。在许多实际应用中，标注数据获取成本高且困难，而未标注数据通常较为丰富和容易获取。因此，半监督学习方法被引入并被用于利用未标注数据来提高模型的性能和泛化能力

在这里插入图片描述

该论文介绍了一种基于一致性和置信度的半监督学习方法 FixMatch。FixMatch首先使用模型为弱增强后的未标注图像生成伪标签。对于给定图像，只有当模型产生高置信度预测时才保留伪标签。然后，模型在输入同一图像的强增强版本时被训练去预测伪标签。FixMatch 在各种半监督学习数据集上实现了先进的性能

算法原理

FixMatch 结合了两种半监督学习方法：一致性正则化和伪标签。其主要创新点在于这两种方法的结合以及在执行一致性正则化时分别使用了弱增强和强增强。

FixMatch 的损失函数由两个交叉熵损失项组成：一个用于有标签数据的监督损失 lsl**s 和一个用于无标签数据的无监督损失 lul**u 。具体来说，lsl**s 只是对弱增强有标签样本应用的标准交叉熵损失

在这里插入图片描述

其中 BB 表示 batch size，HH 表示交叉熵损失，pbp**b 表示标记，pm(y∣α(xb))p**m(y∣α(x**b)) 表示模型对弱增强样本的预测结果。

FixMatch 对每个无标签样本计算一个伪标签，然后在标准交叉熵损失中使用该标签。为了获得伪标签，我们首先计算模型对给定无标签图像的弱增强版本的预测类别分布：qb=pm(y∣α(ub))q**b=p**m(y∣α(u**b))。然后，我们使用 q^{b=arg⁡max⁡qb*q*}b=argmaxq**b 作为伪标签，但我们在交叉熵损失中对模型对 ubu**b 的强增强版本的输出进行约束

在这里插入图片描述

其中 μμ 表示无标签样本与有标签样本数量之比，1(max(qb)>τ)1(max(q**b)>τ) 当前仅当 max(qb)>τmax(q**b)>τ 成立时为 1 否则为 0，ττ 表示置信度阈值，A(ub)A(u**b) 表示对无标签样本的强增强。

FixMatch的总损失就是 ls+λulul**s+λul**u，其中 λuλ**u 是表示无标签损失相对权重的标量超参数

在这里插入图片描述

FixMatch 利用两种增强方法：“弱增强”和“强增强”。论文所使用的弱增强是一种标准的翻转和位移增强策略。具体来说，除了SVHN数据集之外，我们在所有数据集上以50%的概率随机水平翻转图像，并随机在垂直和水平方向上平移图像最多12.5%。对于“强增强”，我采用了基于随机幅度采样的 RandAugment，然后进行了 Cutout 处理。

我在CIFAR-10、CIFAR-100 、SVHN 和 FER2013 数据集上对 FixMatch 进行了实验。关于使用的神经网络，我在 CIFAR-10 和 SVHN 上使用了 Wide ResNet-28-2，在 CIFAR-100 上使用了 Wide ResNet-28-8，在 FER2013 上使用了 Wide ResNe-37-2。实验结果如下表所示

在这里插入图片描述

为了直观展示 FixMatch 的效果，我在线部署了基于 FER2013 数据集训练的 Wide ResNe-37-2 模型。FER2013[2] 是一个面部表情识别数据集，其包含约 30000 张不同表情的面部 RGB 图像，尺寸限制为 48×48。其主要标签可分为 7 种类型：愤怒（Angry），厌恶（Disgust），恐惧（Fear），快乐（Happy），悲伤（Sad），惊讶（Surprise），中性（Neutral）。厌恶表情的图像数量最少，只有 600 张，而其他标签的样本数量均接近 5,000 张

核心逻辑

具体的核心逻辑如下所示：

for epoch in range(epochs):model.train()train_tqdm = zip(labeled_dataloader, unlabeled_dataloader)for labeled_batch, unlabeled_batch in train_tqdm:optimizer.zero_grad()# 利用标记样本计算损失data = labeled_batch[0].to(device)labels = labeled_batch[1].to(device)logits = model(normalize(strong_aug(data)))loss = F.cross_entropy(logits, labels)# 计算未标记样本伪标签with torch.no_grad():data = unlabeled_batch[0].to(device)logits = model(normalize(weak_aug(data)))probs = F.softmax(logits, dim=-1)trusted = torch.max(probs, dim=-1).values > thresholdpseudo_labels = torch.argmax(probs[trusted], dim=-1)loss_factor = weight * torch.sum(trusted).item() / data.shape[0]# 利用未标记样本计算损失logits = model(normalize(strong_aug(data[trusted])))loss += loss_factor * F.cross_entropy(logits, pseudo_labels)# 反向梯度传播并更新模型参数loss.backward()optimizer.step()

效果演示

网站提供了在线体验功能。用户需要输入一张长宽尽可能相等且大小不超过 1MB 的正面脸部 JPG 图像，网站就会返回图片中人物表情所表达的情绪

在这里插入图片描述

使用方式

解压附件压缩包并进入工作目录。如果是Linux系统，请使用如下命令

unzip FixMatch.zip
cd FixMatch

代码的运行环境可通过如下命令进行配置

pip install -r requirements.txt

如果希望在本地运行程序，请运行如下命令

python main.py

如果希望在线部署，请运行如下命令

python main-flask.py

文章代码资源点击附件获取

半监督学习与数据增强（论文复现）

半监督学习与数据增强（论文复现） 本文所涉及所有资源均在传知代码平台可获取文章目录半监督学习与数据增强（论文复现）概述算法原理核心逻辑效果演示使用方式概述本文复现论文提出的半监督学习方法，半监督学习&…...

编程日记 2024/10/3 13:35:45

css3-----2D转换、动画

2D 转换（transform） 转换（transform）是CSS3中具有颠覆性的特征之一，可以实现元素的位移、旋转、缩放等效果移动：translate旋转：rotate缩放：scale 二维坐标系 2D 转换之移动 trans…...

编程日记 2024/10/3 13:34:44

SQL进阶技巧：统计各时段观看直播的人数

目录 0 需求描述 1 数据准备 2 问题分析 3 小结如果觉得本文对你有帮助，那么不妨也可以选择去看看我的博客专栏 ，部分内容如下： 数字化建设通关指南专栏原价99，现在活动价39.9，十一国庆后将上升至59.9&#…...

编程日记 2024/10/3 13:31:41

1.Stream流的终结方法 2.forEach 对于forEach方法，用来遍历stream流中的所有数据 package com.njau.d10_my_stream;import java.util.ArrayList; import java.util.Arrays; import java.util.Collections; import java.util.function.Consumer; import java.util…...

编程日记 2024/10/3 13:28:38

JavaWeb——Vue组件库Element（4/6）：案例：基本页面布局（基本框架、页面布局、CSS样式、完善布局、效果展示，含完整代码）

目录步骤基本页面布局基本框架页面布局 CSS样式完善布局效果展示完整代码 Element 的基本使用方式以及常见的组件已经了解完了，接下来要完成一个案例，通过这个案例让大家知道如何基于 Element 中的各个组件制作一个完整的页面。案例&am…...

编程日记 2024/10/3 13:27:37

【c++】模板初阶

泛型编程写一个交换函数，在学习模板之前，为了匹配不同的参数类型，我们可以利用函数重载来实现。 void Swap(int& a, int& b) {int c a;a b;b c; } void Swap(char& a, char& b) {char c a;a b;b c; } void Swap(dou…...

编程日记 2024/10/3 13:26:36

R 语言 data.table 大规模数据处理利器

前言最近从一个 python 下的 anndata 中提取一个特殊处理过的单细胞矩阵，想读入R用来画图（个人比较喜欢用R可视化 ），保存之后，大概几个G的CSV文件，如果常规方法读入R，花费的时间比较久&#x…...

编程日记 2024/10/3 13:24:33

Java 静态代理详解：为什么代理类和被代理类要实现同一个接口？

在 Java 开发中，代理模式是一种常用的设计模式，其中代理类的作用是控制对其他对象的访问。代理模式分为静态代理和动态代理，在静态代理中，代理类和被代理类都需要实现同一个接口。这一机制为实现透明的代理行为提供了基础&#xf…...

编程日记 2024/10/3 13:23:33

OpenCV C++霍夫圆查找

OpenCV 中的霍夫圆检测基于霍夫变换 (Hough Transform)，它是一种从边缘图像中识别几何形状的算法。霍夫圆检测是专门用于检测图像中的圆形形状的。它通过将图像中的每个像素映射到可能的圆参数空间，来确定哪些像素符合圆形状。 1. 霍夫变换的原理霍夫…...

编程日记 2024/10/3 13:16:28

H.264编解码介绍

一、简介 H.264，又称为AVC（Advanced Video Coding），是一种广泛使用的视频压缩标准。它由国际电信联盟（ITU）和国际标准化组织（ISO）联合开发，并于2003年发布。 H.264的发展历史可以追溯到上个世纪90年代。当时，视频压缩技术的主要标准是MPEG-2，但它在压缩率和视频质…...

编程日记 2024/10/3 13:15:27

Java | Leetcode Java题解之第450题删除二叉搜索树中的节点

题目： 题解： class Solution {public TreeNode deleteNode(TreeNode root, int key) {TreeNode cur root, curParent null;while (cur ! null && cur.val ! key) {curParent cur;if (cur.val > key) {cur cur.left;} else {cur cur.rig…...

编程日记 2024/10/3 13:14:26

【CViT】Deepfake Video Detection Using Convolutional Vision Transformer

文章目录 Deepfake Video Detection Using Convolutional Vision Transformerkey points**卷积视觉变压器**FLViT实验总结Deepfake Video Detection Using Convolutional Vision Transformer 会议/期刊：2021 作者： key points 提出了一种用于检测深度伪造的卷积视觉变压器…...

编程日记 2024/10/3 13:10:23

安卓主板_MTK4G/5G音视频记录仪整机及方案定制

音视频记录仪方案，采用联发科MT6877平台八核2* A78 6* A55主频高达2.4GHz, 具有高能低耗特性，搭载Android 12.0智能操作系统，可选4GB32GB/6GB128GB内存，运行流畅。主板集成NFC、双摄像头、防抖以及多种无线数据连接，支…...

编程日记 2024/10/3 13:09:21

Qt 教程全集目录公布(方便查阅)

点击上方"蓝字"关注我们 Qt 安装以下是常见安装方法和软件获取 Qt4Qt5Qt6版本下载(在线和离线)【网址】...

编程日记 2024/10/3 13:08:21

云计算SLA响应时间的matlab模拟与仿真

目录 1.程序功能描述 2.测试软件版本以及运行结果展示 3.核心程序 4.本算法原理 5.完整程序 1.程序功能描述用matlab模拟，一个排队理论。输入一堆包，经过buffer（一个或者几个都行）传给server，这些包会在buffer里…...

编程日记 2024/10/3 13:07:19

ARTS Week 42

Algorithm 本周的算法题为 2283. 判断一个数的数字计数是否等于数位的值给你一个下标从 0 开始长度为 n 的字符串 num ，它只包含数字。如果对于每个 0 < i < n 的下标 i ，都满足数位 i 在 num 中出现了 num[i]次，那么请你返回 true …...

编程日记 2024/10/3 13:06:18

10.2学习

1.IOC控制反转 IoC（Inverse of Control:控制反转）是⼀种设计思想，就是将原本在程序中⼿动创建对象的控制权，交由Spring框架来管理。 IoC 在其他语⾔中也有应⽤，并⾮ Spring 特有。 IoC 容器是 Spring⽤来实现 IoC …...

编程日记 2024/10/3 13:04:16

【数一线性代数】021入门

Index 推荐阅读：https://blog.csdn.net/weixin_60702024/article/details/141729949分析实现总结推荐阅读：https://blog.csdn.net/weixin_60702024/article/details/141729949 给定二叉树的根节点root，计算其叶节点的个数。分析实现类似…...

编程日记 2024/10/3 13:03:15

(k8s）kubernetes中ConfigMap和Secret

转载：ConfigMap 一、ConfigMap介绍 ConfigMap是一种API对象，用来将非机密性的数据保存到键值对中。使用时，Pod可以将其用作环境变量、命令行参数或存储卷中的配置文件。 ConfigMap将你的环境配置信息和容器镜像解耦，便于应用配置…...

编程日记 2024/10/3 13:01:12

stm32四足机器人(标准库)

项目技术要求 PWM波形的学习参考文章stm32 TIM输出比较(PWM驱动LED呼吸灯&&PWM驱动舵机&&PWM驱动直流电机)_ttl pwm 驱动激光头区别-CSDN博客舵机的学习参考文章 stm32 TIM输出比较(PWM驱动LED呼吸灯&&PWM驱动舵机&&PWM驱动直流电机)…...

编程日记 2024/10/3 13:00:11

终极分屏神器Nucleus Co-Op：一台电脑实现4人同时开黑完整指南

终极分屏神器Nucleus Co-Op：一台电脑实现4人同时开黑完整指南【免费下载链接】nucleuscoop Starts multiple instances of a game for split-screen multiplayer gaming! 项目地址: https://gitcode.com/gh_mirrors/nu/nucleuscoop 你是否曾因朋友聚会时电脑…...

编程新知 2026/5/11 9:40:35

GOCI数据爬虫失效了？别慌！手把手教你用Python搞定新版韩国官网批量下载（附完整代码）

GOCI数据爬虫失效了？别慌！手把手教你用Python搞定新版韩国官网批量下载最近不少同行反馈，之前运行的GOCI数据爬虫脚本突然失效了。作为长期处理海洋遥感数据的老手，我第一时间测试了韩国官网的新版页面结构，发现他们确…...

编程新知 2026/5/11 9:07:09

环境配置与基础教程：保姆级教程：VS Code DevContainer 一键构建可复现的 YOLO 训练开发容器

摘要你是否还在为YOLO训练环境的搭建而焦头烂额？CUDA版本不匹配、Python依赖冲突、团队协作时“在我机器上能跑”的经典难题——这些问题浪费了无数开发者的宝贵时间。本文将带你通过VS Code DevContainer技术，一键构建完全可复现的YOLO训练开发容器，彻底告别环境配置噩梦…...

编程新知 2026/5/11 9:03:34

Seraphine：三步打造你的英雄联盟智能BP助手

Seraphine：三步打造你的英雄联盟智能BP助手【免费下载链接】Seraphine 英雄联盟战绩查询工具项目地址: https://gitcode.com/gh_mirrors/se/Seraphine Seraphine是一款基于英雄联盟官方LCU API开发的智能辅助工具，通过自动化BP流程和实时数据查…...

编程新知 2026/5/11 8:55:37

OpenClaw Mattermost插件：为团队协作平台注入AI智能的轻量集成方案

1. 项目概述：为团队协作平台注入AI灵魂如果你所在的技术团队正在使用 Mattermost 这类自托管、注重数据隐私的团队协作工具，同时又希望引入一个能处理工单、回答疑问、甚至自动执行任务的智能助手，那么你很可能已经厌倦了那些需要复杂 API 调…...

编程新知 2026/5/11 8:53:30

终极指南：3分钟免费配置PotPlayer百度翻译插件，实现实时字幕翻译

终极指南：3分钟免费配置PotPlayer百度翻译插件，实现实时字幕翻译【免费下载链接】PotPlayer_Subtitle_Translate_Baidu PotPlayer 字幕在线翻译插件 - 百度平台项目地址: https://gitcode.com/gh_mirrors/po/PotPlayer_Subtitle_Translate_Baidu …...

编程新知 2026/5/11 8:34:37

system24主题开发实战：创建个性化配色方案的完整指南

system24主题开发实战：创建个性化配色方案的完整指南【免费下载链接】system24 a tui-style discord theme 项目地址: https://gitcode.com/gh_mirrors/sy/system24 想要为Discord打造独特的视觉体验吗？system24主题开发为您提供了完美的起点&am…...

编程新知 2026/5/11 7:50:13

HYMiniMall项目配置详解：从开发环境到生产环境的完整部署

HYMiniMall项目配置详解：从开发环境到生产环境的完整部署【免费下载链接】HYMiniMall 小程序商场项目项目地址: https://gitcode.com/gh_mirrors/hy/HYMiniMall HYMiniMall是一个功能完善的小程序商场项目，本文将详细介绍如何从开发环境到生产环…...

编程新知 2026/5/11 7:44:05

开源技能学习资源聚合项目SkillPort：构建个人与团队知识库的实践指南

1. 项目概述：一个技能提升的“私人图书馆”最近在整理自己的学习资料库时，发现了一个挺有意思的项目，叫gotalab/skillport。乍一看这个名字，可能会联想到某个商业学习平台，但实际上，这是一个由开发者社区构…...

编程新知 2026/5/11 7:42:02

C++异步日志系统

文章目录异步日志系统1. 项目背景2. 设计思路2.1 核心架构2.2 关键技术点3. 实现细节3.1 线程安全的日志队列 (LogQueue)3.2 动态格式化与回退机制 (formatMessage)3.3 自动化管理4. 接口说明日志级别 (LogLevel)核心方法5. 使用指南5.1 快速上手5.2 注意事项6. 总结7.Code异步…...

编程新知 2026/5/11 5:33:03

半监督学习与数据增强（论文复现）

文章目录

概述

算法原理

核心逻辑

效果演示

使用方式

相关文章：