当前位置：首页 > news >正文

pytorch实现半监督学习

news 2026/5/16 10:08:21

半监督学习（Semi-Supervised Learning，SSL）结合了有监督学习和无监督学习的特点，通常用于部分数据有标签、部分数据无标签的场景。其主要步骤如下：

1. 数据准备

有标签数据（Labeled Data）：数据集的一部分带有真实的类别标签。
无标签数据（Unlabeled Data）：数据集的另一部分没有标签，仅有特征信息。
数据预处理：对数据进行清理、标准化、特征工程等处理，以保证数据质量。

2. 选择半监督学习方法

常见的半监督学习方法包括：

基于生成模型（Generative Models）：如高斯混合模型（GMM）、变分自编码器（VAE）。
基于一致性正则化（Consistency Regularization）：如 MixMatch、FixMatch，利用数据增强来约束模型预测一致性。
基于伪标签（Pseudo-Labeling）：先用模型预测无标签数据的类别，然后将高置信度的预测作为新标签加入训练。
图神经网络（Graph-Based Methods）：如 Label Propagation，通过构造数据之间的图结构传播标签信息。

3. 训练初始模型

仅使用有标签数据训练一个初始模型。
选择合适的损失函数，如交叉熵损失（Cross-Entropy Loss）或均方误差（MSE Loss）。
训练过程中可以使用数据增强、正则化等优化策略。

4. 利用无标签数据增强训练

伪标签方法：用初始模型对无标签数据进行预测，筛选高置信度样本，加入有标签数据训练。
一致性正则化：对无标签数据进行不同变换，要求模型的预测结果一致。
联合训练：构造有监督损失（Supervised Loss）和无监督损失（Unsupervised Loss），综合优化。

5. 模型迭代更新

重新利用训练后的模型预测无标签数据，产生新的伪标签或调整模型参数。
通过半监督策略不断优化模型，使其对无标签数据的预测更加稳定。

6. 评估和测试

使用测试集（通常是有标签的数据）评估模型性能。
选择合适的评估指标，如准确率（Accuracy）、F1-score、AUC-ROC 等。

7. 调优和部署

根据实验结果调整超参数，如伪标签置信度阈值、学习率等。
结合业务需求，将最终模型部署到实际应用中。

关键步骤：

初始化模型：首先使用有标签数据训练模型。
生成伪标签：用训练好的模型对无标签数据进行预测，生成伪标签。
结合有标签和伪标签数据进行训练：用带有标签和无标签（伪标签）数据一起训练模型。
迭代训练：不断迭代，使用更新的模型生成新的伪标签，进一步优化模型。

import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
from torch.utils.data import DataLoader, Dataset
import matplotlib.pyplot as plt# 简化的神经网络模型
class SimpleCNN(nn.Module):def __init__(self):super(SimpleCNN, self).__init__()self.conv1 = nn.Conv2d(1, 8, kernel_size=3)  # 缩小卷积层的输出通道self.fc1 = nn.Linear(8 * 26 * 26, 10)  # 调整全连接层的输入和输出尺寸def forward(self, x):x = F.relu(self.conv1(x))x = x.view(x.size(0), -1)  # 展平x = self.fc1(x)return x# 自定义数据集
class CustomDataset(Dataset):def __init__(self, data, labels=None):self.data = dataself.labels = labelsdef __len__(self):return len(self.data)def __getitem__(self, idx):if self.labels is not None:return self.data[idx], self.labels[idx]else:return self.data[idx], -1  # 无标签数据# 半监督训练函数
def pseudo_labeling_training(model, labeled_loader, unlabeled_loader, optimizer, device, threshold=0.95):model.train()labeled_loss_value = 0pseudo_loss_value = 0for (labeled_data, labeled_labels), (unlabeled_data, _) in zip(labeled_loader, unlabeled_loader):labeled_data, labeled_labels = labeled_data.to(device), labeled_labels.to(device)unlabeled_data = unlabeled_data.to(device)# 1. 有标签数据训练optimizer.zero_grad()labeled_output = model(labeled_data)labeled_loss = F.cross_entropy(labeled_output, labeled_labels)labeled_loss.backward()# 2. 无标签数据伪标签生成unlabeled_output = model(unlabeled_data)probs = F.softmax(unlabeled_output, dim=1)max_probs, pseudo_labels = torch.max(probs, dim=1)# 伪标签置信度筛选pseudo_mask = max_probs > threshold  # 置信度大于阈值的数据作为伪标签if pseudo_mask.sum() > 0:pseudo_labels = pseudo_labels[pseudo_mask]unlabeled_data_pseudo = unlabeled_data[pseudo_mask]# 3. 使用伪标签数据进行训练（确保无标签数据参与反向传播）optimizer.zero_grad()  # 清除之前的梯度pseudo_output = model(unlabeled_data_pseudo)pseudo_loss = F.cross_entropy(pseudo_output, pseudo_labels)pseudo_loss.backward()  # 计算反向梯度optimizer.step()  # 更新模型参数# 累加损失用于展示labeled_loss_value += labeled_loss.item()if pseudo_mask.sum() > 0:pseudo_loss_value += pseudo_loss.item()return labeled_loss_value / len(labeled_loader), pseudo_loss_value / len(unlabeled_loader)# 模拟数据
num_labeled = 1000
num_unlabeled = 5000
data_dim = (1, 28, 28)  # 28x28 灰度图像
num_classes = 10labeled_data = torch.randn(num_labeled, *data_dim)
labeled_labels = torch.randint(0, num_classes, (num_labeled,))
unlabeled_data = torch.randn(num_unlabeled, *data_dim)labeled_dataset = CustomDataset(labeled_data, labeled_labels)
unlabeled_dataset = CustomDataset(unlabeled_data)labeled_loader = DataLoader(labeled_dataset, batch_size=32, shuffle=True)  # 缩小批量大小
unlabeled_loader = DataLoader(unlabeled_dataset, batch_size=32, shuffle=True)  # 缩小批量大小# 模型、优化器和设备设置
device = torch.device("cpu")  # 临时使用 CPU
model = SimpleCNN().to(device)
optimizer = optim.Adam(model.parameters(), lr=0.001)# 训练过程并记录损失
num_epochs = 10
labeled_losses = []
pseudo_losses = []for epoch in range(num_epochs):labeled_loss, pseudo_loss = pseudo_labeling_training(model, labeled_loader, unlabeled_loader, optimizer, device)labeled_losses.append(labeled_loss)pseudo_losses.append(pseudo_loss)print(f"Epoch [{epoch + 1}/{num_epochs}] | Labeled Loss: {labeled_loss:.4f} | Pseudo Loss: {pseudo_loss:.4f}")# 绘制损失曲线
plt.plot(range(num_epochs), labeled_losses, label='Labeled Loss')
plt.plot(range(num_epochs), pseudo_losses, label='Pseudo Label Loss')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend()
plt.title('Training Losses Over Epochs')
plt.show()# 展示伪标签生成效果（可视化一些样本的伪标签预测结果）
model.eval()
with torch.no_grad():sample_unlabeled_data = unlabeled_data[:10].to(device)output = model(sample_unlabeled_data)probs = F.softmax(output, dim=1)_, predicted_labels = torch.max(probs, dim=1)# 展示预测的标签print("Generated Pseudo Labels for Samples:")print(predicted_labels)# 假设这些是伪标签预测的图片fig, axes = plt.subplots(2, 5, figsize=(12, 5))for i, ax in enumerate(axes.flat):# 将tensor转换为NumPy数组img = sample_unlabeled_data[i].cpu().numpy().squeeze()  # 转为NumPy数组ax.imshow(img, cmap='gray')  # 使用灰度显示图像ax.set_title(f"Pred: {predicted_labels[i].item()}")ax.axis('off')plt.show()

pytorch实现半监督学习

半监督学习（Semi-Supervised Learning，SSL）结合了有监督学习和无监督学习的特点，通常用于部分数据有标签、部分数据无标签的场景。其主要步骤如下： 1. 数据准备有标签数据（Labeled Data）&…...

编程日记 2025/1/31 6:27:17

我的毕设之路：（2）系统类型的论文写法

一般先进行毕设的设计与实现，再在现成毕设基础上进行描述形成文档，那么论文也就成形了。 1 需求分析：毕业设计根据开题报告和要求进行需求分析和功能确定，区分贴合主题的主要功能和拓展功能能，删除偏离无关紧要的功能…...

编程日记 2025/1/31 6:24:05

LosslessScaling-学习版[steam价值30元的游戏无损放大/补帧工具]

LosslessScaling 链接：https://pan.xunlei.com/s/VOHc-yZBgwBOoqtdZAv114ZTA1?pwdxiih# 解压后运行"A-绿化-解压后运行我.cmd"...

编程日记 2025/1/31 6:21:59

concurrent.futures.Future对象详解：利用线程池与进程池实现异步操作

concurrent.futures.Future对象详解：利用线程池与进程池实现异步操作一、前言二、使用线程池三、使用进程池四、注意事项五、结语一、前言在现代编程中，异步操作已成为提升程序性能和响应速度的关键手段。Python的concurrent.futures模块为此提供了强…...

编程日记 2025/1/31 6:20:45

StarRocks 安装部署 StarRocks端口： 官方《配置检查》有服务端口详细描述： https://docs.starrocks.io/zh/docs/deployment/environment_configurations/ StarRocks架构：https://docs.starrocks.io/zh/docs/introduction/Architecture/ Sta…...

编程日记 2025/1/31 6:17:36

Python Matplotlib库：从入门到精通

Python Matplotlib库：从入门到精通在数据分析和科学计算领域，可视化是一项至关重要的技能。Matplotlib作为Python中最流行的绘图库之一，为我们提供了强大的绘图功能。本文将带你从Matplotlib的基础开始，逐步掌握其高级用法&…...

编程日记 2025/1/31 6:16:33

线程概念、操作

一、背景知识 1、地址空间进一步理解在父子进程对同一变量进行修改时发生写时拷贝，这时候拷贝的基本单位是4KB，会将该变量所在的页框全拷贝一份，这是因为修改该变量很有可能会修改其周围的变量（局部性原理）&#xf…...

编程日记 2025/1/31 6:15:27

【PySide6拓展】QSoundEffect

文章目录【PySide6拓展】QSoundEffect 音效播放类**基本概念****什么是 QSoundEffect？****QSoundEffect 的特点****安装 PySide6** **如何使用 QSoundEffect？****1. 播放音效****示例代码：播放音效** **代码解析****QSoundEffect 的高级用法…...

编程日记 2025/1/31 6:12:23

33【脚本解析语言】

脚本语言也叫解析语言脚本一词，相信很多人都听过，那么什么是脚本语言，我们在开发时有一个调试功能，但是发布版是需要编译执行的，体积比较大，同时这使得我们每次更新都需要重新编译，客户再…...

编程日记 2025/1/31 6:11:18

【Unity】 HTFramework框架（五十九）快速开发编辑器工具（Assembly Viewer + ILSpy）

更新日期：2025年1月23日。 Github源码：[点我获取源码] Gitee源码：[点我获取源码] 索引开发编辑器工具MouseRayTarget焦点视角Collider线框Assembly Viewer搜索程序集ILSpy反编译程序集搜索GizmosElement类找到Gizmos菜单找到Gizmos窗口分析A…...

编程日记 2025/1/31 6:09:10

如何解决TikTok网络不稳定的问题

TikTok是目前全球最受欢迎的短视频平台之一，凭借其丰富多彩的内容和社交功能吸引了数以亿计的用户。然而，尽管TikTok在世界范围内的使用情况不断增长，但不少用户在使用过程中仍然会遇到网络不稳定的问题。无论是在观看视频时遇到缓冲&#xf…...

编程日记 2025/1/31 6:08:05

告别页面刷新！如何使用AJAX和FormData优化Web表单提交

系列文章目录 01-从零开始学 HTML：构建网页的基本框架与技巧 02-HTML常见文本标签解析：从基础到进阶的全面指南 03-HTML从入门到精通：链接与图像标签全解析 04-HTML 列表标签全解析：无序与有序列表的深度应用 05-HTML表格标签全面…...

编程日记 2025/1/31 6:05:01

WireShark4.4.2浏览器网络调试指南：数据统计（八）

概述 Wireshark 是一款功能强大的开源网络协议分析软件，被广泛应用于网络调试和数据分析。随着互联网的发展，以及网络安全问题日益严峻，了解如何使用 Wireshark进行浏览器网络调试显得尤为重要。最新的 Wireshark4.4.2 提供了更加强大的功能…...

编程日记 2025/1/31 6:02:56

Hypium+python鸿蒙原生自动化安装配置

Hypiumpython自动化搭建文章目录 Python安装pip源配置HDC安装Hypium安装DevEco Testing Hypium插件安装及使用方法插件安装工程创建区域 Python安装推荐从官网获取3.10版本，其他版本可能出现兼容性问题 Python下载地址下载64/32bitwindows安装文件&am…...

编程日记 2025/1/31 6:00:47

2025创业思路和方向有哪些？

创业思路和方向是决定创业成功与否的关键因素。以下是一些基于找到的参考内容的创业思路和方向，旨在激发创业灵感： 一、技术创新与融合： 1、智能手机与云电视结合：开发集成智能手机功能的云电视，提供通讯、娱乐一体化体…...

编程日记 2025/1/31 5:59:44

实验五---控制系统的稳定性分析---自动控制原理实验课

一实验目的 1、理解控制系统稳定性的概念 2、掌握多种判定系统稳定性的原理及方法 3、掌握使用Matlab软件进行控制系统的稳定性分析二实验仪器计算机，MATLAB仿真软件三实验内容及步骤 1.计算系统闭环特征根，判别系统稳定性； 2.绘制系统…...

编程日记 2025/1/31 5:56:37

AttributeError: can‘t set attribute ‘lines‘

报错： ax p3.Axes3D(fig) ax.lines [] AttributeError: cant set attribute lines 总结下来，解决方案应包括： 1. 使用ax.clear()方法清除所有内容。 2. 逐个移除lines中的元素。 3. 检查matplotlib版本，确保没有已知的bug。…...

编程日记 2025/1/31 5:52:18

Day07：缓存-数据淘汰策略

Redis的数据淘汰策略有哪些 ? （key过期导致的） 在redis中提供了两种数据过期删除策略第一种是惰性删除，在设置该key过期时间后，我们不去管它，当需要该key时，我们再检查其是否过期，如果过期&…...

编程日记 2025/1/31 5:51:07

基于聚类与相关性分析对马来西亚房价数据进行分析

碎碎念：由于最近太忙了，更新的比较慢，提前祝大家新春快乐，万事如意！本数据集的下载地址，读者可以自行下载。 1.项目背景本项目旨在对马来西亚房地产市场进行初步的数据分析，探索各州的房产市…...

编程日记 2025/1/31 5:48:56

Java—工具类类使用

工具类的调用：工具类名.方法名工具类的书写： 示例： 写一个遍历数组的工具类 import java.util.Arrays;public class ArrayUtil {private ArrayUtil() {} //用私有化构造方法不让外界创建关于它的对象//定义static静态方法，因…...

编程日记 2025/1/31 5:47:49

为什么你需要Scroll Reverser？macOS滚动方向独立控制的终极解决方案

为什么你需要Scroll Reverser？macOS滚动方向独立控制的终极解决方案【免费下载链接】Scroll-Reverser Per-device scrolling prefs on macOS. 项目地址: https://gitcode.com/gh_mirrors/sc/Scroll-Reverser 在macOS上使用触控板和鼠标时，你是否…...

编程新知 2026/5/16 9:14:06

Cube Studio：革命性云原生AI平台，一站式解决机器学习全流程难题

Cube Studio：革命性云原生AI平台，一站式解决机器学习全流程难题【免费下载链接】cube-studio cube studio开源云原生一站式机器学习/深度学习/大模型AI平台/MaaS/mlops/人工智能平台/训推平台，算法全链路流程，多租户，…...

编程新知 2026/5/16 8:45:23

完美解决VS Code/Cursor远程连接报错：远程主机不满足运行 VS Code 服务器的先决条件（附AI编程最佳实践）

完美解决VS Code/Cursor远程连接报错：远程主机不满足运行 VS Code 服务器的先决条件（附AI编程最佳实践） 💡 背景与痛点最近在接手维护一个老项目，服务器是腾讯云的轻量应用服务器，装了宝塔面板。在经历了一…...

编程新知 2026/5/16 7:19:25

AI图像生成预设库：开源项目kaushalrao/ai-editor-presets使用指南

1. 项目概述：AI驱动的编辑预设库如果你和我一样，经常在各类AI图像生成工具里“炼丹”，那你一定对“预设”（Presets）这个概念不陌生。简单来说，预设就是一套预先配置好的参数组合，它能让你一键复…...

编程新知 2026/5/16 5:42:29

Armv8-A内存模型特性寄存器详解与应用

1. Armv8-A内存模型特性寄存器概述在Armv8-A架构中，内存模型特性寄存器（Memory Model Feature Registers，简称MMFR）是一组关键的系统寄存器，用于描述处理器实现的内存管理功能特性。这些寄存器采用只读访问模式&#x…...

编程新知 2026/5/16 5:27:35

告别加密日志：MTK平台离线调试利器SpOffineDebugSuite v3.4安装与使用全攻略

MTK平台离线调试实战：SpOffineDebugSuite v3.4与GAT工具链深度解析在移动设备开发领域，联发科技(MTK)平台因其高性价比和丰富功能而广受欢迎。然而，当系统出现崩溃或异常时，传统的在线调试方式往往受限于设备连接状态和实时性要求…...

编程新知 2026/5/16 5:09:26

基于LLM的dbt智能体：自动化数据建模与项目管理的工程实践

1. 项目概述：当数据建模遇上大语言模型最近在数据工程圈里，一个叫 pragunbhutani/dbt-llm-agent 的项目引起了我的注意。简单来说，它试图用大语言模型（LLM）来辅助甚至自动化我们日常的 dbt 数据建模工作。作为一个和…...

编程新知 2026/5/16 4:59:05

VSCode插件开发利器：cursor_info库实现光标上下文精准解析

1. 项目概述与核心价值最近在开发一个基于VSCode的插件时，遇到了一个挺有意思的需求：我需要实时获取并处理光标在编辑器中的精确位置信息，包括行列号、所在单词、甚至当前行的缩进级别。一开始，我尝试自己写逻辑去解析文档和计算位…...

编程新知 2026/5/16 4:37:46

国产信创电脑是什么意思？为什么政府和企业都在用？

国产信创电脑——这个名词虽然听起来有些陌生，但它正在深刻影响着我们的工作和生活。从政府采购到企业信息化方案，再到科技媒体的报道，“国产信创电脑”已经成为了关键词之一。那么，它究竟是什么？为什么如此重要&#…...

编程新知 2026/5/16 4:25:29

如何在安卓设备上安装和配置HMCL-PE：Minecraft Java版移动启动器终极指南

如何在安卓设备上安装和配置HMCL-PE：Minecraft Java版移动启动器终极指南【免费下载链接】HMCL-PE Hello Minecraft! Launcher for Android 项目地址: https://gitcode.com/gh_mirrors/hm/HMCL-PE 想在手机上畅玩Minecraft Java版却不知从何开始&#xff1f…...

编程新知 2026/5/16 4:15:09