当前位置：首页 > news >正文

【机器学习】机器学习的基本分类-自监督学习（Self-supervised Learning）

news 2026/2/9 14:45:18

自监督学习是一种机器学习方法，介于监督学习和无监督学习之间。它通过数据本身生成标签，创建训练任务，从而学习数据的表征，而不需要人工标注的标签。这种方法在减少标注数据依赖、提高模型通用性等方面具有重要意义。

自监督学习的核心思想

1. 数据生成标签

自监督学习的基本思想是利用数据的结构性或内在特性生成伪标签，构造出预测任务。例如：

图像的不同部分之间的关系。
视频帧的时间顺序。
文本上下文之间的关联。

2. 预训练与微调

通常，自监督学习用于预训练一个深度学习模型，然后通过迁移学习（Transfer Learning）在目标任务上微调模型参数。

3. 表示学习

自监督学习的目标是从大量无标签数据中学习到通用、语义丰富的表征（embeddings），这些表征可以直接用于下游任务。

自监督学习的常见方法

1. 对比学习（Contrastive Learning）

通过比较样本之间的相似性和差异性，学习数据的表征。

典型方法：SimCLR、MoCo
关键思想：最大化正样本（如同一图像的不同增强版本）的相似性，最小化负样本（不同图像）的相似性。

2. 生成式方法（Generative Methods）

通过生成或预测数据的某些部分来学习表征。

图像补全：预测被遮挡部分的像素值。
语言模型：预测句子中的下一个单词或缺失单词。
- 典型方法：GPT、BERT

3. 自回归方法（Autoregressive Methods）

建模数据的条件分布，例如根据前面的数据预测后续数据。

应用：时间序列建模、文本生成。

4. 变换预测（Transformation Prediction）

通过学习预测数据的某种变换，提升模型的理解能力。

例子：预测图像的旋转角度、对称性等。

自监督学习在不同领域的应用

1. 自然语言处理（NLP）

自监督学习已成为 NLP 的主流方法：

GPT（生成式预训练 Transformer）： 根据上下文生成文本。
BERT（双向编码器表示）： 通过遮掩一些单词（Mask Language Model）进行训练。

2. 计算机视觉（CV）

利用自监督学习进行图像表征学习：

图像增强：通过对比学习（SimCLR）或上下文预测（Context Encoder）实现。
视频分析：通过时间帧顺序预测或动作识别。

3. 语音处理

通过自监督学习提取语音特征：

Wav2Vec: 从语音数据中学习语义表示。

4. 其他领域

生物信息学： 学习基因序列或蛋白质结构的表征。
推荐系统： 从用户行为中提取特征。

示例代码：SimCLR（对比学习）

import tensorflow as tf
from tensorflow.keras import layers, Model# 定义简单的图像增强
def augment_image(image):image = tf.image.random_flip_left_right(image)image = tf.image.random_brightness(image, max_delta=0.5)return image# 构造对比学习模型
class SimCLRModel(Model):def __init__(self, base_model, projection_dim):super(SimCLRModel, self).__init__()self.base_model = base_modelself.projection_head = tf.keras.Sequential([layers.Dense(128, activation='relu'),layers.Dense(projection_dim)])def call(self, x):features = self.base_model(x)projections = self.projection_head(features)return projections# 训练数据
(X_train, y_train), (_, _) = tf.keras.datasets.cifar10.load_data()
X_train = X_train / 255.0# 创建增强后的数据
X_augmented = tf.stack([augment_image(x) for x in X_train])# 定义模型
base_model = tf.keras.applications.ResNet50(include_top=False, pooling='avg', input_shape=(32, 32, 3))
simclr_model = SimCLRModel(base_model, projection_dim=64)# 自定义对比损失
def contrastive_loss(projections):normalized = tf.math.l2_normalize(projections, axis=1)similarity_matrix = tf.matmul(normalized, normalized, transpose_b=True)labels = tf.range(tf.shape(similarity_matrix)[0])loss = tf.keras.losses.sparse_categorical_crossentropy(labels, similarity_matrix)return tf.reduce_mean(loss)# 编译模型
simclr_model.compile(optimizer='adam', loss=contrastive_loss)# 训练模型
simclr_model.fit(X_augmented, epochs=10, batch_size=32)

输出结果

170498071/170498071 [==============================] - 86s 1us/step

自监督学习的优点与挑战

优点

减少标注依赖：适合标注成本高的领域。
学习通用表征：在多个任务上表现良好。
大规模数据优势：充分利用无标签数据。

挑战

设计伪任务的难度：伪标签任务的质量直接影响模型性能。
计算成本高：通常需要大规模数据和强大的硬件资源。
对比学习的负样本采样：需要高效的负样本选择机制。

自监督学习的未来方向

统一模型
- 将不同领域的自监督任务结合，构建通用模型（如 GPT-4）。
多模态学习
- 同时处理图像、文本、语音等多种数据形式。
高效训练方法
- 开发更高效的算法，降低计算资源需求。
理论研究
- 深入理解自监督学习的原理，为任务设计提供理论指导。

【机器学习】机器学习的基本分类-自监督学习（Self-supervised Learning）

自监督学习是一种机器学习方法，介于监督学习和无监督学习之间。它通过数据本身生成标签，创建训练任务，从而学习数据的表征，而不需要人工标注的标签。这种方法在减少标注数据依赖、提高模型通用性等方面具有重要意义。自监督学习的…...

编程日记 2025/1/6 13:01:56

R shiny app | 网页应用空格分隔的文本文件在线转csv

shiny 能快速把R程序以web app的形式提供出来，方便使用，降低技术使用门槛。本文提供的示例：把空格分隔的txt文件转为逗号分隔的csv文件。前置依赖：需要有R环境(v4.2.0)，安装shiny包(v1.9.1)。括号内是我使用的版本…...

编程日记 2025/1/6 12:59:52

三天速成微服务

微服务技术栈总结微服务技术对比技术栈 SpringCloud SpringCloud是目前国内使用最广泛的微服务框架。官网地址:https://spring.io/projects/spring-cloud Springboot和SpringCould兼容性代码目录结构如下用于远程调用Bean 代码 package cn.itcast.order.config;//import …...

编程日记 2025/1/6 12:58:50

【踩坑记录】uni-app 微信小程序调试不更新问题解决指南

uni-app 微信小程序调试不更新问题解决指南在使用 uni-app 开发微信小程序时，可能会遇到代码修改后无法更新或者不生效的问题。这种现象常见于调试阶段，通常与缓存、编译或代码错误有关。本文将详细分析调试过程中常见的“不更新”问题，并…...

编程日记 2025/1/6 12:57:47

【Adobe Acrobat PDF】Acrobat failed to connect to a DDE server.是怎么回事？

【Adobe Acrobat PDF】Acrobat failed to connect to a DDE server.是怎么回事？ 【Adobe Acrobat PDF】Acrobat failed to connect to a DDE server.是怎么回事？ 文章目录【Adobe Acrobat PDF】Acrobat failed to connect to a DDE server.是怎么回事&…...

编程日记 2025/1/6 12:55:44

PyTorch 中 coalesce() 函数详解与应用示例

PyTorch 中 coalesce() 函数详解与应用示例 coalesce： 美 [ˌkoʊəˈlɛs] 合并；凝聚；联结，注意发音引言在 PyTorch 中，稀疏张量（Sparse Tensor）是一种高效存储和操作稀疏数据的方式。稀疏…...

编程日记 2025/1/6 12:54:43

ubuntu进行C++的调试

方法一：gdb调试作用: GDB 是 GNU 调试器，用于调试 C/C 程序。它可以在命令行中使用，提供强大的调试功能。集成: GDB 可以独立于 VSCode 使用，你可以在终端中直接运行 GDB 来调试程序。使用示例:编译程序时使用 -g 选项以包含调…...

编程日记 2025/1/6 12:53:42

【U8+】用友U8软件中，出入库流水输出excel的时候提示报表输出引擎错误。

【问题现象】通过天联高级版客户端登录拥有U8后， 将出入库流水输出excel的时候，提示报表输出引擎错误。进行报表输出时出现错误，错误信息：找不到“fd6eea8b-fb40-4ce4-8ab4-cddbd9462981.htm”。如果您正试图从最近使用的文件列…...

编程日记 2025/1/6 12:52:41

NoSQL简介

NoSQL 的定义及特点 NoSQL（Not Only SQL）是一种非关系型数据库，设计之初为解决关系型数据库在扩展性、性能和多样化数据处理方面的局限性。NoSQL 支持多种数据模型，包括键值对、文档、列族和图形结构，广泛应用于大规模…...

编程日记 2025/1/6 12:50:39

XIAO Esp32 S3 网络摄像头——3音视频监控

1、介绍之前分别介绍了音频和视频的接收，本文是整合了前2篇文章，实现了音视频的同时获取。效果：用xiao esp35 s3自制一个网络摄像头 2、适用场景广泛家庭安防无论是门前监控，还是室内安全，自制摄像头可以让你轻松把握每个角落，实时查看视频流，防止任何潜在风险。…...

编程日记 2025/1/6 12:48:37

题目解析与代码实现：You‘re Given a String

引言本文将详细解读一道字符串处理题目 “You’re Given a String”，并用 Python 实现该题的解决方案，同时解析其核心算法逻辑。本文适合有一定基础的程序员，希望通过字符串算法提升能力的读者。 1. 题目描述问题背景题目给出了一个字符…...

编程日记 2025/1/6 12:47:35

Understanding the Lomb–Scargle Periodogram

本文目的：了解Lomb–Scargle Periodogram的原理 （用来估算不均匀采样数据的周期）参考文献Understanding the Lomb–Scargle Periodogram思路： 连续傅里叶变换 --> 离散傅里叶变换（均匀采样–> Classifical perio…...

编程日记 2025/1/6 12:46:32

解决Linux切换用户后的命令提示符为-bashxx$的问题

1、问题描述切换用户时，命令提示符为-bashxx$ 比如： [rootlocalhost ~]# su zhouxingchi bash-4.2$ ### 显示看着不正常的命令提示符 2、PS1变量 PS1变量就是我们的命令提示符的内容，当我们登录时会加载该变量，从而显示提…...

编程日记 2025/1/6 12:40:25

AMP 混合精度训练中的动态缩放机制: grad_scaler.py函数解析（ torch._amp_update_scale_）

AMP 混合精度训练中的动态缩放机制在深度学习中，混合精度训练（AMP, Automatic Mixed Precision）是一种常用的技术，它利用半精度浮点（FP16）计算来加速训练，同时使用单精度浮点（FP32…...

编程日记 2025/1/6 12:38:22

Oracle数据库如何找到 Top Hard Parsing SQL 语句？

有一个数据库应用程序存在过多的解析问题，因此需要找到产生大量硬解析的主要语句。什么是硬解析 Oracle数据库中的硬解析（Hard Parse）是指在执行SQL语句时，数据库需要重新解析该SQL语句，并创建新的执行计划的过程。这…...

编程日记 2025/1/6 12:35:13

Mono里运行C#脚本25—mono_codegen

前面分析怎么样找到主函数Main的入口点功能，也就是说已经找到了这个函数的CIL代码。虽然找到了代码，但是还不能执行它的，因为它是一种虚拟机的代码。也就是说它是假的代码，不是现实世界存在的机器的代码，因此不能直接执行，必须经过后端编译器的再次编译才能真正运行它。下…...

编程日记 2025/1/6 12:32:09

flink cdc oceanbase（binlog模式）

接上文：一文说清flink从编码到部署上线环境：①操作系统：阿里龙蜥 7.9（平替CentOS7.9）；②CPU：x86；③用户：root。预研初衷：现在很多项目有国产化的要求&#…...

编程日记 2025/1/6 12:27:05

【WPF】数据绑定机制之INotifyPropertyChanged

INotifyPropertyChanged 是 WPF 中的一个接口，用于实现数据绑定中的属性更改通知。它的主要作用是，当对象的某个属性值发生更改时，通知绑定到该属性的 UI 控件更新其显示内容。以下是有关 INotifyPropertyChanged 的详细信息和实现方法&…...

编程日记 2025/1/6 12:25:02

机器学习算法深度解析：以支持向量机（SVM）为例及实战应用

机器学习算法深度解析：以支持向量机（SVM）为例及实战应用在当今数据驱动的时代，机器学习作为人工智能的一个核心分支，正以前所未有的速度改变着我们的生活与工作方式。从金融风控到医疗诊断，从自动驾驶到智…...

编程日记 2025/1/6 12:21:59

网络编程基础：连接Java的秘密网络

1 网络编程的重要性网络编程允许Java应用程序与其他计算机或设备进行通信。这包括从简单的数据传输到复杂的分布式系统和Web服务。 2 Java网络编程的核心类 Java提供了多个类来支持网络编程： InetAddress：表示网络上的IP地址。 URL：表示统…...

编程日记 2025/1/6 12:20:58

Golang 面试经典题：map 的 key 可以是什么类型？哪些不可以？

Golang 面试经典题：map 的 key 可以是什么类型？哪些不可以？ 在 Golang 的面试中，map 类型的使用是一个常见的考点，其中对 key 类型的合法性是一道常被提及的基础却很容易被忽视的问题。本文将带你深入理解 Golang 中…...

编程新知 2025/12/20 7:42:02

PPT|230页| 制造集团企业供应链端到端的数字化解决方案：从需求到结算的全链路业务闭环构建

制造业采购供应链管理是企业运营的核心环节，供应链协同管理在供应链上下游企业之间建立紧密的合作关系，通过信息共享、资源整合、业务协同等方式，实现供应链的全面管理和优化，提高供应链的效率和透明度，降低供应链的成…...

编程新知 2026/1/30 22:07:56

无法与IP建立连接，未能下载VSCode服务器

如题，在远程连接服务器的时候突然遇到了这个提示。查阅了一圈，发现是VSCode版本自动更新惹的祸！！！ 在VSCode的帮助->关于这里发现前几天VSCode自动更新了，我的版本号变成了1.100.3 才导致了远程连接出…...

编程新知 2026/1/22 21:24:01

Leetcode 3577. Count the Number of Computer Unlocking Permutations

Leetcode 3577. Count the Number of Computer Unlocking Permutations 1. 解题思路2. 代码实现题目链接：3577. Count the Number of Computer Unlocking Permutations 1. 解题思路这一题其实就是一个脑筋急转弯，要想要能够将所有的电脑解锁&#x…...

编程新知 2026/1/4 2:33:39

Java求职者面试指南：Spring、Spring Boot、MyBatis框架与计算机基础问题解析

Java求职者面试指南：Spring、Spring Boot、MyBatis框架与计算机基础问题解析一、第一轮提问（基础概念问题） 1. 请解释Spring框架的核心容器是什么？它在Spring中起到什么作用？ Spring框架的核心容器是IoC容器&#…...

编程新知 2025/10/4 21:24:40

基于 TAPD 进行项目管理

起因自己写了个小工具，仓库用的Github。之前在用markdown进行需求管理，现在随着功能的增加，感觉有点难以管理了，所以用TAPD这个工具进行需求、Bug管理。操作流程注册 TAPD，需要提供一个企业名新建一个项目&#…...

编程新知 2026/1/24 14:15:44

CVE-2020-17519源码分析与漏洞复现(Flink 任意文件读取)

漏洞概览漏洞名称：Apache Flink REST API 任意文件读取漏洞CVE编号：CVE-2020-17519CVSS评分：7.5影响版本：Apache Flink 1.11.0、1.11.1、1.11.2修复版本：≥ 1.11.3 或 ≥ 1.12.0漏洞类型：路径遍历&#x…...

编程新知 2026/2/6 2:13:58

Golang——6、指针和结构体

指针和结构体 1、指针1.1、指针地址和指针类型1.2、指针取值1.3、new和make 2、结构体2.1、type关键字的使用2.2、结构体的定义和初始化2.3、结构体方法和接收者2.4、给任意类型添加方法2.5、结构体的匿名字段2.6、嵌套结构体2.7、嵌套匿名结构体2.8、结构体的继承 3、结构体与…...

编程新知 2026/1/28 11:35:09

三分算法与DeepSeek辅助证明是单峰函数

前置单峰函数有唯一的最大值，最大值左侧的数值严格单调递增，最大值右侧的数值严格单调递减。单谷函数有唯一的最小值，最小值左侧的数值严格单调递减，最小值右侧的数值严格单调递增。三分的本质三分和二分一样都是通过不断缩…...

编程新知 2026/1/31 2:50:32

【Linux系统】Linux环境变量：系统配置的隐形指挥官

。# Linux系列文章目录前言一、环境变量的概念二、常见的环境变量三、环境变量特点及其相关指令3.1 环境变量的全局性3.2、环境变量的生命周期四、环境变量的组织方式五、C语言对环境变量的操作5.1 设置环境变量：setenv5.2 删除环境变量:unsetenv5.3 遍历所有环境…...

编程新知 2026/1/31 17:02:38