当前位置：首页 > news >正文

论文笔记：SUPERVISED CONTRASTIVE REGRESSION

news 2026/2/10 13:46:07

2022arxiv的论文，没有中，但一作是P大图班本MIT博，可信度应该还是可以的

0 摘要

深度回归模型通常以端到端的方式进行学习，不明确尝试学习具有回归意识的表示。
- 它们的表示往往是分散的，未能捕捉回归任务的连续性质。
在本文中，我们提出了“监督对比回归”（Supervised Contrastive Regression，SupCR）的框架
- 该框架通过将样本与目标距离进行对比来学习具有回归意识的表示。
- SupCR与现有的回归模型是正交的，并且可以与这些模型结合使用以提高性能。
在涵盖计算机视觉、人机交互和医疗保健领域的五个真实世界回归数据集上进行的大量实验表明，使用SupCR可以达到最先进的性能，并且始终在所有数据集、任务和输入模式上改进先前的回归基线。
- SupCR还提高了对数据损坏的鲁棒性
- 对减少的训练数据具有弹性
- 改善了迁移学习的性能
- 并且对未见过的目标有很好的泛化能力。

1 介绍

1.1 动机

之前的回归问题
- 都集中在以端到端的方式对最终预测进行约束
- 并未明确考虑模型学到的表示
——>学习的表示往往是分散的，未能捕捉回归任务中连续的关系
图1(a)展示了在从网络摄像头户外图像预测天气温度的任务中，由L1损失学习的表示
- L1模型学习的表示并没有呈现连续的真实温度值；相反，它按不同的摄像头以一种碎片化的方式进行分组。
  - 这种无序和碎片化的表示对于回归任务是次优的，甚至可能会妨碍性能，因为其中包含了干扰信息
之前的表示学习都集中在分类问题上
- 尤其是监督学习和对比学习
- 如图1(b)所示，这些方法在上述视觉温度预测任务中学习的表示对于回归问题来说是次优的
  - 因为它忽略了回归任务中样本之间的连续顺序。

1.2 本文思路

引入了“监督对比回归”（Supervised Contrastive Regression，SupCR）这一新的深度回归学习框架
- 首先学习一个表示，确保嵌入空间中的距离与目标值的顺序相对应
  - 为了学习这样一个具有回归意识的表示，我们根据样本的标签/目标值距离将样本进行对比
- 然后使用这个表示来预测目标值
方法明确地利用样本之间的有序关系来优化下游回归任务的表示（如1(c)所示）
此外，SupCR与现有的回归方法正交
- 可以使用任何类型的回归方法将学习到的表示映射到预测值上。

2 方法

2.0 方法定义

学习一个神经网络，由两部分组成
- 特征encoder
- 预测器 $p(\cdot):R^{d_e}\rightarrow R^{d_t}$ 从 $x \in X$ 中预测 $y \in R^{d_t}$
对于给定的输入 batch，类似于对比学习,首先对数据进行两次数据增强，得到batch的两个view
- 这两个view被输入到编码器f(·)中，为每个增强的输入数据获取一个de维特征嵌入
- 监督对比回归损失是在这些特征嵌入上计算的
  - 为了将学习到的表示用于回归，冻结编码器f(·)，然后在其之上训练预测器，使用回归损失（例如，L1损失）

2.1 监督对比回归损失

大前提：希望损失函数能够确保嵌入空间中的距离与标签空间中的距离相对应
给定N个数据组成的batch ，其中有input和label
- 对该批数据应用数据增强，得到两个视图的batch
  - $\tilde{x}_{2n}=t(x_n),\tilde{x}_{2n-1}=t'(x_n)$
  - t和t'是两种数据增强方式
  - ——>得到两个视图下的batch
    - $\tilde{y}_{2n}=\tilde{y}_{2n-1}=y_n$
- 数据增强后的batch会被喂到encoder中，以获得相应的embedding
  - $v_l=f(\tilde{x}_l)\in R^{d_e}, \forall n \in [2N]$
监督对比回归损失为

比如我们计算20这个样本的对比学习损失函数时，将30作为anchor的时候，会有两个负样本；将0作为anchor的时候，会有一个负样本

2.2 理论证明

略

3 实验

3.1 五个实验

AgeDB	从人脸图像预测年龄。包含了16,488张名人的图像和相应的年龄标签。年龄范围在0到101岁之间。数据集被分为12,208张训练图像、2140张验证图像和2140张测试图像。
TUAB	从EEG静息态信号估计脑龄。包括1,385个21通道的EEG信号，采样频率为200Hz，来自年龄范围从0到95岁的个体。数据集被分为1,246个受试者的训练集和139个受试者的测试集。
MPIIFaceGaze	从人脸图像估计注视方向。包含了213,659张从15名参与者收集的人脸图像将其划分为一个33,000张训练图像、6,000张验证图像和6,000张测试图像的数据集，参与者之间没有重叠。注视方向被描述为一个二维向量，第一维是俯仰角，第二维是偏航角。俯仰角的范围是-40°到10°，偏航角的范围是-45°到45°。
SkyFinder	从户外网络摄像头图像预测温度。包含了由44台摄像头在每天上午11点左右拍摄的35,417张图像，天气和照明条件涵盖了广泛的范围。温度范围是-20°C到-49°C。数据集被分为28,373张训练图像、3,522张验证图像和3,522张测试图像。
IMDB-WIKI	从人脸图像预测年龄包含了523,051张名人图像和相应的年龄标签。年龄范围在0到186岁之间（有些图像标签错误）。使用该数据集来测试方法对减少训练数据的弹性，迁移学习的性能以及对未见目标的泛化能力。

3.2 实验效果

3.3 数据损坏的鲁棒性

使用ImageNet-C基准测试中的损坏生成过程来对AgeDB测试集进行19种不同强度级别的多样化损坏。

3.4 训练数据的影响

论文笔记：SUPERVISED CONTRASTIVE REGRESSION

2022arxiv的论文，没有中，但一作是P大图班本MIT博，可信度应该还是可以的 0 摘要深度回归模型通常以端到端的方式进行学习，不明确尝试学习具有回归意识的表示。它们的表示往往是分散的，未能捕捉回归任务的连续性质。…...

编程日记 2023/8/9 1:43:47

Java 多线程并发 CAS 技术详解

一、CAS概念和应用背景 CAS的作用和用途 CAS（Compare and Swap）是一种并发编程中常用的技术，用于解决多线程环境下的并发访问问题。CAS操作是一种原子操作，它可以提供线程安全性，避免了使用传统锁机制所带来的性能开…...

编程日记 2023/8/9 1:42:46

如何压缩高清PDF文件大小？将PDF文件压缩到最小的三个方法

PDF格式是一种非常常用的文档格式，但是有时候我们需要将PDF文件压缩为更小的大小以便于传输和存储。在本文中，我们将介绍三种PDF压缩的方法，包括在线PDF压缩、利用软件PDF压缩以及使用WPS缩小pdf。首先，在线PDF压缩是最常用的方…...

编程日记 2023/8/9 1:41:44

博客配套视频链接: https://space.bilibili.com/383551518?spm_id_from=333.1007.0.0 b 站直接看配套 github 链接：https://github.com/nickchen121/Pre-training-language-model 配套博客链接：https://www.cnblogs.com/nickchen121/p/15105048.html 预训练预先训练我们…...

编程日记 2023/8/9 1:40:42

Linux各目录详解

Linux文件系统是一个树状结构，由多个目录（或文件夹）组成。以下是常见的Linux目录及其功能的详细解释： /（根目录）：在Linux文件系统中，所有其他目录和文件都是从根目录派生的。所有的存…...

编程日记 2023/8/9 1:39:41

【css】属性选择器分类

属性选择器类型示例说明[attribute][target]选择带有 target 属性的所有元素[attributevalue][target_blank]选择带有 target“_blank” 属性的所有元素[attribute~value][title~flower]选择带有包含 “flower” 一词的 title 属性的所有元素[attribute|value][lang|en]选择带有…...

编程日记 2023/8/9 1:38:40

备份容灾哪家好怎么样

数字化时代，数据安全是我们不容忽视的问题。云呐容灾备份系统不仅提供了强大的数据保护功能，而且操作简单，使用方便。无论你是企业管理员，还是个人用户，都可以轻松上手。它还提供了丰富的报告和监控功能，让…...

编程日记 2023/8/9 1:37:39

【前端实习生备战秋招】—HTML 和 CSS面试题总结（三）

【前端实习生备战秋招】—HTML 和 CSS面试题总结（三） 1.行内元素有哪些？块级元素有哪些？ 空(void)元素有那些？ CSS 规范规定，每个元素都有 display 属性，确定该元素的类型，每个元素…...

编程日记 2023/8/9 1:36:39

Ansible Rsync 使用Ansible Rsync模块进行文件传输

在Ansible自动化工具中，Rsync模块（Rsync Module）是一个强大的组件，用于在Ansible控制节点和目标主机之间进行文件传输和同步。本文将深入探讨Ansible Rsync模块，了解它如何成为自动化任务中高效同步的自动化利器。 Ans…...

编程日记 2023/8/9 1:35:37

Eclipse如何自动添加作者、日期等注释

一、创建类时自动添加注释 1、Window->Preferences 2、Java->Code Syle->Code Templates->Code->New Java files->Edit->要添加的注释->Apply 二、选中要添加的类或者方法通过AltShiftJ快捷键添加 1、Window->Preferences 2、Java->Code Syle…...

编程日记 2023/8/9 1:34:34

uniapp返回

// 监听返回事件onNavigationBarButtonTap() {uni.showModal({title: 提示,content: 确定要返回吗？,success: (res) > {if (res.confirm) {uni.navigateBack({delta: 2})}}})},...

编程日记 2023/8/9 1:33:32

【Antd】antd form表单的rules文案无法跟随状态重渲染的原因及解决办法

问题背景我有两个表单项，当我选择出库类型，调用onChange改变inOutType 状态，这时候发现这句代码不生效： rules{[{ required: true, message: 请选择${inOutType 1 ? 持有人 : 负责人} }]}示例代码 <TypographyForm.Group…...

编程日记 2023/8/9 1:32:31

Rocketmq Filter 消息过滤（TAGS、SQL92）原理详解源码解析

1. 背景 1.1 Rocketmq 支持的过滤方式 Rocketmq 作为金融级的业务消息中间件，拥有强大的消息过滤能力。其支持多种消息过滤方式： 表达式过滤：通过设置过滤表达式的方式进行过滤 TAG：根据消息的 tag 进行过滤。SQL92&#xff1a…...

编程日记 2023/8/9 1:31:30

Attacks in NLP

一、 Introduction NLP对抗攻击是人工智能对抗攻击的一个重要的组成部分，但是最近几年才逐渐开始兴起，究其原因在于NLP对抗攻击与传统computer vision或者audio对抗攻击有很大的不同，主要在于值空间的连续性（CV、audio&#xff0…...

编程日记 2023/8/9 1:30:29

04-7_Qt 5.9 C++开发指南_QTreeWidget和QDockWidget

文章目录 1. 实例功能简述2. 源码2.1 可视化UI设计2.2 mainwindow.h2.3 mainwindow.cpp 1. 实例功能简述本节介绍 QTreeWidget、QDockWidget 的使用，以及用 QLabel 显示图片的方法。实例 samp4_8以QTreeWidget 为主要组件，创建一个照片管理器&#xff…...

编程日记 2023/8/9 1:29:28

Keburnetes YAML配置文件管理

Kubernetes 支持 YAML 和 JSON 格式管理资源对象JSON 格式：主要用于 api 接口之间消息的传递YAML 格式：用于配置和管理，YAML 是一种简洁的非标记性语言，内容格式人性化，较易读 YAML 语法格式大小写敏感使用缩进表示层…...

编程日记 2023/8/9 1:28:25

opencv基础-33 图像平滑处理-中值滤波cv2.medianBlur()

中值滤波是一种常见的图像处理滤波技术，用于去除图像中的噪声。它的原理是用一个滑动窗口（也称为卷积核）在图像上移动，对窗口中的像素值进行排序，然后用窗口中像素值的中值来替换中心像素的值。这样，中值滤…...

编程日记 2023/8/9 1:27:24

后端进阶之路——深入理解Spring Security配置（二）

前言「作者主页」：雪碧有白泡泡「个人网站」：雪碧的个人网站「推荐专栏」： ★java一站式服务 ★ ★前端炫酷代码分享 ★ ★ uniapp-从构建到提升★ ★ 从0到英雄，vue成神之路★ ★ 解决算法，一个专栏就够了★ ★ 架…...

编程日记 2023/8/9 1:26:22

怎么绘制汤姆索亚历险记思维导图？掌握这几个绘制步骤就可以

怎么绘制汤姆索亚历险记思维导图？如果你正在为学习汤姆索亚历险记而感到困惑，或者你想要更好地理解小说中的人物关系、情节和舞台背景，那么一个清晰的思维导图就可以帮助你梳理思路。那么下面就给大家介绍一下绘制步骤。在进行思维导图绘制的…...

编程日记 2023/8/9 1:25:18

Redis和数据库更新先后顺序

在使用 Redis 和数据库时，更新的先后顺序可以根据具体场景来决定。一般来说，有以下两种典型的更新顺序：先更新数据库，再更新 Redis：这种更新顺序适用于需要保证数据的一致性和可靠性的场景。当有数据更新时，首先将数据更新到数据库中，确保数据持久化。然后再更新 Redi…...

编程日记 2023/8/9 1:24:17

深入剖析AI大模型：大模型时代的 Prompt 工程全解析

今天聊的内容，我认为是AI开发里面非常重要的内容。它在AI开发里无处不在，当你对 AI 助手说 "用李白的风格写一首关于人工智能的诗"，或者让翻译模型 "将这段合同翻译成商务日语" 时，输入的这句话就是 Prompt。…...

编程新知 2026/2/8 20:42:53

反向工程与模型迁移：打造未来商品详情API的可持续创新体系

在电商行业蓬勃发展的当下，商品详情API作为连接电商平台与开发者、商家及用户的关键纽带，其重要性日益凸显。传统商品详情API主要聚焦于商品基本信息（如名称、价格、库存等）的获取与展示，已难以满足市场对个性化、智能…...

编程新知 2025/9/15 5:56:53

什么是EULA和DPA

文章目录 EULA（End User License Agreement）DPA（Data Protection Agreement）一、定义与背景二、核心内容三、法律效力与责任四、实际应用与意义 EULA（End User License Agreement） 定义： EULA即…...

编程新知 2025/10/18 7:13:10

汇编常见指令

汇编常见指令一、数据传送指令指令功能示例说明MOV数据传送MOV EAX, 10将立即数 10 送入 EAXMOV [EBX], EAX将 EAX 值存入 EBX 指向的内存LEA加载有效地址LEA EAX, [EBX4]将 EBX4 的地址存入 EAX（不访问内存）XCHG交换数据XCHG EAX, EBX交换 EAX 和 EB…...

编程新知 2026/1/23 2:04:44

【Redis】笔记｜第8节｜大厂高并发缓存架构实战与优化

缓存架构代码结构代码详情功能点： 多级缓存，先查本地缓存，再查Redis，最后才查数据库热点数据重建逻辑使用分布式锁，二次查询更新缓存采用读写锁提升性能采用Redis的发布订阅机制通知所有实例更新本地缓存适用读多…...

编程新知 2026/1/26 3:45:28

Golang——6、指针和结构体

指针和结构体 1、指针1.1、指针地址和指针类型1.2、指针取值1.3、new和make 2、结构体2.1、type关键字的使用2.2、结构体的定义和初始化2.3、结构体方法和接收者2.4、给任意类型添加方法2.5、结构体的匿名字段2.6、嵌套结构体2.7、嵌套匿名结构体2.8、结构体的继承 3、结构体与…...

编程新知 2026/1/28 11:35:09