当前位置: 首页 > news >正文

Self-regulating Prompts: Foundational Model Adaptation without Forgetting

本文也是大模型系列的文章,主要是与Prompt Learning有关。针对《Self-regulating Prompts: Foundational Model Adaptation without Forgetting》的翻译。

自我调节的提示:不遗忘的基础模型适应

  • 摘要
  • 1 引言
  • 2 相关工作
  • 3 提出的方法
    • 3.1 前言
    • 3.2 提示学习的自正则化
      • 3.2.1 相互协议最大化
      • 3.2.2 提示自集成的规范化
      • 3.2.3 规范具有文本多样性的提示
  • 4 实验
    • 4.1 评估设置
    • 4.2 自律提示的有效性
    • 4.3 从基础到新颖的泛化
    • 4.4 小样本实验
    • 4.5 跨数据集评估
    • 4.6 领域泛化实验
    • 4.7 消融分析
  • 5 结论

摘要

提示学习已成为微调各种下游任务的基础模型(如CLIP)的有效替代方案。使用任务特定目标(即交叉熵损失)进行常规训练的提示往往会过度拟合下游数据分布,并发现从冻结的CLIP中捕获任务不可知的一般特征具有挑战性。这导致了模型原有泛化能力的丧失。为了解决这个问题,我们的工作引入了一个用于提示的自正则化框架,称为PromptSRC(具有自调节约束的提示)。PromptSRC使用三管齐下的方法指导提示优化特定任务和不可知任务的一般表示,方法是:(a)通过与冻结模型的相互协议最大化来调节提示表示,(b)在训练轨迹上用提示的自集成来调节,以编码其互补优势,以及(c)用文本多样性进行调节,以减轻与视觉分支的样本多样性失衡。据我们所知,这是第一个用于提示学习的正则化框架,通过共同关注预训练的模型特征、提示期间的训练轨迹和文本多样性来避免过度拟合。PromptSRC显式地引导提示学习一个表示空间,该空间在不影响CLIP泛化的情况下最大限度地提高下游任务的性能。我们在4个基准上进行了广泛的实验,其中PromptSRC与现有方法相比总体表现良好。我们的代码和预训练模型可在以下网站上公开获取:https://github.com/muzairkhattak/PromptSRC.

1 引言

2 相关工作

3 提出的方法

3.1 前言

3.2 提示学习的自正则化

3.2.1 相互协议最大化

3.2.2 提示自集成的规范化

3.2.3 规范具有文本多样性的提示

4 实验

4.1 评估设置

4.2 自律提示的有效性

4.3 从基础到新颖的泛化

4.4 小样本实验

4.5 跨数据集评估

4.6 领域泛化实验

4.7 消融分析

5 结论

提示学习已经成为适应CLIP等基础VL模型的有效范例。然而,大多数现有方法学习的提示固有地倾向于过度拟合特定任务的目标,从而损害CLIP固有的泛化能力。我们的工作提出了一个自我调节的提示学习框架,该框架解决了提示过拟合问题,以更好地泛化。我们表明,通过引入文本多样性补充的自一致性约束,明确鼓励提示与冻结模型的相互一致,从而指导提示的训练轨迹是至关重要的。我们还提出了一种提示的自组装策略,该策略在训练过程中通过高斯加权方法适当地聚合提示。对多个基准的广泛评估表明,我们的自我调节方法对快速学习有好处。

相关文章:

Self-regulating Prompts: Foundational Model Adaptation without Forgetting

本文也是大模型系列的文章,主要是与Prompt Learning有关。针对《Self-regulating Prompts: Foundational Model Adaptation without Forgetting》的翻译。 自我调节的提示:不遗忘的基础模型适应 摘要1 引言2 相关工作3 提出的方法3.1 前言3.2 提示学习的…...

平时工资不够用?推荐4种适合工作之余做的兼职副业!

你是否也曾经在为每个月的工资发愁?你是否想过做点副业来增加收入?现在很多上班族的工资,已经难以满足他们的生活需求了,很多人开始尝试通过副业来增加收入。那么上班族要如何寻找适合自己的副业呢?下面就给大家分享几…...

21.Netty源码之编码器

highlight: arduino-light Netty如何实现自定义通信协议 在学习完如何设计协议之后,我们又该如何在 Netty 中实现自定义的通信协议呢?其实 Netty 作为一个非常优秀的网络通信框架,已经为我们提供了非常丰富的编解码抽象基类,帮助我…...

Linux 快速创建桌面图标

在安装 tar.gz 这类型压缩文件时,通常启动文件是.sh文件。文章主要记录快速添加到桌面图标。 1、解压 tar -zxvf XXX.tar.gz 2、创建桌面图标文件 touch XXX.desktop 3、文件中配置 [Desktop Entry] NameXXX CommentZZZ Exec/软件可执行文件所在目录/可执行文…...

数据结构—哈夫曼树及其应用

5.6哈夫曼树及其应用 5.6.1哈夫曼树的基本概念 路径:从树中一个结点到另一个结点之间的分支构成这两个结点间的路径。 结点的路径长度:两结点间路径上的分支数。 树的路径长度:从树根到每一个结点的路径长度之和。记作 TL 结点数目相同的…...

NeRF-SLAM: Real-Time Dense Monocular SLAM with Neural Radiance Fields 论文阅读

论文信息 题目:NeRF-SLAM: Real-Time Dense Monocular SLAM with Neural Radiance Fields 作者:Antoni Rosinol, John J. Leonard, Luca Carlone 代码:https://github.com/ToniRV/NeRF-SLAM 来源:arxiv 时间&#xff…...

机器学习之弹性网络(Elastic Net)

弹性网络 代码原文 下面代码参考scikit-learn中文社区,链接在上面。 但是由于scikit-learn中文社区上的代码有些地方跑不通,故对此代码做了修改,输出结果与社区中显示的结果相同。 对弹性网络进行简单的介绍: ElasticNet是一个训…...

嵌入式入门教学——C51

一、前期准备 1、硬件设备 2、软件设备 二、预备知识 1、什么是单片机? 在一片集成电路芯片上集成微处理器、存储器、IO接口电路,从而构成了单芯片微型计算机,及单片机。STC89C52单片机: STC:公司89:所属…...

2023-08-03力扣每日一题

链接&#xff1a; 722. 删除注释 题意&#xff1a; 如题&#xff0c;特殊规则见链接 解&#xff1a; 字符串处理&#xff0c;嗯写就完事了,主要是判断指针位置和特殊规则 实际代码&#xff1a; #include<bits/stdc.h> using namespace std; vector<string> …...

【蓝桥杯备考资料】如何进入国赛?

目录 写在前面注意事项数组、字符串处理BigInteger日期问题DFS 2013年真题Java B组世纪末的星期马虎的算式振兴中华黄金连分数有理数类&#xff08;填空题&#xff09;三部排序&#xff08;填空题&#xff09;错误票据幸运数字带分数连号区间数 2014年真题蓝桥杯Java B组03猜字…...

QtWebApp开发https服务器,完成客户端与服务器基于ssl的双向认证

引言&#xff1a;所谓http协议&#xff0c;本质上也是基于TCP/IP上服务器与客户端请求和应答的标准&#xff0c;web开发中常用的http server有apache和nginx。Qt程序作为http client可以使用QNetworkAccessManager很方便的进行http相关的操作。Qt本身并没有http server相关的库…...

动态IP代理的优势展现与应用场景

在当今数字化时代&#xff0c;网络安全和隐私保护变得愈发重要。作为一家动态IP代理产品供应商&#xff0c;我们深知在保护个人隐私和提高网络安全性方面的重要性。本文将会分享动态IP代理的优势及其在不同应用场景下的实际应用案例&#xff0c;帮助更好地了解和应用动态IP代理…...

ad+硬件每日学习十个知识点(22)23.8.2(LDO datasheet手册解读)

文章目录 1.LDO的概述、features2.LDO的绝对参数&#xff08;功率升温和结温&#xff09;3.LDO的引脚功能4.LDO的电气特性5.LDO的典型电路&#xff08;电容不能真用1uF&#xff0c;虽然按比例取输出值&#xff0c;但是R2的取值要考虑释放电流&#xff09;6.LDO的开关速度和线性…...

这可是全网最全的网络工程师零基础实战视频整理,最新版分享

互联网中每一项傍身的技能都是需要从如何入门开始的&#xff0c;网络技术也是如此&#xff01; 网络技术区别其他互联网技能的一点是学习需要从设备开始&#xff0c;只有认识了解了路由器、交换机、防火墙这些网络设备&#xff0c;才开始从网络通信原理开始&#xff0c;这使得网…...

笔记本WIFI连接无网络【实测有效解决方案,不用重启电脑】

笔记本Wifi连接无网络实测有效解决方案 问题描述&#xff1a; 笔记本买来一段时间后&#xff0c;WIFI网络连接开机一段时间还正常连接&#xff0c;但是过一段时间显示网络连接不上解决方案&#xff1a; 1.编写网络重启bat脚本&#xff0c;将以下内容写到文本文件&#xff0c;把…...

js 正则表达式配合replace进行过滤html字符串遇到的性能问题

问题场景复现&#xff1a; 博主要实现一个邮箱列表&#xff0c;其中列表中的每一封邮件都有一个摘要&#xff0c;但是摘要是要自己从后端提供的content内容区自己过滤掉所有&#xff0c;只留下纯文本内容的前面几行作为摘要。 性能问题 当我测试到一个邮箱&#xff0c;其中的…...

2022牛客寒假算法基础集训营1

B题 炸鸡块君与FIFA22 题目大意&#xff1a; 给出胜负序列&#xff0c;每次询问区间 (l,r,s) &#xff0c;回答在经历 (l-r) 之后积分是多少&#xff0c;初始积分为 (s) 胜 (1) 积分&#xff0c;平 (0) 积分&#xff0c;败的时候如果此时积分为 (3) 的倍数则 (-0) &#xff0c…...

API对接:构建连接不同系统的技术桥梁

API&#xff08;Application Programming Interface&#xff09;是一种用于不同软件系统之间进行通信和数据交换的技术。本文将介绍API对接的基本概念和原理&#xff0c;并通过代码示例演示如何使用API对接不同系统&#xff0c;解决数据传输与通信的难题。 在当今数字化时代&a…...

【MySQL】仓储--维护出入库流水、库存,去重数量逻辑修正

系列文章 C#底层库–MySQLBuilder脚本构建类&#xff08;select、insert、update、in、带条件的SQL自动生成&#xff09; 本文链接&#xff1a;https://blog.csdn.net/youcheng_ge/article/details/129179216 C#底层库–MySQL数据库操作辅助类&#xff08;推荐阅读&#xff0…...

用Log4j 2记录日志

说明 maven工程中增加对Log4j 2的依赖 下面代码示例的maven工程中的pom.xml文件中需要增加对Log4j 2的依赖&#xff1a; <dependency><groupId>org.apache.logging.log4j</groupId><artifactId>log4j-core</artifactId><version>2.20.0&…...

如何用Python免费获取股票数据?终极通达信接口MOOTDX指南

如何用Python免费获取股票数据&#xff1f;终极通达信接口MOOTDX指南 【免费下载链接】mootdx 通达信数据读取的一个简便使用封装 项目地址: https://gitcode.com/GitHub_Trending/mo/mootdx 还在为股票数据获取烦恼吗&#xff1f;想学习量化分析却被高昂的数据费用吓退…...

开箱即用的语音合成方案:CosyVoice-300M Lite镜像深度体验

开箱即用的语音合成方案&#xff1a;CosyVoice-300M Lite镜像深度体验 1. 引言 1.1 语音合成的现代需求 在智能客服、有声读物、语音助手等应用场景中&#xff0c;高质量的文本转语音&#xff08;TTS&#xff09;能力已成为提升用户体验的关键环节。然而&#xff0c;传统TTS…...

AI写教材全流程揭秘,低查重工具带你开启高效编写之旅!

AI教材写作工具&#xff1a;让教材编写更高效 编写教材离不开扎实的资料支持&#xff0c;但传统的资料整合方法已经无法满足当前的需求。以往&#xff0c;从课程标准到学术文章&#xff0c;再到教学案例&#xff0c;信息往往分散在知网、教研网站等各个地方&#xff0c;这不仅…...

营销自动化数据驱动 - 多源数据 OLAP 架构演进墙

1. 流图&#xff1a;数据的河流 如果把传统的堆叠面积图想象成一块块整齐堆叠的积木&#xff0c;那么流图就像一条蜿蜒流淌的河流&#xff0c;河道的宽窄变化自然流畅&#xff0c;波峰波谷过渡平滑。 它特别适合展示多个类别数据随时间的变化趋势&#xff0c;尤其是当你想强调整…...

Wan2.2-I2V-A14B WebUI A/B测试:不同UI布局对运营人员生成效率影响分析

Wan2.2-I2V-A14B WebUI A/B测试&#xff1a;不同UI布局对运营人员生成效率影响分析 1. 测试背景与目标 在内容创作领域&#xff0c;视频生成工具的效率直接影响运营团队的工作产出。Wan2.2-I2V-A14B作为一款专业的文生视频模型&#xff0c;其WebUI界面设计对用户体验至关重要…...

023.混淆矩阵分析:如何从错误中学习,改进模型

上周调一个产线缺陷检测模型&#xff0c;指标看着不错——mAP0.5有92%&#xff0c;实际跑起来却总漏检关键缺陷。产线老大直接打电话过来&#xff1a;“你们这模型怎么把划痕当背景了&#xff1f;” 挂掉电话打开测试集&#xff0c;发现模型把30%的划痕都预测成了“正常”&…...

告别固定邻居!用DeGCN的可变形卷积思想,让GCN在骨架行为识别里‘活’起来

可变形图卷积&#xff1a;让骨架行为识别模型学会"动态思考" 在咖啡厅里&#xff0c;两位工程师正盯着笔记本电脑屏幕上的骨架动作数据争论不休。"你看这个挥手动作&#xff0c;传统GCN对所有关节一视同仁地处理&#xff0c;但明明只有手臂在动啊&#xff01;&q…...

【实战】EasyExcel导出日期数据列宽优化:告别#####显示问题

1. 为什么Excel会显示#####符号&#xff1f; 这个问题困扰过不少刚接触数据导出的开发者。想象一下&#xff0c;你花了大半天时间整理好数据&#xff0c;导出Excel后却发现日期列全变成了"#####"&#xff0c;那种心情就像煮熟的鸭子飞走了。其实这是Excel的善意提醒—…...

网络工程作业四:拓扑图配置(动态)

1.作业要求2.作业预览图3.实验过程&#xff08;1&#xff09;.设备放置和划分网段&#xff08;顺便把IP地址标准好&#xff09;&#xff08;2&#xff09;配置网关在启动设备后&#xff0c;进入路由器用户视图&#xff0c;可以通过命令sys(system-view)&#xff0c;进入系统视图…...

大学c语言搜题app有哪些 大学c语言搜题软件大全

C语言是很多学习IT技术的同学们必须要学习和精通的编程语言&#xff0c;想要成为高级的程序员就一定要认真学习&#xff0c;大学c语言搜题app有哪些就是很多想在课下对知识进行巩固&#xff0c;提前预习&#xff0c;提升能力的同学们想知道的&#xff0c;下面就给大家推荐几款好…...