当前位置：首页 > news >正文

大模型微调技术 --＞脉络

news 2025/7/12 9:05:45

Step1:脉络

微调技术从最早期的全模型微调演变成如今的各种参数高效微调(PEFT)方法，背后是为了应对大模型中的计算、存储和数据适应性的挑战

1.为什么有微调？

深度学习模型越来越大，尤其是 NLP 中的预训练语言模型(BERT, GPT)系列。如果从零开始训练，既耗时又昂贵。

所以人们开始转向预训练-微调范式，在大规模无监督语料库上进行模型的预训练，然后在特定任务上微调模型。

核心需求：

减少从零开始训练的计算成本和时间
利用已经学到的通用语言知识，通过小规模的任务特定数据快速适配模型

2.脉络

1. 微调技术时间线

全量微调(2018, BERT Google 提出) → Adapter 微调(2019, Houlsby et al 提出) → P-Tuning(2021, 清华大学) → LoRA(2021, 微软研究院) → Prefix-Tuning(2021, Li et al 提出) → IA³ (2022, 微软和 HuggingFace 提出)

2.LoRA 的脉络

LoRA(2021)
- 解决：通过低秩分解，只微调少量参数，大幅减少计算和存储成本，尤其适合大模型生成任务
- 不足：固定秩的设计限制了在复杂多任务或多层次任务中的表现力
QLoRA(2023)
- 解决：虽然 LoRA 减少了参数量，但是显存占用依旧较高。QLoRA 通过 4bit 量化，降低了显存需求
- 不足：量化带来了一定的性能损失，特别是在精度要求极高的任务上
LoHA(2022)
- 解决：LoRA 固定秩的方式难以应对多任务学习或复杂层次结构的需求。LoHA 通过层次化的低秩分解，适应不同层次的任务需求。这样增强了多任务和复杂上下文中的适应性。
- 不足：增加了计算复杂度，设计相对复杂
LoKr(2023)
- 解决：LoRA 适用于线性任务，处理非线性特征时表现不足。LoKr 结合了核方法，使模型能够更好的捕捉复杂的非线性关系。提高了模型在非线性特征场景中的表现，如高级 NLP 和 CV 任务中
- 不足：引入了额外的计算成本和复杂性
AdaLoRA(2023)
- 解决：LoRA 固定秩限制了模型对不同层的适应能力。AdaLoRA 通过动态调整每一层的秩，减少了不必要的计算，提高了关键层的标下能力，在资源有限的环境下表现优异
- 不足：引入了更高的实现复杂度和超参数调整要求
Delta-LoRA 和 Prefix Tuning(2021-2022)
- 解决：LoRA 在生成任务的上下文适应性不足。Delta-LoRA 和 Prefix-Tuning 通过引入前缀或序列信息的适应，曾庆了对上下文的捕捉能力，提升了生成任务(对话、故事生成)中的质量
- 不足：推理时成本增加

7.总结

LoRA 的初衷是为了解决大规模模型微调中的高计算和显存开销问题。
QLoRA 进一步通过量化解决了显存占用问题，使得大模型能够在低资源设备上运行。
LoHA 和 LoKr 针对复杂任务和非线性特征的学习需求进行了扩展，增强了模型的适应性。
AdaLoRA 通过自适应调整秩大小，优化了层次间的资源分配，进一步提高了效率和灵活性。
Delta-LoRA 和 Prefix Tuning 则主要提升了生成任务的上下文捕捉能力。

大模型微调技术 --＞脉络

Step1:脉络微调技术从最早期的全模型微调演变成如今的各种参数高效微调(PEFT)方法，背后是为了应对大模型中的计算、存储和数据适应性的挑战 1.为什么有微调？ 深度学习模型越来越大，尤其是 NLP 中的预训练语言模型(BERT, GPT)系列。如果从…...

编程日记 2024/11/6 3:21:40

不要只知道deepl翻译，这里有10个专业好用的翻译工具等着你。

deepl翻译的优点还是有很多的，比如翻译的准确性很高，支持翻译的语言有很多，并且支持翻译文件和文本。但是现在翻译工具那么多，大家需要翻译的场景也有很多，怎么能只拥有一个翻译工具呢。所以在这里我帮助大家寻找了一波…...

编程日记 2024/11/6 3:20:38

第二节管道符、重定向与环境变量

1.重定向技术的 5 种模式 （1）标准覆盖输出重定向 （2）标准追加输出重定向 （3）错误覆盖输出重定向 （4）错误追加输出重定向 （5）输入重定向2.输入输出重定向输入…...

编程日记 2024/11/6 3:19:38

Linux 服务器使用指南：从入门到登录

🌟快来参与讨论💬，点赞👍、收藏⭐、分享📤，共创活力社区。 🌟 🚩博主致力于用通俗易懂且不失专业性的文字，讲解计算机领域那些看似枯燥的知识点🚩 目录一…...

编程日记 2024/11/6 3:18:36

QT 如何使QLabel的文字垂直显示

想要实现QLabel文字的垂直显示，可以通过使用“文字分割填充换行符”的方式来实现QLabel文字垂直显示的效果，下面是效果图： 具体实现代码： #include "mainwindow.h" #include "ui_mainwindow.h"MainWindow:…...

编程日记 2024/11/6 3:17:35

蓬勃发展：移动开发——关于软件开发你需要知道些什么

一、前言移动开发一直都是软件开发领域中最有趣的领域之一，这是因为： 1、移动开发为“只有一个人”的开发团队提供了一个非常独特的机会，让他可以在相对较短的时间内建立一个实际的、可用的、有意义的应用程序； 2、移动开发也代…...

编程日记 2024/11/6 3:16:34

1095. 山脉数组中查找目标值

目录题目解法lambda在这是怎么用的？ 题目 （这是一个交互式问题 ） 你可以将一个数组 arr 称为山脉数组当且仅当： arr.length > 3 存在一些 0 < i < arr.length - 1 的 i 使得： arr[0] < arr[1] <…...

编程日记 2024/11/6 3:15:33

【深度学习】InstantIR：图片高清化修复

InstantIR——借助即时生成参考的盲图像修复新方法作者：Jen-Yuan Huang 等近年来，随着深度学习和计算机视觉技术的飞速发展，图像修复技术取得了令人瞩目的进步。然而，对于未知或复杂退化的图像进行修复，仍然是一个充满挑战的任务。针对这一难题，研究者们提出了 Insta…...

编程日记 2024/11/6 3:14:31

推荐一款PowerPoint转Flash工具：iSpring Suite

iSpring Suite是一款PowerPoint转Flash工具，使用iSpring Suite 8可以轻松的将PPT演示文档转换为对Web友好的Flash影片格式。软件界面简洁，使用方便。为什么要转换成flash格式呢?Flash格式的最大特点是体积小巧、易于分发，兼容所有的操作系统…...

编程日记 2024/11/6 3:12:28

如何搭建汽车行业AI知识库：定义+好处+方法步骤

在汽车行业，大型车企面临着员工众多、价值链长、技术密集和知识传播难等挑战。如何通过有效的知识沉淀与应用，提升各部门协同效率，快速响应客户咨询，降低销售成本，并开启体系化、可持续性的知识管理建设，成…...

编程日记 2024/11/6 3:11:27

创新材料科技：铜冷却壁助力高炉节能降耗

高炉用铜冷却壁是高炉内部的一种构件，通常用于高炉的炉身部分。它的主要功能是在高炉冶炼过程中冷却炉壁，以防止炉壁过热。铜冷却壁通常由铜制成，因为铜具有良好的导热性和耐腐蚀性，能够有效地将热量从高炉内部传导到外部&#xf…...

编程日记 2024/11/6 3:10:26

Proteus中单片机IO口外接LED输出低电平时，引脚却一直保持高电平的问题（已解决）

文章目录前言解决方法后记前言一个排阻接八个 LED，方便又省事，但出现了P1端口输出低电平后，仿真引脚却一直显示红色保持高电平不变，用电压表测量显示 2V 左右。这是仿真的问题，在用开发板时是不会遇到的&#xff…...

编程日记 2024/11/6 3:09:25

Obsidian vs Typora

引言近来几日，自己也算是用了一段时间的Obsidian了，也是有资格来说一下使用感受了。当前感觉是自己未来很长一段时间将会一直使用Obsidian了。 Typora vs Obsidian Typora 优点整体好看，简洁，所见即所得缺点：…...

编程日记 2024/11/6 3:07:22

非线性数据结构之图

一、有向图（Directed Graph） 1. 定义有向图是一个由顶点（节点）和有方向的边（弧）组成的图。在有向图中，每条边都有一个起点和一个终点，表示从一个顶点到另一个顶点的关系。 2. 特…...

编程日记 2024/11/6 3:06:21

vue3项目history模式部署404处理，使用 historyApiFallback 中间件支持单页面应用路由

vue3项目history模式部署404处理，使用 historyApiFallback 中间件支持单页面应用路由在现代的 web 开发中，单页面应用（SPA）变得越来越流行。这类应用通常依赖于客户端路由来提供流畅的用户体验，但在服务器端&#xf…...

编程日记 2024/11/6 3:03:19

不同的科技查新机构之间有什么区别？

科技查新，作为一种确保科研项目新颖性、先进性的重要手段，在现代科研活动中扮演着至关重要的角色。然而，在众多提供科技查新服务的机构中，它们之间的区别究竟体现在哪些方面呢？本文将从服务内容、专业领域、权威性与客…...

编程日记 2024/11/6 3:01:16

Pycharm，2024最新专业版下载安装配置详细教程！

先来一段官方介绍，PyCharm是一种PythonIDE，带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具，比如调试、语法高亮、Project管理、代码跳转、智能提示、自动完成、单元测试、版本控制。此外，该IDE提供了一些高级功能…...

编程日记 2024/11/6 2:57:11

BERT预训练的MLM和NSP任务的损失函数都是什么？

引言 BERT预训练过程中包括两个主要任务：Masked Language Modeling(MLM) 和 Next Sentence Prediction(NSP)。 MLM损失函数：在MLM任务中，模型需要根据上下文预测被MASK掉的词语。具体来说，输入序列中的一部分词语被随机MASK，模型需要依据未被MASK的词语来预测这些被MASK…...

编程日记 2024/11/6 2:56:10

微信发布测试版4.0，碰瓷NT版QQ？

不知有没有小伙伴发现，就在最近，微信推出了全新版本：4.0.0测试版本，张小龙，你在搞什么飞机? 有什么新活儿了嘛记得上一次发布腾讯QQ的NT版本，在网上也是引发了不小的吐槽。很多网友戏称为“脑瘫”版本&am…...

编程日记 2024/11/6 2:55:09

数据库-＞视图

目录一、视图 1.什么是视图编辑 2.创建视图 1.语法 3.使用视图 4.视图的功能 1.屏蔽相关字段 2.对外提供统一访问规范 3.视图和真实表进行表连接查询 5.修改数据 6.注意事项 7.删除视图 1.语法 8.视图的优点 1. 简单性 2. 安全性 3. 逻辑数据独⽴性 4. 重…...

编程日记 2024/11/6 2:52:06

C# 类和继承(抽象类)

抽象类抽象类是指设计为被继承的类。抽象类只能被用作其他类的基类。不能创建抽象类的实例。抽象类使用abstract修饰符声明。抽象类可以包含抽象成员或普通的非抽象成员。抽象类的成员可以是抽象成员和普通带实现的成员的任意组合。抽象类自己可以派生自另一个抽象类。例…...

编程新知 2025/7/7 21:55:30

12.找到字符串中所有字母异位词

🧠 题目解析题目描述： 给定两个字符串 s 和 p，找出 s 中所有 p 的字母异位词的起始索引。返回的答案以数组形式表示。字母异位词定义： 若两个字符串包含的字符种类和出现次数完全相同，顺序无所谓，则互为…...

编程新知 2025/7/10 17:23:18

Web 架构之 CDN 加速原理与落地实践

文章目录一、思维导图二、正文内容（一）CDN 基础概念1. 定义2. 组成部分 （二）CDN 加速原理1. 请求路由2. 内容缓存3. 内容更新 （三）CDN 落地实践1. 选择 CDN 服务商2. 配置 CDN3. 集成到 Web 架构 &#xf…...

编程新知 2025/7/7 17:43:40

USB Over IP专用硬件的5个特点

USB over IP技术通过将USB协议数据封装在标准TCP/IP网络数据包中，从根本上改变了USB连接。这允许客户端通过局域网或广域网远程访问和控制物理连接到服务器的USB设备（如专用硬件设备），从而消除了直接物理连接的需要。USB over IP的…...

编程新知 2025/7/11 6:47:21

NPOI操作EXCEL文件 ——CAD C# 二次开发

缺点:dll.版本容易加载错误。CAD加载插件时，没有加载所有类库。插件运行过程中用到某个类库，会从CAD的安装目录找，找不到就报错了。【方案2】让CAD在加载过程中把类库加载到内存【方案3】是发现缺少了哪个库，就用插件程序加载进…...

编程新知 2025/7/8 18:12:44

从 GreenPlum 到镜舟数据库：杭银消费金融湖仓一体转型实践

作者：吴岐诗，杭银消费金融大数据应用开发工程师本文整理自杭银消费金融大数据应用开发工程师在StarRocks Summit Asia 2024的分享引言：融合数据湖与数仓的创新之路在数字金融时代，数据已成为金融机构的核心竞争力。杭银消费金…...

编程新知 2025/7/10 13:30:24

【从零开始学习JVM | 第四篇】类加载器和双亲委派机制(高频面试题)

前言： 双亲委派机制对于面试这块来说非常重要，在实际开发中也是经常遇见需要打破双亲委派的需求，今天我们一起来探索一下什么是双亲委派机制，在此之前我们先介绍一下类的加载器。目录编辑前言： 类加载器 1. …...

编程新知 2025/7/12 1:31:28

给网站添加live2d看板娘

给网站添加live2d看板娘参考文献： stevenjoezhang/live2d-widget: 把萌萌哒的看板娘抱回家 (ノ≧∇≦)ノ | Live2D widget for web platformEikanya/Live2d-model: Live2d model collectionzenghongtu/live2d-model-assets 前言网站环境如下，文章也主…...

编程新知 2025/7/11 18:38:16

在 Spring Boot 中使用 JSP

jsp？ 好多年没用了。重新整一下还费了点时间，记录一下。项目结构： pom: <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://ww…...

编程新知 2025/7/10 23:45:51

WEB3全栈开发——面试专业技能点P4数据库

一、mysql2 原生驱动及其连接机制概念介绍 mysql2 是 Node.js 环境中广泛使用的 MySQL 客户端库，基于 mysql 库改进而来，具有更好的性能、Promise 支持、流式查询、二进制数据处理能力等。主要特点： 支持 Promise / async-await&#xf…...

编程新知 2025/7/8 22:30:24

Step1:脉络

1.为什么有微调？

2.脉络

1. 微调技术时间线

2.LoRA 的脉络

相关文章：