当前位置: 首页 > article >正文

【极速版 -- 大模型入门到进阶】LORA:大模型轻量级微调

文章目录


论文指路:LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS

🌊 有没有低成本的方法微调大模型?

  • 2021年微软提出 LORA :LOW-RANK ADAPTATION 低秩适配
    • 【什么是秩?】一个矩阵的秩是指矩阵中线性独立的行或列的最大数目;也就是说 一个矩阵的秩越大,它包含的有效信息就越多

🌊 LoRA 的核心思想

  • LoRA通过优化在适应过程中 FC 层权重变化 ( Δ w ∈ R m × n \Delta w \in \mathbb{R}^{m\times n} ΔwRm×n) 的秩分解矩阵 ( A ∈ R m × r × B ∈ R r × n A \in \mathbb{R}^{m\times r} \times B\in \mathbb{R}^{r\times n} ARm×r×BRr×n),来间接调整神经网络中部分层的权重 ( w w w) 。不修改预先训练好的权重,而是通过引入一个低秩的矩阵来实现对这些层的适应调整
    • r < < min ⁡ ( m , n ) r << \min(m,n) r<<min(m,n)
  • 用更小的参数空间存储 模型参数变化量 Δ w \Delta w Δw
    • Δ w \Delta w Δw: 模型参数变化量,也就是对原参数 w w w 变化 Δ w \Delta w Δw 可以适配新任务。LoRA 用 A 和 B 计算获得模型参数变化量 Δ w \Delta w Δw,叠加到原参数 w w w

🌊 LoRA 的初始化和 r r r 的值设定

  • 用随机高斯分布初始化 A A A ,用 0 矩阵初始化 B B B, 保证训练的开始此旁路矩阵依然是 0 矩阵
  • 对于一般的任务, r = 1 , 2 , 4 , . . . r = 1,2,4, ... r=1,2,4,... 就足够了。而一些领域差距比较大的任务可能需要更大的 r r r

🌊 LoRA 实战:LoraConfig参数详解

目前 LORA 已经被 HuggingFace 集成在了 PEFT(Parameter-Efficient Fine-Tuning) 代码库里
所以,使用也非常简单

from peft import get_peft_config, get_peft_model, LoraConfig, TaskType# preModel = ....from_pretrained(".. bert-base-uncased ..")  # 加载你的预训练模型peft_config = LoraConfig(r=4,  # LoRA 维数lora_alpha=8,  # ΔW 按 α / r 缩放target_modules=["", "", ...],  # 对哪些模块进行微调lora_dropout=0.1  # 默认值为 0
)
model = get_peft_model(preModel, peft_config)  # 预训练模型 -> 加好了 LoRA 之后的模型

参考资料: 【LoRA&CN全解析】, 【知乎高赞-大模型轻量级微调】

相关文章:

【极速版 -- 大模型入门到进阶】LORA:大模型轻量级微调

文章目录 &#x1f30a; 有没有低成本的方法微调大模型&#xff1f;&#x1f30a; LoRA 的核心思想&#x1f30a; LoRA 的初始化和 r r r 的值设定&#x1f30a; LoRA 实战&#xff1a;LoraConfig参数详解 论文指路&#xff1a;LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE M…...

3d pose 指标和数据集

目录 3D姿态估计、3维重建指标: 数据集 EHF数据集 SMPL-X 3D姿态估计、3维重建指标: MVE、PMVE 和 p-MPJPE 都是用于评估3D姿态估计、三维重建等任务中预测结果与真实数据之间误差的指标。 MVE (Mean Vertex Error):是指模型重建过程中每个顶点的预测位置与真实位置之间…...

gogs私服详细配置

一.永久挂载方法 通过 /etc/fstab 实现绑定挂载&#xff08;推荐&#xff09; 绑定挂载&#xff08;Bind Mount&#xff09;允许将一个目录挂载到另一个目录&#xff0c;类似于软链接但更底层。 例如&#xff1a;将 /mnt/data 绑定到 /var/www/html&#xff0c;使两者内容同…...

1688商品详情接口:深度解析与应用实践

在电商领域&#xff0c;1688作为中国领先的B2B平台&#xff0c;拥有海量的商品信息。对于开发者、商家和数据分析师来说&#xff0c;获取1688商品的详细信息是实现数据分析、竞品研究、自动化管理和精准营销的重要手段。本文将详细介绍1688商品详情接口的使用方法、技术细节以及…...

线程同步——读写锁

Linux——线程同步 读写锁 目录 一、基本概念 1.1 读写锁的基本概念 1.2 读写锁的优点 1.3 读写锁的实现 1.4 代码实现 一、基本概念 线程同步中的读写锁&#xff08;Read-Write Lock&#xff09;&#xff0c;也常被称为共享-独占锁&#xff08;Shared-Exclusive Lock&a…...

邪性!Anaconda安装避坑细节Windows11

#工作记录 最近不断重置系统和重装Anaconda&#xff0c;配置的要累死&#xff0c;经几十次意料之外的配置状况打击之后&#xff0c;最后发现是要在在Anaconda安装时&#xff0c;一定要选“仅为我安装”这个选项&#xff0c;而不要选“为所有用户安装”这个选项。 选“仅为我安…...

【大模型】激活函数之SwiGLU详解

文章目录 1. Swish基本定义主要特点代码实现 2. GLU (Gated Linear Unit)基本定义主要特点代码实现 3. SwiGLU基本定义主要特点代码实现 参考资料 SWiGLU是大模型常用的激活函数&#xff0c;是2020年谷歌提出的激活函数&#xff0c;它结合了Swish和GLU两者的特点。SwiGLU激活函…...

AOA与TOA混合定位,MATLAB例程,三维空间下的运动轨迹,滤波使用EKF,附下载链接

本文介绍一个MATLAB代码&#xff0c;实现基于 到达角&#xff08;AOA&#xff09; 和 到达时间&#xff08;TOA&#xff09; 的混合定位算法&#xff0c;结合 扩展卡尔曼滤波&#xff08;EKF&#xff09; 对三维运动目标的轨迹进行滤波优化。代码通过模拟动态目标与基站网络&am…...

【动态编译】Roslyn中 SyntaxKind 枚举类型

在 Roslyn&#xff08;.NET 的编译器平台&#xff09;中&#xff0c;SyntaxKind 是一个枚举类型&#xff0c;定义了 C# 语言中所有可能的语法节点类型。它是 Roslyn 抽象语法树&#xff08;AST&#xff09;的基础&#xff0c;用于标识每个 SyntaxNode 的具体种类。SyntaxKind 的…...

getID3获取本地或远程视频时长

音频文件也可使用&#xff0c;使用ffmeg安装太复杂了 附ffmpeg方式&#xff1a;centos下安装ffmpeg_yum安装ffmpeg-CSDN博客 使用composer先安装 composer require james-heinrich/getid3 获取本地视频 //获取本地视频$video_path $_SERVER[DOCUMENT_ROOT].$params[video];…...

【211】线上教学系统

--基于SSM线上教学平添 主要实现的功能有&#xff1a; 管理员 : 首页、个人中心、学员管理、资料类型管理、学习资料管理、交流论坛、我的收藏管理、试卷管理、留言板管理、试题管理、系统管理、考试管理。 学员 : 首页、个人中心、我的收藏管理、留言板管理、考试管理。 前台…...

从混乱思绪到清晰表达:记录想法如何改变你的学习人生

关键要点 • 记录想法似乎是发现自己想法并将其组织成可传播形式的最佳理由&#xff0c;研究表明写作和教学能增强学习和理解。 • 证据倾向于支持写作有助于澄清思想&#xff0c;而教学通过“教授效应”深化知识。 • 教学和分享被认为是最有效的学习方法&#xff0c;这与记录…...

uvm sequence

UVM Sequence 是验证环境中生成和控制事务&#xff08;Transaction&#xff09;流的核心机制&#xff0c;它通过动态生成、随机化和调度事务&#xff0c;实现灵活多样的测试场景。以下是Sequence的详细解析&#xff1a; Sequence 的核心作用 事务流生成&#xff1a;通过 uvm_s…...

CMake ERROR: arm-none-eabi-gcc is not able to compile a simple test program.

用 cmake 构建 STM32 工程问题【已解决】 环境信息 os: ubuntu22.04gcc: arm-none-eabi-gcc (Arm GNU Toolchain 13.2.rel1 (Build arm-13.7)) 13.2.1 20231009cmake: cmake version 3.22.1ninja: 1.10.1 问题 log [main] 正在配置项目: Olidy [driver] 删除 /home/pomegr…...

地图项目入手学习

如果你目前对自己的地图项目实现原理不太了解&#xff0c;周末可以通过以下方法进行高效学习&#xff1a; ⸻ 第一步&#xff1a;梳理项目相关代码&#xff08;3 小时&#xff09; 目标&#xff1a;先大致了解你的地图项目代码&#xff0c;找到核心实现逻辑。 具体做法&…...

电机控制常见面试问题(二十)

文章目录 一.整流电路绕组接法二.电机为什么需要转速器三.电机转矩产生原理四.电机控制中载波频率大小的确定五.开关周期 Tpwm 一.整流电路绕组接法 为了引出直流的输出&#xff0c;一定要在整流变压器的二次侧引出零线&#xff0c;所以二次侧绕组必须接成星形 一次绕组必须要…...

小爱控制via电视浏览器搜索图片-Homeassistant重制上一个自动化

制作自动化详情 为了完成图片搜&#xff0c;暂定指令找找{描述} 在执行脚本的adb地方输入以下指令&#xff0c;百度 因安全不让在图片地址直接搜转用bing >- >am start -n mark.via.gp/mark.via.Shell -a android.intent.action.VIEW -d https://cn.bing.com/images/…...

unity一个图片的物体,会有透明的效果

如图 想要去掉这个透明效果 选择一个高层级的layer即可。...

docker网桥问题导致ldap组件安装失败分析解决

使用pass_install_x86_64_0124版部署k8s底座、kem&#xff1b; 问题&#xff1a;一台kem节点部署ldap组件失败 解决&#xff1a;恢复问题主机的docker0网卡&#xff0c;重新部署kem相关组件 二、问题详情 现象描述 ansible部署kem组件 TASK [kem : start ldap] **********…...

面试的时候问到了HTML5的新特性有哪些

HTML5 是对 HTML 的重要更新&#xff0c;它引入了许多新特性和改进&#xff0c;使 Web 开发变得更加灵活和强大。以下是一些 HTML5 的关键新特性&#xff1a; 1. 新的文档结构元素 HTML5 引入了一些新的语义化元素&#xff0c;帮助开发者更清晰地结构化网页内容&#xff0c;改…...

AI: 文生视频的主流产品

当前主流的5个文生视频&#xff08;Text-to-Video&#xff09;产品及其核心特点&#xff0c;综合技术能力、应用场景及市场影响力&#xff1a; 1. Sora&#xff08;OpenAI&#xff09; 核心能力&#xff1a;支持通过文本指令生成最长60秒的高质量视频&#xff0c;包含复杂场景、…...

【Python】pillow库学习笔记1-Image类

《Python语言程序设计基础 》第3版&#xff0c;嵩天 黄天羽 杨雅婷著&#xff0c;P293 1.pillow库概述 Pillow 库是Python图像处理重要的第三方库。 Pillow库是PIL (Python image library) 库的一个扩展&#xff0c;需要通过pip工具安装。安装PIL库需要注意&#xff0c;安装…...

智能网联交通加速落地,光路科技TSN技术助推车路云一体化发展

今日&#xff0c;为期两天的第二十七届高速公路信息化大会在青岛国际会展中心&#xff08;红岛馆&#xff09;圆满落幕。本次大会以“数智转型安全”为主题&#xff0c;聚焦高速公路数字化转型、车路云协同以及新一代信息技术的融合应用。会议汇聚了交通行业的专家学者、企业代…...

node-imap-sync-client, imap 客户端, 例子

说明 本文是 node-imap-sync-client imap客户端库的使用例子 https://blog.csdn.net/eli960/article/details/146049717 例子 import { imapSyncClient, imapUtf7ToUtf8, utf8ToImapUtf7 } from "imap-sync-client"const sleep async (t) > {return new Promi…...

定时自启动与自关闭一些python脚本

是windows系统,要是linux就好了. 思路是这样的, 首先到早上6点整启动脚本或某个软件,然后记录下对应的pid,等到了晚上18点整的时候,自动根据pid再杀死对应进程. 定时开启与关闭用apscheduler, 示例代码如下: from apscheduler.schedulers.blocking import BlockingSchedule…...

boost.asio

as&#xff08;async&#xff09;:异步 同步io&#xff1a; reactor (非阻塞)&#xff08;需要注册一次&#xff0c;在等待消息时可以干别的事&#xff09; 阻塞io网络模型 接口&#xff1a;read\accept\connect\write 接口返回时&#xff0c;io完成 异步…...

当贝AI知识库评测 AI如何让知识检索快人一步

近日,国内领先的人工智能服务商当贝AI正式推出“个人知识库”功能,这一创新性工具迅速引发行业关注。在信息爆炸的时代,如何高效管理个人知识资产、快速获取精准答案成为用户的核心需求。当贝AI通过将“闭卷考试”变为“开卷考试”的独特设计,为用户打造了一个高度个性化的智能…...

格雷码、汉明码,CRC校验的区别

格雷码、汉明码和CRC校验都是用于数据传输和存储中的编码技术。 它们在原理、功能和应用场景上存在显著区别。 1.格雷码&#xff08;Gray Code&#xff09; • 定义&#xff1a;格雷码是一种特殊的二进制编码&#xff0c;任意两个相邻的码字之间仅有一位不同。 • 功能&#x…...

uvm configuration

UVM Configuration 机制详解 UVM 的 配置机制&#xff08;Configuration Mechanism&#xff09; 是验证环境中实现参数传递和动态配置的核心方法&#xff0c;通过 uvm_config_db 类实现跨组件的数据共享和灵活配置。以下是其核心概念、使用方法和最佳实践的详细解析&#xff1…...

nginx配置页面缓存,前端每次打包生成新的js文件

前端需要处理的&#xff1a;使用时间戳作为文件名 // nuxt.config.js export default {build: {filenames: {app: ({ isDev }) > isDev ? [name].js : [name].${Date.now()}.js, // 生产环境用时间戳chunk: ({ isDev }) > isDev ? [name].js : [name].${Date.now()}.j…...