当前位置：首页 > news >正文

【AI大模型】Transformers大模型库（八）：大模型微调之LoraConfig

news 2026/2/10 7:29:12

一、引言

二、LoraConfig配置参数

2.1 概述

2.2 LoraConfig参数说明

2.3 代码示例

三、总结

一、引言

这里的Transformers指的是huggingface开发的大模型库，为huggingface上数以万计的预训练大模型提供预测、训练等服务。

🤗 Transformers 提供了数以千计的预训练模型，支持 100 多种语言的文本分类、信息抽取、问答、摘要、翻译、文本生成。它的宗旨是让最先进的 NLP 技术人人易用。
🤗 Transformers 提供了便于快速下载和使用的API，让你可以把预训练模型用在给定文本、在你的数据集上微调然后通过 model hub 与社区共享。同时，每个定义的 Python 模块均完全独立，方便修改和快速研究实验。
🤗 Transformers 支持三个最热门的深度学习库： Jax, PyTorch 以及 TensorFlow — 并与之无缝整合。你可以直接使用一个框架训练你的模型然后用另一个加载和推理。

本文重点介绍LoraConfig配置参数

二、LoraConfig配置参数

2.1 概述

LoraConfig是Hugging Face transformers库中用于配置LoRA（Low-Rank Adaptation）的类。LoRA是一种用于微调大型语言模型的轻量级方法，它通过添加低秩矩阵到预训练模型的权重上来实现适应性调整，从而在不显著增加模型大小的情况下提升特定任务的性能。这种方法特别适合于资源有限的环境，因为它减少了存储和计算的需求。

2.2 LoraConfig参数说明

LoraConfig允许用户设置以下关键参数来定制LoRA训练。

r: 低秩矩阵的秩，即添加的矩阵的第二维度，控制了LoRA的参数量。
alpha: 权重因子，用于在训练后将LoRA适应的权重与原始权重相结合时的缩放。
lora_dropout: LoRA层中的dropout率，用于正则化。
target_modules: 指定模型中的哪些模块（层）将应用LoRA适应。这允许用户集中资源在对任务最相关的部分进行微调。
bias: 是否在偏置项上应用LoRA，通常设置为'none'或'all'。
task_type: 指定任务类型，如'CAUSAL_LM'，以确保LoRA适应正确应用到模型的相应部分。

2.3 代码示例

这是一段LoraConfig配置Qwen2的代码，指定模型中的"q_proj"、"v_proj"等层应用LoRA，了解具体有哪些层，可以通过print(model)查看。

config = LoraConfig(r=64,lora_alpha=16,target_modules=["q_proj", "v_proj", "v_proj", "o_proj", "gate_proj", "up_proj","down_proj"],lora_dropout=0.05,bias="none",task_type="CAUSAL_LM",
)model = get_peft_model(model, config)
print_trainable_parameters(model)

三、总结

本文简要介绍LoraConfig的配置参数情况，具体的机遇peft对大模型进行微调后面单独开一页详细讲解。

如果您还有时间，可以看看我的其他文章：

《AI—工程篇》

AI智能体研发之路-工程篇（一）：Docker助力AI智能体开发提效

AI智能体研发之路-工程篇（二）：Dify智能体开发平台一键部署

AI智能体研发之路-工程篇（三）：大模型推理服务框架Ollama一键部署

AI智能体研发之路-工程篇（四）：大模型推理服务框架Xinference一键部署

AI智能体研发之路-工程篇（五）：大模型推理服务框架LocalAI一键部署

《AI—模型篇》

AI智能体研发之路-模型篇（一）：大模型训练框架LLaMA-Factory在国内网络环境下的安装、部署及使用

AI智能体研发之路-模型篇（二）：DeepSeek-V2-Chat 训练与推理实战

AI智能体研发之路-模型篇（三）：中文大模型开、闭源之争

AI智能体研发之路-模型篇（四）：一文入门pytorch开发

AI智能体研发之路-模型篇（五）：pytorch vs tensorflow框架DNN网络结构源码级对比

AI智能体研发之路-模型篇（六）：【机器学习】基于tensorflow实现你的第一个DNN网络

AI智能体研发之路-模型篇（七）：【机器学习】基于YOLOv10实现你的第一个视觉AI大模型

AI智能体研发之路-模型篇（八）：【机器学习】Qwen1.5-14B-Chat大模型训练与推理实战

AI智能体研发之路-模型篇（九）：【机器学习】GLM4-9B-Chat大模型/GLM-4V-9B多模态大模型概述、原理及推理实战

《AI—Transformers应用》

【AI大模型】Transformers大模型库（一）：Tokenizer

【AI大模型】Transformers大模型库（二）：AutoModelForCausalLM

【AI大模型】Transformers大模型库（三）：特殊标记（special tokens）

【AI大模型】Transformers大模型库（四）：AutoTokenizer

【AI大模型】Transformers大模型库（五）：AutoModel、Model Head及查看模型结构

【AI大模型】Transformers大模型库（八）：大模型微调之LoraConfig

目录一、引言二、LoraConfig配置参数 2.1 概述 2.2 LoraConfig参数说明 2.3 代码示例三、总结一、引言这里的Transformers指的是huggingface开发的大模型库，为huggingface上数以万计的预训练大模型提供预测、训练等服务。 🤗 Transformers …...

编程日记 2024/6/12 8:36:05

8-1RT-Thread消息队列

8-1RT-Thread消息队列消息队列又称队列，是一种常用于线程间通信的数据结构。消息队列控制块里有两个链表，空闲列表用来挂接空的小几块，另一个链表是用来挂接存有消息的消息框。其中消息链表头指向消息队列当中的第一个消息框，而…...

编程日记 2024/6/12 8:34:04

解除网站IP抓取限制的方法有哪些？

在爬取网站数据时，经常会遇到IP被限制，导致返回的数据无法显示或者直接空白的情况。这时候就需要采取一些方法来解除网站对IP的爬取限制。IP代理是帮助用户绕过网站限制，保持稳定连接，实现数据顺畅爬取的重要解决方案。 1、IP代理…...

编程日记 2024/6/12 8:28:58

“手撕”二叉树的OJ习题

故事的开头，我们先来三道不是oj的开胃菜，练练手感，后面9道都是OJ题。目录第一题第二题第三题第四题第五题第六题第七题第八题第九题第十题第十一题第一题二叉树前序非递归遍历实现。首先我们需要一个栈来存放二…...

编程日记 2024/6/12 8:27:57

Linux Mint 21.3简介

Linux Mint 21.3是一个更新版本，其中包含了许多新特性和改进。以下是一些主要更新内容： 1. Cinnamon 6.0桌面环境：Linux Mint 21.3采用了最新的Cinnamon 6.0桌面环境，带来了新的功能和改进，例如支持Wayland会话&#…...

编程日记 2024/6/12 8:25:55

C++11 面试题整理

C面试题 1 菱形继承 2 多态多态实现原理： 静态多态动态多态静态多态： 依赖函数重载，编译期确定。函数重载：允许在同一作用于内声明多个功能类似的同名函数，函数列表不同。注意：不能仅通过返回值类型…...

编程日记 2024/6/12 8:24:54

【智能制造-2】焊缝跟踪

焊缝跟踪？ 焊缝跟踪：指在焊接位置前方安装光学传感器进行数据采集，然后传输到焊接机器人，进行自适应的各种模糊控制算法校正焊接机器人或专机的轨迹，实现自适应控制，达到实时的焊缝跟踪。焊缝跟踪的方法…...

编程日记 2024/6/12 8:22:51

优思学院｜用ChatGPT快速完成数据分析图表【柏累托图法】

数据分析是很多行业的人不可少的一部分，尤其是质量工程师更是日常的工作。然而，随着科技的进步，人工智能（AI）将逐渐承担起数据计算的工作，这意味着未来的质量工程师需要具备的不仅仅是计算能力，…...

编程日记 2024/6/12 8:20:49

[晕事]今天做了件晕事37 extern “C“ 被认为了是外部函数

最近看到一个函数声明是 extern “C" void _dump(); 这里的声明是要告诉编译器，这个_dump是C语言的符号，没有经过mangle过的。但是这个关键字可能让人混淆是外部函数。因为这个关键字可以声明外部函数。这也算是一词多用的一个普遍问题。关键的关键…...

编程日记 2024/6/12 8:18:47

问题：关于醋酸钠的结构，下列说法错误的是（） #媒体#媒体

问题：关于醋酸钠的结构，下列说法错误的是（） A．有极性键 B．有非极性键 C．是极性分子 D．是离子晶体参考答案如图所示...

编程日记 2024/6/12 8:17:46

网络安全（补充）

同步包风暴（SYN Flood）攻击者假造源网址发送多个同步数据包（SYN Packet）给服务器，服务器因无法收到确认数据包（ACK Packet），使TCP/IP协议三次握手无法顺利完成，因而无法建…...

编程日记 2024/6/12 8:16:45

Redis集群（3）

集群扩容节点配置和启动我们要加入两个节点，主节点端口为6903，从节点端口为6933。配置与6900节点类似，不再赘述。启动这两个节点： ./redis-server ../conf/cluster_m_6903.conf ./redis-server ../conf/cluster_s_6933.conf加…...

编程日记 2024/6/12 8:15:44

防止Selenium被检测 Google Chrome 125

背景最近在使用selenium自动播放学习课程，相信大家也有一些类似的使用场景。能自动化的事情，绝不自己干。为防止被检测是机器人做题，刷视频，需要做一些小调整。先来看作为服务方维护者，是如何检测是Selenium打…...

编程日记 2024/6/12 8:14:43

LeetCode 算法：螺旋矩阵c++

原题链接🔗：螺旋矩阵难度：中等⭐️⭐️ 题目给你一个 m 行 n 列的矩阵 matrix ，请按照顺时针螺旋顺序 ，返回矩阵中的所有元素。示例 1： 输入：matrix [[1,2,3],[4,5,6],[7,8,9]] 输出&…...

编程日记 2024/6/12 8:13:40

【全开源】医护上门系统小程序APP公众号h5源码

医护上门系统：健康守护，就在您身边 🚪引言：开启全新的医护模式在快节奏的现代生活中，健康问题往往成为我们关注的焦点。而“医护上门系统”正是为了满足这一需求，将专业的医疗服务送到您的家中。这一创新…...

编程日记 2024/6/12 8:12:40

结构体＜C语言＞

导言结构体是C语言中的一种自定义类型，它的值（成员变量）可以是多个，且这些值可以为不同类型，这也是和数组的主要区别，下面将介绍它的一些基本用法，包括：结构体的创建、结构体变量的…...

编程日记 2024/6/12 8:06:30

点云分割报告整理（未完成版-每天写一点）

体积占用网格表示对点进行体素化，然后使用3d卷积神经网络来学习体素级语义。由于点云的稀疏性，体素化效率低，为避免较高的计算成本而忽略了细节。此外，由于同一体素内的所有点都被赋予了相同的语义标签，因此精度受到限…...

编程日记 2024/6/12 8:05:29

python基础 002 - 1 基础语法

1 标识符（identifier），识别码，表明身份身份证，ID 定义：在编程语言中标识符就是程序员自己规定的具有特定含义的词，比如类名称、属性名称、变量名等， 在Python 中，pyt…...

编程日记 2024/6/12 8:02:26

浅谈Web开发的三大主流框架：Angular、React和Vue.js

在现代Web开发领域，Angular、React和Vue.js作为三大主流前端框架，各自拥有独特的特点和优势，为开发者提供丰富的选择。让我们更深入地了解这三大框架，并通过一些小型样例来展示它们的特性。 Angular Angular是一个完整的前端框架…...

编程日记 2024/6/12 8:00:22

1、导入.mpp文件 public void importMppFile(String updateType, MultipartFile multipartFile) {try (InputStream inputStream multipartFile.getInputStream()) {// 读取文件的组件MPPReader mppReader new MPPReader();// 注意，如果在这一步出现了读取异常&a…...

编程日记 2024/6/12 7:59:22

多模态2025：技术路线“神仙打架”，视频生成冲上云霄

文｜魏琳华编｜王一粟一场大会，聚集了中国多模态大模型的“半壁江山”。智源大会2025为期两天的论坛中，汇集了学界、创业公司和大厂等三方的热门选手，关于多模态的集中讨论达到了前所未有的热度。其中，…...

编程新知 2026/2/8 20:43:00

Flask RESTful 示例

目录 1. 环境准备2. 安装依赖3. 修改main.py4. 运行应用5. API使用示例获取所有任务获取单个任务创建新任务更新任务删除任务中文乱码问题： 下面创建一个简单的Flask RESTful API示例。首先，我们需要创建环境，安装必要的依赖，然后…...

编程新知 2026/2/8 20:42:43

【kafka】Golang实现分布式Masscan任务调度系统

要求： 输出两个程序，一个命令行程序（命令行参数用flag）和一个服务端程序。命令行程序支持通过命令行参数配置下发IP或IP段、端口、扫描带宽，然后将消息推送到kafka里面。服务端程序： 从kafka消费者接收…...

编程新知 2026/2/8 20:41:58

在HarmonyOS ArkTS ArkUI-X 5.0及以上版本中，手势开发全攻略：

在 HarmonyOS 应用开发中，手势交互是连接用户与设备的核心纽带。ArkTS 框架提供了丰富的手势处理能力，既支持点击、长按、拖拽等基础单一手势的精细控制，也能通过多种绑定策略解决父子组件的手势竞争问题。本文将结合官方开发文档&#xff0c…...

编程新知 2025/9/19 4:31:58

Leetcode 3577. Count the Number of Computer Unlocking Permutations

Leetcode 3577. Count the Number of Computer Unlocking Permutations 1. 解题思路2. 代码实现题目链接：3577. Count the Number of Computer Unlocking Permutations 1. 解题思路这一题其实就是一个脑筋急转弯，要想要能够将所有的电脑解锁&#x…...

编程新知 2026/1/4 2:33:39

网络编程（UDP编程）

思维导图 UDP基础编程（单播） 1.流程图服务器：短信的接收方创建套接字 (socket)-----------------------------------------》有手机指定网络信息-----------------------------------------------》有号码绑定套接字 (bind)--------------…...

编程新知 2026/2/4 17:31:44

Device Mapper 机制

Device Mapper 机制详解 Device Mapper（简称 DM）是 Linux 内核中的一套通用块设备映射框架，为 LVM、加密磁盘、RAID 等提供底层支持。本文将详细介绍 Device Mapper 的原理、实现、内核配置、常用工具、操作测试流程，并配以详细的…...

编程新知 2025/12/14 13:11:33

处理vxe-table 表尾数据是单独一个接口，表格tableData数据更新后，需要点击两下，表尾才是正确的

修改bug思路： 分别把 tabledata 和表尾相关数据 console.log() 发现更新数据先后顺序不对 settimeout延迟查询表格接口 ——测试可行升级↑：async await 等接口返回后再开始下一个接口查询 ________________________________________________________…...

编程新知 2026/1/25 6:16:49

20个超级好用的 CSS 动画库

分享 20 个最佳 CSS 动画库。它们中的大多数将生成纯 CSS 代码，而不需要任何外部库。 1.Animate.css 一个开箱即用型的跨浏览器动画库，可供你在项目中使用。 2.Magic Animations CSS3 一组简单的动画，可以包含在你的网页或应用项目中。 3.An…...

编程新知 2026/2/9 22:04:45

Neko虚拟浏览器远程协作方案：Docker+内网穿透技术部署实践

前言：本文将向开发者介绍一款创新性协作工具——Neko虚拟浏览器。在数字化协作场景中，跨地域的团队常需面对实时共享屏幕、协同编辑文档等需求。通过本指南，你将掌握在Ubuntu系统中使用容器化技术部署该工具的具体方案，并结合内网…...

编程新知 2026/2/9 22:04:22

【AI大模型】Transformers大模型库（八）：大模型微调之LoraConfig

一、引言

二、LoraConfig配置参数

2.1 概述

2.2 LoraConfig参数说明

2.3 代码示例

三、总结

相关文章：

【AI大模型】Transformers大模型库（八）：大模型微调之LoraConfig

8-1RT-Thread消息队列

解除网站IP抓取限制的方法有哪些？

“手撕”二叉树的OJ习题

Linux Mint 21.3简介

C++11 面试题整理

【智能制造-2】焊缝跟踪

优思学院｜用ChatGPT快速完成数据分析图表【柏累托图法】

[晕事]今天做了件晕事37 extern “C“ 被认为了是外部函数

问题：关于醋酸钠的结构，下列说法错误的是（） #媒体#媒体

网络安全（补充）

Redis集群（3）

防止Selenium被检测 Google Chrome 125

LeetCode 算法：螺旋矩阵c++

【全开源】医护上门系统小程序APP公众号h5源码

结构体＜C语言＞

点云分割报告整理（未完成版-每天写一点）

python基础 002 - 1 基础语法

浅谈Web开发的三大主流框架：Angular、React和Vue.js

使用net.sf.mpxj读取project的.mpp文件

多模态2025：技术路线“神仙打架”，视频生成冲上云霄

Flask RESTful 示例

【kafka】Golang实现分布式Masscan任务调度系统

在HarmonyOS ArkTS ArkUI-X 5.0及以上版本中，手势开发全攻略：

Leetcode 3577. Count the Number of Computer Unlocking Permutations

网络编程（UDP编程）

Device Mapper 机制

处理vxe-table 表尾数据是单独一个接口，表格tableData数据更新后，需要点击两下，表尾才是正确的

20个超级好用的 CSS 动画库

Neko虚拟浏览器远程协作方案：Docker+内网穿透技术部署实践