当前位置：首页 > news >正文

nlp|微调大语言模型初探索(3)，qlora微调deepseek记录

news 2026/4/27 4:24:24

前言

上篇文章记录了使用lora微调llama-1b，微调成功，但是微调llama-8b显存爆炸，这次尝试使用qlora来尝试微调参数体量更大的大语言模型，看看64G显存的极限在哪里。

1.Why QLora?

QLoRA 在模型加载阶段通过 4-bit 量化大幅减少了模型权重的显存占用。
QLoRA 通过反量化到 BF16 进行训练，在保持计算精度的同时，进一步节省显存和提高效率。
QLoRA 在加载、训练、以及权重存储等多个方面都进行了优化，从而有效地减少了显存使用。
总结：比Lora节省显存！！

2.LLaMA-Factory支持模型

在这里插入图片描述
如上图所示，这是LLaMA-Factory所有支持的大语言模型，你可以选择你感兴趣的模型进行微调。
LLaMA-Factory

3.尝试Llama-3.2-3B

下载Llama-3.2-3B-Instruct

nlp|微调大语言模型初探索(3)，qlora微调deepseek记录

前言上篇文章记录了使用lora微调llama-1b，微调成功，但是微调llama-8b显存爆炸，这次尝试使用qlora来尝试微调参数体量更大的大语言模型，看看64G显存的极限在哪里。 1.Why QLora? QLoRA 在模型加载阶段通过 4-bit 量化大幅减少了模型权重的显存占用。QLoRA 通过反量化到 …...

编程日记 2025/2/21 10:12:34

【全栈】SprintBoot+vue3迷你商城-细节解析（1）：Token、Jwt令牌、Redis、ThreadLocal变量

【全栈】SprintBootvue3迷你商城-细节解析（1）：Token、Jwt令牌、Redis、ThreadLocal变量往期的文章都在这里啦，大家有兴趣可以看一下后端部分： 【全栈】SprintBootvue3迷你商城（1） 【全栈】…...

编程日记 2025/2/21 10:11:33

基于ffmpeg+openGL ES实现的视频编辑工具（一）

在深入钻研音视频编辑开发这片技术海洋时，相信不少开发者都和我有同样的感受：网络上关于音视频编辑工具实现的资料繁多，理论阐释细致入微，代码片段也随处可见。然而，一个显著的缺憾是，缺乏一个完整成型的 A…...

编程日记 2025/2/21 10:10:31

面试完整回答：SQL 分页查询中 limit 500000,10和 limit 10 速度一样快吗?

首先：在 SQL 分页查询中，LIMIT 500000, 10 和 LIMIT 10 的速度不会一样快，以下是原因和优化建议： 性能差异的原因 LIMIT 10： 只需要扫描前 10 条记录，然后返回结果。性能非常高，因为数据库只…...

编程日记 2025/2/21 10:09:29

Linux系统管理（十六）——通过WSL配置windows下的Linux系统(可视化界面与远程连接)

前言 WSL，即Windows Subsystem for Linux，是微软在Windows 10和Windows 11中引入的功能，允许用户在Windows上原生运行Linux的命令行工具和应用程序，无需启动完整的Linux虚拟机或进行双系统启动。开启WSL服务开启虚拟化进入…...

编程日记 2025/2/21 10:07:25

【RabbitMQ业务幂等设计】RabbitMQ消息是幂等的吗？

在分布式系统中，RabbitMQ 自身不直接提供消息幂等性保障机制，但可通过业务逻辑设计和技术组合实现消息处理的幂等性。以下是 8 种核心实现方案及最佳实践： 一、消息唯一标识符 (Message Deduplication) 原理每条消息携带全局唯一ID&#xff…...

编程日记 2025/2/21 10:04:21

flutter在安卓模拟器上运行

目录下载android studio，然后把其中的模拟器设为环境变量，然后在vscode/cursor中使用插件，打开安卓模拟器一、下载android studio网址mac 下载64位 ARM 二、启动android studio三、设置SDK四、打开文件打开模拟器五、运行程序六、在vscode/…...

编程日记 2025/2/21 10:01:16

linux shell 当命令执行出现错误立即退出的方法

在 Linux 脚本中，如果你想在整个脚本执行完毕后检查是否有错误发生，可以通过以下几种方式实现： 1. 使用 $? 检查上一条命令的退出状态每个命令执行后，Shell 会将其退出状态存储在特殊变量 $? 中。$? 的值为 0 表示成功&#…...

编程日记 2025/2/21 10:00:15

与本地电脑PDF文档对话的PDF问答程序

文章目录 PDF问答程序程序流程处理PDF文档创建问答链在探索和学习新技术时，了解LangChain框架的理论知识固然重要，但实际的案例分析与实践尝试能为你提供更加直观的认识和更深人的理解。本文主要以解析案例代码为主。通过具体的实践操作，你可…...

编程日记 2025/2/21 9:59:13

QT改变鼠标图片资源路径如下代码实现 QPixmap customCursorPixmap(":/images/mouse.png");QCursor customCursor(customCursorPixmap);QWidget::setCursor(customCursor); // 可以设置为整个窗口或特定控件QWidget::setCursor(); // 设置为透明光标&#xff0c…...

编程日记 2025/2/21 9:58:11

后端开发：开启技术世界的新大门

在互联网的广阔天地中，后端开发宛如一座大厦的基石，虽不直接与用户 “面对面” 交流，却默默地支撑着整个互联网产品的稳定运行。它是服务器端编程的核心领域，负责处理数据、执行业务逻辑以及与数据库和其他后端服务进行交互。在当…...

编程日记 2025/2/21 9:57:09

Sun-Panel：简洁且美观的导航首页开源项目！！

在这个数字化飞速发展的时代，我们几乎每个人都拥有自己的服务器或者NAS。但问题来了，管理这些设备往往需要记住一大堆复杂的命令和界面，对于像了不起这样追求简洁生活的程序员来说，简直是噩梦！ 今天介绍一款界面清爽&…...

编程日记 2025/2/21 9:55:06

第4章信息系统架构（四）

4.6 网络架构网络是信息技术架构中的基础，不仅是用户请求和获取IT信息资源服务的通道，同时也是信息系统架构中各类资源融合和调度的枢纽。特别是云计算、大数据和移动互联网技术飞速发展的今天，网络更加成为实现这些技术跨越的重要环节。…...

编程日记 2025/2/21 9:54:04

【Java八股文】07-Redis面试篇

【Java八股文】07-Redis面试篇 Redis面试篇认识redis为什么用 Redis 作为 MySQL 的缓存？ 数据结构讲一下Redis底层的数据结构ZSet底层是由什么实现的线程模型Redis 是单线程吗？Redis怎么进行I/O多路复用的？Redis 采用单线程为什么还这么快&a…...

编程日记 2025/2/21 9:46:17

Windows PyCharm的python项目移动存储位置后需要做的变更

项目使用的venv虚拟环境，因此项目移动存储位置后需要重新配置python解释器的位置，否则无法识别，若非虚拟环境中运行，则直接移动后打开即可，无需任何配置。 PyCharm版本为2021.3.3 (Professional Edition)，其…...

编程日记 2025/2/21 9:45:14

微信小程序消息推送解密

package com.test.main.b2b;import org.apache.commons.codec.binary.Base64;import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import java.util.Arrays;/*** author * version 1.0* description: 解谜微信小…...

编程日记 2025/2/21 9:44:13

《道德经的现代智慧：解码生活与商业的底层逻辑2》

第二章：人际互动的智慧 🤝 引言：现代人际关系的困境 🌟 时代背景：超连接时代的人际迷思 🌐 在这个前所未有的超连接时代，我们似乎比任何时候都更"在线"、更"联系"&#…...

编程日记 2025/2/21 9:43:11

通过监督微调提升多语言大语言模型性能

引言澳鹏助力一家全球科技公司提升其大语言模型（LLM）的性能。通过提供结构化的人工反馈形式的大语言模型训练数据，让该模型在30多种语言、70多种方言中的表现得到优化。众包人员们进行多轮对话，并依据回复的相关性、连贯性、准确…...

编程日记 2025/2/21 9:41:06

用deepseek学大模型05逻辑回归

deepseek.com:逻辑回归的目标函数，损失函数，梯度下降标量和矩阵形式的数学推导，pytorch真实能跑的代码案例以及模型,数据，预测结果的可视化展示， 模型应用场景和优缺点，及如何改进解决及改进方法数据推导。…...

编程日记 2025/2/21 9:38:00

图解循环神经网络（RNN）

目录 1.循环神经网络介绍 2.网络结构 3.结构分类 4.模型工作原理 5.模型工作示例 6.总结 1.循环神经网络介绍 RNN（Recurrent Neural Network，循环神经网络）是一种专门用于处理序列数据的神经网络结构。与传统的神经网络不同&#xff0c…...

编程日记 2025/2/21 9:35:57

MusicPlayer2完全指南：10个技巧让你的Windows音乐体验焕然一新

MusicPlayer2完全指南：10个技巧让你的Windows音乐体验焕然一新【免费下载链接】MusicPlayer2 MusicPlayer2是一款功能强大的本地音乐播放软件，旨在为用户提供最佳的本地音乐播放体验。它支持歌词显示、歌词卡拉OK样式显示、歌词在线下载、歌词编辑、歌曲…...

编程新知 2026/4/27 4:15:18

Arm系统缓存组架构与CCIX端口聚合配置详解

1. Arm系统缓存组架构解析在现代处理器架构中，系统缓存组(System Cache Group, SCG)是提升内存访问效率的核心组件。以Arm架构为例，其通过分布式缓存节点设计实现了低延迟的数据访问。每个SCG包含多个SN(Subordinate Node)节点，这些节点通过哈…...

编程新知 2026/4/27 4:02:49

正则表达式终极指南：10个文本处理匹配技巧

正则表达式终极指南：10个文本处理匹配技巧【免费下载链接】interview 📚 C/C 技术面试基础知识总结，包括语言、程序库、数据结构、算法、系统、网络、链接装载库等知识及面试经验、招聘、内推等信息。This repository is a summary of the b…...

编程新知 2026/4/27 3:29:55

如何快速解决Elixir项目中Hex模块加载失败的10个实用技巧

如何快速解决Elixir项目中Hex模块加载失败的10个实用技巧【免费下载链接】elixir Elixir is a dynamic, functional language for building scalable and maintainable applications 项目地址: https://gitcode.com/GitHub_Trending/el/elixir Elixir作为一种动态函数式…...

编程新知 2026/4/27 3:17:29

交通数据存证：Java区块链3大“不可篡改”密码，篡改成本高到哭！

🔥关注墨瑾轩，带你探索编程的奥秘！🚀 🔥超萌技术攻略，轻松晋级编程高手🚀 🔥技术宝库已备好，就等你来挖掘🚀 🔥订阅墨瑾轩，智趣学习不…...

编程新知 2026/4/27 3:00:53

05.YOLO的预测机制：从图像到边界框

在环境搭建完成后，你可能会好奇：当我们把一张图片输入YOLO模型，它究竟是如何识别出物体并输出位置的呢？这个过程的核心就是YOLO的预测机制。理解它，是掌握YOLO工作原理的第一步。首先，YOLO不采用滑动窗口或区域提议这类传统方法，而是将物体检测看作一个单一的回归问题…...

编程新知 2026/4/27 2:58:46

从‘小乌龟’到命令行：一个老派Java程序员迁移到Git的心路历程与配置清单

从‘小乌龟’到命令行：一个老派Java程序员迁移到Git的心路历程与配置清单第一次在IDEA终端里敲下git commit -m "initial"时，我的手悬在回车键上整整三秒——这行黑底白字的命令，怎么看都比TortoiseSVN那个绿色小乌龟图标少了些安…...

编程新知 2026/4/27 2:04:40

PyTorch Lightning深度学习工程化实战指南

1. 课程定位与核心价值这个Python深度学习迷你课程的设计初衷，是帮助具备基础Python编程能力的学习者，在最短时间内掌握深度学习核心技术的工程化应用能力。不同于传统学院派教学，我们采用"问题驱动案例实战"的模式，重…...

编程新知 2026/4/27 1:55:07

VS Code + MCP + Cursor + Continue：多智能体开发工作流搭建（私有化部署+离线模型接入+权限沙箱实录）

更多请点击： https://intelliparadigm.com 第一章：VS Code MCP 插件生态概览与核心价值定位 MCP 是什么？ MCP（Model Context Protocol）是由 OpenAI 提出的标准化协议，用于在 IDE 中安全、可扩展地集成大…...

编程新知 2026/4/27 0:39:33

量子-经典混合编排难题全解析，基于MCP 2026标准的4类典型故障诊断与容错加固指南

更多请点击： https://intelliparadigm.com 第一章：量子-经典混合编排的MCP 2026标准演进与核心约束 MCP 2026（Mixed Classical-Quantum Orchestration Protocol）标志着量子计算基础设施从实验性调度迈向生产级协同编排的关键转折…...

编程新知 2026/4/27 0:20:55

nlp|微调大语言模型初探索(3)，qlora微调deepseek记录

前言

1.Why QLora?

2.LLaMA-Factory支持模型

3.尝试Llama-3.2-3B

相关文章：

nlp|微调大语言模型初探索(3)，qlora微调deepseek记录

【全栈】SprintBoot+vue3迷你商城-细节解析（1）：Token、Jwt令牌、Redis、ThreadLocal变量

基于ffmpeg+openGL ES实现的视频编辑工具（一）

面试完整回答：SQL 分页查询中 limit 500000,10和 limit 10 速度一样快吗?

Linux系统管理（十六）——通过WSL配置windows下的Linux系统(可视化界面与远程连接)

【RabbitMQ业务幂等设计】RabbitMQ消息是幂等的吗？

flutter在安卓模拟器上运行

linux shell 当命令执行出现错误立即退出的方法

与本地电脑PDF文档对话的PDF问答程序

QT之改变鼠标样式

后端开发：开启技术世界的新大门

Sun-Panel：简洁且美观的导航首页开源项目！！

第4章信息系统架构（四）

【Java八股文】07-Redis面试篇

Windows PyCharm的python项目移动存储位置后需要做的变更

微信小程序消息推送解密

《道德经的现代智慧：解码生活与商业的底层逻辑2》

通过监督微调提升多语言大语言模型性能

用deepseek学大模型05逻辑回归

图解循环神经网络（RNN）

MusicPlayer2完全指南：10个技巧让你的Windows音乐体验焕然一新

Arm系统缓存组架构与CCIX端口聚合配置详解

正则表达式终极指南：10个文本处理匹配技巧

如何快速解决Elixir项目中Hex模块加载失败的10个实用技巧

交通数据存证：Java区块链3大“不可篡改”密码，篡改成本高到哭！

05.YOLO的预测机制：从图像到边界框

从‘小乌龟’到命令行：一个老派Java程序员迁移到Git的心路历程与配置清单

PyTorch Lightning深度学习工程化实战指南

VS Code + MCP + Cursor + Continue：多智能体开发工作流搭建（私有化部署+离线模型接入+权限沙箱实录）

量子-经典混合编排难题全解析，基于MCP 2026标准的4类典型故障诊断与容错加固指南