当前位置：首页 > article >正文

【大模型微调】魔搭社区GPU进行LLaMA-Factory微调大模型自我认知

article 2026/2/7 8:21:55

文章概要：
本文是一篇详细的技术教程，介绍如何使用魔搭社区（ModelScope）的GPU资源来进行LLaMA-Factory的模型微调。文章分为11个主要步骤，从环境准备到最终的模型测试，系统地介绍了整个微调流程。主要内容包括：

环境准备和硬件资源配置
LLaMA-Factory的安装和部署
可视化界面的配置和启动
基座模型的下载和测试
自我认知数据集的修改
微调参数的设置和训练过程
模型评估和优化
最终模型的导出和测试

文章目的

帮助开发者快速上手LLaMA-Factory工具，学习如何利用魔搭社区的免费GPU资源进行大模型微调
详细讲解模型微调的完整流程，包括环境配置、模型训练、参数调优等关键步骤
提供实用的技术细节和注意事项，如显存管理、训练参数调整等，帮助读者避免常见问题
指导读者如何进行模型的自我认知微调，实现个性化的AI助手定制

1. 准备硬件资源、搭建环境

访问魔搭社区官网：https://modelscope.cn，完成注册和登录
进入我的Notebook页面，依次选择：魔搭平台免费实例 -> 阿里云弹性加速计算EAIS -> 方式二 GPU环境
选择GPU实例类型和配置，确认配置并启动实例
点击「打开notebook」进入JupyterLab环境

在这里插入图片描述

2. LLaMA-Factory 安装部署

LLaMA-Factory 的 Github地址：https://github.com/hiyouga/LLaMA-Factory

克隆仓库

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git

切换到项目目录
```
cd LLaMA-Factory
```
创建 Conda 虚拟环境(一定要 3.10 的 python 版本，不然和 LLaMA-Factory 不兼容)
```
conda create -n llama-factory python=3.10
```
激活虚拟环境
```
conda activate llama-factory
```
在虚拟环境中安装 LLaMA Factory 相关依赖
```
pip install -e ".[torch,metrics]"
```
注意：如报错 bash: pip: command not found ，先执行 conda install pip 即可
检验是否安装成功
```
llamafactory-cli version
```

3. 配置本地远程访问LLama-Factory 的可视化微调界面

修改LLaMA-Factory/src/llamafactory/webui/interface.py文件中share=gradio_share为share=True
下载文件 https://cdn-media.huggingface.co/frpc-gradio-0.3/frpc_linux_amd64
重命名文件为 frpc_linux_amd64_v0.3
移动文件至 /root/.cache/huggingface/gradio/frpc
进入文件夹，输入以下命令给予权限：chmod +x frpc_linux_amd64_v0.3

4. 启动 LLama-Factory 的可视化微调界面（由 Gradio 驱动）

llamafactory-cli webui --share

点击显示的公网地址即可进入可视化界面

5. 从 modelscope 上下载基座模型

创建文件夹统一存放所有基座模型

cd LLaMA-Factory
mkdir models
cd models

执行下载命令

git lfs install
git clone https://www.modelscope.cn/Qwen/Qwen2.5-1.5B-Instruct.git

如果要下载其他模型，可以替换git地址即可

注意：由于网络环境等原因，文件下载后往往会存在文件不完整的很多情况，下载后需要先做一下校验，校验分为两部分，第一先检查一下文件大小和文件数量是否正确，和原始的huggingface显示的做一下肉眼对比，进入文件夹通过du -sh *查看文件和文件大小情况

6. 可视化页面上加载模型测试，检验是否加载成功

选择模型 Qwen2.5-1.5B-Instruct
输入下载的模型路径 models/Qwen2.5-1.5B-Instruct
选择chat模式，点击加载模型，加载完后就可以进行聊天测试了

7. 修改自我认知数据集

使用编辑器打开文件 LLaMA-Factory/data/identity.json
批量替换 {{name}} 为需要的助手名称，比如小梦助手
批量替换{{author}} 为开发者名称，比如LChuck茶客
保存文件

8. 在页面上进行微调的相关设置，开始微调（整个微调过程大概1-2小时）

选择微调算法 LoRA
添加数据集 identity
修改其他训练相关参数，如学习率、训练轮数、截断长度、验证集比例等
- 学习率（Learning Rate）：决定了模型每次更新时权重改变的幅度。过大可能会错过最优解；过小会学得很慢或陷入局部最优解
- 训练轮数（Epochs）：太少模型会欠拟合（没学好），太大会过拟合（学过头了）
- 最大梯度范数（Max Gradient Norm）：当梯度的值超过这个范围时会被截断，防止梯度爆炸现象
- 最大样本数（Max Samples）：每轮训练中最多使用的样本数
- 计算类型（Computation Type）：在训练时使用的数据类型，常见的有 float32 和 float16。在性能和精度之间找平衡
- 截断长度（Truncation Length）：处理长文本时如果太长超过这个阈值的部分会被截断掉，避免内存溢出
- 批处理大小（Batch Size）：由于内存限制，每轮训练我们要将训练集数据分批次送进去，这个批次大小就是 Batch Size
- 梯度累积（Gradient Accumulation）：默认情况下模型会在每个 batch 处理完后进行一次更新一个参数，但你可以通过设置这个梯度累计，让他直到处理完多个小批次的数据后才进行一次更新
- 验证集比例（Validation Set Proportion）：数据集分为训练集和验证集两个部分，训练集用来学习训练，验证集用来验证学习效果如何
- 学习率调节器（Learning Rate Scheduler）：在训练的过程中帮你自动调整优化学习率
页面上点击启动训练，或复制命令到终端启动训练
- 实践中推荐用 nohup 命令将训练任务放到后台执行，这样即使关闭终端任务也会继续运行。同时将日志重定向到文件中保存下来
在训练过程中注意观察损失曲线，尽可能将损失降到最低
- 如损失降低太慢，尝试增大学习率
- 如训练结束损失还呈下降趋势，增大训练轮数确保拟合

Tips：使用`nvidia-smi`和`kill命令`

当训练模型时，如果中断了训练进程，可能会导致显存被占满。此时可以使用以下命令查看和释放显存：

使用nvidia-smi查看GPU使用情况
使用ps aux | grep python查看进程号
使用kill -9 <进程号>结束进程，释放显存

9. 微调结束，评估微调效果

观察损失曲线的变化；观察最终损失
在交互页面上通过预测/对话等方式测试微调好的效果
检查点：保存的是模型在训练过程中的一个中间状态，包含了模型权重、训练过程中使用的配置（如学习率、批次大小）等信息，对LoRA来说，检查点包含了训练得到的 B 和 A 这两个低秩矩阵的权重
若微调效果不理想，你可以：
- 使用更强的预训练模型
- 增加数据量
- 优化数据质量（数据清洗、数据增强等，可学习相关论文如何实现）
- 调整训练参数，如学习率、训练轮数、优化器、批次大小等等

10. 导出合并后的模型

为什么要合并：因为 LoRA 只是通过低秩矩阵调整原始模型的部分权重，而不直接修改原模型的权重。合并步骤将 LoRA 权重与原始模型权重融合生成一个完整的模型
先创建目录，用于存放导出后的模型

mkdir -p export

在页面上配置导出路径，如expert/Qwen2.5-1.5B-Instruct-LoRA-v1，导出即可。

11. 测试微调完的模型

选择模型 Qwen2.5-1.5B-Instruct

输入下载的模型路径 expert/Qwen2.5-1.5B-Instruct-LoRA-v1
选择chat模式，点击加载模型，加载完后就可以进行聊天测试了

【大模型微调】魔搭社区GPU进行LLaMA-Factory微调大模型自我认知

文章概要： 本文是一篇详细的技术教程，介绍如何使用魔搭社区（ModelScope）的GPU资源来进行LLaMA-Factory的模型微调。文章分为11个主要步骤，从环境准备到最终的模型测试，系统地介绍了整个微调流程。主要内容包…...

编程日记 2026/2/7 8:21:55

基于MATLAB编程针对NCV检测数据去漂移任务的完整解决方案

以下为针对NCV检测数据去漂移任务的完整解决方案，基于MATLAB编程实现，结构清晰，内容详实，满足技术深度。 NCV信号尾部漂移处理与分析 1. 任务背景与目标神经传导速度（NCV）检测信号易受环境干扰与设备漂移…...

编程日记 2026/1/21 19:17:43

【数据结构】哈希表的实现

文章目录 1. 哈希的介绍1.1 直接定址法1.2 哈希冲突1.3 负载因子1.4 哈希函数1.4.1 除法散列法/除留余数法1.4.2 乘法散列法1.4.3 全域散列法 1.5 处理哈希冲突1.5.1 开放地址法1.5.1.1 线性探测1.5.1.2 二次探测1.5.1.3 双重探测1.5.1.4 三种探测方法对比 1.6.3 链地址法 2. 哈…...

编程日记 2026/2/1 7:03:40

永磁同步电机控制算法--基于电磁转矩反馈补偿的新型IP调节器

一、基本原理先给出IP速度控制器还是PI速度控制器的传递函数： PI调节器 IP调节器从IP速度控制器还是PI速度控制器的传递函数可以看出，系统的抗负载转矩扰动能力相同,因此虽然采用IP速度控制器改善了转速环的超调问题，但仍然需要通过其他途…...

编程日记 2026/1/28 5:24:58

RabbitMQ 应用 - SpringBoot

以下介绍的是基于 SpringBoot 的 RabbitMQ 开发介绍 Spring Spring AMQP RabbitMQ RabbitMQ tutorial - "Hello World!" | RabbitMQ 工程搭建步骤: 1.引入依赖 2.编写 yml 配置,配置基本信息 3.编写生产者代码 4.编写消费者代码定义监听类,使用 RabbitListener…...

编程日记 2026/1/31 12:18:57

基于递归思想的系统架构图自动化生成实践

文章目录一、核心思想解析二、关键技术实现1. 动态布局算法2. 样式规范集成3. MCP服务封装三、典型应用场景四、最佳实践建议五、扩展方向一、核心思想解析本系统通过递归算法实现了Markdown层级结构到PPTX架构图的自动转换，其核心设计思想包含两个维度：数据结构递归：将…...

编程日记 2026/2/3 0:23:21

OpenGL Chan视频学习-9 Index Buffers inOpenGL

bilibili视频链接： 【最好的OpenGL教程之一】https://www.bilibili.com/video/BV1MJ411u7Bc?p5&vd_source44b77bde056381262ee55e448b9b1973 函数网站： docs.gl 说明： 1.之后就不再单独整理网站具体函数了，网站直接翻译会…...

编程日记 2026/1/28 2:41:25

《基于AIGC的智能化多栈开发新模式》研究报告重磅发布！ ——AI重塑软件工程，多栈开发引领未来

在人工智能技术迅猛发展的浪潮下，软件开发领域正经历一场前所未有的范式革命。在此背景下，由贝壳找房（北京）科技有限公司、中国信息通信研究院云计算与大数据研究所联合编写，阿里、腾讯、北京大学、南京大学、同济大学…...

编程日记 2025/12/14 0:45:38

Nginx安全防护与HTTPS部署实战

目录前言一. 核心安全配置1. 隐藏版本号2. 限制危险请求方法3. 请求限制（CC攻击防御）（1）使用nginx的limit_req模块限制请求速率（2）压力测试验证 4. 防盗链二. 高级防护1. 动态黑名单（1&#x…...

编程日记 2026/1/31 5:43:44

JAVA重症监护系统源码 ICU重症监护系统源码智慧医院重症监护系统源码

智慧医院重症监护系统源码 ICU重症监护系统源码开发语言：JavaVUE ICU护理记录：实现病人数据的自动采集，实时记录监护过程数据。支持主流厂家的监护仪、呼吸机等床旁数字化设备的数据采集。对接检验检查系统，实现自动化录入。喜…...

编程日记 2026/2/2 15:11:24

静态资源js,css免费CDN服务比较分析的 CDN 服务列表： BootCDN (https://cdn.bootcdn.net/ajax/libs)jsDelivr (主域名) (https://cdn.jsdelivr.net/npm)jsDelivr (Gcore 镜像) (https://gcore.jsdelivr.net/npm)UNPKG (https://unpkg.com)ESM (https://esm.sh)By…...

编程日记 2025/7/28 23:38:09

组合型回溯＋剪枝

本篇基于b站灵茶山艾府。 77. 组合给定两个整数 n 和 k，返回范围 [1, n] 中所有可能的 k 个数的组合。你可以按任何顺序返回答案。示例 1： 输入：n 4, k 2 输出： [[2,4],[3,4],[2,3],[1,2],[1,3],[1,4], ]示例 2&#…...

编程日记 2025/9/27 1:20:59

python：机器学习（KNN算法）

本文目录： 一、K-近邻算法思想二、KNN的应用方式（ 一）分类流程（二）回归流程三、API介绍（一）分类预测操作（二）回归预测操作四、距离度量方法（一）…...

编程日记 2026/2/2 9:47:20

【笔记】2025 年 Windows 系统下 abu 量化交易库部署与适配指南

#工作记录前言在量化交易的学习探索中，偶然接触到 2017 年开源的 abu 量化交易库，其代码结构和思路对新手理解量化回测、指标分析等基础逻辑有一定参考价值。然而，当尝试在 2025 年的开发环境中部署这个久未更新的项目时，遇到…...

编程日记 2026/2/1 7:30:52

小程序 - 视图与逻辑

个人简介 👨‍💻‍个人主页：魔术师 📖学习方向：主攻前端方向，正逐渐往全栈发展 🚴个人状态：研发工程师，现效力于政务服务网事业 🇨🇳人生格言： “心有多大，舞台就有多大。” 📚推荐学习： 🍉Vue2 🍋Vue3 🍓Vue2/3项目实战 🥝Node.js实战 🍒T…...

编程日记 2026/1/31 7:42:40

ChatGPT Plus/Pro 订阅教程(支持支付宝)

订阅 ChatGPT Plus GPT-4 最简单，成功率最高的方案 1. 登录 chat.openai.com 依次点击 Login ，输入邮箱和密码 2. 点击升级 Upgrade 登录自己的 OpenAI 帐户后，点击左下角的 Upgrade to Plus，在弹窗中选择 Upgrade plan。如果…...

编程日记 2026/1/31 2:39:10

[蓝帽杯 2022 初赛]网站取证_2

一、找到与数据库有关系的PHP文件打开内容如下，发现数据库密码是函数my_encrypt()返回的结果。二、在文件夹encrypt中找到encrypt.php,内容如下，其中mcrypt已不再使用，所以使用php>7版本可能没有执行结果，需要换成较低版本…...

编程日记 2026/2/1 6:11:36

vue3+Pinia+element-plus 后台管理系统项目实战记录

vue3Piniaelement-plus 后台管理系统项目实战记录参考项目：https://www.bilibili.com/video/BV1L24y1n7tB 全局api provide、inject vue2 import api from/api vue.propotype.$api apithis.$api.xxxvue3 import api from/api app.provide($api, api)import {…...

编程日记 2025/12/5 18:17:24

安装 Node.js 和配置 cnpm 镜像源

一、安装 Node.js 方式一：官网下载（适合所有系统） 访问 Node.js 官网推荐选择 LTS（长期支持）版本，点击下载安装包。根据系统提示一步步完成安装。方式二：通过包管理器安装（建…...

编程日记 2026/2/1 7:26:19

MacOS内存管理-删除冗余系统数据System Data

文章目录一、问题复现二、解决思路三、解决流程四、附录一、问题复现以题主的的 Mac 为例，我们可以看到System Data所占数据高达77.08GB，远远超出系统所占内存二、解决思路占据大量空间的是分散在系统中各个位置Cache数据； 其中容量最…...

编程日记 2026/1/29 11:10:32

电脑开机后长时间黑屏，桌面图标和任务栏很久才会出现，但是可通过任务管理器打开应用程序，如何解决

目录一、造成这种情况的主要原因（详细分析）： （1）启动项过多，导致系统资源占用过高（最常见） 检测方法： （2）系统服务启动异常（常见&a…...

编程日记 2025/11/29 3:44:01

行为型：中介者模式

目录 1、核心思想 2、实现方式 2.1 模式结构 2.2 实现案例 3、优缺点分析 4、适用场景 5、注意事项 1、核心思想目的：通过引入一个中介对象来封装一组对象之间的交互，解决对象间过度耦合、频繁交互的问题。不管是对象引用维护还是消息的转发&am…...

编程日记 2026/1/29 12:10:42

光谱相机在生态修复监测中的应用

光谱相机通过多维光谱数据采集与智能分析技术，在生态修复监测中构建起‌“感知-评估-验证”‌的全周期管理体系，其核心应用方向如下： 一、土壤修复效能量化评估 ‌重金属污染动态监测‌ 通过短波红外（1000-2500nm）波…...

编程日记 2026/2/6 7:36:44

吉林大学操作系统上机实验五（磁盘引臂调度算法(scan算法）实现）

本次实验无参考，从头开始实现。一.实验内容模拟实现任意一个磁盘引臂调度算法，对磁盘进行移臂操作列出基于该种算法的磁道访问序列，计算平均寻道长度。二.实验设计假设磁盘只有一个盘面，并且磁盘是可移动头磁盘。磁盘是可…...

编程日记 2026/1/30 13:57:29

【深度学习-pytorch篇】4. 正则化方法（Regularization Techniques）

正则化方法（Regularization Techniques） 1. 目标理解什么是过拟合及其影响掌握常见正则化技术：L2 正则化、Dropout、Batch Normalization、Early Stopping能够使用 PyTorch 编程实现这些正则化方法并进行比较分析 2. 数据构造与任务设定 …...

编程日记 2025/12/13 6:10:06

ESP8266+STM32 AT驱动程序,心知天气API 记录时间: 2025年5月26日13:24:11

接线为串口2 接入ESP8266 esp8266.c #include "stm32f10x.h"//8266预处理文件 #include "esp8266.h"//硬件驱动 #include "delay.h" #include "usart.h"//用得到的库 #include <string.h> #include <stdio.h> #include …...

编程日记 2026/2/3 21:30:47

WPF【11_5】WPF实战-重构与美化(MVVM 实战)

11-10 【重构】创建视图模型，显示客户列表正式进入 MVVM 架构的代码实战。在之前的课程中， Model 和 View 这部分的代码重构实际上已经完成了。 Model 就是在 Models 文件夹中看到的两个文件， Customer 和 Appointment。而 View 则是所有与…...

编程日记 2026/1/22 23:08:08

⭐️⭐️⭐️ 模拟题及答案 ⭐️⭐️⭐️ 大模型Clouder认证：RAG应用构建及优化

考试注意事项：一、单选题（21题）检索增强生成（RAG）的核心技术结合了什么？ A. 图像识别与自然语言处理 B. 信息检索与文本生成 C. 语音识别与知识图谱 D. 数据挖掘与机器学习 RAG技术中，“建立索引”步骤不包括以下哪项操作？ A. 将文档解析为纯文本 B. 文本片段分割（…...

编程日记 2026/2/5 20:11:00

kali系统的安装及配置

1 kali下载 Kali 下载地址：Get Kali | Kali Linux （https://www.kali.org/get-kali） 下载 kali-linux-2024.4-installer-amd64.iso (http://cdimage.kali.org/kali-2024.4/) 2. 具体安装步骤： 2.1 进入官方地址，点击…...

编程日记 2026/2/5 18:10:40