当前位置：首页 > news >正文

llama-factory SFT系列教程 (二)，大模型在自定义数据集 lora 训练与部署

news 2026/2/8 17:26:14

文章目录

- 简介
- 支持的模型列表
- 2. 添加自定义数据集
- 3. lora 微调
- 4. 大模型 + lora 权重，部署
- - 问题
- 参考资料

简介

文章列表：

llama-factory SFT系列教程 (一)，大模型 API 部署与使用
llama-factory SFT系列教程 (二)，大模型在自定义数据集 lora 训练与部署
llama-factory SFT系列教程 (三)，chatglm3-6B 命名实体识别实战

支持的模型列表

模型名	模型大小	默认模块	Template
Baichuan2	7B/13B	W_pack	baichuan2
BLOOM	560M/1.1B/1.7B/3B/7.1B/176B	query_key_value	-
BLOOMZ	560M/1.1B/1.7B/3B/7.1B/176B	query_key_value	-
ChatGLM3	6B	query_key_value	chatglm3
DeepSeek (MoE)	7B/16B/67B	q_proj,v_proj	deepseek
Falcon	7B/40B/180B	query_key_value	falcon
Gemma	2B/7B	q_proj,v_proj	gemma
InternLM2	7B/20B	wqkv	intern2
LLaMA	7B/13B/33B/65B	q_proj,v_proj	-
LLaMA-2	7B/13B/70B	q_proj,v_proj	llama2
Mistral	7B	q_proj,v_proj	mistral
Mixtral	8x7B	q_proj,v_proj	mistral
OLMo	1B/7B	att_proj	olmo
Phi-1.5/2	1.3B/2.7B	q_proj,v_proj	-
Qwen	1.8B/7B/14B/72B	c_attn	qwen
Qwen1.5	0.5B/1.8B/4B/7B/14B/72B	q_proj,v_proj	qwen
StarCoder2	3B/7B/15B	q_proj,v_proj	-
XVERSE	7B/13B/65B	q_proj,v_proj	xverse
Yi	6B/9B/34B	q_proj,v_proj	yi
Yuan	2B/51B/102B	q_proj,v_proj	yuan

参考自：https://zhuanlan.zhihu.com/p/689333581

默认模块 作为 --lora_target 参数的默认值，也可使用 --lora_target all 参数指定全部模块；
–template 参数可以是 default, alpaca, vicuna 等任意值。但“对话”（Chat）模型请务必使用对应的模板。

项目所支持模型的完整列表请参阅 constants.py。

2. 添加自定义数据集

LLaMA-Factory 数据集说明，参考该文件给出的说明，在dataset_info.json 文件中添加配置信息；

参考如下数据集格式，定义自定义数据集；

[{"instruction": "用户指令（必填）","input": "用户输入（选填）","output": "模型回答（必填）","system": "系统提示词（选填）","history": [["第一轮指令（选填）", "第一轮回答（选填）"],["第二轮指令（选填）", "第二轮回答（选填）"]]}
]

新数据集内容如下：
diy.json

[{"instruction": "你是谁？","input": "","output": "我是Qwen，edit by JieShin.","history": []},{"instruction": "你能帮我干些什么？","input": "","output": "我能和你互动问答，我的其他功能正在开发中。","history": []}
]

添加自定义数据集的步骤如下：

将 diy.json 文件保存到 LLaMA-Factory/data 文件夹下；

在这里插入图片描述

在 dataset_info.json 文件中，配置数据集
首先计算 diy.json 文件的sha1sum, sha1sum diy.json

vim dataset_info.json 添加自定义数据集的配置信息, 把 diy.json 文件的sha1 值添加到文件中，"diy" 为该数据集名；

3. lora 微调

使用配置好的 diy 数据集进行模型训练；

--model_name_or_path qwen/Qwen-7B，只写模型名，不写绝对路径可运行成功，因为配置了export USE_MODELSCOPE_HUB=1

查看配置是否生效，输出1 即为配置成功：
echo $USE_MODELSCOPE_HUB

在这里插入图片描述

CUDA_VISIBLE_DEVICES=0 python src/train_bash.py \
--stage sft \
--do_train \
--model_name_or_path qwen/Qwen-7B \
--dataset diy \
--template qwen \
--finetuning_type lora \
--lora_target c_attn \
--output_dir /mnt/workspace/llama_factory_demo/qwen/lora/sft \
--overwrite_cache \
--per_device_train_batch_size 4 \
--gradient_accumulation_steps 4 \
--lr_scheduler_type cosine \
--logging_steps 10 \
--save_strategy epoch \
--learning_rate 5e-5 \
--num_train_epochs 50.0 \
--plot_loss \
--fp16

训练完成的lora 权重，保存在下述文件夹中；
--output_dir /mnt/workspace/llama_factory_demo/qwen/lora/sft

模型的训练结果如下：
在这里插入图片描述

lora 训练后的权重如下图所示：
在这里插入图片描述

4. 大模型 + lora 权重，部署

由于llama-factory 不支持 qwen 结合 lora 进行推理，故需要把 lora 权重融合进大模型成一个全新的大模型权重；

可查看如下链接，了解如何合并模型权重：merge_lora GitHub issue

下述是合并 lora 权重的脚本，全新大模型的权重保存到 export_dir 文件夹；

CUDA_VISIBLE_DEVICES=0 python src/export_model.py \--model_name_or_path qwen/Qwen-7B \--adapter_name_or_path /mnt/workspace/llama_factory_demo/qwen/lora/sft/checkpoint-50 \--template qwen \--finetuning_type lora \--export_dir /mnt/workspace/merge_w/qwen \--export_size 2 \--export_legacy_format False

使用融合后到大模型进行推理，model_name_or_path 为融合后的新大模型路径

CUDA_VISIBLE_DEVICES=0 API_PORT=8000 python src/api_demo.py \--model_name_or_path /mnt/workspace/merge_w/qwen \--template qwen \--infer_backend vllm \--vllm_enforce_eager \
~

模型请求脚本

curl -X 'POST' \'http://0.0.0.0:8000/v1/chat/completions' \-H 'accept: application/json' \-H 'Content-Type: application/json' \-d '{"model": "string","messages": [{"role": "user","content": "你能帮我做一些什么事情？","tool_calls": [{"id": "call_default","type": "function","function": {"name": "string","arguments": "string"}}]}],"tools": [{"type": "function","function": {"name": "string","description": "string","parameters": {}}}],"do_sample": true,"temperature": 0,"top_p": 0,"n": 1,"max_tokens": 128,"stream": false
}'

模型推理得到了和数据集中一样的结果，这说明 lora 微调生效了；
在这里插入图片描述

以为设置了 "stop": "<|endoftext|>"，模型会在遇到结束符自动结束，但模型依然推理到了最长的长度后结束，设置的 stop 并没有生效；

在这里插入图片描述

llama-factory的作者表示还没有支持stop，万一未来支持了stop功能，大家可以关注这个issue support “stop” in api chat/completions #3114

问题

虽然设置了 "temperature": 0 ，但是模型的输出结果依然变动很大，运行3-4次后，才出现训练数据集中的结果；

参考资料

api 参数列表
使用LLaMa-Factory简单高效微调大模型
展示了支持的大模型列表；

llama-factory SFT系列教程 (二)，大模型在自定义数据集 lora 训练与部署

文章目录简介支持的模型列表2. 添加自定义数据集3. lora 微调4. 大模型 lora 权重，部署问题参考资料简介文章列表： llama-factory SFT系列教程 (一)，大模型 API 部署与使用llama-factory SFT系列教程 (二)，大模型在自定义数…...

编程日记 2024/4/15 19:37:59

C语言游戏实战（11）：贪吃蛇大作战（多人对战）

成果展示： 贪吃蛇（多人对战） 前言： 这款贪吃蛇大作战是一款多人游戏，玩家需要控制一条蛇在地图上移动，吞噬其他蛇或者食物来增大自己的蛇身长度和宽度。本游戏使用C语言和easyx图形库编写，旨在…...

编程日记 2024/4/15 19:34:56

腾讯测试岗位的面试经历与经验分享【一面、二面与三面】

腾讯两个月的实习一转眼就结束了,回想起当时面试的经过,感觉自己是跌跌撞撞就这么过了,多少有点侥幸.马上腾讯又要来校招了,对于有意愿想投腾讯测试岗位的同学们,写了一些那时候面试的经历和自己的想法,算不上经验，仅供参考吧! 一面 — —技术基础，全面…...

编程日记 2024/4/15 19:30:50

手机移动端网卡信息获取原理分析

有些场景我们需要获取当前手机上的网卡信息（如双卡双待、Wifi等）。本文准备研究一下这块的原理，以便更好的掌握相关技术原理。 1、底层系统接口 getifaddrs 使用 getifaddrs 接口可以达到我们的目的，该接口会返回本地所有网卡的信…...

编程日记 2024/4/15 19:29:49

无人新零售引领的创新浪潮

无人新零售引领的创新浪潮在数字化时代加速演进的背景下，无人新零售作为商业领域的一股新兴力量，正以其独特的高效性和便捷性重塑着传统的购物模式，开辟了一条充满创新潜力的发展道路。依托人脸识别、物联网等尖端技术，无人新…...

编程日记 2024/4/15 19:26:46

SD-WAN提升企业网络体验

在现代企业中，网络体验已成为提升工作效率与业务质量的关键因素。SD-WAN技术的出现，以其独特的优势，为企业提供了优化网络连接、加速数据传输、提升服务质量和应用访问体验，以及增强网络稳定性的解决方案。接下来，我们…...

编程日记 2024/4/15 19:25:45

Docker搭建Let‘s Encrypt

Let’s Encrypt是一个免费、开放和自动化的证书颁发机构（CA），它提供了一种简单、无需重复的机制来获取和更新SSL/TLS证书。Let’s Encrypt Docker镜像允许用户在容器化环境中轻松部署和使用Let’s Encrypt的服务。主要功能包括：…...

编程日记 2024/4/15 19:24:43

单链表讲解

一.链表的概念以及结构链表是一种物理结构上不连续，逻辑结构上连续的存储结构，数据元素的逻辑顺序是通过链表中的指针链接次序实现的。链表的结构与火车是类似的，一节一节的，数据就像乘客一样在车厢中一样。与顺序表不同的…...

编程日记 2024/4/15 19:22:41

DFS算法系列回溯

DFS算法系列-回溯文章目录 DFS算法系列-回溯1. 算法介绍2. 算法应用2.1 全排列2.2 组合2.3 子集 3. 总结 1. 算法介绍回溯算法是一种经典的递归算法，通常被用来解决排列问题、组合问题和搜索问题基本思想从一个初始状态开始，按一定的规则向前搜索&…...

编程日记 2024/4/15 19:21:40

Linux C应用编程：MQTT物联网

1 MQTT通信协议 MQTT（Message Queuing Telemetry Transport，消息队列遥测传输）是一种基于客户端-服务端架构的消息传输协议，如今，MQTT 成为了最受欢迎的物联网协议，已广泛应用于车联网、智能家居、即时聊…...

编程日记 2024/4/15 19:18:37

企业常用Linux文件命令相关知识+小案例

远程连接工具无法连接VMWARE： 如果发现连接工具有时连不上，ip存在，这时候我们查看网络编辑器，更多配置，看vnet8是不是10段，nat设置是否是正确的？ 软件重启一下虚机还原一下网络编辑器查看文件…...

编程日记 2024/4/15 19:16:35

Istio介绍

1.什么是Istio Istio是一个开源的服务网格（Service Mesh）框架，它提供了一种简单的方式来为部署在Kubernetes等容器编排平台上的微服务应用添加网络功能。Istio的核心功能包括： 服务治理：Istio能够帮助管理服务之间的…...

编程日记 2024/4/15 19:15:34

代码随想录算法训练营第四十七天|leetcode115、392题

一、leetcode第392题本题要求判断s是否为t的子序列，因此设置dp数组，dp[i][j]的含义是下标为i-1的子串与下标为j-1的子串相同字符的个数，可得递推公式是通过s[i-1]和t[j-1]是否相等区分。具体代码如下： class Solution { publ…...

编程日记 2024/4/15 19:14:33

将Ubuntu18.04默认的python3.6升级到python3.8

1、查看现有的 python3 版本 python3 --version 2、安装 python3.8 sudo apt install python3.8 3、将 python3.6 和 3.8 添加到 update-alternatives sudo update-alternatives --install /usr/bin/python3 python3 /usr/bin/python3.6 1 sudo update-alternatives --insta…...

编程日记 2024/4/15 19:13:32

Python和Java哪个更适合后端开发？

Python和Java都是强大的后端开发语言，它们各自有鲜明的特点和适用场景。选择哪一个更适合后端开发，主要取决于具体的项目需求、团队技术栈、个人技能偏好以及长期发展考虑等因素。下面是两者在后端开发中的优势和劣势： 「Python&#xff1…...

编程日记 2024/4/15 19:12:30

Python+pytest接口自动化之cookie绕过登录(保持登录状态)

前言我们今天来聊聊pythonpytest接口自动化之cookie绕过登录（保持登录状态），在编写接口自动化测试用例或其他脚本的过程中，经常会遇到需要绕过用户名/密码或验证码登录，去请求接口的情况，一是因为有时验证…...

编程日记 2024/4/15 19:11:28

什么数据集成（Data Integration）：如何将业务数据集成到云平台？

说到数据集成（Data Integration），简单地将所有数据倒入数据湖并不是解决办法。在这篇文章中，我们将介绍如何轻松集成数据、链接不同来源的数据、将其置于合适的环境中，使其具有相关性并易于使用。数据集成&#xff1…...

编程日记 2024/4/15 19:10:27

国外EDM邮件群发多少钱？哪个软件好？

在当今全球化市场环境下，电子邮件营销作为最有效的数字营销渠道之一，其影响力不容忽视。而高效精准的EDM（Electronic Direct Mail）邮件营销策略更是企业拓展海外市场、提升品牌知名度的关键手段。云衔科技以其创新的智能EDM邮件营…...

编程日记 2024/4/15 19:05:22

C语言入门算法——回文数

题目描述： 若一个数（首位不为零）从左向右读与从右向左读都一样，我们就将其称之为回文数。例如：给定一个十进制数 56，将 56 加 65（即把 56 从右向左读），得到 121 是一个…...

编程日记 2024/4/15 19:04:21

OceanBase—操作实践

文档结构 1、概念简介2、核心设计3、操作实践3.3、数据同步官方文档：https://www.oceanbase.com/docs/oceanbase-database-cn 1、概念简介版本分为社区版和企业版，其中企业版兼容MySQL 和Oracle数据库语法； 2、核心设计存储层复制层 …...

编程日记 2024/4/15 19:01:17

label-studio的使用教程(导入本地路径)

文章目录 1. 准备环境2. 脚本启动2.1 Windows2.2 Linux 3. 安装label-studio机器学习后端3.1 pip安装(推荐)3.2 GitHub仓库安装 4. 后端配置4.1 yolo环境4.2 引入后端模型4.3 修改脚本4.4 启动后端 5. 标注工程5.1 创建工程5.2 配置图片路径5.3 配置工程类型标签5.4 配置模型5.…...

编程新知 2026/2/7 20:40:53

Spring Boot 实现流式响应（兼容 2.7.x）

在实际开发中，我们可能会遇到一些流式数据处理的场景，比如接收来自上游接口的 Server-Sent Events（SSE） 或流式 JSON 内容，并将其原样中转给前端页面或客户端。这种情况下，传统的 RestTemplate 缓存机制会…...

编程新知 2025/8/11 8:18:44

Objective-C常用命名规范总结

【OC】常用命名规范总结文章目录【OC】常用命名规范总结1.类名（Class Name)2.协议名（Protocol Name)3.方法名（Method Name)4.属性名（Property Name）5.局部变量/实例变量（Local / Instance Variables&…...

编程新知 2025/12/14 22:33:06

04-初识css

一、css样式引入 1.1.内部样式 <div style"width: 100px;"></div>1.2.外部样式 1.2.1.外部样式1 <style>.aa {width: 100px;} </style> <div class"aa"></div>1.2.2.外部样式2 <!-- rel内表面引入的是style样…...

编程新知 2026/1/29 17:54:05

【Java_EE】Spring MVC

目录 Spring Web MVC 编辑注解 RestController RequestMapping RequestParam RequestParam RequestBody PathVariable RequestPart 参数传递注意事项编辑参数重命名 RequestParam 编辑编辑传递集合 RequestParam 传递JSON数据编辑RequestBody …...

编程新知 2026/2/1 16:32:53

python报错No module named ‘tensorflow.keras‘

是由于不同版本的tensorflow下的keras所在的路径不同，结合所安装的tensorflow的目录结构修改from语句即可。原语句： from tensorflow.keras.layers import Conv1D, MaxPooling1D, LSTM, Dense 修改后： from tensorflow.python.keras.lay…...

编程新知 2025/9/24 7:39:50

Webpack性能优化：构建速度与体积优化策略

一、构建速度优化 1、升级Webpack和Node.js 优化效果：Webpack 4比Webpack 3构建时间降低60%-98%。原因： V8引擎优化（for of替代forEach、Map/Set替代Object）。默认使用更快的md4哈希算法。AST直接从Loa…...

编程新知 2025/12/26 15:05:09

脑机新手指南（七）：OpenBCI_GUI：从环境搭建到数据可视化（上）

一、OpenBCI_GUI 项目概述 （一）项目背景与目标 OpenBCI 是一个开源的脑电信号采集硬件平台，其配套的 OpenBCI_GUI 则是专为该硬件设计的图形化界面工具。对于研究人员、开发者和学生而言，首次接触 OpenBCI 设备时，往…...

编程新知 2026/2/3 4:26:32

pikachu靶场通关笔记19 SQL注入02-字符型注入(GET)

目录一、SQL注入二、字符型SQL注入三、字符型注入与数字型注入四、源码分析五、渗透实战 1、渗透准备 2、SQL注入探测 （1）输入单引号 （2）万能注入语句 3、获取回显列orderby 4、获取数据库名database 5、获取表名…...

编程新知 2026/2/5 5:47:53

android RelativeLayout布局

<?xml version"1.0" encoding"utf-8"?> <RelativeLayout xmlns:android"http://schemas.android.com/apk/res/android"android:layout_width"match_parent"android:layout_height"match_parent"android:gravity&…...

编程新知 2026/2/6 13:49:41

文章目录

简介

支持的模型列表

2. 添加自定义数据集

3. lora 微调

4. 大模型 + lora 权重，部署

问题

参考资料

相关文章：