当前位置：首页 > news >正文

使用 LlamaFactory 结合开源大语言模型实现文本分类：从数据集构建到 LoRA 微调与推理评估

news 2026/5/19 15:29:39

文章目录

- 背景介绍
- - 文本分类数据集
  - Lora 微调
  - 模型部署与推理
  - - 期待模型的输出结果
- 文本分类评估代码

背景介绍

本文将一步一步地，介绍如何使用llamafactory框架利用开源大语言模型完成文本分类的实验，以 LoRA微调 qwen/Qwen2.5-7B-Instruct 为例。

文本分类数据集

按照 alpaca 样式构建数据集，并在将其添加到 LLaMA-Factory/data/dataset_info.json 文件中。如此方便直接根据自定义数据集的名字，获取到数据集的数据。

[{"instruction": "","input": "请将以下文本分类到一个最符合的类别中。以下是类别及其定义：\n\n要求}}\nreason: \nlabel:","output": "reason: 该文本主要讨论的是xxx。因此，该文本最符合“社会管理”这一类别。\n\nlabel: 社会管理"},...
]

Lora 微调

llamafactory 框架支持网页端训练，但本文选择在终端使用命令行微调模型。

模型微调训练的参数较多，将模型训练的参数都存储在 yaml 文件中。

qwen_train_cls.yaml 的文件内容如下：

### model
model_name_or_path: qwen/Qwen2.5-7B-Instruct### method
stage: sft
do_train: true
finetuning_type: lora
lora_target: all### dataset
# dataset_dir: data
dataset_dir: LLaMA-Factory/data/ 填写相应路径
dataset: 数据集名 
template: qwen
cutoff_len: 2048
# max_samples: 1000 若数据集较大，可随机筛选一部分数据微调模型
overwrite_cache: true
preprocessing_num_workers: 16### output
output_dir: output/qwen2.5-7B/cls_epoch2 训练的LoRA权重输出路径
logging_steps: 10
save_steps: 500
plot_loss: true
overwrite_output_dir: true### train
per_device_train_batch_size: 1
gradient_accumulation_steps: 8
learning_rate: 1.0e-4
num_train_epochs: 2.0
lr_scheduler_type: cosine
warmup_ratio: 0.1
bf16: true
ddp_timeout: 180000000### eval
# val_size: 0.1
# per_device_eval_batch_size: 1
# eval_strategy: steps
# eval_steps: 500

使用下述命令启动模型训练：

nohup llamafactory-cli train qwen_train_cls.yaml > qwen_train_cls.log 2>&1 &

命令分解介绍：
nohup, 全称为 “no hangup”（不要挂起）。它的作用是让命令在退出终端后仍然运行，防止因关闭终端或会话中断导致进程被终止。
默认情况下，nohup 会将输出重定向到 nohup.out 文件，但这里已经显式指定了输出位置。
llamafactory-cli train qwen_train_cls.yaml 运行 llamafactory-cli 工具，用于执行训练任务。
train 是子命令，表示进行训练。
qwen_train_cls.yaml 是一个配置文件，包含训练所需的超参数、数据路径、模型结构等。
qwen_train_cls.log
将标准输出 (stdout) 重定向到 qwen_train_cls.log 文件中。
即运行过程中的正常日志信息会被记录到这个文件。
2>&1: 将标准错误输出 (stderr) 重定向到标准输出 (stdout)。
这样，所有错误信息也会被写入到 qwen_train_cls.log 文件中。
&: 表示将整个命令放到后台运行。终端会立即返回，您可以继续进行其他操作，而不用等待命令完成。

模型部署与推理

模型训练完成后得到 Lora 权重。相关微调模型部署与推理，请浏览下述两篇文章，相比llamafactory原本的模型推理速度更快。

基于 LLamafactory 的异步API高效调用实现与速度对比.https://blog.csdn.net/sjxgghg/article/details/144176645
基于 LlamaFactory 的 LoRA 微调模型支持 vllm 批量推理的实现

目前llamafactory已经支持 vllm_infer 推理，这个PR是笔者提交的：

llamafactory vllm.https://github.com/hiyouga/LLaMA-Factory/blob/main/scripts/vllm_infer.py

期待模型的输出结果

下述是使用 llamafactory 推理出的数据格式，建议大家在做推理评估时，也做成这个样式，方便统一评估。

{"prompt": "请将以下文本分类到一个最符合的类别中。以下是类别及其定义：...", "predict": "\nreason: 该文本主要讨论了改革创新发展、行政区划调整、行政管理体制等方面的内容，涉及到体制机制的改革与完善，旨在推动高质量发展和提升生活品质。这些内容与社会管理和经济管理密切相关，但更侧重于行政管理和社会治理的改革，因此更符合“社会管理”这一类别。\n\nlabel: 社会管理", 		 "label": "reason: 该文本主要讨论的是改革创新、行政区划调整、体制机制障碍的破除以及行政管理体制等与政府治理和社会管理相关的内容，强调了与高质量发展和生活品质的关系。这些内容显示出对社会管理和行政管理的关注，尤其是在推动城乡一体化和适应高质量发展要求方面。因此，该文本最符合“社会管理”这一类别。\n\nlabel: 社会管理"
}

文本分类评估代码

import os
import re
import jsonfrom sklearn.metrics import classification_report, confusion_matrix# 文本类别
CLASS_NAME = ["产业相关",..."法律法规与行政事务","其他",
]def load_jsonl(file_path):"""加载指定路径的 JSON 文件并返回解析后的数据。:param file_path: JSON 文件的路径:return: 解析后的数据（通常是字典或列表）:raises FileNotFoundError: 如果文件未找到:raises json.JSONDecodeError: 如果 JSON 格式不正确"""data = []try:with open(file_path, "r", encoding="utf-8") as file:for line in file:tmp = json.loads(line)data.append(tmp)except FileNotFoundError as e:print(f"文件未找到：{file_path}")raise eexcept json.JSONDecodeError as e:print(f"JSON 格式错误：{e}")raise ereturn datadef parser_label(text: str):pattern = r"label[:：\s\.\d\*]*([^\s^\*]+)"matches = re.findall(pattern, text, re.DOTALL)if len(matches) == 1:return matches[0]return Nonedef trans2num(item):predict = parser_label(item["predict"])label = parser_label(item["label"])predict_idx = -1label_idx = -1for idx, cls_name in enumerate(CLASS_NAME):if predict == cls_name:predict_idx = idxif label == cls_name:label_idx = idxreturn predict_idx, label_idxdef cls_eval(input_file):data = load_jsonl(file_path=input_file)predicts = []labels = []for item in data:predict, label = trans2num(item)if label == -1:continuepredicts.append(predict)labels.append(label)return classification_report(predicts, labels, output_dict=False)

本文使用了大模型生成式预测文本类别，我没有使用结构化输出的方式，大家可以使用结构化的json格式输出，这样在提取大模型预测结果的时候会方便很多。

大家按照自己模型的输出结果，修改parser_label 函数，这个函数用于从大模型的输出结果提取label。

cls_eval("xxx/generated_predictions.jsonl")

就会得到下述的输出结果：

-1 代表模型预测的类别不在给定的类别中。
在这里插入图片描述

使用 LlamaFactory 结合开源大语言模型实现文本分类：从数据集构建到 LoRA 微调与推理评估

文章目录背景介绍文本分类数据集Lora 微调模型部署与推理期待模型的输出结果文本分类评估代码背景介绍本文将一步一步地，介绍如何使用llamafactory框架利用开源大语言模型完成文本分类的实验，以 LoRA微调 qwen/Qwen2.5-7B-Instruct 为例。文本分类…...

编程日记 2024/12/7 13:36:16

Python基础学习总结篇

Python基础学习_01注释、变量、计算、打印 Python基础学习-02转义、输入、函数 Python基础学习-03逻辑分支语句、循环 Python基础学习-04列表List Python基础学习-05元组 tuple Python基础学习-06字典Dict Python基础学习-07不可重复的set集合 Python基础学习-08字符串 …...

编程日记 2024/12/7 13:35:14

8. Debian系统中显示屏免密码自动登录

本文介绍如何在Debian系统上，启动后，自动免密登录，不卡在登录界面。 1. 修改lightDM配置文件嵌入式Debian系统采用lightDM显示管理器，所以，一般需要修改它的配置文件/etc/lightdm/lightdm.conf，找到[Seat…...

编程日记 2024/12/7 13:33:12

1、下载nginx相关依赖包 sudo apt-get install gccsudo apt-get install libpcre3 libpcre3-devsudo apt-get install zlib1g zlib1g-devsudo sudo apt-get install opensslsudo apt-get install libssl-devsudo apt install make2、进入想下载安装包位置 cd /usr/local3、通…...

编程日记 2024/12/7 13:28:06

SQLServer中使用ISNULL替换为指定的替换值

ISNULL (Transact-SQL) 适用于： SQL ServerAzure SQL 数据库Azure SQL 托管实例Azure Synapse Analytics 分析平台系统 (PDW)Microsoft Fabric 中的 SQL 分析端点Microsoft Fabric 中的仓库 NULL替换为指定的替换值。 1、语法 ISNULL ( check_expression , rep…...

编程日记 2024/12/7 13:27:05

深入浅出：PHP函数的定义与使用

文章目录前言什么是函数定义函数语法示例调用函数示例参数传递按值传递示例按引用传递示例默认参数示例可变数量的参数示例返回值示例变量作用域全局作用域示例局部作用域示例静态作用域示例匿名函数示例闭包示例递归函数示例内置函数常见内置函数示例用户自定义函数示…...

编程日记 2024/12/7 13:26:04

C++知识整理day4内存管理——new和delete详解

文章目录 1.C/C内存分布2.C语言中动态内存管理：malloc/realloc/calloc3.C内存管理方式3.1 new/delete操作内置类型3.2 new和delete操作自定义类型 4.malloc/free和new/delete到底什么区别？4.1 对于自定义类型4.2 对于自定义类型4.3 总结：它们…...

编程日记 2024/12/7 13:25:03

部署项目报错

vue2项目部署后 Error: Cannot find module /views/*** 1.起因登录页、首页等静态页面可以正常进入，后端访问也正常，可以获取到验证码。但是登录之后会发现首页空白或者进入不到首页 F12查看有报错信息：Error: Cannot find module ‘/v…...

编程日记 2024/12/7 13:24:02

专业140+总分420+上海交通大学819考研经验上交电子信息与通信工程，真题，大纲，参考书。博睿泽信息通信考研论坛，信息通信考研Jenny

考研结束，专业819信号系统与信号处理140，总分420，终于梦圆交大，高考时敢都不敢想目标，现在已经成为现实，考研后劲很大，这一年的复习经历，还是历历在目，整理一下&#xff…...

编程日记 2024/12/7 13:23:01

电子信息工程自动化单片机自动门控制系统设计

摘要伴随着社会经济的发展进步、科学技术的发展进步以及人民群众日常生活质量的逐渐提升，自动门开始全面进入人民群众的生活，逐渐发展成为了宾馆、大型超市、政府等当代建筑里必须配备的设备，是建筑自动智能化综合水平的主要标准之一。它具…...

编程日记 2024/12/7 13:18:56

T C P

文章目录基于UDP应用场景 TCP协议TCP 协议段格式确认应答机制16位窗口大小下定义32位序号和32位确认序号基于UDP应用场景 UDP，tcp这样的协议根本不是直接谈UDP。tcp的应用场景，一定是上层写了应用层协议，所以才有UDP协议的应用场景。比…...

编程日记 2024/12/7 13:17:55

PDF与PDF/A的区别及如何使用Python实现它们之间的相互转换

目录概述 PDF/A 是什么？与 PDF 有何不同？ 用于实现 PDF 与 PDF/A 相互转换的 Python 库 Python 实现 PDF 转 PDF/A 将 PDF 转换为 PDF/A-1a 将 PDF 转换为 PDF/A-1b 将 PDF 转换为 PDF/A-2a 将 PDF 转换为 PDF/A-2b 将 PDF 转换为 PDF/A-3a 将…...

编程日记 2024/12/7 13:15:53

【Linux课程学习】：进程地址空间，小故事理解虚拟地址，野指针

🎁个人主页：我们的五年 🔍系列专栏：Linux课程学习 🌷追光的人，终会万丈光芒 🎉欢迎大家点赞👍评论📝收藏⭐文章 Linux学习笔记： https://blog.csdn.net/…...

编程日记 2024/12/7 13:12:47

解决el-select数据量过大的3种方法

在准备上线的后台管理系统中，我们发现有两个下拉框（select），其选项数据量超过 1 万条，而在测试环境中这些数据量只有几百条。这导致在页面加载时，浏览器性能出现瓶颈，页面卡顿甚至崩溃。想了一…...

编程日记 2024/12/7 13:09:44

速盾：高防cdn预热指定url就只刷新这个吗？

高防CDN预热是指在网站上线或更新之前，将网站内容缓存到CDN节点服务器上，以提高用户访问网站的速度和稳定性。通常，预热可以通过指定URL来进行，而不是刷新整个网站。预热指定URL的好处是可以选择性地进行缓存刷新，而…...

编程日记 2024/12/7 13:08:44

aarch64-linux-gnu-g++在windous不能用

aarch64-linux-gnu-g 是针对 ARM 64 位架构（aarch64）的交叉编译器，它通常用于在一个平台（例如 x86 的 Linux 系统）上为另一个平台（例如 ARM 设备）编译代码。aarch64-linux-gnu-g 是 Linux 环境下…...

编程日记 2024/12/7 13:07:43

01_Node.js入门 (黑马)

01_Node.js入门知识点自测从 index.js 出发，访问到 student/data.json 的相对路径如何写? A：../public/teacher/data.json B：./public/student/data.json C：../student/data.json <details><summary>答案</sum…...

编程日记 2024/12/7 13:05:39

记一次搞校园网的经历

接教室的校园网，到另一个屋子玩电脑，隔墙想放大一下AP的信号，发现死活不行这是现状由于校园网认证的存在，无法用桥接，桥接需要路由器有IP，而这个IP无法用未刷机的路由器来打开校园网页面认证解决将一…...

编程日记 2024/12/7 13:02:36

沃德云商协系统微信小程序PHP+Uniapp

“多组织”的云服务平台，打造总商会、总协会、总校友会、工商联等多组织无障碍沟通合作平台，让各大分会、各大分校友会、分组织实现轻松管理，线上宣传展示、商机挖掘、会员管理、会员服务、跨界交流等, 借助沃德云商协平台系统，让…...

编程日记 2024/12/7 13:01:36

Leecode刷题C语言之可以被进一步捕获的棋子数

执行结果:通过执行用时和内存消耗如下： 代码如下： int numRookCaptures(char** board, int boardSize, int* boardColSize) {int cnt 0, st 0, ed 0;int dx[4] {0, 1, 0, -1};int dy[4] {1, 0, -1, 0};for (int i 0; i < 8; i) {for (int j…...

编程日记 2024/12/7 12:59:34

英雄联盟录像编辑终极指南：5分钟掌握免费开源工具League Director

英雄联盟录像编辑终极指南：5分钟掌握免费开源工具League Director 【免费下载链接】leaguedirector League Director is a tool for staging and recording videos from League of Legends replays 项目地址: https://gitcode.com/gh_mirrors/le/leaguedirector …...

编程新知 2026/5/19 15:18:13

RK3562核心板选型与开发实战：从硬件拆解到软件适配

1. 项目概述：为什么是PET_RK3562_CORE？ 在嵌入式开发领域，尤其是智能硬件和物联网设备的设计中，核心板的选择往往是决定项目成败、成本控制和技术路线的关键一步。最近几年，基于ARM架构的国产化芯片方案异军突起&#…...

编程新知 2026/5/19 15:13:58

并发编程小记1

什么时候用单线程，什么时候用多线程？图里展示了一个典型的网络请求场景：左侧处理耗时：1ms网络请求往返耗时：25ms 25ms 50ms右侧处理耗时：2ms整个流程总耗时：1ms 25ms 2ms 25ms 53ms这里的…...

编程新知 2026/5/19 13:57:22

3个神奇步骤：用QRazyBox轻松修复任何损坏的二维码

3个神奇步骤：用QRazyBox轻松修复任何损坏的二维码【免费下载链接】qrazybox QR Code Analysis and Recovery Toolkit 项目地址: https://gitcode.com/gh_mirrors/qr/qrazybox 你是否曾经遇到过这种情况：一张重要的二维码因为打印模糊、表面划伤或…...

编程新知 2026/5/19 13:23:43

从‘看’到‘穿透’：用Python实战解析不同SAR波段影像（以哨兵1号和林火监测为例）

从‘看’到‘穿透’：用Python实战解析不同SAR波段影像（以哨兵1号和林火监测为例） 当卫星划过天际，它携带的"眼睛"并非普通光学镜头，而是能穿透云层和黑暗的微波雷达。这种被称为合成孔径雷达（SAR…...

编程新知 2026/5/19 12:23:04

告别手动点点点：用pywinauto给微信做个自动化小助手（Python实战）

告别手动点点点：用pywinauto打造微信自动化小助手微信作为日常高频使用的通讯工具，每天重复的"文件传输助手"转发、消息发送等操作消耗着大量时间。本文将带你用pywinauto构建一个能自动完成这些任务的Python脚本，解放双手的同时深…...

编程新知 2026/5/19 12:21:04

【Android】CloneTTS最强朗读听书引擎-可克隆一切音色

【Android】CloneTTS最强朗读听书引擎-可克隆一切音色链接：https://pan.xunlei.com/s/VOsu4mh3O_d7zjeERkKPfcG4A1?pwddi3y# CloneTTS 是一款运行在安卓系统本地的文字转语音(TTS)原生引擎，允许用户离线克隆所需的声音并直接使用该声音来朗读书籍或长…...

编程新知 2026/5/19 11:15:55

别再只盯着RRT了！关节空间六次多项式规划，可能是更简单的机械臂避障方案

关节空间六次多项式规划：机械臂避障的优雅解法在工业机器人领域，路径规划一直是核心挑战之一。当机械臂需要在充满障碍物的环境中工作时，传统基于笛卡尔空间的规划方法常常面临逆运动学奇异、轨迹不平滑等问题。而基于关节空间的六次多项式规…...

编程新知 2026/5/19 11:07:28

3步掌握LRC歌词制作：开源工具的终极实践指南

3步掌握LRC歌词制作：开源工具的终极实践指南【免费下载链接】lrc-maker 歌词滚动姬｜可能是你所能见到的最好用的歌词制作工具项目地址: https://gitcode.com/gh_mirrors/lr/lrc-maker 还在为制作精准同步的歌词文件而烦恼吗？传统歌词…...

编程新知 2026/5/19 9:31:51

Allegro与OrCAD联动实操：如何安全高效地完成PCB位号‘反向同步’而不飞器件？

Allegro与OrCAD协同设计中的位号反标：规避风险的全流程实战指南在复杂电子系统设计领域，Cadence Allegro与OrCAD的协同工作流程已成为行业标准配置。当PCB布局工程师经过多轮迭代优化器件位置后，如何将最终的位号变更安全地反向同步到原理图…...

编程新知 2026/5/19 9:12:43

使用 LlamaFactory 结合开源大语言模型实现文本分类：从数据集构建到 LoRA 微调与推理评估

文章目录

背景介绍

文本分类数据集

Lora 微调

模型部署与推理

期待模型的输出结果

文本分类评估代码

相关文章：

使用 LlamaFactory 结合开源大语言模型实现文本分类：从数据集构建到 LoRA 微调与推理评估

Python基础学习总结篇

8. Debian系统中显示屏免密码自动登录

ubuntu安装nginx并设置开机自启动

SQLServer中使用ISNULL替换为指定的替换值

深入浅出：PHP函数的定义与使用

C++知识整理day4内存管理——new和delete详解

部署项目报错

专业140+总分420+上海交通大学819考研经验上交电子信息与通信工程，真题，大纲，参考书。博睿泽信息通信考研论坛，信息通信考研Jenny

电子信息工程自动化单片机自动门控制系统设计

T C P

PDF与PDF/A的区别及如何使用Python实现它们之间的相互转换

【Linux课程学习】：进程地址空间，小故事理解虚拟地址，野指针

解决el-select数据量过大的3种方法

速盾：高防cdn预热指定url就只刷新这个吗？

aarch64-linux-gnu-g++在windous不能用

01_Node.js入门 (黑马)

记一次搞校园网的经历

沃德云商协系统微信小程序PHP+Uniapp

Leecode刷题C语言之可以被进一步捕获的棋子数

英雄联盟录像编辑终极指南：5分钟掌握免费开源工具League Director

RK3562核心板选型与开发实战：从硬件拆解到软件适配

并发编程小记1

3个神奇步骤：用QRazyBox轻松修复任何损坏的二维码

从‘看’到‘穿透’：用Python实战解析不同SAR波段影像（以哨兵1号和林火监测为例）

告别手动点点点：用pywinauto给微信做个自动化小助手（Python实战）

【Android】CloneTTS最强朗读听书引擎-可克隆一切音色

别再只盯着RRT了！关节空间六次多项式规划，可能是更简单的机械臂避障方案

3步掌握LRC歌词制作：开源工具的终极实践指南

Allegro与OrCAD联动实操：如何安全高效地完成PCB位号‘反向同步’而不飞器件？