当前位置：首页 > article >正文

使用 LLaMA-Factory 微调 llama3 模型（二）

article 2026/2/8 12:01:44

使用 LLaMA-Factory 微调 llama3 模型

在这里插入图片描述

1. LLaMA-Factory模型介绍

https://github.com/hiyouga/LLaMA-Factory

LLaMA-Factory 是一个用于大型语言模型（LLM）微调的工具，它旨在简化大型语言模型的微调过程，使得用户可以快速地对模型进行训练和优化，以提高模型在特定任务上的性能。

这个工具支持多种预训练的大型语言模型，例如 LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Yi、 Gemma、Baichuan、ChatGLM 和 Phi 等。

LLaMA-Factory 的特点包括：

支持多种微调方法：它集成了连续预训练、有监督微调(SFT)、偏好对齐（RLHF）等多种微调方法。
高效的微调技术：与 ChatGLM 官方的 P-Tuning 微调相比，LLaMA Factory 的 LoRA 微调提供了显著的加速比，并且在特定任务上取得了更高的性能分数。
易用性：LLaMA-Factory 提供了高层次的抽象接口，使得开发者可以开箱即用，快速上手操作。
WebUI 支持：借鉴 Stable Diffusion WebUI，该项目提供了基于 gradio 的网页版工作台，方便初学者可以迅速上手操作。
模型导出和推理：支持模型的导出和推理，包括动态合并 LoRA 模型进行推理。
API Server：支持启动 API Server，使得训练好的模型可以通过网络接口被远程访问和调用。
评测 benchmark：提供了主流评测 benchmark 支持，如 mmlu、cmmlu、ceval 等，用于评估模型的泛化能力。

LLaMA-Factory 旨在降低大型语言模型微调的门槛，使得更多的研究者和开发者能够利用这些强大的模型来解决具体的实际问题。

1.1 环境配置

/mnt/workspace路径下执行

git clone https://github.com/hiyouga/LLaMA-Factory.git
conda create -n llama_factory python=3.10
conda activate llama_factory
cd LLaMA-Factory
pip install -e .[metrics]

1.2 下载llama3模型

/mnt/workspace路径下执行

mkdir models
cd models

/mnt/workspace/models路径下执行

pip install modelscope
git clone https://www.modelscope.cn/LLM-Research/Meta-Llama-3-8B-Instruct.git

2 llama3中文增强大模型(lora微调)

使用预训练模型+LoRA适配器的方式, 可以在不重新训练整个模型的情况下, 快速且高效地将模型适应到新的任务或领域, 如将英文模型适应到中文对话。这是一种常见且实用的微调方法。

2.1 模型训练

修改文件 /mnt/workspace/LLaMA-Factory/examples/train_lora/llama3_lora_sft.yaml

!上传配置文件
llama3_lora_sft.yaml

### model
model_name_or_path: /mnt/workspace/models/Meta-Llama-3-8B-Instruct### method
stage: sft
do_train: true
finetuning_type: lora
lora_target: all### dataset
dataset: alpaca_gpt4_zh
template: llama3
cutoff_len: 2048
max_samples: 1000
overwrite_cache: true
preprocessing_num_workers: 16### output
output_dir: /mnt/workspace/models/llama3-lora-zh
logging_steps: 10
save_steps: 500
plot_loss: true
overwrite_output_dir: true### train
per_device_train_batch_size: 1
gradient_accumulation_steps: 8
learning_rate: 1.0e-4
num_train_epochs: 3.0
lr_scheduler_type: cosine
warmup_ratio: 0.1
bf16: true
ddp_timeout: 180000000### eval
val_size: 0.1
per_device_eval_batch_size: 1
eval_strategy: steps
eval_steps: 500

yaml文件中的主要参数:

model

model_name_or_path: 指定预训练模型的路径或名称, 这里使用的是

/mnt/workspace/models/Meta-Llama-3-8B-Instruct 路径下的 Meta-Llama 3.8B 模型作为基础模型。
method
- stage: 表示训练阶段, 这里是 sft(Supervised Fine-Tuning)。
- do_train: 表示要进行训练。
- finetuning_type: 微调方法, 这里使用 LoRA(Low-Rank Adaptation)。
- lora_target: LoRA 作用的对象, 这里是 attention 层的 query 和 value 映射矩阵。
dataset
- dataset: 训练数据集名称,这里用的是 alpaca_gpt4_zh 数据集。（注意：数据集可以选择多个 alpaca_zh,alpaca_gpt4_zh,oaast_sft_zh）
- template: 数据集的格式模板,这里是 llama3。
- cutoff_len: 输入序列的最大长度, 超过会截断, 这里设为1024。
- max_samples: 从数据集中取的最大样本数, 这里取前1000个样本。
- preprocessing_num_workers: 数据预处理的进程数, 这里用16个进程并行处理。
output
- output_dir: 训练日志和模型的保存路径。
- logging_steps: 每隔多少步记录一次日志, 这里每100步记录一次。
- save_steps: 每隔多少步保存一次模型, 这里每500步保存一次。
- plot_loss: 是否绘制loss曲线图。
train
- per_device_train_batch_size: 每个设备上的训练批大小, 这里设为1。
- gradient_accumulation_steps: 梯度累积的步数, 这里累积8步才更新一次模型参数。
- learning_rate: 学习率, 这里设为0.0001。
- num_train_epochs: 训练的epoch数, 这里训练1个epoch。(还可以指定max_steps 3000 : 训练 3000步。注意：真正项目训练增大总步数；注意：num_train_epochs和max_steps之中选择一个）
- lr_scheduler_type: 学习率调度器类型, 这里用cosine, 即先warmup再降温。
- warmup_steps: 用初始学习率warmup的步数, 这里取总步数的10%。 fp16: 是否使用fp16混合精度训练, 以加速训练并减少显存占用。
eval
- val_size: 从训练集中划分出的验证集比例, 这里取10%作为验证集。
- per_device_eval_batch_size: 验证时每个设备的批大小,这里为1。
- evaluation_strategy: 验证策略, 这里根据steps数来验证。
- eval_steps: 每隔多少步验证一次, 这里每500步验证一次。

以上就是这个yaml配置文件的主要参数解释。这些参数设置了一个使用LoRA对Meta-Llama-3-8BInstruct模型在alpaca_gpt4_zh数据集上进行微调的训练过程。

2.2 克隆数据集

在/mnt/workspace/LLaMA-Factory/data路径下使用下面的命令克隆alpaca_gpt4_zh数据集

git clone https://www.modelscope.cn/datasets/llamafactory/alpaca_gpt4_zh.git

然后，修改dataset_info.json文件

!上传配置文件
data_info.json

上传alpaca_gpt4_data_zh.json到data目录下

2.3 训练

llamafactory-cli train examples/train_lora/llama3_lora_sft.yaml

1.4 推理

修改examples/inference/llama3_lora_sft.yaml

model_name_or_path: /mnt/workspace/models/Meta-Llama-3-8B-Instruct
adapter_name_or_path: /mnt/workspace/models/llama3-lora-zh
template: llama3
finetuning_type: lora

–model_name_or_path /mnt/workspace/models/Meta-Llama-3-8B-Instruct : 这个参数指定了预训练语言模型的名称或路径。在这个例子中, 使用的是位于 /mnt/workspace/models/MetaLlama-3-8B-Instruct 的Meta的Llama-3-8B-Instruct模型。这个模型将作为基础模型,在其上进行微调。
–adapter_name_or_path /mnt/workspace/models/llama3-lora-zh : 这个参数指定了用于微调的适配器(Adapter)的名称或路径。在这个例子中, 使用的是位于 /mnt/workspace/models/llama3-lora-zh 的适配器。这个适配器是通过LoRA技术在基础模型上微调得到的。
–template llama3 : 这个参数指定了对话模板的名称。模板定义了对话的格式和风格。在这个例子中, 使用的是名为 llama3 的模板。
–finetuning_type lora : 这个参数指定了微调的类型。在这个例子中, 使用的是LoRA技术进行微调。

/mnt/workspace/LLaMA-Factory路径下执行

llamafactory-cli chat examples/inference/llama3_lora_sft.yaml

使用 LLaMA-Factory 微调 llama3 模型（二）

使用 LLaMA-Factory 微调 llama3 模型 1. LLaMA-Factory模型介绍 https://github.com/hiyouga/LLaMA-FactoryLLaMA-Factory 是一个用于大型语言模型（LLM）微调的工具，它旨在简化大型语言模型的微调过程， 使得用户可以快速地对模型…...

编程日记 2026/2/6 12:16:29

并发编程--条件量与死锁及其解决方案

并发编程–条件量与死锁及其解决方案文章目录并发编程--条件量与死锁及其解决方案1.条件量1.1条件量基本概念1.2条件量的使用 2. 死锁 1.条件量 1.1条件量基本概念在许多场合中，程序的执行通常需要满足一定的条件，条件不成熟的时候，任务…...

编程日记 2026/2/5 9:36:05

JAVA SE 自我总结

目录 1. 字面常量 2. 数据类型 3. 变量 4. 类型转换 5. 实参和形参的关系 6. 数组 6.1 数组的概念 6.2 动态初始化 6.3 静态初始化 7. 数据区编辑 8. 数组的拷贝 8.1 赋值拷贝 8.2 方法拷贝 9. 代码块 10. 内部类 10.1 实例内部类 10.2 静态内部类 10.3 …...

编程日记 2026/2/4 5:28:23

RAG创建向量数据库：docsearch = FAISS.from_texts(documents, embeddings)

RAG创建向量数据库：docsearch = FAISS.from_texts(documents, embeddings) 代码解释 docsearch = FAISS.from_texts(documents, embeddings) 这行代码主要作用是基于给定的文本集合创建一个向量数据库（这里使用 FAISS 作为向量数据库工具）。具体说明如下： FAISS ：FAISS …...

编程日记 2026/1/31 15:39:36

虚幻引擎5-Unreal Engine笔记之“将MyStudent变量设置为一个BP_Student的实例”这句话如何理解？

虚幻引擎5-Unreal Engine笔记之“将MyStudent变量设置为一个BP_Student的实例”这句话如何理解？ code review! 文章目录虚幻引擎5-Unreal Engine笔记之“将MyStudent变量设置为一个BP_Student的实例”这句话如何理解？理解这句话的关键点1.类&#xff08…...

编程日记 2026/2/1 2:47:55

鸢尾花分类的6种机器学习方法综合分析与实现

鸢尾花分类的6种机器学习方法综合分析与实现首先我们来看一下对应的实验结果。数据准备与环境配置在开始机器学习项目前，首先需要准备编程环境和加载数据。以下代码导入必要的库并加载鸢尾花数据集： import numpy as np import pandas as pd impo…...

编程日记 2026/1/31 0:44:26

vite,Vue3,ts项目关于axios配置

一、安装依赖包 npm install axios -S npm install qs -S npm install js-cookie 文件目录二、配置线上、本地环境与src文件同级，分别创建本地环境文件 .env.development 和线上环境文件 .env.production # 本地环境 ENV = development # 本地环境接口地址 VITE_API_URL =…...

编程日记 2026/1/20 19:36:52

mysql：重置表自增字段序号

情况一：清空表数据后重置自增 ID 如果你希望清空表中的所有数据，并将自增 ID 重置为初始值（通常为 1） 1、truncate truncate table tb_dict; 2、delete 配合 alter 语句 delete from tb_dict; alter table tb_dict AUTO_INCR…...

编程日记 2025/9/10 22:28:51

STM32 模块化开发指南 · 第 4 篇用状态机管理 BLE 应用逻辑：分层解耦的实践方式

本文是《STM32 模块化开发实战指南》第 4 篇，聚焦于 BLE 模块中的状态管理问题。我们将介绍如何通过有限状态机（Finite State Machine, FSM）架构，实现 BLE 广播、扫描、连接等行为的解耦与可控，并配合事件队列驱动完成主从共存、低功耗友好、状态清晰的 BLE 应用。一、为…...

编程日记 2026/2/1 4:53:27

HTML — 浮动

浮动 HTML浮动（Float）是一种CSS布局技术，通过float: left或float: right使元素脱离常规文档流并向左/右对齐，常用于图文混排或横向排列内容。浮动元素会紧贴父容器或相邻浮动元素的边缘，但脱离文档流后可能导致父容器高…...

编程日记 2026/2/1 4:34:57

IP节点详解及国内IP节点获取指南

获取国内IP节点通常涉及网络技术或数据资源的使用，IP地址作为网络设备的唯一标识，对于网络连接和通信至关重要。详细介绍几种修改网络IP地址的常用方法，无论是对于家庭用户还是企业用户，希望能找到适合自己的解决方案。以下是方法…...

编程日记 2026/2/6 2:33:34

AD9253 LVDS 高速ADC驱动开发

1、查阅AD9253器件手册 2、查阅Xilinx xapp524手册 3、该款ADC工作在125Msps下，14bit - 2Lane - 1frame 模式。对应：data clock时钟为500M DDR mode。data line rate：1Gbps。frame clock：1/4 data clock 具体内容：…...

编程日记 2026/2/5 17:30:44

pycharm2024.3.5版本配置conda踩坑

配置解释器是conda时，死活选不到自己的环境看了很多，都是说要选scripts下的conda.exe 都没用主要坑在于这是新版的pycharm 是配置condabin 下的 conda.bat 参考：PyCharm配置PyTorch环境(完美解决找不到Conda可执行文件python.exe问题) …...

编程日记 2026/1/21 7:28:00

【异常处理】Clion IDE中cmake时头文件找不到头文件飘红

如图所示是我的clion项目目录我自定义的data_structure.h和func_declaration.h在unit_test.c中无法检索到 cmakelists.txt配置文件如下所示： cmake_minimum_required(VERSION 3.30) project(noc C) #设置头文件的目录 include_directories(${CMAKE_SOURCE_DIR}/…...

编程日记 2026/2/1 6:34:34

14 - VDMA彩条显示实验

文章目录 1 实验任务2 系统框图3 硬件设计4 软件设计 1 实验任务本实验任务是PS端写彩条数据至DDR3内存中，然后通过PL端的VDMA IP核将彩条数据通过HDMI接口输出显示。 2 系统框图本实验是用HDMI接口固定输出1080P的彩条图，所以： rgb2lc…...

编程日记 2026/2/7 7:12:55

每天学一个 Linux 命令（13）：touch

Linux 文件管理命令：touch touch 是 Linux 中一个简单但高频使用的命令，主要用于创建空文件或修改文件的时间戳（访问时间、修改时间）。它是文件管理和脚本操作的实用工具。 1. 命令作用创建空文件：快速生成一个或多个空白文件。更新时间戳：修改文件的访问时间（Access …...

编程日记 2025/12/4 15:01:31

PromptUp 网站介绍：AI助力，轻松创作

1. 网站定位与核心功能 promptup.net 可能是一个面向创作者、设计师、营销人员及艺术爱好者的AI辅助创作平台，主打零门槛、智能化的内容生成与优化。其核心功能可能包括： AI艺术创作：通过输入关键词、选择主题或拖放模板，快速生成风格多样的数字艺术作品（如插画、海报…...

编程日记 2026/1/15 14:42:02

高级java每日一道面试题-2025年3月26日-微服务篇[Nacos篇]-在Spring Cloud项目中如何集成Nacos？

如果有遗漏,评论区告诉我进行补充面试官: 在Spring Cloud项目中如何集成Nacos？ 我回答: 在Spring Cloud项目中集成Nacos，可以充分利用Nacos作为服务注册与发现中心以及配置管理中心的功能。以下是详细的步骤和说明，帮助你完成这一集成过程…...

编程日记 2026/1/8 13:03:52

AI 大语言模型 (LLM) 平台的整体概览与未来发展

📋 分析报告：AI 大语言模型 (LLM) 平台的整体概览与未来发展自动生成的结构化分析报告 💻 整体概述：AI LLM 平台的市场现状与发展动力随着人工智能技术的飞速发展，大语言模型（Large Language Models, L…...

编程日记 2025/11/26 0:37:07

Java中的Map vs Python字典：核心对比与使用指南

一、核心概念 1. 基本定义 Python字典（dict） ：动态类型键值对集合，语法简洁，支持快速查找。Java Map：接口，常用实现类如 HashMap、LinkedHashMap，需声明键值类型（泛型&…...

编程日记 2025/11/30 8:28:40

人工智能100问☞第3问：深度学习的核心原理是什么？

目录一、通俗解释二、专业解析三、权威参考深度学习的核心原理是通过构建多层神经网络结构，逐层自动提取并组合数据特征，利用反向传播算法优化参数，从而实现对复杂数据的高层次抽象和精准预测。一、通俗解释深度学习的核心原理，就像是教计算机像婴儿…...

编程日记 2026/1/7 19:40:24

金能电力：配电房为什么离不开绝缘胶板

在当今电力系统日益复杂、对供电稳定性与安全性要求极高的时代，每一个细节都关乎着电力供应的顺畅以及工作人员的生命安全。而配电房里常常被大家忽视的绝缘垫，实则起着至关重要的 “守护” 作用。今天，金能电力就来给大家详细讲讲配电房为什…...

编程日记 2026/2/7 9:15:49

Python 深度学习实战第1章什么是深度学习代码示例

第1章：什么是深度学习内容概要第1章介绍了深度学习的背景、发展历史及其在人工智能（AI）和机器学习（ML）中的地位。本章探讨了深度学习的定义、其与其他机器学习方法的关系，以及深度学习在近年来取得的成…...

编程日记 2026/2/6 14:01:57

【模块化拆解与多视角信息1】基础信息：隐藏的筛选规则——那些简历上没说出口的暗号

写在最前作为一个中古程序猿，我有很多自己想做的事情，比如埋头苦干手搓一个低代码数据库设计平台（目前只针对写java的朋友），比如很喜欢帮身边的朋友看看简历，讲讲面试技巧，毕竟工作这么多年，也做到过高管，有很多面人经历，意见还算有用，大家基本都能拿到想要的offe…...

编程日记 2025/12/16 13:25:40

【HD-RK3576-PI】VNC 远程桌面连接

在当今数字化时代，高效便捷的操作方式是技术爱好者与专业人士的共同追求。对于使用 HD-RK3576-PI微型单板计算机的用户而言，当面临没有显示屏的场景时，如何实现远程操作桌面系统呢？别担心，VNC 远程桌面连接将为你解决这…...

编程日记 2026/2/3 20:42:08

Vue.js 中 v-if 的使用及其原理

在 Vue.js 的开发过程中，条件渲染是一项极为常见的需求。v-if指令作为 Vue.js 实现条件渲染的关键手段，能够根据表达式的真假来决定是否渲染某一块 DOM 元素。它在优化页面展示逻辑、提升用户体验等方面发挥着重要作用。接下来，我们就深入探讨…...

编程日记 2025/9/11 1:52:07

电梯广告江湖的终局：分众 “吃掉” 新潮，是救赎还是迷途？

文 / 大力财经作者 / 魏力导言：商业世界的底层运行法则，从来都是能量流动的自然映射。宇宙第一性原理和运行法则是，能量大的吸引能量小的。电梯里的战争与和平，从对抗到合并，成为中国商业竞争史中关于博弈与进化的…...

编程日记 2026/2/2 3:44:56

第十六届蓝桥杯大赛软件赛省赛 C/C++ 大学B组

由于官方没有公布题目的数据, 所以代码仅供参考 1. 移动距离题目链接：P12130 [蓝桥杯 2025 省 B] 移动距离 - 洛谷【问题描述】小明初始在二维平面的原点，他想前往坐标 (233, 666)。在移动过程中，他只能采用以下两种移动方式&#xf…...

编程日记 2025/9/9 19:27:51

如何在 CentOS 7 系统上以容器方式部署 GitLab，使用 ZeroNews 通过互联网访问 GitLab 私有仓库，进行代码版本发布与更新

第 1 步： 部署 GitLab 容器在开始部署 GitLab 容器之前，您需要创建本地目录来存储 GitLab 数据、配置和日志： #创建本地目录 mkdir -p /opt/docker/gitlab/data mkdir -p /opt/docker/gitlab/config mkdir -p /opt/docker/gitlab/log#gi…...

编程日记 2026/2/2 5:17:16

第1章对大型语言模型的介绍

人类正处在一个关键转折点。自2012年起，基于深度神经网络的人工智能系统研发进入快速通道，将这一技术推向了新高度：至2019年底，首个能够撰写与人类文章真假难辨的软件系统问世，这个名为GPT-2（生成型预训练变…...

编程日记 2026/2/2 3:00:22