当前位置：首页 > article >正文

LLaMA-Factory 微调 Qwen2-7B-Instruct

article 2026/2/7 21:38:59

一、系统环境

使用的 autoDL 算力平台

1、下载基座模型

pip install -U huggingface_hub
export HF_ENDPOINT=https://hf-mirror.com  # （可选）配置 hf 国内镜像站huggingface-cli download --resume-download shenzhi-wang/Llama3-8B-Chinese-Chat --local-dir /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1

二、llama factory 框架

1、安装框架

git clone https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e .
pip install unsloth
pip install vllm==0.7.3
pip install torch==2.7.0

2、准备数据

fintech.json 数据格式如下：

[{"instruction": "国际经济与贸易专业的就业前景是怎样的？","input": "","output": "国际经济与贸易专业的就业前景较为广阔。随着全球经济一体化的深入发展，国际贸易交流不断增加，对专业人才的需求也日益增长。毕业生可以在跨国公司、国际贸易企业、金融机构以及政府部门等领域找到就业机会。此外，随着国家对外贸易政策的不断调整与改善，国际经济与贸易专业的就业前景也将更加乐观。综合来看，国际经济与贸易专业具有较高的就业率和就业质量，为毕业生提供了良好的职业发展空间。","history": [["从事国际经济与贸易专业的人可以有哪些工作机会？","国际经济与贸易专业拥有广泛的就业领域。毕业生可以在进出口公司、物流公司、保险公司、银行中介类货代以及报关员、报检员等职位工作。此外，他们还可以在政府机构如外贸局、外汇局、商检局、海关等部门从事涉外经济贸易的实际业务、管理、调研和宣传策划工作。国际经济与贸易专业还培养了高素质的复合型涉外经贸人才，使他们具备从事国际经贸工作的能力和竞争力。"]]},{"instruction": "列出三种创造性的解决问题的技巧。","input": "","output": "1. 头脑风暴: 这种技巧旨在通过鼓励尽可能多的想法来产生新颖的解决方案。与团队成员合作，不管想法多么离奇都应该提出来。最终，团队成员可以一起筛选想法，找到可行的解决方案。\n2. 逆向思维: 这种技巧要求您从问题的根源入手，从结局反推回去。基于这种思想，您可以回顾失败的原因，找到问题的根本所在，并找到更好的解决方案。\n3. 生命周期思考: 这种技巧倡导从全局的角度思考问题。它要求您考虑问题的各个环节，从问题的产生，发展到最终的解决方案。每一个阶段都需要考虑，确保解决方案是全面和持久的。","history": []},...{"instruction": "多元化是否更好","input": "","output": "多元化更好。\n\n通过多元化，不同的观点、文化、价值观和经验可以在一个社会中得到广泛的表达和交流。多元化可以促进创新和进步，因为它鼓励不同的思维方式和方法的交流和融合。不同的人才和智慧可以相互启发和补充，从而推动社会的发展。\n\n多元化还可以提供更多的选择和机会。在一个多元化的社会中，人们可以自由选择自己感兴趣的事业、教育、生活方式等。这种多样性可以促进个人的发展和幸福感，同时也为社会的进步和繁荣创造更多的机会。\n\n此外，多元化还有助于促进社会的稳定和和谐。在一个多元化的社会中，人们可以更好地理解和尊重彼此的差异，增进相互之间的理解和合作。这有助于减少冲突和分裂，促进社会的和谐和稳定。\n\n总的来说，多元化可以带来更多的创新、选择和机会，同时也有助于社会的稳定和和谐。因此，多元化是更好的选择。","history": []}]

identity.json 数据格式如下：

[{"instruction": "hi","input": "","output": "Hello! I am 东东, an AI assistant developed by 科研🐶. How can I assist you today?"},{"instruction": "hello","input": "","output": "Hello! I am 东东, an AI assistant developed by 科研🐶. How can I assist you today?"},...{"instruction": "Who are you?","input": "","output": "I am 东东, an AI assistant developed by 科研🐶. How can I assist you today?"}]

将训练数据放在 LLaMA-Factory/data/fintech.json
并且修改数据注册文件：LLaMA-Factory/data/dataset_info.json

"fintech": {"file_name": "fintech.json","columns": {"prompt": "instruction","query": "input","response": "output","history": "history"}
}

3、启动 webui 界面

注意：使用下述命令将远程端口转发到本地端口

ssh -CNg -L 7860:127.0.0.1:7860 -p 12610 root@connect.nmb2.seetacloud.com

webui 启动命令

cd LLaMA-Factory
llamafactory-cli webui

启动成功显示

四、在 webui 中设置相关参数

语言选择 zh，切换为中文界面
选择支持的模型名称，填上本地模型地址，微调方法选择 lora，RoPE 插值方法选择 dynamic，加速方式选择 unsloth，选择数据集，其他选项基本不需要改变。

在这里插入图片描述

五、进行微调

1、方式一：在 webui 界面上进行微调

前提：已完成第四步

完成第四步后，点击下方的开始命令，开始训练

2、方式二：根据第四步生成的参数，使用命令行进行微调

前提：已完成第四步

完成第四步后，点击下方的预览命令，根据第四步填写的微调参数，生成相关命令；命令如下：

llamafactory-cli train \--stage sft \--do_train True \--model_name_or_path /root/autodl-tmp/models/Llama3-8B-Chinese-Chat \--preprocessing_num_workers 16 \--finetuning_type lora \--template llama3 \--rope_scaling dynamic \--flash_attn auto \--use_unsloth True \--dataset_dir data \--dataset identity,fintech \--cutoff_len 2048 \--learning_rate 0.0002 \--num_train_epochs 10.0 \--max_samples 1000 \--per_device_train_batch_size 2 \--gradient_accumulation_steps 8 \--lr_scheduler_type cosine \--max_grad_norm 1.0 \--logging_steps 5 \--save_steps 100 \--warmup_steps 0 \--packing False \--report_to none \--output_dir saves/Llama-3-8B-Chinese-Chat/lora/train_2025-05-14-20-32-17 \--bf16 True \--plot_loss True \--trust_remote_code True \--ddp_timeout 180000000 \--include_num_input_tokens_seen True \--optim adamw_torch \--lora_rank 8 \--lora_alpha 16 \--lora_dropout 0 \--lora_target all

在这里插入图片描述

3、微调中

在这里插入图片描述

六、微调前后（聊天结果）进行对比

微调前

模型路径为 微调前模型本地路径，点击下方chat选项，点击加载模型

微调后

模型路径为 微调前模型本地路径，检查点路径选择 刚刚微调产生的lora权重，点击下方chat选项，点击加载模型

七、开放 openai 式接口

# 指定多卡和端口
CUDA_VISIBLE_DEVICES=0,1 API_PORT=8000 
llamafactory-cli api custom.yaml
#custom.yaml的文件内容为上述第五步中，方式二的命令参数

八、模型合并

将 base model 与训练好的 LoRA Adapter 合并成一个新的模型。

1、方式一

custom_merge.yml 文件内容如下：


### model
model_name_or_path: /root/autodl-tmp/models/Llama3-8B-Chinese-Chat/ （原始模型路径）
adapter_name_or_path: /root/code/LLaMA-Factory/saves/LLaMA3-8B-Chinese-Chat/lora/train_2024-05-25-20-27-47 （lora权重参数路径）
template: llama3（模版）
finetuning_type: lora（微调类型）### export
export_dir: /root/autodl-tmp/models/LLaMA3-8B-Chinese-Chat-merged（合并后的路径）
export_size: 4（设置单个文件大小为4g）
export_device: cuda
export_legacy_format: false

运行下方指令

llamafactory-cli export custom_merge.yml

运行结果

2、方式二

模型路径为 微调前模型本地路径，检查点路径选择 刚刚微调产生的lora权重，点击下方export选项，导出目录填写需要保存的地址，点击开始导出
导出结果为：

LLaMA-Factory 微调 Qwen2-7B-Instruct

一、系统环境使用的 autoDL 算力平台 1、下载基座模型 pip install -U huggingface_hub export HF_ENDPOINThttps://hf-mirror.com # （可选）配置 hf 国内镜像站huggingface-cli download --resume-download shenzhi-wang/Llama3-8B-Chinese-Chat -…...

编程日记 2026/2/2 4:10:55

mac本地docker镜像上传指定虚拟机

在Mac本地将Docker镜像上传至指定虚拟机的完整步骤 1. 在Mac本地保存Docker镜像为文件通过docker save命令将镜像打包为.tar文件，便于传输至虚拟机。 # 示例：保存名为"my_image"的镜像到当前目录 docker save -o my_image.tar my_image:ta…...

编程日记 2026/2/2 4:40:30

从代码学习深度学习 - 风格迁移 PyTorch版

文章目录前言方法 (Methodology)阅读内容和风格图像预处理和后处理抽取图像特征定义损失函数内容损失 (Content Loss)风格损失 (Style Loss)全变分损失 (Total Variation Loss)总损失函数初始化合成图像训练模型总结前言大家好！欢迎来到我们的深度学习代码学习系列。今天，…...

编程日记 2026/2/2 5:51:23

软件设计师考试《综合知识》设计模式之——工厂模式与抽象工厂模式考点分析

软件设计师考试《综合知识》工厂模式与抽象工厂模式考点分析 1. 分值占比与考察趋势（75分制） 年份题量分值占总分比例核心考点2023111.33%抽象工厂模式适用场景2022222.67%工厂方法 vs 抽象工厂区别2021111.33%工厂方法模式结构2020111.33%简单工厂模式…...

编程日记 2026/2/2 6:19:01

轻量级离线版二维码工具的技术分析与开发指南

摘要本文介绍一款基于本地化运行的轻量级二维码处理工具。该工具采用标准QR Code规范实现，具备完整的生成与识别功能。通过实测验证其核心功能表现及适用场景。主要功能模块分析编码生成模块：支持文本/URL等多种数据类型转换；提供尺寸调…...

编程日记 2026/2/2 5:43:16

中级网络工程师知识点4

1.Portal认证：可以以网页的形式为用户提供身份认证和个性化信息服务。如台式电脑，笔记本，手机等智能终端 2.MAC认证：无法安装和使用802.1X客户端软件的终端，如打印机，门禁等非智能终端 3.CAPWAP隧道&…...

编程日记 2026/2/3 6:55:20

机器学习--特征工程具体案例

一、数据集介绍 sklearn库中的玩具数据集，葡萄酒数据集。在前两次发布的内容《机器学习基础中》有介绍。 1.1葡萄酒列标签名： wine.feature_names 结果： [alcohol, malic_acid, ash, alcalinity_of_ash, magnesium, total_phenols, flavanoi…...

编程日记 2026/2/4 14:21:14

LeetCode 每日一题 2025/5/12-2025/5/18

记录了初步解题思路以及本地实现代码；并不一定为最优也希望大家能一起探讨一起进步目录 5/12 2094. 找出 3 位偶数5/13 3335. 字符串转换后的长度 I5/14 3337. 字符串转换后的长度 II5/15 2900. 最长相邻不相等子序列 I5/16 2901. 最长相邻不相等子序列 II5/17 …...

编程日记 2026/1/8 9:10:33

Unreal 从入门到精通之SceneCaptureComponent2D实现UI层3D物体360°预览

文章目录前言SceneCaptureComponent2D实现步骤新建渲染目标新建材质UI控件激活3DPreview鼠标拖动旋转模型最后前言我们在（电商展示/角色预览/装备查看）等应用场景中，经常会看到这种3D展示的页面。即使用相机捕获一个3D的模型的视图，然后把这个视图显示在一个UI画布上，…...

编程日记 2026/2/2 4:44:34

电机控制杂谈（25）——为什么对于一般PMSM系统而言相电流五、七次谐波电流会比较大？

1. 背景最近都在写论文回复信。有个审稿人问了一个问题——为什么对于一般PMSM系统而言相电流五、七次谐波电流会比较大？同时，为什么相电流五、七次谐波电流会在dq基波旋转坐标系构成六次谐波电流？ 回答这个问题挺简单的，但在网…...

编程日记 2026/2/2 5:27:20

多模态大语言模型arxiv论文略读（七十八）

AID: Adapting Image2Video Diffusion Models for Instruction-guided Video Prediction ➡️ 论文标题：AID: Adapting Image2Video Diffusion Models for Instruction-guided Video Prediction ➡️ 论文作者：Zhen Xing, Qi Dai, Zejia Weng, Zuxuan W…...

编程日记 2026/2/1 19:14:57

项目中把webpack 打包改为vite 打包

项目痛点: 老vu e-cli1创建的项目,项目是ERP系统集成了很多很多管理,本地运行调试的时候,每次修改代码都需要等待3分钟左右的编译时间,严重影响开发效率. 解决方案: 采用vite构建项目工程方案执行第一步使用vite脚手架构件一个项目,然后把build文件自定义的编译逻辑般到…...

编程日记 2025/7/16 16:27:30

【C语言】易错题经典题型

出错原因：之前运行起来的可执行程序没有关闭关闭即可平均数（average） 输入3个整数，输出它们的平均值，保留3位小数。 #include <stdio.h> int main() {int a, b, c;scanf("%d %d %d", &a, &…...

编程日记 2026/2/2 4:40:43

哈夫曼编码：数据压缩的优雅艺术

哈夫曼编码：数据压缩的优雅艺术在数字信息时代，数据压缩技术扮演着至关重要的角色。其中，哈夫曼编码（Huffman Coding）作为一种经典的无损压缩算法，以其简洁优雅的设计和卓越的压缩效率而闻名。本文将通过…...

编程日记 2025/9/10 5:29:22

说一说Node.js高性能开发中的I/O操作

众所周知，在软件开发的领域中，输入输出（I/O）操作是程序与外部世界交互的重要环节，比如从文件读取数据、向网络发送请求等。这段时间，也指导项目中一些项目的开发工作，发现在Node.js运用中&#…...

编程日记 2026/2/2 5:22:44

扫描网络内所有设备的IP地址

arp 命令本身不能直接列出网络中所有 IP 地址，它只能显示本机 ARP 缓存中已知的 IP-MAC 映射，即：本机通信过的设备。如果你想查询局域网中所有在线的 IP 地址，需要配合 ping 扫描或使用更强大的工具。以下是几种常见的方法&…...

编程日记 2025/12/28 16:11:17

web3 前端常见错误类型以及错误捕获处理

在Web3前端开发中，常见的错误类型包括用户拒绝交易、RPC节点超时、网络连接问题、智能合约调用错误等。正确捕获这些错误并提供友好的用户提示是提升用户体验的关键。以下是一些常见的Web3前端错误类型及其处理方法： 1. 用户拒绝交易根据错误码 4001 …...

编程日记 2026/1/22 6:23:09

应用层协议简介：以 HTTP 和 MQTT 为例

文章目录应用层协议简介：什么是应用层协议？为什么需要应用层协议？什么是应用层协议？为什么需要应用层协议？ HTTP 协议详解HTTP 协议特点HTTP 工作的基本原理HTTP 请求与响应示例为什么 Web 应用基于 HTTP 请求&#x…...

编程日记 2026/2/2 5:49:22

LeetCode 39. 组合总和 LeetCode 40.组合总和II LeetCode 131.分割回文串

LeetCode 39. 组合总和需要注意的是题目已经明确了数组内的元素不重复（重复的话需要执行去重操作），且元素都为正整数（如果存在0，则会出现死循环）。思路1：暴力解法对最后结果进行去重每一…...

编程日记 2026/2/2 6:25:16

如何在 Windows 11 或 10 上安装 Fliqlo 时钟屏保

了解如何在 Windows 11 或 10 上安装 Fliqlo，为您的 PC 或笔记本电脑屏幕添加一个翻转时钟屏保以显示时间。 Fliqlo 是一款适用于 Windows 和 macOS 平台的免费时钟屏保。它也适用于移动设备，但仅限于 iPhone 和 iPad。Fliqlo 的主要功能是在用户不活动时在 PC 或笔记本电脑…...

编程日记 2026/2/4 7:02:56

Linux云计算训练营笔记day08（MySQL数据库）

Linux云计算训练营笔记day08（MySQL数据库） 目录 Linux云计算训练营笔记day08（MySQL数据库）数据准备修改更新update删除delete数据类型1.整数类型2.浮点数类型(小数)3.字符类型4.日期5.枚举: 表头的值必须在列举的值里选择拷贝表复…...

编程日记 2026/1/27 1:13:04

计算机视觉与深度学习｜ matlab实现EMD-CNN-LSTM时间序列预测（完整源码、数据、公式)

EMD-CNN-LSTM 一、完整代码实现二、核心公式说明1. **经验模态分解（EMD）**2. **1D卷积运算**3. **LSTM门控机制**4. **损失函数**三、代码结构解析四、关键参数说明五、性能优化建议六、典型输出示例以下是用MATLAB实现EMD-CNN-LSTM时间序列预测的完整方案，包含数据生成、经…...

编程日记 2026/1/17 13:17:32