当前位置：首页 > article >正文

【AI时代】可视化训练模型工具LLaMA-Factory安装与使用

article 2026/4/6 15:57:53

文章目录

安装
训练
使用

安装

官方地址：https://github.com/hiyouga/LLaMA-Factory

创建虚拟环境

conda create -n llama-factory
conda activate llama-factory

安装

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

检查

完成安装后，可以通过使用llamafactory-cli来快速校验安装是否成功

如果您能成功看到类似下面的界面，就说明安装成功了。

启动webui

nohup llamafactory-cli webui > output.log 2>&1 &

启动后访问该地址：

训练

简单在页面设置一下参数

模型路径：可以使用huggingface的路径，也可以直接配置本地的路径；大部分参数使用默认的即可。

自定义数据集需要在该文件中进行配置，页面才可见：

配置好之后，点击预览命令，展示训练命令：

llamafactory-cli train \--stage sft \--do_train True \--model_name_or_path /mnt/largeroom/llm/model/DeepSeek-R1-Distill-Qwen-1.5B \--preprocessing_num_workers 16 \--finetuning_type lora \--template deepseek3 \--flash_attn auto \--dataset_dir data \--dataset alpaca_zh_demo \--cutoff_len 2048 \--learning_rate 5e-05 \--num_train_epochs 3.0 \--max_samples 1000000 \--per_device_train_batch_size 4 \--gradient_accumulation_steps 8 \--lr_scheduler_type cosine \--max_grad_norm 1.0 \--logging_steps 5 \--save_steps 100 \--warmup_steps 4 \--packing False \--report_to none \--output_dir saves/DeepSeek-R1-1.5B-Distill/lora/train_lora_02 \--bf16 True \--plot_loss True \--trust_remote_code True \--ddp_timeout 180000000 \--include_num_input_tokens_seen True \--optim adamw_torch \--lora_rank 16 \--lora_alpha 16 \--lora_dropout 0 \--lora_target all

可以看到我所有卡都用上了：

完成之后，会展示损失函数：

在输出目录可以看到微调好的权重：

使用

对于训练好的模型，如果是像上图这像的分开存储的权重，可以通过配置检查点路径进行调用

需要提前安装vllm：

pip install vllm==0.7.2

如果安装慢，网络连接不上，可以使用-i指定源：

 pip install vllm==0.7.2 -i https://pypi.tuna.tsinghua.edu.cn/simple/

常用的国内源：

阿里云：https://mirrors.aliyun.com/pypi/simple/
豆瓣：https://pypi.douban.com/simple/
清华大学：https://pypi.tuna.tsinghua.edu.cn/simple/
中国科学技术大学：https://pypi.mirrors.ustc.edu.cn/simple/

也可以通过 <font style="color:rgb(0, 0, 0);">llamafactory-cli export merge_config.yaml</font> 指令来合并模型。

### model
model_name_or_path: /mnt/largeroom/llm/model/DeepSeek-R1-Distill-Qwen-1.5B
adapter_name_or_path: /mnt/largeroom/zhurunhua/LLaMA-Factory/saves/DeepSeek-R1-1.5B-Distill/lora/train_lora_02
template: deepseek3
finetuning_type: lora### export
export_dir: /mnt/largeroom/llm/model/deepseek-r1-1.5b-peft
export_size: 2
export_device: cpu
export_legacy_format: false

【AI时代】可视化训练模型工具LLaMA-Factory安装与使用

文章目录安装训练使用安装官方地址：https://github.com/hiyouga/LLaMA-Factory 创建虚拟环境 conda create -n llama-factory conda activate llama-factory安装 git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git cd LLaMA-Factory pip in…...

编程日记 2026/4/6 15:57:53

Docker 部署 OnlyOffice 文档服务器

Docker 部署 OnlyOffice 文档服务器前言一、准备工作二、设置变量和目录结构三、创建并运行 OnlyOffice 容器四、访问 OnlyOffice 文档服务器五、配置和管理总结前言 OnlyOffice 是一个强大的开源文档编辑平台，支持文档、表格、演示文稿等文件格式的编辑。通过 D…...

编程日记 2026/4/5 20:58:33

将产品照片（form.productPhotos）转为 JSON 字符串发送给后端

文章目录 1. 前端 form.productPhotos 的当前处理a. 组件绑定b. 当前发送逻辑 2. 如何将 form.productPhotos 转为 JSON 字符串发送给后端a. 修改前端 save() 方法b. 确保 esave API 支持接收字符串基于你提供的 identify-form.vue 代码，我将分析如何将产品照片&a…...

编程日记 2026/4/5 13:32:22

【科研绘图系列】R语言绘制小提琴图、散点图和韦恩图（violin scatter plot Venn）

禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者! 文章目录介绍加载R包数据下载画图1画图2画图3画图4画图5画图6画图7参考介绍【科研绘图系列】R语言绘制小提琴图、散点图和韦恩图（violin & scatter plot & Venn）加载R包 library…...

编程日记 2026/4/6 4:21:44

kotlin 知识点一变量和函数

在Kotlin中定义变量的方式和Java 区别很大，在Java 中如果想要定义一个变量，需要在变量前面声明这个变量的类型，比如说int a表示a是一个整型变量，String b表示b是一个字符串变量。而Kotlin中定义一个变量，只允许在变量…...

编程日记 2026/4/5 2:53:24

科普：你的笔记本电脑中有三个IP：127.0.0.1、无线网 IP 和局域网 IP；两个域名：localhost和host.docker.internal

三个IP 你的笔记本电脑中有三个IP：127.0.0.1、无线网 IP 和局域网 IP。在不同的场景下，需要选用不同的 IP 地址，如下为各自的特点及适用场景： 127.0.0.1（回环地址） 特点 127.0.0.1 是一个特殊的 IP 地…...

编程日记 2026/3/29 15:26:13

solidity之Foundry安装配置(一)

一门面向合约的高级编程语言，主要用来编写以太坊只能合约。 Solidity受C语言，Python和js影响，但为编译成为以太坊虚拟机字节码在EVM上执行，很多特性和限制都和EVM相关。 Solidity 是静态类型语言，支持继承、库、自定义…...

编程日记 2026/4/5 7:20:40

爬虫解析库：parsel的详细使用

文章目录 1. 安装 Parsel2. 基本用法3. 使用 CSS 选择器提取数据4. 使用 XPath 提取数据5. 链式调用6. 正则表达式提取7. 处理嵌套元素8. 处理默认值9. 结合 Requests 使用10. 处理复杂 HTML11. 性能优化12. 注意事项引言：本博客详细介绍爬虫解析库parser的详细使用…...

编程日记 2026/4/5 2:01:42

PHP-create_function

[题目信息]： 题目名称题目难度PHP-create_function2 [题目考点]： create_function ( string args , string args , string code )[Flag格式]: SangFor{wWx5dEGHHhDUwmST4bpXwfjSzq43I6cz}[环境部署]： docker-compose.yml文件或者docker …...

编程日记 2026/4/5 7:07:36

从工程师到系统架构设计师

在技术领域，从一名初出茅庐的工程师成长为独当一面的系统架构设计师，是一条需要长期积累、持续突破的路径。这一过程不仅需要扎实的技术功底，更需要思维的升级和视野的拓展。以下将结合不同阶段的特征，为你梳理一条清晰的成长路线…...

编程日记 2026/2/15 18:07:21

FFmpeg 是什么？为什么？怎么用？

摘要：本文介绍了 FFmpeg，一个功能强大的开源多媒体处理工具，广泛应用于视频和音频文件的处理。FFmpeg 支持多种多媒体格式，能够实现视频编码/解码、格式转换、裁剪、合并、音频提取、流媒体处理等功能。本文详细阐述了 FFmpeg 的主…...

编程日记 2026/3/31 12:53:15

云计算及其他计算

云计算知识思维导图：https://kdocs.cn/l/cpl2Kizx7IyC 云计算的核心判断标准通常基于美国国家标准与技术研究院（NIST）的定义，并结合实际应用场景。以下是判断一个服务是否为云计算的关键标准，以及对应的服务类型&#…...

编程日记 2026/3/18 14:28:11

前端Toast提示快速入门

White graces：个人主页 🙉专栏推荐:Java入门知识🙉 🐹今日诗词:十年一觉扬州梦，赢得青楼薄幸名🐹 ⛳️点赞 ☀️收藏⭐️关注💬卑微小博主🙏 ⛳️点赞 ☀️收藏⭐️关注&#x1f4…...

编程日记 2026/4/6 2:08:21

体育电竞比分网开发流程

开发一个体育电竞比分网的流程可以分为以下几个主要步骤： 1. 需求分析目标用户：确定网站的主要用户群体，如体育迷、电竞爱好者等。功能需求：列出网站需要实现的功能，如实时比分更新、赛事日程、新闻资讯、用户评论…...

编程日记 2026/2/15 4:14:58

垂类大模型微调（一）：认识LLaMA-Factory

LlamaFactory 是一个专注于高效微调大型语言模型（LLMs）的开源工具框架，尤其以支持 LLaMA（Meta 的大型语言模型系列）及其衍生模型（如 Chinese-LLaMA、Alpaca 等）而闻名。它的目标是简化模型微调流程，降低用户使用门槛；官方文档一、介绍高效微调支持支持多种微调…...

编程日记 2026/4/5 7:10:24

Opengl常用缓冲对象功能介绍及使用示例（C++实现）

本文整理了常用的opengl缓冲区对象并安排了使用示例名称英文全称作用简述顶点数组对象Vertex Array Object (VAO)管理 VBO 和 EBO 的配置，存储顶点属性设置，简化渲染流程，避免重复设置状态顶点缓冲区对象Vertex Buffer Object (VBO)存储顶点…...

编程日记 2026/2/15 10:54:10

【量化策略】均值回归策略

【量化策略】均值回归策略 🚀量化软件开通 🚀量化实战教程技术背景与应用场景在金融市场中，均值回归策略是一种基于统计学原理的量化交易策略。该策略的核心思想是，资产价格和收益率最终都会回归到其长期平均值或趋势线。这…...

编程日记 2026/3/22 11:51:42

【CS285】高斯策略对数概率公式的学习笔记

公式介绍在【CS285】中提到了高斯策略对数概率公式的公式如下： log ⁡ π θ ( a t ∣ s t ) − 1 2 ∥ f ( s t ) − a t ∥ Σ 2 const \log \pi_{\theta}(\mathbf{a}_t | \mathbf{s}_t) -\frac{1}{2} \left\| f(\mathbf{s}_t) - \mathbf{a}_t \right\|_{\S…...

编程日记 2026/3/13 22:59:27

C++双指针：算法优化的“左右互搏术”与高效问题破解全指南

C双指针：算法优化的“左右互搏术”与高效问题破解全指南开篇故事：迷宫中的“双人探路策略” 想象两名探险者在迷宫中寻找出口： 快慢指针：一人快速探索死路，另一人稳步记录正确路径。左右指针：两人从两端…...

编程日记 2026/3/2 8:50:53

高级SQL技术在Python项目中的应用：ORM与深度性能优化

引言在现代Python项目开发中，数据库交互远不止是数据的简单存取，它已成为构建高性能、可维护应用的核心瓶颈和关键能力所在。仅仅依赖基础SQL查询，虽然入门简单，却难以应对日益增长的应用挑战。这些挑战主要体现在以下几个方面：性能瓶颈: 数据量剧增: 从百万到数十亿乃…...

编程日记 2026/2/14 2:25:56

Pytorch实现论文：基于多尺度融合生成对抗网络的水下图像增强

简介简介：提出了一种新型的水下图像增强算法，基于多尺度融合生成对抗网络，名为UMSGAN，以解决低对比度和颜色失真的问题。首先经过亮度的处理，将处理后的图像输入设计的MFFEM模块和RM模块生成图像。该算法旨在适应各种水下场景，提供颜色校正和细节增强。论文题目：Und…...

编程日记 2026/3/14 14:00:38

从单片机的启动说起一个单片机到点灯发生了什么下——使用GPIO点一个灯

目录前言 HAL库对GPIO的抽象核心分析：HAL_GPIO_Init 前言我们终于到达了熟悉的地方，对GPIO的初始化。经过漫长的铺垫，我们终于历经千辛万苦，来到了这里。关于GPIO的八种模式等更加详细的细节，由于只是点个灯&am…...

编程日记 2026/4/1 7:59:02

基于大语言模型的推荐系统（1）

推荐系统（recommendation system）非常重要。事实上，搜索引擎，电子商务，视频，音乐平台，社交网络等等，几乎所有互联网应用的核心就是向用户推荐内容，商品，电影&…...

编程日记 2026/3/15 23:02:32

Docker基础实践与应用举例

Docker 是一个轻量级容器化平台，通过将应用及其依赖打包到容器中，实现快速部署和环境一致性。以下是 Docker 的实践与应用场景举例，结合具体操作步骤： 一、基础实践 1. 快速启动一个容器 # 运行一个Nginx容器，映射宿…...

编程日记 2026/2/14 19:01:14

计算机毕业设计SpringBoot+Vue.js新闻推荐系统(源码+文档+PPT+讲解)

温馨提示：文末有 CSDN 平台官方提供的学长联系方式的名片！ 温馨提示：文末有 CSDN 平台官方提供的学长联系方式的名片！ 温馨提示：文末有 CSDN 平台官方提供的学长联系方式的名片！ 作者简介：Java领…...

编程日记 2026/4/5 9:30:05

Android 布局系列（一）：LinearLayout 使用指南

引言在 Android 开发中，布局是每个应用的基础，而 LinearLayout 无疑是最常见、最简单的布局之一。它允许我们将多个视图按顺序排列，可以选择水平方向（horizontal）或垂直方向（vertical）。 Line…...

编程日记 2026/4/6 1:28:01

蓝桥杯备赛-精卫填海-DP

精卫终于快把东海填平了！只剩下了最后的一小片区域了。同时，西山上的木石也已经不多了。精卫能把东海填平吗？ 事实上，东海未填平的区域还需要至少体积为 v 的木石才可以填平，而西山上的木石还剩下 n 块，每块…...

编程日记 2026/2/27 4:08:27

git中，如何查看具体单个文件的log

在 Git 中，可以使用多种方式查看单个文件的提交日志（Log），以下详细介绍不同场景下的查看方法： 目录一、基本命令查看文件的完整提交日志二、查看文件提交日志并显示差异内容三、限制显示的提交日志数量四、按…...

编程日记 2026/2/19 23:55:33

Winform工具箱、属性、事件

工具箱 Button------按钮：用户可以点击的按钮控件。 CheckBox------复选框：允许用户选择或取消选择选项的复选框。 CheckedListBox：结合了ListBox和CheckBox的功能，允许多项选择。 ColorDialog------颜色选择对话框：用…...

编程日记 2026/2/18 20:37:42

科普：HTTP端口80和HTTPS端口443

你会发现，有的网址不带端口号，怎么回事？ HTTP协议默认端口：HTTP协议的默认端口是80。当用户在浏览器中输入一个没有指定端口的以http://开头的网址时，浏览器会自动使用80端口与服务器建立连接，进行超文本数…...

编程日记 2026/4/5 13:53:03

文章目录

安装

训练

使用

相关文章：