当前位置：首页 > article >正文

使用LLaMA-Factory对AI进行认知的微调

article 2026/5/7 22:45:28

使用LLaMA-Factory对AI进行认知的微调

- 引言
- 1. 安装LLaMA-Factory
- - 1.1. 克隆仓库
  - 1.2. 创建虚拟环境
  - 1.3. 安装LLaMA-Factory
  - 1.4. 验证
- 2. 准备数据
- - 2.1. 创建数据集
  - 2.2. 更新数据集信息
- 3. 启动LLaMA-Factory
- 4. 进行微调
- - 4.1. 设置模型
  - 4.2. 预览数据集
  - 4.3. 设置学习率等参数
  - 4.4. 预览和执行命令
  - 4.5. 训练完成
- 5. 与微调后的模型聊天
- - 5.1. 加载模型
  - 5.2. 开始聊天
  - 5.3. 导出模型
  - 5.4. 使用Vllm启动
- 总结

引言

本文将介绍如何使用LLaMA-Factory对AI进行微调，使其具备“忍者”的认知，并认知其是由“富士电视台”开发的。

1. 安装LLaMA-Factory

1.1. 克隆仓库

git clone https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory

1.2. 创建虚拟环境

conda create -n llama_factory python=3.11 -y
conda activate llama_factory

1.3. 安装LLaMA-Factory

pip install -e '.[torch,metrics]'

1.4. 验证

import torch
print(torch.cuda.current_device())
print(torch.cuda.get_device_name(0))
print(torch.__version__)
print(torch.cuda.is_available())

2. 准备数据

2.1. 创建数据集

进入LLaMA-Factory目录：

cd LLaMA-Factory

复制identity.json并创建identity_ninja.json：

cp data/identity.json data/identity_ninja.json

将{{name}}和{{author}}替换为“忍者”和“富士电视台”：

sed -i 's/{{name}}/一人の忍者/g' data/identity_ninja.json
sed -i 's/{{author}}/フジテレビ/g' data/identity_ninja.json

验证：

head data/identity_ninja.json

2.2. 更新数据集信息

编辑data/dataset_info.json，添加新的数据集：

vi data/dataset_info.json

添加以下内容：

  "identity_ninja": {"file_name": "identity_ninja.json"},

3. 启动LLaMA-Factory

启动LLaMA-Factory：

llamafactory-cli webui

在浏览器中访问http://localhost:7860。

4. 进行微调

4.1. 设置模型

设置模型名称和微调方法，本文使用Vicuna-v1.5-7B-Chat作为基础模型。

4.2. 预览数据集

点击“预览数据集”按钮，确认数据。

4.3. 设置学习率等参数

设置学习率和训练轮数。

4.4. 预览和执行命令

设置输出目录，点击“预览命令”按钮确认命令，无误后点击“开始”。

命令示例：

llamafactory-cli train \--stage sft \--do_train True \--model_name_or_path lmsys/vicuna-7b-v1.5 \--preprocessing_num_workers 16 \--finetuning_type lora \--template vicuna \--flash_attn auto \--dataset_dir data \--dataset identity_ninja \--cutoff_len 2048 \--learning_rate 0.0001 \--num_train_epochs 6.0 \--max_samples 100000 \--per_device_train_batch_size 2 \--gradient_accumulation_steps 2 \--lr_scheduler_type cosine \--max_grad_norm 1.0 \--logging_steps 5 \--save_steps 100 \--warmup_steps 0 \--packing False \--report_to none \--output_dir saves/Vicuna-v1.5-7B-Chat/lora/train_vicuna_7b_identity_ninja_1e-4_epoch6 \--bf16 True \--plot_loss True \--trust_remote_code True \--ddp_timeout 180000000 \--include_num_input_tokens_seen True \--optim adamw_torch \--lora_rank 8 \--lora_alpha 16 \--lora_dropout 0 \--loraplus_lr_ratio 16 \--lora_target all

4.5. 训练完成

训练完成后，会显示以下消息：

5. 与微调后的模型聊天

5.1. 加载模型

选择“检查点路径”，点击“Chat”选项卡，然后点击“加载模型”。

5.2. 开始聊天

模型加载完成后，输入问题并确认AI的回答。此时，AI将具备“忍者(一人の忍者)”的认知，并认知其是由“富士电视台(フジテレビ)”开发的。

5.3. 导出模型

选择“检查点路径”，点击“Export”选项卡，输入“导出目录”，然后点击“导出”。

导出完成后，会显示“模型导出完成”消息。

5.4. 使用Vllm启动

使用以下命令在Vllm中启动导出的模型：

CUDA_VISIBLE_DEVICES=3,1,0,2 VLLM_USE_V1=1 VLLM_WORKER_MULTIPROC_METHOD=spawn vllm serve /root/HuggingFaceCache/models--lmsys--vicuna-7b-v1.5-sft --trust-remote-code --served-model-name gpt-4 --gpu-memory-utilization 0.98 --tensor-parallel-size 4 --port 8000

总结

通过以上步骤，我们成功使用LLaMA-Factory对AI进行了微调，使其具备特定的认知。希望大家能够尝试并应用这些方法进行更多的定制化。

使用LLaMA-Factory对AI进行认知的微调

使用LLaMA-Factory对AI进行认知的微调引言1. 安装LLaMA-Factory1.1. 克隆仓库1.2. 创建虚拟环境1.3. 安装LLaMA-Factory1.4. 验证 2. 准备数据2.1. 创建数据集2.2. 更新数据集信息 3. 启动LLaMA-Factory4. 进行微调4.1. 设置模型4.2. 预览数据集4.3. 设置学习率等参数4.4. 预览…...

编程日记 2026/5/7 22:45:28

Kafka分区策略实现

引言 Kafka 的分区策略决定了生产者发送的消息会被分配到哪个分区中，合理的分区策略有助于实现负载均衡、提高消息处理效率以及满足特定的业务需求。轮询策略（默认） 轮询策略是 Kafka 默认的分区策略（当消息没有指定键时&…...

编程日记 2026/3/1 6:38:49

在无sudo权限Linux上安装 Ollama 并使用 DeepSeek-R1 模型

本教程将指导你如何在 Linux 系统上安装 Ollama（一个本地运行大型语言模型的工具），并加载 DeepSeek-R1 模型。DeepSeek-R1 是一个高性能的开源语言模型，适用于多种自然语言处理任务。 DeepSeek-R1 简介 DeepSeek-R1 是 DeepSeek …...

编程日记 2026/4/29 17:50:05

Vue.js `v-memo` 性能优化技巧

Vue.js v-memo 性能优化技巧今天我们来聊聊 Vue 3.2 引入的一个性能优化指令：v-memo。如果你在处理大型列表或复杂组件时，遇到性能瓶颈，那么 v-memo 可能会成为你的得力助手。什么是 v-memo？ v-memo 是 Vue 3.2 新增的内置指…...

编程日记 2026/3/6 6:47:51

蓝桥杯思维训练营(一）

文章目录题目总览题目详解翻之一起做很甜的梦蓝桥杯的前几题用到的算法较少，大部分考察的都是思维能力，方法比较巧妙，所以我们要积累对应的题目，多训练题目总览翻之一起做很甜的梦题目详解翻之思维分析：一开…...

编程日记 2026/5/6 2:40:44

HBase-2.5.10 伪分布式环境搭建【Mac】

文章目录前言一、搭建单节点Zookeeper1. 解压zookeeper2. 配置环境变量3. 修改配置文件4. 启动zk 二、搭建伪分布式Hbase1. 解压hbase2. 配置环境变量3. 修改配置4. 启动HBase 前言搭建hbase伪分布式环境提示：以下是本篇文章正文内容，下面案例仅供参…...

编程日记 2026/2/28 1:46:27

【小白学AI系列】NLP 核心知识点（五）Transformer介绍

Transformer Transformer 是一种基于自注意力机制（Self-Attention Mechanism）的深度学习模型，首次由 Vaswani 等人于 2017 年在论文《Attention is All You Need》中提出。与 RNN 和 LSTM 不同，Transformer 不需要依靠序列顺序进…...

编程日记 2025/7/6 16:05:40

纯后训练做出benchmark超过DeepseekV3的模型？

论文地址 https://arxiv.org/pdf/2411.15124 模型是AI2的，他们家也是玩开源的先看benchmark，几乎是纯用llama3 405B后训练去硬刚出一个gpt4o等级的LLamA405 我们先看之前的机遇Lllama3.1 405B进行全量微调的模型 Hermes 3，看着还没缘模型…...

编程日记 2026/4/29 17:52:14

OpenAI深夜反击：o3-mini免费上线，能否撼动DeepSeek的地位？

还在为寻找合适的 AI 模型而烦恼吗？chatTools 平台为您精选 o1、GPT4o、Claude、Gemini 等顶尖 AI 模型，满足您不同的 AI 应用需求。立即体验强大的 AI 能力！ 深夜反击，OpenAI祭出o3-mini 在DeepSeek异军突起，搅动AI行…...

编程日记 2026/5/4 23:09:52

【Linux-网络】初识计算机网络 Socket套接字 TCP/UDP协议（包含Socket编程实战）

🎬 个人主页：谁在夜里看海. 📖 个人专栏：《C系列》《Linux系列》《算法系列》 ⛰️ 道阻且长，行则将至目录 📚一、初识计算机网络 📖 背景 📖 网络协议 🔖OSI七层…...

编程日记 2026/4/29 17:53:36

使用ollama在本地部署一个deepseek大模型

文章目录为什么选择本地化部署需要用到什么作者使用的什么环境如何根据自己的电脑或服务器配置选择自己能部署的大模型一、Ollama1、下载Ollama2、安装Ollama 二、DeepSeek R11、下载DeepSeek R12、安装DeepSeek R1 三、ChatBox AI1、下载ChatBox AI2、安装ChatBox AI3、连接…...

编程日记 2026/5/2 17:29:08

10 Flink CDC

10 Flink CDC 1. CDC是什么2. CDC 的种类3. 传统CDC与Flink CDC对比4. Flink-CDC 案例5. Flink SQL 方式的案例 1. CDC是什么 CDC 是 Change Data Capture（变更数据获取）的简称。核心思想是，监测并捕获数据库的变动（包括数据或数…...

编程日记 2026/5/3 14:46:25

【含文档+PPT+源码】基于微信小程序连锁药店商城

项目介绍本课程演示的是一款基于微信小程序连锁药店商城，主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的 Java 学习者。 1.包含：项目源码、项目文档、数据库脚本、软件工具等所有资料 2.带你从零开始部署运行本套系统 3.该项目附带的…...

编程日记 2026/5/8 7:12:50

使用 EXISTS 解决 SQL 中 IN 查询数量过多的问题

在 SQL 查询中，当我们面对需要在 IN 子句中列举大量数据的场景时，查询的性能往往会受到显著影响。这时候，使用 EXISTS 可以成为一种优化的良方。问题的来源假设我们有两个表，orders 和 customers，我们需要查询所有…...

编程日记 2026/3/20 2:21:01

[免费]微信小程序智能商城系统(uniapp+Springboot后端+vue管理端)【论文+源码+SQL脚本】

大家好，我是java1234_小锋老师，看到一个不错的微信小程序智能商城系统(uniappSpringboot后端vue管理端)，分享下哈。项目视频演示【免费】微信小程序智能商城系统(uniappSpringboot后端vue管理端) Java毕业设计_哔哩哔哩_bilibili 项目介绍…...

编程日记 2026/4/30 7:15:37

UE学习日志#19 C++笔记#5 基础复习5 引用1

C中的引用（reference）是另一个变量的别名。对引用的所有修改都会更改其引用的变量的值。可以将引用视为隐式指针，它省去了获取变量地址和解引用指针的麻烦。另外，可以将引用视为原始变量的另一个名称。可以创建独立的引用变量&…...

编程日记 2026/3/20 6:34:11

PHP代码审计学习02

目录代码审计一般思路 Beescms代码审计（upload） Finecms基于前台MVC任意文件上传挖掘思路 CLTPHP基于thinkphp5框架的文件上传挖掘思路今天来看PHP有框架MVC类，文件上传，断点调试挖掘。同样还是有关键字搜索和功能点抓包两…...

编程日记 2026/4/10 7:35:02

2025年02月02日Github流行趋势

项目名称：oumi 项目地址url：https://github.com/oumi-ai/oumi 项目语言：Python 历史star数：1416 今日star数：205 项目维护者：xrdaukar, oelachqar, taenin, wizeng23, kaisopos 项目简介：构建最…...

编程日记 2026/5/2 9:43:58

vue入门到实战三

目录 3.1 v-bind 3.1.1 v-bind指令用法编辑3.1.2 使用v-bind绑定class 3.1.3 使用v-bind绑定style 3.2.1 v-if指令 3.2.1 v-if指令 3.2.2 v-show指令 3.3 列表渲染指令v-for 3.3.1 基本用法 3.3.2 数组更新 3.3.3 过滤与排序 3.4 事件处理 3.4.1 使用v-on指令…...

编程日记 2026/4/30 12:12:51

[创业之路-271]：站在管理的角度看计算机操作系统，OS是技术思想与管理思想的完美融合，是物理世界和数字化虚拟世界的桥梁

一、前言： Operating System，站在终端用户的角度，翻译成了"操作系统"，但站在计算机系统本身角度，翻译成"运营系统"更合适，是指它是负责运营计算机所有的硬件（物理&#xf…...

编程日记 2026/4/30 10:40:52

实验六项目二简易信号发生器的设计与实现（HEU）

声明：代码部分使用了AI工具实验六综合考核 Quartus 18.0 FPGA 5CSXFC6D6F31C6N 1. 实验项目要求利用硬件描述语言Verilog（或VHDL）、图形描述方式、IP核，结合数字系统设计方法，在Quartus开发环境下&#xff…...

编程日记 2026/5/1 1:37:48

java SSM框架商城系统源码(含数据库脚本)

商城购物功能，项目代码，mysql脚本，html等静态资源在压缩包里面注册界面登陆界面商城首页文件列表 shop/.classpath , 1768 shop/.project , 1440 shop/.settings/.jsdtscope , 639 shop/.settings/org.eclipse.core.resources.prefs , …...

编程日记 2026/5/1 4:48:36

Unet 改进：在encoder和decoder间加入TransformerBlock

目录 1. TransformerBlock 2. Unet 改进 3. 完整代码 Tips：融入模块后的网络经过测试，可以直接使用，设置好输入和输出的图片维度即可 1. TransformerBlock TransformerBlock是Transformer模型架构的基本组件，广泛应用于机器翻译、文本摘要和情感分析等自然语言处理任务…...

编程日记 2026/4/29 17:51:04

【黄啊码】DeepSeek提示词大道至简版

1.1 有效提问的五个黄金法法则一：明确需求错误示例： Γ帮我写点东西」正确姿势： Γ我需要一封求职邮件，应聘新媒体运营岗位，强调B年公众号运营经验法则二：提供背景错误示例 ： Γ分析这个…...

编程日记 2026/4/14 7:05:30

【Linux系统】信号：认识信号与信号的产生

信号快速认识 1、生活角度的信号异步：你是老师正在上课，突然有个电话过来资料到了，你安排小明过去取资料，然后继续上课，则小明取资料这个过程就是异步的同步：小明取快递，你停下等待小明回来再…...

编程日记 2026/5/5 14:58:01

一、html笔记

（一）前端概述 1、定义前端是Web应用程序的前台部分，运行在PC端、移动端等浏览器上，展现给用户浏览的网页。通过HTML、CSS、JavaScript等技术实现，是用户能够直接看到和操作的界面部分。上网就是下载html文档，浏览器是一个解释器，运行从服务器下载的html文件，解析html、…...

编程日记 2026/5/5 7:48:02

C# 数组和列表的基本知识及 LINQ 查询

数组和列表的基本知识及 LINQ 查询一、基本知识二、引用命名空间声明三、数组3.1、一维数组3.2、二维数组3.3、不规则数组 Jagged Array 四、列表 List4.1、一维列表4.2、二维列表五、数组和列表使用 LINQ的操作和运算5.1、一维 LIST 删除所有含 double.NaN 的行5.2、一维 LI…...

编程日记 2026/4/28 22:17:09

PyQt5超详细教程终篇

PyQt5超详细教程前言接： [【Python篇】PyQt5 超详细教程——由入门到精通（序篇）](【Python篇】PyQt5 超详细教程——由入门到精通（序篇）-CSDN博客) 建议把代码复制到pycahrm等IDE上面看实际效果，方便理…...

编程日记 2026/5/6 12:57:38

【llm对话系统】大模型 Llama 源码分析之归一化方法 RMS Norm

1. 引言在深度学习中，归一化 (Normalization) 是一种常用的技术，它可以加速模型的训练并提高模型的性能。常见的归一化方法包括 Batch Normalization (BatchNorm)、Layer Normalization (LayerNorm) 等。Llama 模型采用了一种称为 RMS Norm 的归一化方…...

编程日记 2026/3/1 19:33:53

Ubuntu 24.04 安装 NVIDIA Container Toolkit 全指南：让Docker拥抱GPU

Ubuntu 24.04 安装 NVIDIA Container Toolkit 全指南：让Docker拥抱GPU 前言一、环境准备1.1 验证驱动状态二、安装NVIDIA Container Toolkit2.1 添加官方仓库2.2 执行安装三、配置Docker运行时3.1 更新Docker配置四、验证安装结果4.1 运行测试容器五、实战应用 …...

编程日记 2026/5/8 4:19:48

使用LLaMA-Factory对AI进行认知的微调

引言

1. 安装LLaMA-Factory

1.1. 克隆仓库

1.2. 创建虚拟环境

1.3. 安装LLaMA-Factory

1.4. 验证

2. 准备数据

2.1. 创建数据集

2.2. 更新数据集信息

3. 启动LLaMA-Factory

4. 进行微调

4.1. 设置模型

4.2. 预览数据集

4.3. 设置学习率等参数

4.4. 预览和执行命令

4.5. 训练完成

5. 与微调后的模型聊天

5.1. 加载模型

5.2. 开始聊天

5.3. 导出模型

5.4. 使用Vllm启动

总结

相关文章：