当前位置：首页 > news >正文

使用LLaMA-Factory对AI进行认知的微调

news 2026/5/16 13:28:16

使用LLaMA-Factory对AI进行认知的微调

- 引言
- 1. 安装LLaMA-Factory
- - 1.1. 克隆仓库
  - 1.2. 创建虚拟环境
  - 1.3. 安装LLaMA-Factory
  - 1.4. 验证
- 2. 准备数据
- - 2.1. 创建数据集
  - 2.2. 更新数据集信息
- 3. 启动LLaMA-Factory
- 4. 进行微调
- - 4.1. 设置模型
  - 4.2. 预览数据集
  - 4.3. 设置学习率等参数
  - 4.4. 预览和执行命令
  - 4.5. 训练完成
- 5. 与微调后的模型聊天
- - 5.1. 加载模型
  - 5.2. 开始聊天
  - 5.3. 导出模型
  - 5.4. 使用Vllm启动
- 总结

引言

本文将介绍如何使用LLaMA-Factory对AI进行微调，使其具备“忍者”的认知，并认知其是由“富士电视台”开发的。

1. 安装LLaMA-Factory

1.1. 克隆仓库

git clone https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory

1.2. 创建虚拟环境

conda create -n llama_factory python=3.11 -y
conda activate llama_factory

1.3. 安装LLaMA-Factory

pip install -e '.[torch,metrics]'

1.4. 验证

import torch
print(torch.cuda.current_device())
print(torch.cuda.get_device_name(0))
print(torch.__version__)
print(torch.cuda.is_available())

2. 准备数据

2.1. 创建数据集

进入LLaMA-Factory目录：

cd LLaMA-Factory

复制identity.json并创建identity_ninja.json：

cp data/identity.json data/identity_ninja.json

将{{name}}和{{author}}替换为“忍者”和“富士电视台”：

sed -i 's/{{name}}/一人の忍者/g' data/identity_ninja.json
sed -i 's/{{author}}/フジテレビ/g' data/identity_ninja.json

验证：

head data/identity_ninja.json

2.2. 更新数据集信息

编辑data/dataset_info.json，添加新的数据集：

vi data/dataset_info.json

添加以下内容：

  "identity_ninja": {"file_name": "identity_ninja.json"},

3. 启动LLaMA-Factory

启动LLaMA-Factory：

llamafactory-cli webui

在浏览器中访问http://localhost:7860。

4. 进行微调

4.1. 设置模型

设置模型名称和微调方法，本文使用Vicuna-v1.5-7B-Chat作为基础模型。

4.2. 预览数据集

点击“预览数据集”按钮，确认数据。

4.3. 设置学习率等参数

设置学习率和训练轮数。

4.4. 预览和执行命令

设置输出目录，点击“预览命令”按钮确认命令，无误后点击“开始”。

命令示例：

llamafactory-cli train \--stage sft \--do_train True \--model_name_or_path lmsys/vicuna-7b-v1.5 \--preprocessing_num_workers 16 \--finetuning_type lora \--template vicuna \--flash_attn auto \--dataset_dir data \--dataset identity_ninja \--cutoff_len 2048 \--learning_rate 0.0001 \--num_train_epochs 6.0 \--max_samples 100000 \--per_device_train_batch_size 2 \--gradient_accumulation_steps 2 \--lr_scheduler_type cosine \--max_grad_norm 1.0 \--logging_steps 5 \--save_steps 100 \--warmup_steps 0 \--packing False \--report_to none \--output_dir saves/Vicuna-v1.5-7B-Chat/lora/train_vicuna_7b_identity_ninja_1e-4_epoch6 \--bf16 True \--plot_loss True \--trust_remote_code True \--ddp_timeout 180000000 \--include_num_input_tokens_seen True \--optim adamw_torch \--lora_rank 8 \--lora_alpha 16 \--lora_dropout 0 \--loraplus_lr_ratio 16 \--lora_target all

4.5. 训练完成

训练完成后，会显示以下消息：

5. 与微调后的模型聊天

5.1. 加载模型

选择“检查点路径”，点击“Chat”选项卡，然后点击“加载模型”。

5.2. 开始聊天

模型加载完成后，输入问题并确认AI的回答。此时，AI将具备“忍者(一人の忍者)”的认知，并认知其是由“富士电视台(フジテレビ)”开发的。

5.3. 导出模型

选择“检查点路径”，点击“Export”选项卡，输入“导出目录”，然后点击“导出”。

导出完成后，会显示“模型导出完成”消息。

5.4. 使用Vllm启动

使用以下命令在Vllm中启动导出的模型：

CUDA_VISIBLE_DEVICES=3,1,0,2 VLLM_USE_V1=1 VLLM_WORKER_MULTIPROC_METHOD=spawn vllm serve /root/HuggingFaceCache/models--lmsys--vicuna-7b-v1.5-sft --trust-remote-code --served-model-name gpt-4 --gpu-memory-utilization 0.98 --tensor-parallel-size 4 --port 8000

总结

通过以上步骤，我们成功使用LLaMA-Factory对AI进行了微调，使其具备特定的认知。希望大家能够尝试并应用这些方法进行更多的定制化。

使用LLaMA-Factory对AI进行认知的微调

使用LLaMA-Factory对AI进行认知的微调引言1. 安装LLaMA-Factory1.1. 克隆仓库1.2. 创建虚拟环境1.3. 安装LLaMA-Factory1.4. 验证 2. 准备数据2.1. 创建数据集2.2. 更新数据集信息 3. 启动LLaMA-Factory4. 进行微调4.1. 设置模型4.2. 预览数据集4.3. 设置学习率等参数4.4. 预览…...

编程日记 2025/2/4 2:30:34

@Nullable 注解

文章目录解释 Nullable 注解注解的组成部分：如何使用 Nullable 注解a. 标注方法返回值：b. 标注方法参数：c. 标注字段： 结合其他工具与 Nonnull 配合使用总结 Nullable 注解在 Java 中的使用场景通常与 Nullability（空…...

编程日记 2025/2/4 2:28:31

Arduino大师练成手册 -- 控制 AS608 指纹识别模块

要在 Arduino 上控制 AS608 指纹识别模块，你可以按照以下步骤进行： 硬件连接连接指纹模块：将 AS608 指纹模块与 Arduino 连接。通常，AS608 使用 UART 接口进行通信。你需要将 AS608 的 TX、RX、VCC 和 GND 引脚分别连接到 Ardu…...

编程日记 2025/2/4 2:25:28

Mask R-CNN与YOLOv8的区别

Mask R-CNN与YOLOv8虽然都是深度学习在计算机视觉领域的应用，但它们属于不同类型的视觉框架，各有特点和优势。以下是关于 Mask R-CNN 和 YOLOv8 的详细对比分析，涵盖核心原理、性能差异、应用场景和选择建议： 1. 核心原理与功能…...

编程日记 2025/2/4 2:19:13

在Ubuntu上使用Docker部署DeepSeek

在Ubuntu上使用Docker部署DeepSeek，并确保其可以访问公网网址进行对话，可以按照以下步骤进行： 一、安装Docker 更新Ubuntu的软件包索引： sudo apt-get update安装必要的软件包，这些软件包允许apt通过HTTPS使用存储库…...

编程日记 2025/2/4 2:18:11

MySQL的覆盖索引

MySQL的覆盖索引前言当一个索引包含了查询所需的全部字段时，就可以提高查询效率，这样的索引又被称之为覆盖索引。以MySQL常见的三种存储引擎为例：InnoDB、MyISAM、Memory，对于覆盖索引提高查询效率的方式均不同，…...

编程日记 2025/2/4 2:16:05

【Numpy核心编程攻略：Python数据处理、分析详解与科学计算】2.12 连续数组：为什么contiguous这么重要？

2.12 连续数组：为什么contiguous这么重要？ 目录 #mermaid-svg-wxhozKbHdFIldAkj {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-wxhozKbHdFIldAkj .error-icon{fill:#552222;}#mermaid-svg-…...

编程日记 2025/2/4 2:11:59

在React中使用redux

一、首先安装两个插件 1.Redux Toolkit 2.react-redux 第一步：创建模块counterStore 第二步：在store的入口文件进行子模块的导入组合第三步：在index.js中进行store的全局注入第四步：在组件中进行使用第五步：在组件中…...

编程日记 2025/2/4 2:04:51

lstm预测

import numpy as np import pandas as pd import tensorflow as tf import math import matplotlib.pyplot as plt from sklearn.preprocessing import MinMaxScaler from keras.layers import LSTM,Activation,Dense,Dropout# 时间序列数据转换为监督学习的格式 def creatXY(d…...

编程日记 2025/2/4 2:03:48

《 C++ 点滴漫谈：二十五》空指针，隐秘而危险的杀手：程序崩溃的真凶就在你眼前！

摘要本博客全面解析了 C 中指针与空值的相关知识，从基础概念到现代 C 的改进展开，涵盖了空指针的定义、表示方式、使用场景以及常见注意事项。同时，深入探讨了 nullptr 的引入及智能指针在提升代码安全性和简化内存管理方面的优势。通过实际…...

编程日记 2025/2/4 2:02:47

【AI】探索自然语言处理（NLP）：从基础到前沿技术及代码实践

Hi ！ 云边有个稻草人-CSDN博客必须有为成功付出代价的决心，然后想办法付出这个代价。目录引言 1. 什么是自然语言处理（NLP）？ 2. NLP的基础技术 2.1 词袋模型（Bag-of-Words，BoW&#xff…...

编程日记 2025/2/4 2:01:45

2025年Android开发趋势全景解读

文章目录一、界面开发：从"手写代码"到"智能拼装"1.1 Jetpack Compose实战进化1.2 淘汰XML布局的三大信号二、AI融合开发：无需炼丹的普惠智能2.1 设备端AI三大杀手级应用2.2 成本对比：设备端VS云端AI 三、跨平台演进&am…...

编程日记 2025/2/4 1:59:43

C#面试常考随笔11：Dictionary＜K, V＞、Hashtable的内部实现原理是什么？效率如何？

Dictionary<K, V> 底层数据结构：使用哈希表（Hash Table），由一个数组和链表（或在.NET Core 2.1 及之后版本中，当链表长度达到一定阈值时转换为红黑树）组成。数组中的每个元素称为一个桶&a…...

编程日记 2025/2/4 1:58:42

Linux防火墙基础

一、Linux防火墙的状态机制 1.iptables是可以配置有状态的防火墙，其有状态的特点是能够指定并记住发送或者接收信息包所建立的连接状态，其一共有四种状态，分别为established invalid new related。 established:该信息包已建立连接&#x…...

编程日记 2025/2/4 1:55:35

Qt u盘自动升级软件

Qt u盘自动升级软件 Chapter1 Qt u盘自动升级软件u盘自动升级软件思路：step1. 获取U盘判断U盘名字是否正确， 升级文件是否存在。step2. 升级step3. 升级界面 Chapter2 Qt 嵌入式设备应用程序，通过U盘升级的一种思路Chapter3 在开发板上运行的…...

编程日记 2025/2/4 1:48:24

【Conda 和虚拟环境详细指南】

Conda 和虚拟环境的详细指南什么是 Conda？ Conda 是一个开源的包管理和环境管理系统，支持多种编程语言（如Python、R等），最初由Continuum Analytics开发。主要功能： 包管理：安装、更新、删…...

编程日记 2025/2/4 1:46:22

Python递归函数深度解析：从原理到实战

Python递归函数深度解析：从原理到实战递归是计算机科学中重要的编程范式，也是算法设计的核心思想之一。本文将通过20实战案例，带你深入理解Python递归函数的精髓，掌握递归算法的实现技巧。一、递归函数核心原理 1.1 递归三要…...

编程日记 2025/2/4 1:45:19

OpenGL学习笔记（五）：Textures 纹理

文章目录纹理坐标纹理环绕方式纹理过滤——处理纹理分辨率低的情况多级渐远纹理Mipmap——处理纹理分辨率高的情况加载与创建纹理 （ <stb_image.h> ）生成纹理应用纹理纹理单元练习1练习2练习3练习4 通过上一篇着色部分的学习，我们可以…...

编程日记 2025/2/4 1:43:16

【TypeScript】基础：数据类型

文章目录 TypeScript一、简介二、类型声明三、数据类型anyunknownnervervoidobjecttupleenumType一些特殊情况 TypeScript 是JavaScript的超集，代码量比JavaScript复杂、繁多；但是结构更清晰一、简介为什么需要TypeScript？ JavaScript的…...

编程日记 2025/2/4 1:39:13

Notepad++消除生成bak文件

设置(T) ⇒ 首选项... ⇒ 备份 ⇒ 勾选 "禁用" 勾选禁用就不会再生成bak文件了 notepad怎么修改字符集编码格式为gbk 如图所示...

编程日记 2025/2/4 1:38:10

如何用LinkSwift解锁九大网盘下载新姿势？完整攻略揭秘

如何用LinkSwift解锁九大网盘下载新姿势？完整攻略揭秘【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ，支持百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼…...

编程新知 2026/5/16 13:09:18

终极MifareOneTool使用指南：零基础玩转MIFARE经典卡的Windows图形化神器

终极MifareOneTool使用指南：零基础玩转MIFARE经典卡的Windows图形化神器【免费下载链接】MifareOneTool A GUI Mifare Classic tool on Windows（停工/最新版v1.7.0） 项目地址: https://gitcode.com/gh_mirrors/mi/MifareOneTool 想要…...

编程新知 2026/5/16 11:43:35