当前位置：首页 > news >正文

使用LLaMA-Factory微调大模型

news 2025/12/22 21:09:28

使用LLaMA-Factory微调大模型

github 地址
https://github.com/hiyouga/LLaMA-Factory

搭建环境

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory

在 LLaMA-Factory 路径下创建虚拟环境

conda create -p ./venv python=3.10

激活环境

conda activate ./venv

在虚拟环境中安装依赖

python -m pip install -e .

下载数据集

我这里使用自带的数据
LLaMA-Factory/data/glaive_toolcall_zh_demo.json

下载模型

我这里使用 Qwen-1_8B-Chat
本地路径 /media/wmx/soft1/huggingface_cache/Qwen-1_8B-Chat

启动 webui

我这里是本地电脑显卡是 GTX-4070ti-super 16G ，单卡

CUDA_VISIBLE_DEVICES=0 GRADIO_SHARE=1 llamafactory-cli webui

配置参数

在这里插入图片描述

因为是Qwen模型，不是Qwen1.5及以后的模型所以
train.lora_target: c_attn 这里必须这样，不然报错！！！

Qwen-1.8B-Chat.yaml：

top.adapter_path: []
top.booster: none
top.finetuning_type: lora
top.model_name: Qwen1.5-1.8B-Chat
top.quantization_bit: none
top.rope_scaling: none
top.template: qwen
top.visual_inputs: false
train.additional_target: ''
train.badam_mode: layer
train.badam_switch_interval: 50
train.badam_switch_mode: ascending
train.badam_update_ratio: 0.05
train.batch_size: 4
train.compute_type: fp16
train.create_new_adapter: false
train.cutoff_len: 1024
train.dataset:
- glaive_toolcall_zh_demo
train.dataset_dir: data
train.device_count: '1'
train.ds_offload: false
train.ds_stage: none
train.freeze_extra_modules: ''
train.freeze_trainable_layers: 2
train.freeze_trainable_modules: all
train.galore_rank: 16
train.galore_scale: 0.25
train.galore_target: all
train.galore_update_interval: 200
train.gradient_accumulation_steps: 8
train.learning_rate: 5e-5
train.logging_steps: 5
train.lora_alpha: 16
train.lora_dropout: 0
train.lora_rank: 8
train.lora_target: c_attn
train.loraplus_lr_ratio: 0
train.lr_scheduler_type: cosine
train.max_grad_norm: '1.0'
train.max_samples: '100000'
train.neftune_alpha: 0
train.num_train_epochs: '100'
train.optim: adamw_torch
train.packing: false
train.ppo_score_norm: false
train.ppo_whiten_rewards: false
train.pref_beta: 0.1
train.pref_ftx: 0
train.pref_loss: sigmoid
train.report_to: false
train.resize_vocab: false
train.reward_model: null
train.save_steps: 100
train.shift_attn: false
train.training_stage: Supervised Fine-Tuning
train.upcast_layernorm: false
train.use_badam: false
train.use_dora: false
train.use_galore: false
train.use_llama_pro: false
train.use_rslora: false
train.val_size: 0
train.warmup_steps: 0

然后保存配置参数，然后点击开始微调

使用LLaMA-Factory微调大模型

使用LLaMA-Factory微调大模型 github 地址 https://github.com/hiyouga/LLaMA-Factory 搭建环境 git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git cd LLaMA-Factory在 LLaMA-Factory 路径下创建虚拟环境 conda create -p ./venv python3.10激活环境 c…...

编程日记 2024/6/6 18:41:43

C语言二级指针、指针数组

一、二级指针指针变量也是变量，是变量就应有地址，那指针变量的地址存放在哪里？存放在二级指针变量。此时，*ppa pa，**ppa a。二、指针数组指针数组，顾名思义就是存放指针的数组。数组每个元素为int类…...

编程日记 2024/6/6 18:40:42

python方法

目录公共方法 1.容器类型之间的转化 2.运算符 3.通用函数公共方法 1.容器类型之间的转化 # 类型转化 data_str itcast data_list [hadoop, spark, hive, python, hive] data_tupe (hadoop, spark, hive, python, hive) data_set {hadoop, spark, hive, python,…...

编程日记 2024/6/6 18:39:41

0基础学习区块链技术——去中心化

大纲去验证的中心化验证者如何验证验证者为什么要去传播去确认的中心化去存储的中心化 “去中心化”是区块链技术的核心。那么我们该如何理解这个概念呢？ 我们可以假想在一次现实转账中，有哪些“中心化”的行为： 判断余额是否足够。即判断…...

编程日记 2024/6/6 18:38:40

索引的强大作用和是否创建的索引越多越好

在经常查询字段上创建索引。在大数据的情况下，在索引上查找可以提交10倍以上甚至1000倍的速度。实际测试，不在索引上查找用时12秒左右。建立索引，在索引上查找速度提高只耗时1.1秒左右。当然索引也是一把双刃剑，在一个表上创建索…...

编程日记 2024/6/6 18:37:38

批量GBK转UTF-8

大家都有这样的需求，把GBK编码的源代码转换成utf-8编码的源代码。毕竟现在UTF-8的支持是很好的。以前一些旧代码是GBK的，尤其是里面的注释，如果不采用UTF-8，在vscode里面可能看着就是乱码。试了各种工具，最后发现…...

编程日记 2024/6/6 18:35:35

C#WPF数字大屏项目实战08--生产量/良品统计

1、区域划分生产量/良品统计这部分位于第二列的第二行 2、livechart拆线图定义折线图,如下: <lvc:CartesianChart> <lvc:CartesianChart.Series>  <lvc:LineSeries/>…...

编程日记 2024/6/6 18:34:34

22、matlab锯齿波、三角波、方波：rectpuls()函数/sawtooth()函数/square()函数

1、采样的非周期性矩形语法语法1：y rectpuls(t) 返回一个以数组 t 中指示的采样时间采样的连续非周期性单位高度矩形脉冲，该矩形脉冲以 t 0 为中心。语法2：y rectpuls(t,w) 生成一个宽度为 w 的矩形参数 t:采样时间 w:矩形宽度…...

编程日记 2024/6/6 18:32:33

手机和WINDOWS电脑蓝牙连接后怎样放歌,无法选择媒体音频蓝牙媒体音频勾选不上

手机和电脑蓝牙连接后怎样放歌要将手机通过蓝牙连接到电脑并播放音乐，可以按照以下步骤操作： 确保手机和电脑都支持蓝牙功能，并且蓝牙功能已经开启。在电脑上，打开“设置”> “设备”> “蓝牙和其他设备”。点击“添…...

编程日记 2024/6/6 18:31:31

MatrixOne→MatrixOS：矩阵起源的创业史即将用“AI Infra”和“AI Platform”书写新章程

在数字化浪潮的推动下，MatrixOne的故事就像一部科技界的创业史诗，它始于一个简单而宏伟的梦想——构建一个能够支撑起新一代数字世界的操作系统。想象一下，在AIGC时代，数据流动如同“血液”，算法运转如同“心跳”&…...

编程日记 2024/6/6 18:29:29

vue3将自定义组件插入指定dom

需求简要描述页面渲染了一个 id 为 videoPlayerId 的div盒子，代码自定义了一个名为CustomComponent 的组件，现在需要在vue3中，通过纯 js 的方式将组件 CustomComponent 插入 videoPlayerId 的div中，作为其子节点。实现代码 C…...

编程日记 2024/6/6 18:28:28

flutter封装日历选择器（单日选择）

简单封装： 引入库：table_calendar import package:generated/l10n.dart; import package:jade/utils/JadeColors.dart; import package:jade/utils/Utils.dart; import package:util/easy_loading_util.dart; import package:flutter/material.dart; im…...

编程日记 2024/6/6 18:27:27

SwiftUI调用相机拍照

在 SwiftUI 中实现拍照功能，需要结合 UIViewControllerRepresentable 和 UIImagePickerController 来实现相机功能。下面是一个详细的示例，展示如何使用 SwiftUI 来实现拍照功能： 1. 创建一个 ImagePicker 组件首先，创建一个 U…...

编程日记 2024/6/6 18:26:26

elasticsearch （dsl）

正排索引和倒排索引正排索引：通过id ，查询content 倒排索引：通过content，查询到符合的 ids eg： 正排索引就是通过《静夜思》，找到整片文章。倒排索引通过“明月”，找到《静夜思》《望…...

编程日记 2024/6/6 18:25:25

聊聊大模型微调训练全流程的思考

前言参考现有的中文医疗模型：MedicalGPT、CareGPT等领域模型的训练流程，结合ChatGPT的训练流程，总结如下： 在预训练阶段，模型会从大量无标注文本数据集中学习领域/通用知识；其次使用{有监督微调}(SFT)优化…...

编程日记 2024/6/6 18:24:23

Python变量符号：深入探索与实用指南

Python变量符号：深入探索与实用指南在Python编程的世界中，变量符号扮演着至关重要的角色。它们不仅是存储数据的容器，更是构建复杂逻辑和算法的基础。然而，对于初学者来说，Python的变量符号可能会带来一些困惑和挑战…...

编程日记 2024/6/6 18:23:22

实验八页面置换模拟程序设计

网上找到的程序得到的答案经过手算验证是错的，所以自己实现了一个，具体实现看代码吧，多余的操作已经去掉了。 #include <stdio.h> #include <stdlib.h> #include <stdbool.h>#define VM_PAGE 7 /*假设每个页面可以存放10…...

编程日记 2024/6/6 18:22:21

Spring类加载机制揭秘：深度解析“卸载”阶段

1. 引言在Spring框架中，类的加载和卸载是一个复杂但至关重要的过程。加载主要涉及将类的字节码加载到JVM中，创建对应的Class对象，并准备使其可用的过程。而卸载，则是指当一个类不再被需要时，将其从JVM中清除&#xf…...

编程日记 2024/6/6 18:21:20

Jupyter Notebook快速搭建

Jupyter Notebook why Jupyter Notebook Jupyter Notebook 是一个开源的 Web 应用程序，允许你创建和分享包含实时代码、方程、可视化和解释性文本的文档。其应用包括：数据清洗和转换、数值模拟、统计建模、数据可视化、机器学习等等。 Jupyter Notebo…...

编程日记 2024/6/6 18:20:18

Linux C语言：数组的定义和初始化

一、数组 1、定义在程序设计中，为了处理方便，把具有相同类型的若干变量按有序的形式组织起来，具有一定顺序关系的若干个变量的集合就是数组。 2、特点组成数组的各个变量称为数组的元素数组中各元素的数据类型要求相同元素在内存中是连…...

编程日记 2024/6/6 18:18:16

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板，载入页面后，会显示引导弹窗，适用于引导用户使用页面，点击完成后，会显示下一个引导弹窗，直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…...

编程新知 2025/12/22 20:59:43

【网络安全产品大调研系列】2. 体验漏洞扫描

前言 2023 年漏洞扫描服务市场规模预计为 3.06（十亿美元）。漏洞扫描服务市场行业预计将从 2024 年的 3.48（十亿美元）增长到 2032 年的 9.54（十亿美元）。预测期内漏洞扫描服务市场 CAGR（增长率&…...

编程新知 2025/12/20 17:25:26

聊聊 Pulsar：Producer 源码解析

一、前言 Apache Pulsar 是一个企业级的开源分布式消息传递平台，以其高性能、可扩展性和存储计算分离架构在消息队列和流处理领域独树一帜。在 Pulsar 的核心架构中，Producer（生产者） 是连接客户端应用与消息队列的第一步。生产者…...

编程新知 2025/12/19 22:49:25

【决胜公务员考试】求职OMG——见面课测验1

2025最新版！！！6.8截至答题，大家注意呀！ 博主码字不易点个关注吧,祝期末顺利~~ 1.单选题(2分) 下列说法错误的是:（ B ） A.选调生属于公务员系统 B.公务员属于事业编 C.选调生有基层锻炼的要求 D…...

编程新知 2025/11/8 16:25:01

让AI看见世界：MCP协议与服务器的工作原理

让AI看见世界：MCP协议与服务器的工作原理 MCP（Model Context Protocol）是一种创新的通信协议，旨在让大型语言模型能够安全、高效地与外部资源进行交互。在AI技术快速发展的今天，MCP正成为连接AI与现实世界的重要桥梁。…...

编程新知 2025/12/12 7:41:41

c#开发AI模型对话

AI模型前面已经介绍了一般AI模型本地部署，直接调用现成的模型数据。这里主要讲述讲接口集成到我们自己的程序中使用方式。微软提供了ML.NET来开发和使用AI模型，但是目前国内可能使用不多，至少实践例子很少看见。开发训练模型就不介绍了&am…...

编程新知 2025/12/17 4:32:25

selenium学习实战【Python爬虫】

selenium学习实战【Python爬虫】文章目录 selenium学习实战【Python爬虫】一、声明二、学习目标三、安装依赖3.1 安装selenium库3.2 安装浏览器驱动3.2.1 查看Edge版本3.2.2 驱动安装四、代码讲解4.1 配置浏览器4.2 加载更多4.3 寻找内容4.4 完整代码五、报告文件爬取5.1 提…...

编程新知 2025/12/21 0:32:16