当前位置: 首页 > news >正文

llamafactory大模型微调教程(周易大模型案例)

1.环境说明

操作系统:ubuntu 20
基础模型:Qwen2.5-1.5B-Instruct
工具:llamafactory
GPU:四张4090

2、环境部署

2.1 下载基础模型

# 1、下载 modelscope
pip install modelscope#2、模型下载
cd /data/
cat >> download.py <<EOF
from modelscope import snapshot_download
model_dir = snapshot_download('Qwen/Qwen2.5-1.5B-Instruct')
EOF
python download.py#等待下载完成即可

2.2 下载llamafactory工具

#1.克隆仓库
git clone https://github.com/hiyouga/LLaMA-Factory.git
#2.下载依赖
cd LLaMA-Factory
pip install -e .[torch,metrics]
#3、执行需要使用的显卡,运行web
CUDA_VISIBLE_DEVICES=0,1,2,3 python src/webui.py
或者
CUDA_VISIBLE_DEVICES=0,1,2,3 llamafactory-cli webui

3、模型微调训练

3.1 数据准备

1.1 制作数据
LLaMA-Factory/data/ 下面有很多数据格式demo,我们参考这种的就行alpaca_zh_demo.json

下面我们把周易的数据制作成下面的格式:
LLaMA-Factory/data/zhougong.json

[{"instruction": "你是一个周文王,周易的作者,擅长通过梦境去推演现在过去未来","input": "梦见体育教练是什么意思","output": "梦见体育教练有现实的影响和反应,也有梦者的主观想象,请看下面由(周公解梦官网)小编帮你整理的梦见体育教练的详细解说吧。  体育教练的职责是自己出力而让学生获得巨大成功, 所以在梦境中自己充当着教练的角色,或者梦见教练在训练的情景, 这都提示着梦者自己的投资不会获得直接利润。  别人的成功也就是自己的成功,只有这样才能得到心理平衡。梦中教练的身份还提示着不合理冲动、攻击的间接性表达,这类教练都是攻击性、竞技性比较强烈的项目教练,如拳击、击剑,足球、篮球教练等。  梦到体育教练,暗示你的投资不会有利润。  商人梦见体育教练,表示最近自己的事业不会盈利,但是对社会有很大的贡献。  梦见受著名的体育选手指导,健康方面将有不韦。尤其社团活动时,发生事故或受伤的可能性很大。 这个时候,最好避免练球练得太晚。  梦见体育教练的案例分析  梦境描述:不知道为什么,这一个星期来,不论是睡午觉还是晚上睡觉,都会梦见我的体育教练,梦见他对我笑,然后我跟他像好朋友似的,一起玩,一起逛街,为什么呢?如果说这种是恋师,那我又不喜欢他,而且他长得又不算好看,而且还有些讨厌他呢!  梦境解析:很多感情的萌牙都是在不知不觉中进行的,明明自己讨厌着他,不知不觉却离不开他了,只是你现在还没察觉而已。  【大师特色梦境分析】  以上解梦为通用解释,如需知晓具体事宜,可请大师结合您的生辰八字及做梦时的情景解梦:"},{"instruction": "你是一个周文王,周易的作者,擅长通过梦境去推演现在过去未来","input": "梦见贵人是什么意思","output": "梦见贵人有现实的影响和反应,也有梦者的主观想象,请看下面由(周公解梦官网)小编帮你整理的梦见贵人的详细解说吧。    做这种梦见贵人的梦不多,能够梦见贵人表示你能够出人头地的机会很大,未来有一番作为。  如果梦见领袖,则表示心灵上得到安详;如果梦见领袖在行事,则会受到赏识。  一般人梦见自己在贵人面前,表示将会出人头地;但若梦中与贵人为对等地位,则有忧事将至。  原版周公解梦  贵人走马,官事明。《周公解梦》  来见贵人,不得凶。《周公解梦》  梦贵人入家。凡梦官吏人门,富贵大吉。梦欲见贵人官吏而不得见者凶,得见者贵。梦与贵人亲近者吉利,拜谒贵人者主有扶持之力,事无不吉。 《梦林玄解》  梦见拜贵人,吉利。《敦煌本梦书》  梦见贵人赐饭,主病。《敦煌本梦书》  梦见贵人坐,欲贵。《敦煌本梦书》  梦见人拜贵人,吉。《敦煌本梦书》  梦见屋中有贵人,大吉。《敦煌本梦书》  梦见与贵人交往,吉。《敦煌本梦书》  一切贵人,皆吉利。《周公解梦》  做贵人卫兵,主吉。《周公解梦》  【大师特色梦境分析】  以上解梦为通用解释,如需知晓具体事宜,可请大师结合您的生辰八字及做梦时的情景解梦:"},{"instruction": "你是一个周文王,周易的作者,擅长通过梦境去推演现在过去未来","input": "梦见贵族是什么意思","output": "梦见贵族有现实的影响和反应,也有梦者的主观想象,请看下面由(周公解梦官网)小编帮你整理的梦见贵族的详细解说吧。  贵族大多是人们对上层阶级的统称,也大多泛指在社会上享有特权的阶层。  一般贵族代表了身份的高贵,也是财富与社会地位的象征。  梦见与贵族说话,若平静的说话,表示会发生烦恼的事。  梦见贵族人士骂你,表示你的幸运即将来临。  相反的,若是梦见你骂贵族人士,则为凶兆,预示可能会遭遇灾难。  梦见结交贵族,暗示你强烈的愿望并不是很正当的,因为你更喜欢炫耀和享乐,而不是追求心智方面的更高层次的修养。  对于年轻女子,梦见贵族,预示她将在选择伴侣时以貌取人,而不是明智地让品行优秀的男人做她的保护神。  梦见贵族的案件分析  梦境描述:梦见自己是欧洲中世纪贵族家的小姐,好像父亲是一个很有权势的人,家里有女佣,梦中我还有自己喜欢的人。  梦境解析:此梦反映了你热衷于享乐,而自己的实际情况被完全背离,做此梦是提醒你不要过度骄奢淫逸,更应该注重自己内心的修养。  【大师特色梦境分析】  以上解梦为通用解释,如需知晓具体事宜,可请大师结合您的生辰八字及做梦时的情景解梦:"},...]

3.2 注册数据集

LLaMA-Factory/data/dataset_info.json

{"zhougong": {"file_name": "zhougong.json"},"identity": {"file_name": "identity.json"},"alpaca_en_demo": {"file_name": "alpaca_en_demo.json"},....
}

可以看到我注册了一个名字为zhougong的数据集

3.3 大模型训练

在这里插入图片描述
在这里插入图片描述
开始训练
在这里插入图片描述

在模型训练过程中,"loss值"指的是损失函数(Loss Function)计算出来的结果,它是衡量模型预测值与真实值之间差异的一个指标。损失值越小,意味着模型的预测结果与实际数据之间的误差越小,模型的表现就越好。

3.3 新模型验证

在这里插入图片描述
在这里插入图片描述
可以发现新模型已经有效果了,但是由于训练的数据集质量不太行(网上免费的数据,自己做的清洗),造成输出结果不太理想。

3.4 模型权重导出

在这里插入图片描述

相关文章:

llamafactory大模型微调教程(周易大模型案例)

1.环境说明 操作系统&#xff1a;ubuntu 20 基础模型&#xff1a;Qwen2.5-1.5B-Instruct 工具&#xff1a;llamafactory GPU&#xff1a;四张4090 2、环境部署 2.1 下载基础模型 # 1、下载 modelscope pip install modelscope#2、模型下载 cd /data/ cat >> download…...

excel 斜向拆分单元格

右键-合并单元格 右键-设置单元格格式-边框 在设置好分割线后&#xff0c;你可以开始输入文字。 需要注意的是&#xff0c;文字并不会自动分成上下两行。 为了达到你期望的效果&#xff0c;你可以通过 同过左对齐、上对齐 空格键或使用【AltEnter】组合键来调整单元格中内容的…...

【JAVA架构师成长之路】【JVM实战】第2集:生产环境内存飙高排查实战

课程标题:生产环境内存飙高排查实战——从堆转储到代码修复的15分钟指南 目标:掌握内存泄漏与OOM问题的系统性排查方法,快速定位代码或配置缺陷 0-1分钟:问题引入与核心现象 线上服务内存持续增长,触发频繁Full GC甚至OOM(OutOfMemoryError),导致服务崩溃。常见诱因:…...

MATLAB实现遗传算法优化风电_光伏_光热_储热优化

1. 问题定义 目标&#xff1a;最小化输出负荷与需求负荷的偏差平方和。决策变量&#xff1a;每个时间步长的风电、光伏、光热和储热输出功率。约束条件&#xff1a; 风电、光伏、光热的输出功率不得超过其最大容量。储热系统的输出功率&#xff08;充放电&#xff09;不得超过…...

JCRQ1河马算法+四模型对比!HO-CNN-GRU-Attention系列四模型多变量时序预测

JCRQ1河马算法四模型对比&#xff01;HO-CNN-GRU-Attention系列四模型多变量时序预测 目录 JCRQ1河马算法四模型对比&#xff01;HO-CNN-GRU-Attention系列四模型多变量时序预测预测效果基本介绍程序设计参考资料 预测效果 基本介绍 基于HO-CNN-GRU-Attention、CNN-GRU-Attent…...

react中的fiber和初次渲染

源码中定义了不同类型节点的枚举值 组件类型 文本节点HTML标签节点函数组件类组件等等 src/react/packages/react-reconciler/src/ReactWorkTags.js export const FunctionComponent 0; export const ClassComponent 1; export const IndeterminateComponent 2; // Befo…...

LLM 大模型基础认知篇

目录 1、基本概述 2、大模型工作原理 3、关键知识点 &#xff08;1&#xff09;RAG 知识库 &#xff08;2&#xff09;蒸馏 &#xff08;3&#xff09;微调 &#xff08;4&#xff09;智能体 1、基本概述 大型语言模型&#xff08;Large Language Model, LLM&#xff09…...

leetcode700-二叉搜索树中的搜索

leetcode 700 思路 我们需要先了解一下二叉搜索树的特性&#xff1a; 左子树的所有节点值 < 当前节点的值。右子树的所有节点值 > 当前节点的值。这个特性适用于树中的每个节点 那么根据这个特性&#xff0c;我们可以通过根节点的值和目标值的大小来判断后序的走向&…...

《MySQL三大核心日志解析:Undo Log/Redo Log/Bin Log对比与实践指南》

MySQL三大核心日志解析&#xff1a;Undo Log/Redo Log/Bin Log对比与实践指南 一、核心日志全景概览 在MySQL数据库体系中&#xff0c;Undo Log、Redo Log和Bin Log构成了事务处理和数据安全的三大基石。这三大日志各司其职&#xff0c;协同保障了数据库的ACID特性与高可用架…...

java中实体类常见的设计模式

实体类常见的设计模式 1. Set 链式编程 在实体类中实现链式调用通常是指让 setter 方法返回当前对象实例&#xff08;this&#xff09;&#xff0c;从而允许连续调用多个 setter 方法设置属性值。这种方式可以使代码更加简洁和直观。 例如实体类为&#xff1a; public clas…...

【够用就好006】如何从零开发游戏上架steam面向AI编程的godot独立游戏制作实录001流程

记录工作实践 这是全新的系列&#xff0c;一直有个游戏制作梦 感谢AI时代&#xff0c;让这一切变得可行 长欢迎共同见证&#xff0c;期更新&#xff0c;欢迎保持关注&#xff0c;待到游戏上架那一天&#xff0c;一起玩 面向AI编程的godot独立游戏制作流程实录001 本期是第…...

发行思考:全球热销榜的频繁变动

几点杂感&#xff1a; 1、单机游戏销量与在线人数的衰退是剧烈的&#xff0c;有明显的周期性&#xff0c;而在线游戏则稳定很多。 如去年的某明星游戏&#xff0c;最高200多万在线&#xff0c;如今在线人数是48名&#xff0c;3万多。 而近期热门的是MH&#xff0c;在线人数8…...

docker目录挂载与卷映射的区别

在 Docker 中&#xff0c;目录挂载&#xff08;Bind Mount&#xff09;和卷映射&#xff08;Volume Mount&#xff09;的命令语法差异主要体现在路径格式上&#xff0c;具体表现为是否以斜杠&#xff08;/&#xff09;开头。以下是两者的核心区别及使用场景的总结&#xff1a; …...

`label` 标签的 `for` 属性详解

一、基本概念 label 标签的 for 属性用于将标签与表单控件&#xff08;如 input、select 等&#xff09;绑定&#xff0c;其值需与目标元素的 id 完全匹配。这种关联允许用户点击标签时触发控件交互&#xff08;如聚焦输入框或切换复选框&#xff09;&#xff0c;提升操作便捷…...

公开笔记:自然语言处理(NLP)中文文本预处理主流方法

在自然语言处理&#xff08;NLP&#xff09;领域&#xff0c;将中文文本转化为数字的主流方法主要集中在预训练语言模型和子词编码技术上。这些方法能够更好地捕捉语义信息&#xff0c;并且在各种NLP任务中表现出色。以下是目前主流的文本编码方法&#xff1a; 1. 基于预训练语…...

【一个月备战蓝桥算法】递归与递推

字典序 在刷题和计算机科学领域&#xff0c;字典序&#xff08;Lexicographical order&#xff09;也称为词典序、字典顺序、字母序&#xff0c;是一种对序列元素进行排序的方式&#xff0c;它模仿了字典中单词的排序规则。下面从不同的数据类型来详细解释字典序&#xff1a; …...

算法策略深度解析与实战应用

一、算法策略的本质与价值 算法策略是计算机科学的灵魂&#xff0c;它决定了问题解决的效率与质量。优秀的算法设计者就像战场上的指挥官&#xff0c;需要根据地形&#xff08;问题特征&#xff09;选择最佳战术&#xff08;算法策略&#xff09;。本文将深入剖析五大核心算法…...

【LeetCode 热题 100】3. 无重复字符的最长子串 | python 【中等】

美美超过管解 题目&#xff1a; 3. 无重复字符的最长子串 给定一个字符串 s &#xff0c;请你找出其中不含有重复字符的 最长的长度。 示例 1: 输入: s "abcabcbb" 输出: 3 解释: 因为无重复字符的最长子串是 "abc"&#xff0c;所以其长度为 3。 注…...

计算机网络(1) 网络通信基础,协议介绍,通信框架

网络结构模式 C/S-----客户端和服务器 B/S -----浏览器服务器 MAC地址 每一个网卡都拥有独一无二的48位串行号&#xff0c;也即MAC地址&#xff0c;也叫做物理地址、硬件地址或者是局域网地址 MAC地址表示为12个16进制数 如00-16-EA-AE-3C-40 &#xff08;每一个数可以用四个…...

在 Docker 中,无法直接将外部多个端口映射到容器内部的同一个端口

Docker 的端口映射是一对一的&#xff0c;即一个外部端口只能映射到容器内部的一个端口。 1. 为什么不能多对一映射&#xff1f; 端口冲突&#xff1a; 如果外部多个端口映射到容器内部的同一个端口&#xff0c;Docker 无法区分外部请求应该转发到哪个内部端口&#xff0c;会…...

python如何将word的doc另存为docx

将 DOCX 文件另存为 DOCX 格式&#xff08;Python 实现&#xff09; 在 Python 中&#xff0c;你可以使用 python-docx 库来操作 Word 文档。不过需要注意的是&#xff0c;.doc 是旧的 Word 格式&#xff0c;而 .docx 是新的基于 XML 的格式。python-docx 只能处理 .docx 格式…...

新能源汽车智慧充电桩管理方案:新能源充电桩散热问题及消防安全监管方案

随着新能源汽车的快速普及&#xff0c;充电桩作为核心配套设施&#xff0c;其安全性与可靠性备受关注。然而&#xff0c;在高温、高负荷运行环境下&#xff0c;充电桩的散热问题与消防安全隐患日益凸显&#xff0c;成为制约行业发展的关键瓶颈。 如何通过智慧化管理手段优化散…...

PL0语法,分析器实现!

简介 PL/0 是一种简单的编程语言,通常用于教学编译原理。它的语法结构清晰,功能包括常量定义、变量声明、过程(子程序)定义以及基本的控制结构(如条件语句和循环语句)。 PL/0 语法规范 PL/0 是一种教学用的小型编程语言,由 Niklaus Wirth 设计,用于展示编译原理的核…...

【JavaSE】绘图与事件入门学习笔记

-Java绘图坐标体系 坐标体系-介绍 坐标原点位于左上角&#xff0c;以像素为单位。 在Java坐标系中,第一个是x坐标,表示当前位置为水平方向&#xff0c;距离坐标原点x个像素;第二个是y坐标&#xff0c;表示当前位置为垂直方向&#xff0c;距离坐标原点y个像素。 坐标体系-像素 …...

项目部署到Linux上时遇到的错误(Redis,MySQL,无法正确连接,地址占用问题)

Redis无法正确连接 在运行jar包时出现了这样的错误 查询得知问题核心在于Redis连接失败&#xff0c;具体原因是客户端发送了密码认证请求&#xff0c;但Redis服务器未设置密码 1.为Redis设置密码&#xff08;匹配客户端配置&#xff09; 步骤&#xff1a; 1&#xff09;.修…...

大语言模型(LLM)中的KV缓存压缩与动态稀疏注意力机制设计

随着大语言模型&#xff08;LLM&#xff09;参数规模的增长&#xff0c;推理阶段的内存占用和计算复杂度成为核心挑战。传统注意力机制的计算复杂度随序列长度呈二次方增长&#xff0c;而KV缓存的内存消耗可能高达数十GB&#xff08;例如Llama2-7B处理100K token时需50GB内存&a…...

如何更改默认 Crontab 编辑器 ?

在 Linux 领域中&#xff0c;crontab 是您可能经常遇到的一个术语。这个实用程序在类 unix 操作系统上可用&#xff0c;用于调度在预定义时间和间隔自动执行的任务。这对管理员和高级用户非常有益&#xff0c;允许他们自动执行各种系统任务。 编辑 Crontab 文件通常使用文本编…...

三分算法与DeepSeek辅助证明是单峰函数

前置 单峰函数有唯一的最大值&#xff0c;最大值左侧的数值严格单调递增&#xff0c;最大值右侧的数值严格单调递减。 单谷函数有唯一的最小值&#xff0c;最小值左侧的数值严格单调递减&#xff0c;最小值右侧的数值严格单调递增。 三分的本质 三分和二分一样都是通过不断缩…...

Android屏幕刷新率与FPS(Frames Per Second) 120hz

Android屏幕刷新率与FPS(Frames Per Second) 120hz 屏幕刷新率是屏幕每秒钟刷新显示内容的次数&#xff0c;单位是赫兹&#xff08;Hz&#xff09;。 60Hz 屏幕&#xff1a;每秒刷新 60 次&#xff0c;每次刷新间隔约 16.67ms 90Hz 屏幕&#xff1a;每秒刷新 90 次&#xff0c;…...

JUC并发编程(二)Monitor/自旋/轻量级/锁膨胀/wait/notify/锁消除

目录 一 基础 1 概念 2 卖票问题 3 转账问题 二 锁机制与优化策略 0 Monitor 1 轻量级锁 2 锁膨胀 3 自旋 4 偏向锁 5 锁消除 6 wait /notify 7 sleep与wait的对比 8 join原理 一 基础 1 概念 临界区 一段代码块内如果存在对共享资源的多线程读写操作&#xf…...