当前位置：首页 > news >正文

peft＋llama3训练自定义数据

news 2026/2/11 4:30:26

要微调自己的模型训练 LLaMA 3，则需要准备一个 JSON 格式的数据集，其中每个条目包含输入文本和相应的标签（如果有的话）。以下是一个 JSON 数据集的示例格式：

[{"input": "这是一个输入样本。","label": "这是一个标签样本。"},{"input": "这是另一个输入样本。","label": "这是另一个标签样本。"},// 更多样本...
]

在这个格式中，每个 JSON 对象包含一个 “input” 字段和一个 “label” 字段。输入字段包含你的模型需要预测的文本，而标签字段包含相应的目标输出。如果你的任务是语言建模，那么 “label” 字段通常是 “input” 字段的延续。
以下是一个使用 JSON 数据集微调 LLaMA 3 的代码案例：

import torch
from peft import LoraConfig, TaskType, get_peft_model
from transformers import LlamaForCausalLM, LlamaTokenizer, DataCollatorForLanguageModeling
from transformers import Trainer, TrainingArguments
from datasets import load_dataset
# 加载 LLaMA 3 模型和分词器
model = LlamaForCausalLM.from_pretrained("path/to/llama3/model")
tokenizer = LlamaTokenizer.from_pretrained("path/to/llama3/tokenizer")
# 设置 PEFT 的 LoraConfig
lora_config = LoraConfig(r=8,lora_alpha=32,target_modules=["q_proj", "v_proj"],task_type=TaskType.CAUSAL_LM
)
# 使用 PEFT 装饰模型
model = get_peft_model(model, lora_config)
# 加载 JSON 数据集
dataset = load_dataset('json', data_files={'train': 'path/to/train.json', 'validation': 'path/to/valid.json'})
# 准备数据集
def preprocess_data(examples):inputs = examples['input']labels = examples['label']tokenized_inputs = tokenizer(inputs, truncation=True, padding='max_length')tokenized_labels = tokenizer(labels, truncation=True, padding='max_length')tokenized_inputs['labels'] = tokenized_labels['input_ids']return tokenized_inputs
tokenized_dataset = dataset.map(preprocess_data, batched=True)
# 设置数据集格式
tokenized_dataset.set_format(type='torch', columns=['input_ids', 'attention_mask', 'labels'])
# 设置训练参数
training_args = TrainingArguments(output_dir="path/to/output/directory",per_device_train_batch_size=4,per_device_eval_batch_size=4,eval_steps=400,logging_steps=100,gradient_accumulation_steps=32,num_train_epochs=3,warmup_steps=500,learning_rate=2e-4,weight_decay=0.01,save_total_limit=3,fp16=True,
)
# 创建 Trainer
trainer = Trainer(model=model,args=training_args,data_collator=DataCollatorForLanguageModeling(tokenizer=tokenizer, mlm=False),train_dataset=tokenized_dataset['train'],eval_dataset=tokenized_dataset['validation'],
)
# 开始训练
trainer.train()
# 保存模型
model.save_pretrained("path/to/output/directory")

在这个代码案例中，我们首先加载了 LLaMA 3 模型和分词器，并设置了 PEFT 的 LoraConfig。然后，我们加载了 JSON 格式的数据集，并使用 preprocess_data 函数对其进行预处理。接着，我们设置了训练参数并创建了 Trainer 实例，最后开始训练模型并保存。

peft＋llama3训练自定义数据

要微调自己的模型训练 LLaMA 3，则需要准备一个 JSON 格式的数据集，其中每个条目包含输入文本和相应的标签（如果有的话）。以下是一个 JSON 数据集的示例格式： [{"input": "这是一个输入样本。",&q…...

编程日记 2024/5/15 17:50:37

vue+ts+vite+pinia+less+echarts 前端可视化实战项目

1.初始化前端输入 npm init vuelatest 命令然后选择需要的插件2.构建完成后在终端切换到vue-project文件夹下 npm install 下载依赖 3.下载 less样式 npm install less less-loader -D 4.下载axios npm install axios 5.下载echarts npm install echarts -S 6.引入中国…...

编程日记 2024/5/15 17:49:36

文心一言指令多样化，你知道的有哪些？

文心一言的指令非常多样化，可以根据用户的需求和场景进行灵活调整。以下是一些常见的文心一言指令示例： 知识问答： 帮我解释一下什么是芯片？中国的历史上有哪些重要的朝代？人工智能在未来会有哪些发展趋势？…...

编程日记 2024/5/15 17:48:34

QT状态机8-使用恢复策略自动恢复属性

当状态分配的属性不再活动时，可能希望将其恢复到初始值，通过设置全局的恢复策略可以使状态机进入一个状态而不用明确制定属性的值。 QStateMachine machine; machine.setGlobalRestorePolicy(QStateMachine::RestoreProperties);当设置了恢复策略以后，状态机将自动恢复所有…...

编程日记 2024/5/15 17:47:32

第83天：代码审计-PHP 项目RCE 安全调试追踪代码执行命令执行

案例一：CNVD拿1day-RCE命令执行-百家CMS 这里用代码审计系统搜索system，可以利用的是第一种打开看细节查找函数引用查找$_file第一次出现的地方这个时候就明白了，必须上传文件，然后利用文件名，去执行system命令 …...

编程日记 2024/5/15 17:44:28

学习Uni-app开发小程序Day8

前面几天，学习了vue的button组件、input组件，vue模版语法、计算属性等，在昨天又根据前面学习的，跟着做了一个小的购物车功能，今天学习了侦听器和计算属性计算属性 computed computed是一个只读的状态,如果要修改…...

编程日记 2024/5/15 17:40:23

OpenHarmony标准设备应用开发（二）——布局、动画与音乐

本章是 OpenHarmony 标准设备应用开发的第二篇文章。我们通过知识体系新开发的几个基于 OpenHarmony3.1 Beta 标准系统的样例：分布式音乐播放、传炸弹、购物车等样例，分别介绍下音乐播放、显示动画、动画转场（页面间转场）三个进阶…...

编程日记 2024/5/15 17:39:22

mysql字段乱序 information_schema

select COLUMN_NAME from information_schema.columns where table_namecollect_column_info and table_schema nz; 返回ASCII排列导致 sqoop import \ --connect "jdbc:mysql://your_host/collect" \ --username your_username \ --password your_password \ --t…...

编程日记 2024/5/15 17:38:20

使用php和redis实现分布式锁

实现分布式锁是在分布式环境中确保资源独占性的重要手段。在这里，我将使用 PHP 和 Redis 来展示如何实现基于 Redis 的分布式锁。首先，我们需要使用 Redis 的 SET 指令来尝试获取锁，并设置一个过期时间，确保锁不会永久存在。在 …...

编程日记 2024/5/15 17:37:18

大龄程序员是否要入职嵌入式python岗位？

在开始前我有一些资料，是我根据网友给的问题精心整理了一份「Python的资料从专业入门到高级教程」， 点个关注在评论区回复“888”之后私信回复“888”，全部无偿共享给大家！！！ 是否要做嵌入式 Python 取决于…...

编程日记 2024/5/15 17:34:14

STL—string类（1）

一、string类 1、为什么要学习string？ C语言中，字符串是以\0结尾的一些字符的集合，为了操作方便，C标准库中提供了一些str系列的库函数，但是这些库函数与字符串是分离开的，不太符合OOP（面向对象…...

编程日记 2024/5/15 17:31:10

科技查新中化工领域查新点如何确立与提炼？案例讲解！

我国化工科技查新工作始于1985年，至今经历了30多年的发展。化工类课题包含化工、炼油、冶金、能源、轻工、石化、环境、医药、环保和军工等， 具有物质种类繁多、制备工艺复杂等特点。因此，本文结合化工查新项目实例，总结提高化工…...

编程日记 2024/5/15 17:30:09

国网698.45报文解析工具

本文分享一个698.45协议的报文解析工具，此报文解析工具功能强大，可以解析多种国网数据协议。下载链接: https://pan.baidu.com/s/1ngbBG-yL8ucRWLDflqzEnQ 提取码: y1de 主要界面如下： 本工具内置698.45数据协议， 即可调用word…...

编程日记 2024/5/15 17:28:06

留学资讯 | 2024英国学生签证申请需要满足哪些条件？

英国移民局于2020年9月10日发布了《移民规则变更声明: HC 707》，对学生签证制度进行了全面改革。该法案于2020年10月5日正式生效。根据此法案，新的学生签证——The Student and Child Student Routes学生和儿童学生路线，将替代原先的Tier 4学…...

编程日记 2024/5/15 17:26:04

Python 中的分步机器学习

1.安装 Python 和 SciPy 平台。 # Check the versions of libraries# Python version import sys print(Python: {}.format(sys.version)) # scipy import scipy print(scipy: {}.format(scipy.__version__)) # numpy import numpy print(numpy: {}.format(numpy.__version__)…...

编程日记 2024/5/15 17:25:03

C++错题集（持续更新ing）

Day 1 一、选择题解析： 在数字不会溢出的前提下，对于正数和负数，有： 1）左移n位，相当于操作数乘以2的n次方； 2）右移n位，相当于操作数除以2的n次方。解析&#xff1a…...

编程日记 2024/5/15 17:24:01

静态IP代理：网络世界的隐秘通道

在数字化时代，网络安全和隐私保护日益受到重视。静态IP代理作为一种网络服务，为用户提供了一个稳定且可预测的网络连接方式，同时保护了用户的在线身份。本文将从五个方面深入探讨静态IP代理的概念、优势、应用场景、技术实现以及选择时的考量…...

编程日记 2024/5/15 17:23:00

信号和槽的其他说明和优缺点

🐌博主主页：🐌倔强的大蜗牛🐌 📚专栏分类：QT❤️感谢大家点赞👍收藏⭐评论✍️ 目录一、信号与槽的断开二、使用Lambda 表达式定义槽函数 1、局部变量引入方式 [ ] 2、函数参数 &am…...

编程日记 2024/5/15 17:20:57

手工创建 kamailio database tables

有些场景可能kamdbctl create不好使，可能需要手工创建 kamailio database tables，可参考下面的命令序列： USE mysql # 删除之前创建的用户 SELECT user,host FROM user; DROP USER kamailio%; FLUSH PRIVILEGES; # 删除之前创建的数据库 DROP…...

编程日记 2024/5/15 17:17:53

SpringBoot接收参数的19种方式

https://juejin.cn/post/7343243744479625267?share_token6D3AD82C-0404-47A7-949C-CA71F9BC9583...

编程日记 2024/5/15 17:16:52

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造，完美适配AGV和无人叉车。同时，集成以太网与语音合成技术，为各类高级系统（如MES、调度系统、库位管理、立库等）提供高效便捷的语音交互体验。 L…...

编程新知 2026/2/10 23:40:34

多模态2025：技术路线“神仙打架”，视频生成冲上云霄

文｜魏琳华编｜王一粟一场大会，聚集了中国多模态大模型的“半壁江山”。智源大会2025为期两天的论坛中，汇集了学界、创业公司和大厂等三方的热门选手，关于多模态的集中讨论达到了前所未有的热度。其中，…...

编程新知 2026/2/8 20:43:00

【快手拥抱开源】通过快手团队开源的 KwaiCoder-AutoThink-preview 解锁大语言模型的潜力

引言： 在人工智能快速发展的浪潮中，快手Kwaipilot团队推出的 KwaiCoder-AutoThink-preview 具有里程碑意义——这是首个公开的AutoThink大语言模型（LLM）。该模型代表着该领域的重大突破，通过独特方式融合思考与非思考…...

编程新知 2026/2/6 19:29:20

Linux 中如何提取压缩文件？

Linux 是一种流行的开源操作系统，它提供了许多工具来管理、压缩和解压缩文件。压缩文件有助于节省存储空间，使数据传输更快。本指南将向您展示如何在 Linux 中提取不同类型的压缩文件。 1. Unpacking ZIP Files ZIP 文件是非常常见的，要在 …...

编程新知 2026/2/1 5:38:25

ubuntu22.04 安装docker 和docker-compose

首先你要确保没有docker环境或者使用命令删掉docker sudo apt-get remove docker docker-engine docker.io containerd runc安装docker 更新软件环境 sudo apt update sudo apt upgrade下载docker依赖和GPG 密钥 # 依赖 apt-get install ca-certificates curl gnupg lsb-rel…...

编程新知 2025/10/31 16:09:12

Vue3中的computer和watch

computed的写法在页面中 <div>{{ calcNumber }}</div>script中写法1 常用 import { computed, ref } from vue; let price ref(100);const priceAdd () > { //函数方法 price 1price.value ; }//计算属性 let calcNumber computed(() > {return ${p…...

编程新知 2025/11/8 20:34:42

OCR MLLM Evaluation

为什么需要评测体系？——背景与矛盾能干的事： 看清楚发票、身份证上的字（准确率>90%），速度飞快（眨眼间完成）。干不了的事： 碰到复杂表格（合并单元…...

编程新知 2025/10/6 15:50:41

网页端 js 读取发票里的二维码信息（图片和PDF格式）

起因为了实现在报销流程中，发票不能重用的限制，发票上传后，希望能读出发票号，并记录发票号已用，下次不再可用于报销。基于上面的需求，研究了OCR 的方式和读PDF的方式，实际是可行的&#xff…...

编程新知 2026/2/4 11:44:46

C++中vector类型的介绍和使用

文章目录一、vector 类型的简介1.1 基本介绍1.2 常见用法示例1.3 常见成员函数简表二、vector 数据的插入2.1 push_back() —— 在尾部插入一个元素2.2 emplace_back() —— 在尾部“就地”构造对象2.3 insert() —— 在任意位置插入一个或多个元素2.4 emplace() —— 在任意…...

编程新知 2026/2/8 6:54:24

基于Java项目的Karate API测试

Karate 实现了可以只编写Feature 文件进行测试，但是对于熟悉Java语言的开发或是测试人员，可以通过编程方式集成 Karate 丰富的自动化和数据断言功能。本篇快速介绍在Java Maven项目中编写和运行测试的示例。创建Maven项目最简单的创建项目的方式就是创建一个目录，里面…...

编程新知 2025/11/5 23:09:37

相关文章：