当前位置：首页 > news >正文

colab使用本地数据集微调llama3-8b模型

news 2025/7/8 1:53:46

在Google的Colab上面采用unsloth,trl等库，训练数据集来自Google的云端硬盘，微调llama3-8b模型，进行推理验证模型的微调效果。

保存模型到Google的云端硬盘可以下载到本地供其它使用。

准备工作：将训练数据集上传到google的云端硬盘根目录下，文件名就叫做train.json

train.json里面的数据格式如下：

[
{
"instruction": "你好",
"output": "你好，我是智能助手胖胖"
},
{
"instruction": "hello",
"output": "Hello! I am 智能助手胖胖, an AI assistant developed by 丹宇码农. How can I assist you ?"
}

......

]

采用unsloth库、trl库、transformers等库。

直接上代码：

%%capture
# Installs Unsloth, Xformers (Flash Attention) and all other packages!
!pip install "unsloth[colab-new] @ git+https://github.com/unslothai/unsloth.git"
!pip install --no-deps "xformers<0.0.26" trl peft accelerate bitsandbytesfrom unsloth import FastLanguageModel
import torch
max_seq_length = 2048 # Choose any! We auto support RoPE Scaling internally!
dtype = None # None for auto detection. Float16 for Tesla T4, V100, Bfloat16 for Ampere+
load_in_4bit = True # Use 4bit quantization to reduce memory usage. Can be False.# 4bit pre quantized models we support for 4x faster downloading + no OOMs.
fourbit_models = ["unsloth/mistral-7b-bnb-4bit","unsloth/mistral-7b-instruct-v0.2-bnb-4bit","unsloth/llama-2-7b-bnb-4bit","unsloth/gemma-7b-bnb-4bit","unsloth/gemma-7b-it-bnb-4bit", # Instruct version of Gemma 7b"unsloth/gemma-2b-bnb-4bit","unsloth/gemma-2b-it-bnb-4bit", # Instruct version of Gemma 2b"unsloth/llama-3-8b-bnb-4bit", # [NEW] 15 Trillion token Llama-3
] # More models at https://huggingface.co/unslothmodel, tokenizer = FastLanguageModel.from_pretrained(model_name = "unsloth/llama-3-8b-bnb-4bit",max_seq_length = max_seq_length,dtype = dtype,load_in_4bit = load_in_4bit,# token = "hf_...", # use one if using gated models like meta-llama/Llama-2-7b-hf
)model = FastLanguageModel.get_peft_model(model,r = 16, # Choose any number > 0 ! Suggested 8, 16, 32, 64, 128target_modules = ["q_proj", "k_proj", "v_proj", "o_proj","gate_proj", "up_proj", "down_proj",],lora_alpha = 16,lora_dropout = 0, # Supports any, but = 0 is optimizedbias = "none",    # Supports any, but = "none" is optimized# [NEW] "unsloth" uses 30% less VRAM, fits 2x larger batch sizes!use_gradient_checkpointing = "unsloth", # True or "unsloth" for very long contextrandom_state = 3407,use_rslora = False,  # We support rank stabilized LoRAloftq_config = None, # And LoftQ
)alpaca_prompt = """Below is an instruction that describes a task, paired with an input that provides further context. Write a response that appropriately completes the request.### Instruction:
{}### Input:
{}### Response:
{}"""EOS_TOKEN = tokenizer.eos_token # Must add EOS_TOKEN
def formatting_prompts_func(examples):instructions = examples["instruction"]outputs      = examples["output"]texts = []for instruction, output in zip(instructions, outputs):input = ""# Must add EOS_TOKEN, otherwise your generation will go on forever!text = alpaca_prompt.format(instruction, input, output) + EOS_TOKENtexts.append(text)return { "text" : texts, }
passfrom datasets import load_dataset
#dataset = load_dataset("yahma/alpaca-cleaned", split = "train")
#dataset = dataset.map(formatting_prompts_func, batched = True,)
from google.colab import drive
# 挂载云端硬盘，加载成功后，在左边的文件树中将会多一个 /content/drive/MyDrive/ 目录
drive.mount('/content/drive')# 加载本地数据集：
# 有instruction和output,input为空字符串
from datasets import load_datasetdata_home = r"/content/drive/MyDrive/"
data_dict = {"train": os.path.join(data_home, "train.json"),#"validation": os.path.join(data_home, "dev.json"),
}
dataset = load_dataset("json", data_files=data_dict, split = "train")
print(dataset[0])
dataset = dataset.map(formatting_prompts_func, batched = True,)from trl import SFTTrainer
from transformers import TrainingArgumentstrainer = SFTTrainer(model = model,tokenizer = tokenizer,train_dataset = dataset,dataset_text_field = "text",max_seq_length = max_seq_length,dataset_num_proc = 2,packing = False, # Can make training 5x faster for short sequences.args = TrainingArguments(per_device_train_batch_size = 2,gradient_accumulation_steps = 4,warmup_steps = 5,max_steps = 60,learning_rate = 2e-4,fp16 = not torch.cuda.is_bf16_supported(),bf16 = torch.cuda.is_bf16_supported(),logging_steps = 1,optim = "adamw_8bit",weight_decay = 0.01,lr_scheduler_type = "linear",seed = 3407,output_dir = "outputs",),
)# 开始微调训练
trainer_stats = trainer.train()#推理
# alpaca_prompt = Copied from above
FastLanguageModel.for_inference(model) # Enable native 2x faster inference
inputs = tokenizer(
[alpaca_prompt.format("你是谁？", # instruction"", # input"", # output - leave this blank for generation!)
], return_tensors = "pt").to("cuda")outputs = model.generate(**inputs, max_new_tokens = 64, use_cache = True)
tokenizer.batch_decode(outputs)#此处输出的答案，能明显看到就是自己训练的数据，而不是原来模型的输出。说明微调起作用了# 保存模型，改成挂接的云硬盘目录也可以保存到google的个人云存储空间，然后打开个人云存储空间下载到本地
model.save_pretrained("lora_model") # Local saving
tokenizer.save_pretrained("lora_model")# Merge to 16bit
if True: model.save_pretrained_merged("model", tokenizer, save_method = "merged_16bit",)

其实可以将.ipynb文件上传到个人云存储空间，双击这个文件就会打开colab，然后依次执行代码即可，随时可以增加、删除、修改，特别方便，还能免费使用GPU、CPU等资源，真的是广大AI爱好者的不错选择。

colab使用本地数据集微调llama3-8b模型

在Google的Colab上面采用unsloth,trl等库，训练数据集来自Google的云端硬盘，微调llama3-8b模型，进行推理验证模型的微调效果。保存模型到Google的云端硬盘可以下载到本地供其它使用。准备工作：将训练数据集上传到google的云端硬盘…...

编程日记 2024/5/16 10:17:46

YOLO数据集制作（二）|json文件转txt验证

以下教程用于验证转成YOLO使用的txt格式，适用场景：矩形框，配合json格式文件转成YOLO使用的txt格式脚本使用。 https://blog.csdn.net/StopAndGoyyy/article/details/138681454 使用方式：将img_path和label_path分别填入对应的图…...

编程日记 2024/5/16 10:16:45

linux常用命令(持续更新)

1.sudo -i 切换root权限 2. ll 和 ls 查看文件夹下面的文件 3. cat 查看文件内容 cat xxx.txt |grep 好筛选出有好的内容 4. vi 编辑文件点击insert进入编辑模式编辑完之后点击Esc退出编辑模式数据:wq!回车保存文件 5. ssh 连接到可以访问的系统 6. telnet 看端口是否可以…...

编程日记 2024/5/16 10:15:43

Excel表格导入/导出数据工具类

Excel表格导入/导出数据工具这里以java语言为类，实现一个简单且较通用的Excel表格数据导入工具类。自定义注解 ExcelColumn写导入工具类 ExcelImportUtil 自定义注解 ExcelColumn Retention(RetentionPolicy.RUNTIME) Target({java.lang.annotation.ElementTy…...

编程日记 2024/5/16 10:13:41

Python自学之路--004：Python使用注意点（原始字符串‘r’\字符转换\‘wb’与‘w区别’\‘\‘与‘\\’区别）

目录 1、原始字符串‘r’ 2、字符转换问题 3、open与write函数’wb’与’w’区分 4、Python里面\与\\的区别 1、原始字符串‘r’ 以前的脚本通过Python2.7写的，通过Python3.12去编译发现不通用了，其实也是从一个初学者的角度去看待这些问题。其中的\…...

编程日记 2024/5/16 10:12:40

javaEE进阶——SpringBoot与SpringMVC第一讲

文章目录什么是springMVCSpringMVC什么是模型、视图、控制器MVC和SpringMVC的关系SpringMVC的使用第一个SpringMVC程序RestController什么是注解那么RestController到底是干嘛的呢？RequestMapping 如何接收来自请求中的querystryingRequestParamRequestMapping(&q…...

编程日记 2024/5/16 10:10:37

LabVIEW和usrp连接实现ofdm通信系统如何实现

1. 硬件准备 USRP设备：选择合适的USRP硬件（如USRP B210或N210），并确保其与计算机连接（通常通过USB或以太网）。天线：根据频段需求选择合适的天线。 2. 软件安装 LabVIEW：安装LabVI…...

编程日记 2024/5/16 10:09:35

服务器：xxx.xxx.xxx.56 客户端器：xxx.xxx.xxx.94##生成服务器证书和密钥容器 keytool -genkey -alias tas-server -keypass 250250 -keyalg RSA -keysize 2048 -validity 3650 -keystore D:\https证书\tas-server.jks -storepass 250250 -dname "C…...

编程日记 2024/5/16 10:08:34

WordPress插件Plus WebP，可将jpg、png、bmp、gif图片转为WebP

现在很多浏览器和CDN都支持WebP格式的图片了，不过我们以前的WordPress网站使用的图片都是jpg、png、bmp、gif，那么应该如何将它们转换为WebP格式的图片呢？推荐安装这款Plus WebP插件，可以将上传到媒体库的图片转为WebP格式图片&am…...

编程日记 2024/5/16 10:06:31

GitLab CI/CD的原理及应用详解（五）

本系列文章简介： 在当今快速变化的软件开发环境中，持续集成（Continuous Integration, CI）和持续交付（Continuous Delivery, CD）已经成为提高软件开发效率、确保代码质量以及快速响应市场需求的重要手段。Gi…...

编程日记 2024/5/16 10:02:26

连锁收银系统如何助力实体门店私域运营

作为实体门店，私域运营是提升客户黏性和增加复购率的重要策略之一。而连锁收银系统在私域运营中扮演了关键的角色，它不仅可以帮助门店管理客户信息和消费记录，还能够通过数据分析和营销功能提供个性化的服务和推广活动。下面看看连锁收银系统…...

编程日记 2024/5/16 10:01:25

JETBRAINS IDES 分享一个2099通用试用码！PhpStorm 2024 版，支持一键升级

文章目录废话不多说上教程：（动画教程图文教程）一、动画教程激活与升级（至最新版本） 二、图文教程 （推荐）Stage 1.下载安装 toolbox-app（全家桶管理工具）Stage 2 : 下…...

编程日记 2024/5/16 10:00:22

超级好用的C++实用库之MD5信息摘要算法

💡 需要该C实用库源码的大佬们，可搜索微信公众号“希望睿智”。添加关注后，输入消息“超级好用的C实用库”，即可获得源码的下载链接。概述 MD5信息摘要算法是一种广泛使用的密码散列函数，由Ronald L. Rivest在1991年设…...

编程日记 2024/5/16 9:59:21

ssm132医院住院综合服务管理系统设计与开发+vue

医院住院综合服务管理系统的设计与实现摘要互联网发展至今，无论是其理论还是技术都已经成熟，而且它广泛参与在社会中的方方面面。它让信息都可以通过网络传播，搭配信息管理工具可以很好地为人们提供服务。针对医院住院信息管理混乱&…...

编程日记 2024/5/16 9:58:20

在Linux上安装并启动Redis

目录安装gcc环境上传redis文件启动redis-server 后台启动redis-server 查看redis启动状态参考文章：Linux 安装 Redis 及踩坑 - 敲代码的阿磊 - 博客园 (cnblogs.com) 准备：打开VMware Workstation，创建一个虚拟机，进入管…...

编程日记 2024/5/16 9:56:17

vue3.0+antdv的admin管理系统vue-admin-beautiful推荐

前言几年前，笔者自学了vue这一优秀的前端框架，但苦于没项目练手，无意间发现了vue-admin-beautiful这一优秀的前端集成框架。当时就使用它做了一很有意思的小项目---终端监控云平台，实现了前端和后台的整体功能。整体方案介绍参见…...

编程日记 2024/5/16 9:55:16

C# WinForm —— 20 RichTextBox 介绍

1. 简介富文本框，拥有TextBox的所有功能，，但还有更多高级的文本输入和编辑功能，比如设置字体颜色、样式、段落、图片、超链接等 2. 常用属性属性解释(Name)控件ID，在代码里引用的时候会用到,一般以 rtxt 开头Acce…...

编程日记 2024/5/16 9:53:13

springmvc数据绑定

数据绑定数据绑定流程 springmvc框架将ServletRequest对象及目标方法的入参实例传递给WebDataBinderFactory实例，以创建DataBinder实例对象 DataBinder调用装配在springmvc上下文中的ConversionService组件进行数据类型转换、数据格式化工作。将Servlet中的请求信息…...

编程日记 2024/5/16 9:52:12

Milvus的存储/计算分离

前言根据数据面与控制面相隔离的原则，从可扩展性和灾难恢复来看，Milvus由4个相互独立的层组成访问层由一系列无状态的代理组成，访问层是系统和用户之间的第一层，它主要是验证客户端请求和规整返回的结果代理是无状态的&am…...

编程日记 2024/5/16 9:51:11

SHAP值是个什么值？

SHAP 值是个什么值？ 起初，我们知道SHAP值代表了变量对于结局变量的贡献程度，然而，在做了一些SHAP分析之后，感觉有一些SHAP值还是有一些难以理解的地方，比如，为什么有负值？SHAP值为0…...

编程日记 2024/5/16 9:50:09

[2025CVPR]DeepVideo-R1：基于难度感知回归GRPO的视频强化微调框架详解

突破视频大语言模型推理瓶颈，在多个视频基准上实现SOTA性能一、核心问题与创新亮点 1.1 GRPO在视频任务中的两大挑战安全措施依赖问题 GRPO使用min和clip函数限制策略更新幅度，导致：梯度抑制：当新旧策略差异过大时梯度消失收敛困难：策略无法充分优化# 传统GRPO的梯…...

编程新知 2025/6/18 19:00:20

树莓派超全系列教程文档--(61)树莓派摄像头高级使用方法

树莓派摄像头高级使用方法配置通过调谐文件来调整相机行为使用多个摄像头安装 libcam 和 rpicam-apps依赖关系开发包文章来源： http://raspberry.dns8844.cn/documentation 原文网址配置大多数用例自动工作，无需更改相机配置。但是，一…...

编程新知 2025/7/6 23:16:14

Leetcode 3576. Transform Array to All Equal Elements

Leetcode 3576. Transform Array to All Equal Elements 1. 解题思路2. 代码实现题目链接：3576. Transform Array to All Equal Elements 1. 解题思路这一题思路上就是分别考察一下是否能将其转化为全1或者全-1数组即可。至于每一种情况是否可以达到&#xf…...

编程新知 2025/7/7 16:55:31

练习（含atoi的模拟实现,自定义类型等练习）

一、结构体大小的计算及位段 （结构体大小计算及位段详解请看：自定义类型：结构体进阶-CSDN博客） 1.在32位系统环境，编译选项为4字节对齐，那么sizeof(A)和sizeof(B)是多少？ #pragma pack(4)st…...

编程新知 2025/7/6 19:40:25

Java如何权衡是使用无序的数组还是有序的数组

在 Java 中，选择有序数组还是无序数组取决于具体场景的性能需求与操作特点。以下是关键权衡因素及决策指南： ⚖️ 核心权衡维度维度有序数组无序数组查询性能二分查找 O(log n) ✅线性扫描 O(n) ❌插入/删除需移位维护顺序 O(n) ❌直接操作尾部 O(1) ✅内存开销与无序数组相…...

编程新知 2025/7/4 21:35:34

【JVM】- 内存结构

引言 JVM：Java Virtual Machine 定义：Java虚拟机，Java二进制字节码的运行环境好处： 一次编写，到处运行自动内存管理，垃圾回收的功能数组下标越界检查（会抛异常，不会覆盖到其他代码…...

编程新知 2025/7/7 23:12:47

爬虫基础学习day2

# 爬虫设计领域工商：企查查、天眼查短视频：抖音、快手、西瓜 ---> 飞瓜电商：京东、淘宝、聚美优品、亚马逊 ---> 分析店铺经营决策标题、排名航空：抓取所有航空公司价格 ---> 去哪儿自媒体：采集自媒体数据进…...

编程新知 2025/7/6 13:55:34

Element Plus 表单(el-form)中关于正整数输入的校验规则

目录 1 单个正整数输入1.1 模板1.2 校验规则 2 两个正整数输入（联动）2.1 模板2.2 校验规则2.3 CSS 1 单个正整数输入 1.1 模板 <el-formref"formRef":model"formData":rules"formRules"label-width"150px"…...

编程新知 2025/7/5 21:10:52

佰力博科技与您探讨热释电测量的几种方法

热释电的测量主要涉及热释电系数的测定，这是表征热释电材料性能的重要参数。热释电系数的测量方法主要包括静态法、动态法和积分电荷法。其中，积分电荷法最为常用，其原理是通过测量在电容器上积累的热释电电荷，从而确定热释电系数…...

编程新知 2025/7/7 20:29:47

C++.OpenGL （14/64）多光源（Multiple Lights）

多光源（Multiple Lights）多光源渲染技术概览 #mermaid-svg-3L5e5gGn76TNh7Lq {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-3L5e5gGn76TNh7Lq .error-icon{fill:#552222;}#mermaid-svg-3L5e5gGn76TNh7Lq .erro…...

编程新知 2025/6/11 3:15:20

colab使用本地数据集微调llama3-8b模型

相关文章：

colab使用本地数据集微调llama3-8b模型

YOLO数据集制作（二）|json文件转txt验证

linux常用命令(持续更新)

Excel表格导入/导出数据工具类

Python自学之路--004：Python使用注意点（原始字符串‘r’\字符转换\‘wb’与‘w区别’\‘\‘与‘\\’区别）

javaEE进阶——SpringBoot与SpringMVC第一讲

LabVIEW和usrp连接实现ofdm通信系统如何实现

NGINX SPRING HTTPS证书

WordPress插件Plus WebP，可将jpg、png、bmp、gif图片转为WebP

GitLab CI/CD的原理及应用详解（五）

连锁收银系统如何助力实体门店私域运营

JETBRAINS IDES 分享一个2099通用试用码！PhpStorm 2024 版，支持一键升级

超级好用的C++实用库之MD5信息摘要算法

ssm132医院住院综合服务管理系统设计与开发+vue

在Linux上安装并启动Redis

vue3.0+antdv的admin管理系统vue-admin-beautiful推荐

C# WinForm —— 20 RichTextBox 介绍

springmvc数据绑定

Milvus的存储/计算分离

SHAP值是个什么值？

[2025CVPR]DeepVideo-R1：基于难度感知回归GRPO的视频强化微调框架详解

树莓派超全系列教程文档--(61)树莓派摄像头高级使用方法

Leetcode 3576. Transform Array to All Equal Elements

练习（含atoi的模拟实现,自定义类型等练习）

Java如何权衡是使用无序的数组还是有序的数组

【JVM】- 内存结构

爬虫基础学习day2

Element Plus 表单(el-form)中关于正整数输入的校验规则

佰力博科技与您探讨热释电测量的几种方法

C++.OpenGL （14/64）多光源（Multiple Lights）