当前位置：首页 > news >正文

HuggingFace peft LoRA 微调 LLaMA

news 2026/4/4 1:16:01

1. 安装必要库

pip install transformers peft accelerate

2. 加载 LLaMA 模型和分词器

从 Hugging Face Transformers 加载预训练的 LLaMA 模型和分词器。

from transformers import AutoModelForCausalLM, AutoTokenizer# 加载 LLaMA 模型和分词器
model_name = "meta-llama/Llama-2-7b-hf"  # 替换为适合的模型
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto", load_in_8bit=True)# 设置 pad_token 为 eos_token（如果模型没有 pad_token）
tokenizer.pad_token = tokenizer.eos_token
model.resize_token_embeddings(len(tokenizer))  # 调整词汇表大小

3. 配置 LoRA 微调

使用 PEFT 配置 LoRA 参数。

from peft import get_peft_model, LoraConfig, TaskType# 定义 LoRA 配置
lora_config = LoraConfig(task_type=TaskType.CAUSAL_LM,  # 因果语言模型任务inference_mode=False,r=8,  # LoRA 的秩lora_alpha=16,lora_dropout=0.05
)# 将 LoRA 应用于模型
model = get_peft_model(model, lora_config)# 检查模型被正确标记为 trainable
print(model)

4. 定义数据集加载器

使用自定义数据集加载器和 Hugging Face 提供的 DataCollator 进行批量处理。

数据集预处理流程及其代码如下链接：训练数据格式为＜input，output＞，为什么微调大模型时，模型所需的输入数据input_ids有时仅包含了input，而有时包含了input和output呢？-CSDN博客

from torch.utils.data import DataLoader
from transformers import DataCollatorForSeq2Seq# 自定义数据集（之前定义的 FineTuneDataset）
dataset = FineTuneDataset(data_path="./train.jsonl", tokenizer=tokenizer, max_length=1024)# 定义数据批处理器
data_collator = DataCollatorForSeq2Seq(tokenizer, padding=True)

5. 配置 `TrainingArguments`

设置训练超参数，包括学习率、批次大小、保存频率等。

from transformers import TrainingArgumentstraining_args = TrainingArguments(output_dir="./llama_lora_finetuned",   # 输出模型路径evaluation_strategy="steps",          # 每隔多少步进行验证save_strategy="steps",                # 保存检查点的策略logging_dir="./logs",                 # 日志文件路径per_device_train_batch_size=8,        # 每个设备的训练批次大小gradient_accumulation_steps=4,        # 梯度累积learning_rate=2e-4,                   # 学习率num_train_epochs=3,                   # 训练轮数save_steps=500,                       # 每隔多少步保存模型logging_steps=100,                    # 日志记录频率fp16=True,                            # 使用混合精度训练push_to_hub=False                     # 如果需要保存到 Hugging Face Hub
)

6. 定义模型和 Trainer

from transformers import Trainer# 定义 Trainer
trainer = Trainer(model=model,                          # 微调的模型args=training_args,                   # 训练参数train_dataset=dataset,                # 训练数据集data_collator=data_collator,          # 数据批处理器
)

7. 启动训练

trainer.train()
trainer.save_model("./llama_lora_finetuned")
tokenizer.save_pretrained("./llama_lora_finetuned")

HuggingFace peft LoRA 微调 LLaMA

1. 安装必要库 pip install transformers peft accelerate2. 加载 LLaMA 模型和分词器从 Hugging Face Transformers 加载预训练的 LLaMA 模型和分词器。 from transformers import AutoModelForCausalLM, AutoTokenizer# 加载 LLaMA 模型和分词器 model_name "meta-…...

编程日记 2024/12/27 19:09:08

记-编译magisk_v22

1) 下载源码 git clone gitgitee.com:MayuriNFC/Magisk.git 使用国内镜像站 2) 切换标签: git checkout v22.0 3)下载/更新依赖 git submodule initgit sumodule update 4)下载对应ndk(自动下载出错了,用了手动下载), wget -c https://dl.google.com/android/reposito…...

编程日记 2024/12/27 19:06:05

前端登录业务

1.用户登录成功拿到token，放在请求拦截器的请求头中，调用户接口才可以获取到用户信息，存储到仓库中，以便其他组件使用用户信息 2.退出登录需要清空用户数据，以及本地存储，调退出登录接口告诉服务器当前toke…...

编程日记 2024/12/27 19:03:02

项目2路由交换

背景某学校为满足日常教学生活需求，推动数字校园的建设，学校有办公楼和学生宿舍楼和服务器集群三块区域，请合理规划IP地址和VLAN，实现企业内部能够互联互通现要求外网能通过公网地址访问服务器集群，学生和老师能正常…...

编程日记 2024/12/27 18:56:56

易语言 OCR 文字识别

一.引言文字识别，也称为光学字符识别（Optical Character Recognition, OCR），是一种将不同形式的文档（如扫描的纸质文档、PDF文件或数字相机拍摄的图片）中的文字转换成可编辑和可搜索的数据的技术。随着技…...

编程日记 2024/12/27 18:53:54

云手机+YouTube：改变通信世界的划时代技术

随着科技的不断进步，手机作为人们生活中不可或缺的工具，也在不断地更新换代。近年来，一个名为“油管云手机”的全新产品正在引起广泛的关注和讨论。作为一个运用最新科技实现的新型手机，它在通信领域带来了全新的体验和革命性的变…...

编程日记 2024/12/27 18:50:50

C++-----------映射

探索 C 中的映射与查找表在 C 编程中，映射（Map）和查找表（Lookup Table）是非常重要的数据结构，它们能够高效地存储和检索数据，帮助我们解决各种实际问题。今天，我们就来深入探讨一下…...

编程日记 2024/12/27 18:48:49

清空DNS 缓存

如果遇到修改了host文件，但是IP和域名的映射有问题的情况，可以尝试刷新DNS缓存。 ipconfig/flushdns win建加R建，然后输入cmd，然后回车然后回车，或者点击确定按钮。出现如下所示标识清空DNS 缓存成功。...

编程日记 2024/12/27 18:43:42

计算机网络习题( 第3章物理层第4章数据链路层 )

第3章物理层一、单选题 1、下列选项中，不属于物理层接口规范定义范畴的是（ ）。 A、接口形状 B、引脚功能 C、传输媒体 D、信号电平正确答案： C 2、在物理层接口特性中，用于描述完成每种功能的事件发…...

编程日记 2024/12/27 18:42:41

UE5 崩溃问题汇总！！！

Using bundled DotNet SDK version: 6.0.302 ERROR: UnrealBuildTool.dll not found in "..\..\Engine\Binaries\DotNET\UnrealBuildTool\UnrealBuildTool.dll" 在你遇到这种极奇崩溃的BUG ，难以解决的时候。尝试了N种方法，都不行的解决方法。…...

编程日记 2024/12/27 18:39:38

基于ArcGIS Pro的SWAT模型在流域水循环、水生态模拟中的应用及案例分析；SWAT模型安装、运行到结果读取全流程指导

目前，流域水资源和水生态问题逐渐成为制约社会经济和环境可持续发展的重要因素。SWAT模型是一种基于物理机制的分布式流域水文与生态模拟模型，能够对流域的水循环过程、污染物迁移等过程进行精细模拟和量化分析。SWAT模型目前广泛应用于流域水文过程研究…...

编程日记 2024/12/27 18:33:33

Docker下TestHubo安装配置指南

TestHubo是一款开源免费的测试管理工具， 下面介绍Docker 私有部署的安装与配置。TestHubo 私有部署版本更适合有严格数据安全要求的企业，支持在本地或专属服务器上运行，以实现对数据和系统的完全控制。 1、Docker 服务端安装 Docker安装包下…...

编程日记 2024/12/27 18:31:31

AWS、Google Cloud Platform (GCP)、Microsoft Azure、Linode和桔子数据的价格对比

要对比 AWS、Google Cloud Platform (GCP)、Microsoft Azure、Linode 和桔子数据的价格，我们需要先了解每个平台的定价模型、服务类型以及不同服务之间的价格差异。以下是根据各个平台常见服务（如计算实例、存储、数据传输等）做的一个简化…...

编程日记 2024/12/27 18:30:29

基础优化方法

梯度下降学习率代表每一次沿着这个方向走多远， batchsize的概念梯度下降通过不断沿着反梯度方向更新参数求解两个重要的超参数是 batchsize 和学习率...

编程日记 2024/12/27 18:28:27

v语言介绍

V 语言是一种多用途的编程语言，可以用于前端开发、后端开发、系统编程、游戏开发等多个领域。它的设计哲学是提供接近 C 语言的性能，同时简化开发过程并提高代码的安全性和可读性。接下来我会详细介绍 V 在前后端开发中的应用，并给出一个具体…...

编程日记 2024/12/27 18:26:25

Ubuntu安装Apache Airflow详细指南

本文我们介绍如何在Ubuntu上安装Apache Airflow。Apache Airflow旨在通过编程方式编写、调度和监控工作流。随着数据编排在现代数据工程中变得越来越重要，掌握Apache Airflow等工具可以显著提高您的生产力和效率。学习Apache Airflow的首要任务是安装单机版本进行测…...

编程日记 2024/12/27 18:24:23

【数据可视化复习方向】

1.数据可视化就是数据中信息的可视化 2.数据可视化主要从数据中寻找三个方面的信息：模式、关系和异常 3.大数据可视化分类：科学可视化、信息可视化、可视分析学 4.大数据可视化作用：记录信息、分析推理、信息传播与协同 5.可视化流程&…...

编程日记 2024/12/27 18:23:21

CentOS下安装RabbitMQ

提示：“奔跑吧邓邓子” 的高效运维专栏聚焦于各类运维场景中的实际操作与问题解决。内容涵盖服务器硬件（如 IBM System 3650 M5）、云服务平台（如腾讯云、华为云）、服务器软件（如 Nginx、Apache、GitLab、Redis、Elasticsearch、Kubernetes、Docker 等）、开发工具（如 Gi…...

编程日记 2024/12/27 18:22:20

探究音频丢字位置和丢字时间对pesq分数的影响

丢字的本质丢字的本质是在一段音频中一小段数据变为0 丢字对主观感受的影响 1. 丢字位置丢字的位置对感知效果有很大影响。如果丢字发生在音频信号的静音部分或低能量部分，感知可能不明显；而如果丢字发生在高能量部分或关键音素上，感知…...

编程日记 2024/12/27 18:16:15

音视频入门基础：MPEG2-TS专题（23）——通过FFprobe显示TS流每个packet的信息

音视频入门基础：MPEG2-TS专题系列文章： 音视频入门基础：MPEG2-TS专题（1）——MPEG2-TS官方文档下载音视频入门基础：MPEG2-TS专题（2）——使用FFmpeg命令生成ts文件音视频入门基础…...

编程日记 2024/12/27 18:15:12

MTS-Utils：面向Arduino的MTS模组专用AT指令工具库

1. 项目概述MTS-Utils 是 Multi-Tech Systems（多技系统公司）为其 MTS Socket Modem Arduino Shield 系列通信模组配套开发的底层工具库。该库并非通用型通信协议栈，而是专为适配其硬件平台特性而设计的轻量级 C/C 工具集，运行于 A…...

编程新知 2026/4/4 0:21:43

QuiX公司取得光子量子计算纠错重大突破

QuiX Quantum公司周四宣布，该公司已成功演示了光子量子计算机中首个低于阈值的错误缓解技术，这一突破被认为有助于实现可扩展的容错量子系统。QuiX表示，其方法将物理量子比特的错误率降低到与大规模量子计算兼容的水平。这些研究结果是在QuiX…...

编程新知 2026/4/3 23:06:43

企业PTC软件正版化路径与长期价值分析

企业PTC软件正版化路径和长期价值分析我帮一家制造业客户处理软件正版化问题，提醒一句到他们的巨头供应商PTC的许可证使用率常年徘徊在30%左右，年均浪费成本超过800万，这事儿在行业内其实挺普遍的。如果说你正在为软件许可证管理头疼&#xf…...

编程新知 2026/4/3 21:52:01

丧尸危机模拟：灾备系统的终极压力测试

对于软件测试从业者而言，压力测试早已是日常工作的一部分。我们习惯于用并发用户数、吞吐量、响应时间等冰冷指标，去描绘一个系统在极限负载下的“抗压能力”。然而，当我们将这些概念投射到一个更宏大、更富有冲击力的隐喻——丧尸危机之中时…...

编程新知 2026/4/3 21:23:53

【深伪检测】论文整体调研与梳理方法

一、单篇论文精读：抓核心信息（先“拆”后“懂”） 每篇论文都要完成「标题→摘要→引言→方法→实验→相关工作」的递进式阅读，目的是精准捕捉“这篇论文在解决什么问题、用了什么方法、做出了什么贡献”。标题摘要（10分…...

编程新知 2026/4/3 21:17:49

【枕上节令笺】清明食青团，一口咬尽江南春

最近下班有时间，都在捣鼓公众号文章，之前的两天一直沉迷于改主题、改完主题改内容排版、最后发现文章偏离主题写的太杂了，奈何语文水平太久没用了，就想到用写技术博客的总分总的写法去表诉文章…有热爱或想写公众号的同学一起交流…...

编程新知 2026/4/3 21:17:49

计算机毕业设计：Python汽车销量智能可视化与预测系统 Flask框架可视化机器学习 AI 大模型大数据（建议收藏）✅

博主介绍：✌全网粉丝50W，前互联网大厂软件研发、集结硕博英豪成立软件开发工作室，专注于计算机相关专业项目实战6年之久，累计开发项目作品上万套。凭借丰富的经验与专业实力，已帮助成千上万的学生顺利毕业，…...

编程新知 2026/4/3 20:57:35

考研408计算机学科专业基础——计算机组成原理复习

考研408计算机学科专业基础——计算机组成原理复习核心说明：本笔记聚焦考研408计算机组成原理（计组）高频考点、必背知识点，贴合命题规律（选择大题），剔除冗余内容，突出重难点&#x…...

编程新知 2026/4/3 19:47:06

终极性能调优指南：如何配置dnstwist实现超高速域名扫描

终极性能调优指南：如何配置dnstwist实现超高速域名扫描【免费下载链接】dnstwist Domain name permutation engine for detecting homograph phishing attacks, typo squatting, and brand impersonation 项目地址: https://gitcode.com/gh_mirrors/dn/dnstwist …...

编程新知 2026/4/3 19:45:06

高效微信聊天记录管理：解决数据丢失风险的本地化方案

高效微信聊天记录管理：解决数据丢失风险的本地化方案【免费下载链接】WeChatMsg 提取微信聊天记录，将其导出成HTML、Word、CSV文档永久保存，对聊天记录进行分析生成年度聊天报告项目地址: https://gitcode.com/GitHub_Trending/we/WeChat…...

编程新知 2026/4/3 19:32:53