当前位置：首页 > news >正文

LLaMA-Factory添加adalora

news 2026/5/17 1:46:16

感谢https://github.com/tsingcoo/LLaMA-Efficient-Tuning/commit/f3a532f56b4aa7d4200f24d93fade4b2c9042736和https://github.com/huggingface/peft/issues/432的帮助。

在LLaMA-Factory中添加adalora

1. 修改src/llmtuner/hparams/finetuning_args.py代码
在FinetuningArguments中修改finetuning_type，添加target_r和init_r
在这里插入图片描述
修改__post_init__函数

2. 修改src/llmtuner/tuner/core/adapter.py代码
添加AdaLoraConfig
在这里插入图片描述
在init_adapter函数中添加一个if判断，添加位置在如红框所示：

    if finetuning_args.finetuning_type == "adalora":logger.info("Fine-tuning method: AdaLoRA")latest_checkpoint = Noneif model_args.checkpoint_dir is not None:if (is_trainable and finetuning_args.resume_lora_training) or (not is_mergeable): # continually fine-tuningcheckpoints_to_merge, latest_checkpoint = model_args.checkpoint_dir[:-1], model_args.checkpoint_dir[-1]else:checkpoints_to_merge = model_args.checkpoint_dirfor checkpoint in checkpoints_to_merge:model = PeftModel.from_pretrained(model, checkpoint)model = model.merge_and_unload()if len(checkpoints_to_merge) > 0:logger.info("Merged {} model checkpoint(s).".format(len(checkpoints_to_merge)))if latest_checkpoint is not None: # resume lora training or quantized inferencemodel = PeftModel.from_pretrained(model, latest_checkpoint, is_trainable=is_trainable)if is_trainable and latest_checkpoint is None: # create new lora weights while trainingif len(finetuning_args.lora_target) == 1 and finetuning_args.lora_target[0] == "all":target_modules = find_all_linear_modules(model, model_args.quantization_bit)else:target_modules = finetuning_args.lora_targetlora_config = AdaLoraConfig(task_type=TaskType.CAUSAL_LM,inference_mode=False,target_r=finetuning_args.target_r,init_r=finetuning_args.init_r,r=finetuning_args.lora_rank,target_modules=target_modules,lora_alpha=finetuning_args.lora_alpha,lora_dropout=finetuning_args.lora_dropout,)model = get_peft_model(model, lora_config)if id(model.peft_config) != id(model.base_model.peft_config): # https://github.com/huggingface/peft/issues/923model.base_model.peft_config = model.peft_config

3. 修改src/llmtuner/tuner/core/parser.py的代码
这边建议所有有关finetuning_args.finetuning_type==/!= "lora"的都改成图片所示
在这里插入图片描述

修改transformer源码

按照上面的改完之后虽然可以训练，但是其实并没有实现adalora的秩的调整。

我是通过在update_and_allocate函数中设置断点发现模型训练没有调用update_and_allocate函数，update_and_allocate函数位于python3.10/site-packages/peft/tuners/adalora.py中。

1. 修改python3.10/site-packages/transformers/trainer.py代码

                    from peft import PeftModelif isinstance(model, PeftModel):if getattr(model.base_model, "update_and_allocate", None) is not None:model.base_model.update_and_allocate(total_batched_samples)

把上面的代码复制到train函数中，具体的位置应该是整个文件的第二个model.zero_grad()上面，不同transformers的位置可能不一样
在这里插入图片描述
2. 设置adalora的总迭代次数
两个方法一个是在adaloraconfig定义的时候设定(我没试)，另外一个就是一样修改train.py，如下：
在for epoch in range(epochs_trained, num_train_epochs):上面一行设置

        # 设置总迭代数model.base_model.peft_config[model.base_model.trainable_adapter_name].total_step = len(train_dataloader)

在这里插入图片描述

训练启动

在这里插入图片描述

LLaMA-Factory添加adalora

在LLaMA-Factory中添加adalora

修改transformer源码

训练启动

相关文章：

LLaMA-Factory添加adalora

多端多用户万能DIY商城系统源码：自营+多商户入驻商城系统独立部署带完整的安装代码包以及搭建教程

Qt 6之七：学习资源

解决大模型的幻觉问题：一种全新的视角

mysql进阶-重构表

Element-ui图片懒加载

Linux系统——DNS解析详解

初识Ubuntu

Casper Network (CSPR）2024 年愿景：通过投资促进增长

《MySQL系列-InnoDB引擎06》MySQL锁介绍

获取多个PDF文件的内容并保存到excel上

深入了解网络流量清洗--使用免费的雷池社区版进行防护

【FFMPEG应用篇】基于FFmpeg的转码应用(FLV MP4)

LInux初学之路linux的磁盘分区/远程控制/以及关闭图形界面/查看个人身份

Netty 介绍、使用场景及案例

小游戏选型(一):游戏化设计助力直播间互动和营收

社区嵌入式服务设施建设为社区居家养老服务供给增加赋能

SpringBoot请求参数加密、响应参数解密

Mysql适配国产化数据库人大金仓冲突记录

在微服务架构中认证和授权的那些事儿

APK安装器终极指南：3种方法让Windows电脑秒变安卓设备

解密Jsxer：如何高效反编译Adobe JSXBIN二进制脚本

影刀RPA跨境店群运营架构：基于Python的高并发环境隔离与自动化调度系统设计实战

gifuct-js：高性能JavaScript GIF解码器的架构设计与性能优化策略

为什么你的ElevenLabs马拉雅拉姆文输出失真？5步诊断法+3个预处理Python脚本立即修复

PyWxDump：微信数据管理的终极本地解决方案指南

FPGA开发入门：从零开始用Vivado实现LED流水灯项目

开关电源传导EMI超标？手把手教你用π型滤波器搞定（附SCT2450实测数据）

stm32 FOC从学习开发（七）SVPWM算法MATLAB仿真进阶：从模型搭建到代码生成

pgwatch2监控指标详解：从基础性能到高级洞察