当前位置：首页 > news >正文

安装LLaMA-Factory微调chatglm3，修改自我认知

news 2026/5/18 8:19:15

安装git clone https://github.com/hiyouga/LLaMA-Factory.git
conda create -n llama_factory python=3.10
conda activate llama_factory
cd LLaMA-Factory
pip install -r requirements.txt

之后运行

单卡训练，

CUDA_VISIBLE_DEVICES=0 python src/train_web.py，按如下配置

demo_tran.sh

CUDA_VISIBLE_DEVICES=0 python src/train_bash.py \--stage sft \--model_name_or_path /data/models/llm/chatglm3-lora/ \--do_train \--overwrite_output_dir \--dataset self_cognition \--template chatglm3 \--finetuning_type lora \--lora_target query_key_value \--output_dir export_chatglm3 \--overwrite_cache \--per_device_train_batch_size 4 \--gradient_accumulation_steps 4 \--lr_scheduler_type cosine \--logging_steps 10 \--save_steps 1000 \--learning_rate 1e-3 \--num_train_epochs 10.0 \--plot_loss \--fp16

export_model.sh

python src/export_model.py \--model_name_or_path /data/models/llm/chatglm3-lora/ \--template chatglm3 \--finetuning_type lora \--checkpoint_dir /data/projects/LLaMA-Factory/export_chatglm3 \--export_dir lora_merge_chatglm3

cli_demo.sh

python src/cli_demo.py \--model_name_or_path /data/models/llm/chatglm3-lora/ \--template default \--finetuning_type lora

注意合并模型的时候，最后复制chatglm3的tokenizer.model和tokenizer_config.json到合并后模型覆盖之后，要修改

不覆盖会有这个错误，

Use DeepSpeed方法

deepspeed --num_gpus 3 --master_port=9901 src/train_bash.py \--deepspeed ds_config.json \--stage sft \--model_name_or_path /media/cys/65F33762C14D581B/chatglm2-6b \--do_train True \--finetuning_type lora \--template chatglm2 \--flash_attn False \--shift_attn False \--dataset_dir data \--dataset self_cognition,sharegpt_zh \--cutoff_len 1024 \--learning_rate 0.001 \--num_train_epochs 10.0 \--max_samples 1000 \--per_device_train_batch_size 4 \--gradient_accumulation_steps 4 \--lr_scheduler_type cosine \--max_grad_norm 1.0 \--logging_steps 10 \--save_steps 1000 \--warmup_steps 0 \--neft_alpha 0 \--train_on_prompt False \--upcast_layernorm False \--lora_rank 8 \--lora_dropout 0.1 \--lora_target query_key_value \--resume_lora_training True \--output_dir saves/ChatGLM2-6B-Chat/lora/train_2023-12-12-23-26-49 \--fp16 True \--plot_loss True

ds_config.json的格式下面的：

{"train_batch_size": "auto","train_micro_batch_size_per_gpu": "auto","gradient_accumulation_steps": "auto","gradient_clipping": "auto","zero_allow_untested_optimizer": true,"fp16": {"enabled": "auto","loss_scale": 0,"initial_scale_power": 16,"loss_scale_window": 1000,"hysteresis": 2,"min_loss_scale": 1},  "zero_optimization": {"stage": 2,"allgather_partitions": true,"allgather_bucket_size": 5e8,"reduce_scatter": true,"reduce_bucket_size": 5e8,"overlap_comm": false,"contiguous_gradients": true}
}

跑成功的效果图：

如果出现下面这个问题，

[E ProcessGroupNCCL.cpp:916] [Rank 3] NCCL watchdog thread terminated with exception: CUDA error: the launch timed out and was terminated CUDA kernel errors might be asynchronously reported at some other API call, so the stacktrace below might be incorrect. For debugging consider passing CUDA_LAUNCH_BLOCKING=1. Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions.

可能原因是显卡坏了或者显卡不是同一个型号！

安装LLaMA-Factory微调chatglm3，修改自我认知

相关文章：

安装LLaMA-Factory微调chatglm3，修改自我认知

以太网协议与DNS

Spring Boot的日志

Cisco Packet Tracer配置命令——交换机篇

python单例模式

环境保护：人类生存的最后机会

头歌-Python 基础

C++数据结构：B树

【07】ES6：对象的扩展

flink找不到隐式项

【网络编程】-- 04 UDP

【脚本】图片-音视频-压缩文件处理

跨品牌的手机要怎样相互投屏？iPhone和iPad怎么相互投屏？

图像特征提取-角点

N26：构建无缝体验的平台工程之路-Part 2

【Hadoop-Distcp】通过Distcp的方式进行两个HDFS集群间的数据迁移

【Linux】使用Bash和GNU Parallel并行解压缩文件

T天池SQL训练营(五)-窗口函数等

道可云元宇宙每日资讯｜上海市区块链关键技术攻关专项项目立项清单公布

大语言模型有什么意义？亚马逊训练自己的大语言模型有什么用？

VSCode光标主题定制指南：从颜色令牌到扩展开发

Adobe-GenP终极指南：5分钟破解Adobe创意套件限制的完整教程

Solidworks PDM二次开发实战：文件夹权限与数据卡配置详解

Zotero插件市场：三步快速上手的插件管理神器

使用mcp-maker快速构建AI工具调用服务器：从协议原理到工程实践

【2026最新】鸿蒙NEXT ArkUI实战：培训班管理系统UI界面开发全攻略

基于双线性插值的AMG8833热成像分辨率提升方案与嵌入式实现

深度解析VS Code Live Server：高效前端开发实时预览配置秘籍

Arm Neoverse CMN-700架构与寄存器配置详解

视觉显著目标的自适应分割与动态网格生成算法研究