当前位置：首页 > article >正文

CANN/AMCT量化感知训练配置创建

article 2026/5/9 18:15:02

create_quant_retrain_config【免费下载链接】amctAMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。项目地址: https://gitcode.com/cann/amct产品支持情况产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列产品 / Atlas A3 推理系列产品√Atlas A2 训练系列产品 / Atlas A2 推理系列产品√功能说明量化感知训练接口根据图的结构找到所有可量化的层自动生成量化配置文件并将可量化层的量化配置信息写入配置文件。函数原型create_quant_retrain_config(config_file, model, input_data, config_definationNone)参数说明参数名输入/输出说明config_file输入含义待生成的量化感知训练配置文件存放路径及名称。如果存放路径下已经存在该文件则调用该接口时会覆盖已有文件。数据类型stringmodel输入含义待进行量化感知训练的模型已加载权重。数据类型torch.nn.Moduleinput_data输入含义模型的输入数据。一个torch.tensor会被等价为tuple(torch.tensor)。数据类型tupleconfig_defination输入含义简易配置文件。基于retrain_config_pytorch.proto文件生成的简易配置文件quant.cfg*.proto文件所在路径为AMCT安装目录/amct_pytorch/proto/。*.proto文件参数解释以及生成的quant.cfg简易量化配置文件样例请参见量化感知训练简易配置文件。默认值None。数据类型string量化支持的层及约束支持的层类型约束备注torch.nn.Linear-复用层共用weight和bias参数不支持量化。torch.nn.Conv2dpadding_mode为zeros由于硬件约束原始模型中输入通道数Cin16时不建议进行量化感知训练否则可能会导致量化后的部署模型推理时精度下降只支持input data的shape为(N, Cin, Hin, Win)torch.nn.ConvTranspose2dpadding_mode为zeros由于硬件约束原始模型中输入通道数Cin16时不建议进行量化感知训练否则可能会导致量化后的部署模型推理时精度下降只支持input data的shape为(N, Cin, Hin, Win)返回值说明无调用示例import amct_pytorch as amct # 建立待量化的网络图结构 model build_model() model.load_state_dict(torch.load(state_dict_path)) input_data tuple([torch.randn(input_shape)]) # 生成量化配置文件 amct.create_quant_retrain_config(config_file./configs/config.json, modelmodel, input_datainput_data)落盘文件说明生成JSON格式的量化感知训练配置文件样例如下重新执行量化感知训练时该接口输出的配置文件将会被覆盖参数解释请参见量化感知训练配置参数。{ version:1, batch_num:1, conv1:{ retrain_enable:true, retrain_data_config:{ algo:ulq_quantize, dst_type:INT8 }, retrain_weight_config:{ algo:arq_retrain, channel_wise:true, dst_type:INT8 } }, layer1.0.conv1:{ retrain_enable:true, retrain_data_config:{ algo:ulq_quantize, dst_type:INT8 }, retrain_weight_config:{ algo:arq_retrain, channel_wise:true, dst_type:INT8 } }, fc:{ retrain_enable:true, retrain_data_config:{ algo:ulq_quantize, dst_type:INT8 }, retrain_weight_config:{ algo:arq_retrain, channel_wise:false, dst_type:INT8 } } }【免费下载链接】amctAMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。项目地址: https://gitcode.com/cann/amct创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

CANN/AMCT量化感知训练配置创建

相关文章：

CANN/AMCT量化感知训练配置创建

第12章后土化轮回：安装垃圾回收机制？六道是六个分类对象池，亡魂不再内存泄漏

AI驱动优化算法选择与设计：从元学习到自动化求解

从预测到响应：构建基于状态识别的量化交易系统

ClawZ：桌面AI助手革命，零门槛部署OpenClaw智能体

Hyperf 默认使用 Nikic/FastRoute 作为路由器。

基于MCP协议构建AI助手与Google Drive的安全连接方案

CANN算子测试赛Add报告

别人写的代码看不懂，到底是谁的水平有问题

AI光学硬件加速：1.2Tb/s高光谱视频实时理解平台架构与实践

从代码生成到自主学习：构建AI编程智能体的核心架构与实践

分布式追踪深度解析：解锁微服务架构的可观测性

3步搭建个人游戏串流服务器：Sunshine让你在任何设备畅玩3A大作

追赶行业节奏！DeepSeek计划6月推V4.1，500亿融资加速商业化转型

Java AI应用开发实战：langchain4j框架核心架构与生产实践指南

保姆级教程：Qwen-Image-2512-ComfyUI内置工作流怎么用？手把手教你5分钟出图

ACAI平台：基于数据湖与智能调度的MLOps实验管理实践

第三代社保卡全功能使用指南

Qwen-Image-2512+LoRA像素艺术作品集：Retro、Cyberpunk、Fantasy三风格实测

构式语法与AI融合：从语言认知到可解释NLP的实践路径

DeepAnalyze部署教程：基于Ollama的免配置镜像，10分钟搭建私有文本分析平台

AI项目管理中的算法偏见与包容性设计：效率与公平的平衡之道

Driver Store Explorer：Windows驱动存储清理终极指南，释放数GB磁盘空间

CANN / cann-learning-hub: Ascend C 算子工程化开发指南

XUnity.AutoTranslator：5分钟掌握Unity游戏实时翻译的完整指南

AI智能体开发实战：基于agent-sdk构建可扩展的智能应用

基于verl框架和代码沙盒环境工具调用的代码强化学习实践

美欧AI治理法案对比：从核心理念到企业合规实操全解析

nli-MiniLM2-L6-H768在舆情分析中的实战：识别观点冲突与一致性

Gemma-3-12B-IT实战体验：搭建企业内部AI助手完整指南