当前位置：首页 > article >正文

昇腾CANN/TensorFlow MemoryConfig构造函数

article 2026/5/9 13:58:22

MemoryConfig构造函数【免费下载链接】tensorflowAscend TensorFlow Adapter项目地址: https://gitcode.com/cann/tensorflow功能说明MemoryConfig类的构造函数用于配置系统内存使用方式。函数原型class MemoryConfig(): def __init__(self, atomic_clean_policy0, static_memory_policy0, variable_use_1g_huge_page0 # ... )参数说明atomic_clean_policy输入是否集中清理网络中所有memset算子占用的内存含有memset属性的算子都是memset算子。0默认值集中清理。1单独清理对网络每一个memset算子进行单独清理。当网络中memset算子内存过大时可尝试此种清理方式但可能会导致一定的性能损耗。static_memory_policy输入网络运行时使用的内存分配方式。0默认值动态分配内存即按照实际大小动态分配。2静态shape支持内存动态扩展。网络运行时可以通过此取值实现同一session中多张图之间的内存复用即以最大图所需内存进行分配。例如假设当前执行图所需内存超过前一张图的内存时直接释放前一张图的内存按照当前图所需内存重新分配。3动态shape支持内存动态扩展解决内存动态分配时的碎片问题降低动态shape网络内存占用。4静态shape和动态shape同时支持内存动态扩展。[!NOTE]说明多张图并发执行时不支持配置为“2”和“4”。为兼容历史版本配置配置为“1”的场景下系统会按照“2”的方式进行处理。配置为“3”和“4”的场景下将带来内存收益但可能导致性能损失。variable_use_1g_huge_page输入在推荐模型中嵌入层(Embedding层)在TensorFlow中使用的是变量当嵌入层作为索引类算子(Gather、ScatterNd等)的输入或输出地址时若内存较大会存在大范围的离散访问可能会出现算子性能下降问题。此时可尝试通过配置此参数为变量和常量使用1G大页申请内存从而提升访存性能。该参数取值包括0默认值使用系统默认的4K或者2M页申请内存。1使用1G大页申请内存如果申请失败立即打印ERROR日志并终止业务执行。2使用1G大页申请内存如果申请失败会打印ERROR日志但不终止业务执行而是转为使用2M页申请内存如果尝试申请成功则业务继续执行。如果尝试申请失败则终止业务执行。使用1G大页申请内存可以有效降低页表数量有效扩大TLBTranslation Lookaside Buffer缓存的地址范围从而提升离散访问的性能。TLB是昇腾AI处理器中用于高速缓存的硬件模块用于存储最近使用的虚拟地址到物理地址的映射。[!NOTE]说明此参数仅支持以下产品Ascend 950PR/Ascend 950DTAtlas A3 训练系列产品/Atlas A3 推理系列产品Atlas A2 训练系列产品/Atlas A2 推理系列产品返回值返回MemoryConfig类对象作为NPURunConfig的参数传入。约束说明无调用示例from npu_bridge.npu_init import * ... mem_config MemoryConfig(atomic_clean_policy0, static_memory_policy0) session_configtf.ConfigProto(allow_soft_placementTrue) config NPURunConfig(memory_configmem_config, session_configsession_config)【免费下载链接】tensorflowAscend TensorFlow Adapter项目地址: https://gitcode.com/cann/tensorflow创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

昇腾CANN/TensorFlow MemoryConfig构造函数

相关文章：

昇腾CANN/TensorFlow MemoryConfig构造函数

CANN/driver设备故障码查询API

2025最权威的五大AI论文网站解析与推荐

ARMv8内存管理机制与地址转换详解

IEEE 802.11az安全Wi-Fi测距技术解析与应用

数字幅度调制器原理与3dB耦合器应用解析

CANN/driver获取能力组信息API

基于LLM+RAG的动态本体生成：从概念到工程实践

CANN/cann-bench: 3D卷积滤波器梯度算子

CANN/runtime回调机制示例

AI模型评估中的规范过拟合：超越基准测试的实战应对策略

基于DenseNet201的实时手语识别系统：从数据构建到工程部署全流程解析

脉冲神经网络：从决策到共情的多层级类脑智能实现

CANN/HCCL算法分析器使用指南

UVa 189 Pascal Program Lengths

AI高通量实验平台：数据驱动电池级碳酸锂工艺优化

CANN ops-tensor Blaze引擎

UVa 188 Perfect Hash

长期使用中观察到的Taotoken账单明细与成本分析价值

联邦学习与Transformer在CV与安全领域的融合应用与实战解析

信贷风控中可解释AutoML实践：用SHAP与H2O实现透明AI决策

基于SVR与特征选择的系外行星半径预测：数据清洗、模型构建与天文解读

不同价位的燕窝品质差异大吗？行业标准解读与选购建议

第五篇：锻造大脑——为什么算法公开，你却造不出 GPT？

非洲AI本土化实践：医疗、农业、金融、教育四大领域创新与挑战

基于主动学习的广义Benders分解算法初始化优化研究

CANN/tensorflow NPURunConfig精度调优配置

CANN/cann-recipes-infer：NPU DeepSeek-V4 TileLang算子开发实践

CANN/pyasc ib_wait函数文档

昇腾SiP CgemvOperation C++示例