当前位置：首页 > article >正文

CANN/hccl：rank table配置资源信息（Atlas 300I Duo 推理卡）

article 2026/5/9 18:53:43

rank table配置资源信息Atlas 300I Duo 推理卡【免费下载链接】hccl集合通信库Huawei Collective Communication Library简称HCCL是基于昇腾AI处理器的高性能集合通信库为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl针对Atlas 300I Duo 推理卡以包含两个AI Server每个AI Server内2个Device为例rank table文件配置示例如下[!NOTE]说明 rank table文件为JSON格式本节所示JSON文件示例中的注释仅为方便理解实际使用时请删除JSON文件中的注释。{ status:completed, // rank table可用标识completed为可用 version:1.0, // rank table模板版本信息配置为1.0 server_count:2, // 参与训练的AI Server数目此例中有两个AI Server server_list: [ { server_id:node_0, //AI Server标识String类型请确保全局唯一 device:[ // AI Server中的Device列表 { device_id:0, // 处理器的物理ID device_ip:192.168.1.8, // 处理器真实网卡IP rank_id:0 // rank的标识从0开始配置请确保全局唯一 }, { device_id:1, device_ip:192.168.1.9, rank_id:1 } ] }, { server_id:node_1, device:[ { device_id:0, device_ip:192.168.2.8, rank_id:2 }, { device_id:1, device_ip:192.168.2.9, rank_id:3 } ] } ] }rank table配置文件说明如下所示一级配置项二级配置项三级配置项配置说明status必选。rank table可用标识。- completed表示rank table可用。- initializing表示rank table不可用。version必选。rank table模板版本信息。配置为1.0。server_count必选。参与集合通信的AI Server个数。server_list必选。参与集合通信的AI Server列表。server_id必选。AI Server标识字符串类型长度小于等于64请确保全局唯一。配置示例node_0。device必选。AI Server中的Device列表。device_id必选。AI处理器的物理ID即Device在AI Server上的序列号。可通过执行“ls /dev/davinci*”命令获取AI处理器的物理ID。例如显示/dev/davinci0表示AI处理器的物理ID为0。取值范围[0实际Device数量-1]。注意“device_id”配置项的优先级高于环境变量“ASCEND_DEVICE_ID”。device_ip必选。AI处理器集成网卡IP全局唯一要求为常规IPv4或IPv6格式。可以在当前AI Server执行指令“cat /etc/hccn.conf”获取网卡IP例如address_0xx.xx.xx.xxnetmask_0xx.xx.xx.xxnetdetect_0xx.xx.xx.xx查询到的address_xx即为网卡IPaddress后的序号为AI处理器的物理ID即device_id后面的ip地址即为需要用户填入的该device对应的网卡IP。rank_id必选。rank唯一标识请配置为整数从0开始配置且全局唯一取值范围[0, 总Device数量-1]为方便管理建议rank_id按照Device物理连接顺序进行排序即将物理连接上较近的Device编排在一起。例如若device_ip按照物理连接从小到大设置则rank_id也建议按照从小到大的顺序设置。【免费下载链接】hccl集合通信库Huawei Collective Communication Library简称HCCL是基于昇腾AI处理器的高性能集合通信库为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

CANN/hccl：rank table配置资源信息（Atlas 300I Duo 推理卡）

相关文章：

CANN/hccl：rank table配置资源信息（Atlas 300I Duo 推理卡）

GitHub Profile动态化：用SVG与Twitter API打造个人技术名片

机器学习性能基线：Zero Rule算法原理与Weka实践

CANN/metadef GenerateTask接口

基于GPT的Python 2到3代码迁移：原理、实践与避坑指南

SwiftUI Pro Agent Skill：提升AI生成代码质量的专业技能包

CANN/ge：AscendIR图引擎中间表示设计

CANN/cannbot-skills Flash Attention内核深度分析

从开发者视角体验Taotoken文档中Python与Node示例的易用性

医疗AI公平性挑战：破解非洲部署中的数据偏见与技术鸿沟

Fairseq-Dense-13B-Janeway入门必看：Temperature/Top-p参数调优对创意写作影响的实测分析

偏导数与梯度向量：多维空间变化率的本质与应用

Taotoken提供的标准OpenAI协议兼容性实际体验分享

Oumuamua-7b-RP真实作品：基于‘贵族女仆’设定的料理指导+生活关怀对话

通过用量看板观察不同模型API调用的Token消耗与成本分布

生成式AI社会风险评估：从技术原理到治理框架的实践指南

Phi-4-mini-flash-reasoning行业落地：IT运维故障逻辑链自动推演案例

Taotoken的APIKey管理与访问控制功能切实提升了安全性

CANN/driver DCMI设备cgroup信息获取

Oumuamua-7b-RP效果展示：温度0.3 vs 1.2下角色性格稳定性对比实测

自动驾驶AI算法演进：从L0到L5的技术跃迁与工程挑战

新能源车维修成本畸高，行业垄断与技术壁垒让车主陷入“买得起修不起“困境

Orangutan算法：仿生视觉注意力机制在计算机视觉中的应用

新手教程使用Python和OpenAI兼容SDK五分钟接入Taotoken大模型服务

大模型参数规模与性能的非线性关系：从规模迷信到精准设计

CANN/torchtitan-npu版本策略

CANN ops-cv图模式适配指南

CANN运行时Stream管理

RankSpot 全自动 AI 智能体技术架构与核心机制深度解析

2026年程序员必看：6条AI独立开发实战路径，从0到月入3万+（收藏版）