当前位置: 首页 > article >正文

CANN/hixl昇腾通信库

【免费下载链接】hixlHIXLHuawei Xfer Library是一个灵活、高效的昇腾单边通信库面向集群场景提供简单、可靠、高效的点对点数据传输能力。项目地址: https://gitcode.com/cann/hixlHIXL面向集群场景提供简单、可靠、高效的点对点数据传输能力Latest News[2026/03] HIXL已支持超节点内FabricMem模式详见 FabricMem。[2026/01] LLM-DataDist与HIXL已支持下一代芯片的Host RoCE传输能力。[2025/12] 基于A3超平面实现D2rH直传新增链路池与IPv6支持并对接Mooncake社区的下一代TENT架构。[2025/11] HIXL提供异步传输能力支持更高并发的非阻塞数据传输场景。[2025/10] HIXL项目开源在昇腾芯片上提供高效的多链路D2D/D2H/H2D等单边通信能力并优化了小数据量批量传输场景的性能。同时HIXL已对接多个开源社区包含MooncakeDeepLink等。概述HIXLHuawei Xfer Library是一个灵活、高效的昇腾单边通信库面向集群场景提供简单、可靠、高效的点对点数据传输能力并通过简易API开放给用户, 在多AI应用和多传输链路之间建立了桥梁。可用于构建大模型PD分离、RL后训练参数切换、模型参数缓存等多种业务场景。核心优势支持单边零拷贝One-Sided Zero-Copy通信机制HIXL提供简易、可靠的单边通信接口可在本地内存数据准备就绪之后通过单边操作完成向远端内存的直接数据传输。该机制无需远端节点执行任何操作为用户构建通信与计算重叠掩盖的调度机制提供核心技术支撑。同时零拷贝能力实现用户内存间的直接数据传输避免冗余数据搬运不仅可以降低内存带宽占用还可以减少内存容量消耗。屏蔽硬件差异兼容多链路实现跨设备高速互联HIXL屏蔽了昇腾系列芯片的底层硬件差异用户无需针对不同芯片架构进行代码适配。在通信链路层面该技术原生支持RDMAHCCS等多种高速互联协议通信带宽最高可达119GB/s可实现跨架构设备如A2系列与A3系列昇腾芯片的无缝高速互联满足低时延、 高吞吐的需求。极简API设计深度适配开源生态框架HIXL采用极简式API接口设计接口数量精简至10余个核心调用降低开发者集成门槛同时提供完善的C/Python语言接口支持。目前已实现与Mooncake、DeepLink等开源框架的深度集成vLLM、SGLang等主流推理引擎也可以直接调用HIXL API完成KV Cache的跨设备高效传输将大模型推理过程中的内存访问延迟降低20%显著提升推理吞吐。核心组件HIXL Engine作为核心传输引擎提供了基础传输接口支持多种类型内存类型传输比如D2D、D2H、H2D。同时兼容多种传输协议包括HCCS、RDMA等。可实现高速、可靠的数据传输。原生支持多类型数据链路可灵活同构集群、异构集群的复杂场景。面对集群节点动态扩缩容需求时可快速完成链路适配与资源调度为集群整体运行构建可靠通信基础。LLM-DataDist基于HIXL Engine构建提供了一套携带KV Cache语义的数据传输接口。可快速、灵活对接vLLM、SGLang等推理引擎。性能表现在昇腾A3芯片上传输128M数据场景下通过HCCS链路进行传输HIXL传输引擎的带宽可达119GB/s通过RDMA链路进行传输HIXL传输引擎的带宽可达22GB/s查看基准测试Benchmarks了解更多细节。目录结构本项目的关键目录说明如下├── build.sh # 项目工程编译脚本 ├── benchmarks # 项目benchmark性能用例 ├── cmake # 项目工程编译目录 ├── CMakeLists.txt # 项目的CMakeList ├── docs # 项目文档介绍 │ ├── cpp # C文档 │ └── python # Python文档 ├── examples # 端到端样例开发和调用示例 │ ├── cpp # C样例 │ ├── python # Python样例 ├── include # 头文件 │ ├── hixl │ ├── cs │ ├── adxl │ └── llm_datadist ├── README.md ├── scripts # 脚本路径 │ └── package ├── src # 源码路径 │ ├── hixl │ ├── llm_datadist │ ├── ops │ └── python └── tests # 测试工程目录⚡️快速入门若您希望快速体验该组件的构建和样例执行请访问如下文档获取简易教程。构建介绍组件的编译和安装包括编译成功后利用tests进行本地验证。样例执行介绍如何端到端执行样例代码包括C和Python样例。学习教程若您希望深入了解组件的相关接口并修改源码请访问如下文档获取详细教程。C/C接口C接口介绍。Python接口Python接口介绍。如果希望深入了解 HIXL 开发指南和技术文章等内容可参考以下文档HIXL 资料书架总览汇总HIXL相关资料、技术文章和培训视频链接。 AI Agent支持AI辅助编程介绍仓内默认使用的一些skills及触发方式用于提升开发者编程效率和代码质量。Zread智能问答本仓已集成 Zread 代码仓智能体旨在通过 AI 技术为您提供更深度的代码理解与技术支持开启在线智能代码学习与知识问答体验⚠️ 说明 当前代码AI Agent服务处于试点阶段。在使用过程中如果您发现 AI 生成的内容存在准确性问题或对智能助手的功能有任何改进建议欢迎通过 Issues 与我们交流您的反馈对我们非常重要相关信息贡献指南安全声明许可证所属SIG联系我们本项目功能和文档正在持续更新和完善中欢迎您关注最新版本。问题反馈通过GitCode【Issues】提交问题。社区互动通过GitCode【讨论】参与交流。经验分享通过GitCode【Wiki】分享经验总结。加入交流群通过扫描下方微信二维码添加HIXL小助手微信加入微信群与我们进一步交流。【免费下载链接】hixlHIXLHuawei Xfer Library是一个灵活、高效的昇腾单边通信库面向集群场景提供简单、可靠、高效的点对点数据传输能力。项目地址: https://gitcode.com/cann/hixl创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关文章:

CANN/hixl昇腾通信库

【免费下载链接】hixl HIXL(Huawei Xfer Library)是一个灵活、高效的昇腾单边通信库,面向集群场景提供简单、可靠、高效的点对点数据传输能力。 项目地址: https://gitcode.com/cann/hixl HIXL 面向集群场景提供简单、可靠、高效的点对…...

CANN/ops-tensor API 实现状态

ops-tensor API 实现状态 【免费下载链接】ops-tensor ops-tensor 是 CANN (Compute Architecture for Neural Networks)算子库中提供张量类计算的基础算子库,采用模块化设计,支持灵活的算子开发和管理。 项目地址: https://git…...

Supabase database-build:声明式PostgreSQL架构管理的工程实践

1. 项目概述:一个数据库构建的“乐高工厂”如果你在Supabase社区里混过一段时间,大概率会听说过或者用过supabase-community/database-build这个仓库。乍一看名字,它可能被误解为某个数据库的构建脚本或者一个独立的工具。但当你真正深入进去…...

Figma文件语义化重构:提升AI协作与前端开发效率

1. 项目概述:为Figma文件注入“语义灵魂”如果你是一名前端开发者,或者经常需要与设计师协作,你一定遇到过这样的场景:设计师丢过来一个Figma文件,你满怀期待地打开,准备从中提取设计规范、组件结构&#x…...

AI智能体如何通过MCP协议直接操作浏览器?DrissionPage-MCP-Server实践指南

1. 项目概述:当浏览器自动化遇上AI智能体 最近在折腾AI智能体(Agent)和自动化工具链的整合,发现一个挺有意思的痛点:很多AI助手,比如Claude、Cursor的AI编程伙伴,它们能理解你的指令&#xff0…...

多智能体系统核心架构解析:从AutoGen到Shogun的“将军”模型实践

1. 项目概述:当“将军”指挥多个AI智能体最近在开源社区里,一个名为yohey-w/multi-agent-shogun的项目引起了我的注意。光看名字,“multi-agent”和“shogun”(将军)这两个词就足够让人浮想联翩。这显然不是一个简单的…...

GPU能耗建模技术:从指令级优化到跨架构统一

1. GPU能耗建模的技术演进与核心挑战 在现代高性能计算(HPC)和机器学习领域,GPU已成为算力核心,但随之而来的能耗问题日益突出。以美国能源部的Frontier超级计算机为例,其搭载的64000块GPU在满负荷运行时功耗可达30兆瓦…...

如何为 Linux 之父,打造一台让他满意的最强主机?

今天在B站刷到了一个堪称 “世纪同框” 的视频,我关注的 LTT 频道,请来了 Linux 和 Git 之父——Linus Torvalds 本尊! 这绝对是每个技术宅的梦想时刻:当科技圈最能“整活”的 Linus,遇上最硬核的 Linus,他…...

智慧工地工作人员建筑工人工作状态检测数据集VOC+YOLO格式7375张3类别

注意数据集中有部分增强,大约5000张是原图剩余为旋转增强图片数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数):7375标注数量(xml文…...

基于MCP协议构建AI邮件助手:lettr-mcp架构设计与实现详解

1. 项目概述:一个连接AI与外部世界的“翻译官”最近在折腾AI应用开发的朋友,估计都绕不开一个词:MCP(Model Context Protocol)。简单来说,它就像给大语言模型(比如ChatGPT、Claude)装…...

开源情绪感知交互空间:从传感器到氛围生成的软硬件实现

1. 项目概述:一个开源的情绪感知与交互空间最近在GitHub上看到一个挺有意思的项目,叫“open-vibe-island”。光看名字,你可能会有点摸不着头脑,这“开放氛围岛”到底是个啥?简单来说,这是一个开源的情绪感知…...

Resonix-AG:实时音频动态处理库的架构、算法与工程实践

1. 项目概述:一个音频处理领域的“瑞士军刀”最近在音频处理社区里,一个名为Resonix-AG的项目引起了我的注意。这个由mangiapanejohn-dev维护的仓库,名字听起来就很有技术感——“Resonix”很容易让人联想到“共振”(Resonance&am…...

艾尔登法环帧率解锁与视觉增强终极指南

艾尔登法环帧率解锁与视觉增强终极指南 【免费下载链接】EldenRingFpsUnlockAndMore A small utility to remove frame rate limit, change FOV, add widescreen support and more for Elden Ring 项目地址: https://gitcode.com/gh_mirrors/el/EldenRingFpsUnlockAndMore …...

用Rust构建跨平台光标主题引擎:提升终端开发体验的个性化利器

1. 项目概述:一个为开发者打造的轻量级光标主题引擎在终端和代码编辑器的世界里,我们每天有数小时与闪烁的光标为伴。这个看似不起眼的小竖线或方块,却是我们与机器交互最直接的视觉焦点。然而,大多数开发者默认使用的都是系统或编…...

writ工具:提升AI编程指令质量与智能体协作的工程实践

1. 项目概述:为AI编码智能体构建质量与沟通层如果你和我一样,每天都在和Cursor、Claude Code这类AI编码助手打交道,那你肯定遇到过这样的场景:你精心写了一大段指令,告诉AI“重构这个函数,让它更高效”&…...

多智能体开发环境配置管理:模块化、隔离化与一键化实践

1. 项目概述:一个为多智能体协作环境量身定制的配置管理方案如果你和我一样,日常开发工作流中已经离不开各类AI助手,从代码补全、文档生成到复杂任务的自动化分解,那么你很可能已经体验过同时与多个AI智能体“协同作战”的场景。无…...

期刊名称智能缩写工具Journal Abbrev:解放科研文献管理自动化

1. 项目概述与核心价值 如果你是一名科研工作者、学术编辑,或者经常需要处理参考文献,那么“期刊名称缩写”这件事,绝对是你学术生涯中一个不大不小、但又极其磨人的痛点。想象一下,你正在撰写一篇论文,需要引用几十篇…...

实测 Taotoken 在不同时段的 API 响应延迟与稳定性观感

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 实测 Taotoken 在不同时段的 API 响应延迟与稳定性观感 在将大模型能力集成到应用中的过程中,API 的响应延迟与稳定性是…...

统一通信协作平台UCCL:架构解析与自托管部署实践

1. 项目概述:一个面向未来的统一通信与协作平台最近几年,远程办公和混合工作模式已经成为常态,随之而来的是团队协作工具的“爆炸式增长”。我们每天可能要在五六个不同的应用之间切换:用A软件开会,用B软件传文件&…...

2026届毕业生推荐的十大AI论文助手推荐榜单

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 人工智能写作工具是依据深度学习算法构建而成的,其具备飞快生成出结构完整且语言…...

2026届学术党必备的五大降AI率神器解析与推荐

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek DeepSeek系列论文展现出大规模语言模型的技术突破,其创新架构运用混合专家模型跟…...

2026届最火的五大降AI率神器实测分析

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 倘若人工智能技术得以广泛普及,那么便会有越来越多的毕业生尝试借助AI工具来辅助…...

2025最权威的五大AI辅助论文工具解析与推荐

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 存在着一种基于人工智能技术的自动化写作工具,你知道是什么吗,它就是…...

PyTorch 混合精度训练:FP16 与 BF16 性能对比

PyTorch 混合精度训练:FP16 与 BF16 性能对比 1. 技术分析 1.1 浮点精度对比 精度位数范围精度内存占用FP32321.2e-38 ~ 3.4e387位有效数字4字节FP16166.1e-5 ~ 6.5e43位有效数字2字节BF16161.1e-38 ~ 3.4e383位有效数字2字节 1.2 混合精度训练原理 混合精度训练流程…...

AI意识评估:从理论到工程实践的科学探索

1. 项目概述:当AI开始“思考”,我们如何评估?“AI意识评估”这个标题,听起来像科幻小说里的概念,但事实上,它正迅速从一个哲学思辨议题,演变为一个迫在眉睫的工程与伦理挑战。作为一名长期关注前…...

医疗生成式AI的伦理挑战与GREAT PLEA治理框架实践指南

1. 项目概述:当AI开始“思考”医疗最近几年,生成式AI在医疗领域的应用,已经从实验室的“概念验证”阶段,快速渗透到临床辅助诊断、药物研发、患者教育乃至医院运营管理的方方面面。作为一名长期关注医疗科技交叉领域的从业者&…...

从信托义务到AI对齐:构建可信人工智能的技术与治理框架

1. 项目概述:当法律遇上代码最近和几位做AI产品落地的朋友聊天,大家不约而同地提到了同一个词:“对齐”。但聊着聊着,话题就从技术上的“奖励模型”和“人类反馈强化学习”,滑向了更让人头疼的领域——合规、责任和信任…...

基于Claude API的智能代码生成工具设计与实现

1. 项目概述:一个被“设计失败”命名的代码生成工具在开发者社区里,项目名称往往承载着创始人的某种情绪或愿景。当你第一次看到designfailure/claudecode这个仓库名时,可能会感到一丝困惑甚至好奇。designfailure(设计失败&#…...

自主智能体架构解析:从ReAct框架到实战应用开发指南

1. 项目概述与核心价值最近在GitHub上看到一个名为“Autonomous-Agents”的项目,作者是tmgthb。这个标题本身就充满了吸引力,它指向了当前人工智能领域一个极其热门且富有想象力的方向——自主智能体。简单来说,这个项目探讨和实现的&#xf…...

RAG-Fusion:用多查询与RRF融合提升复杂意图检索效果

1. 项目概述:RAG-Fusion,一次对搜索本质的深度探索如果你和我一样,在过去几年里一直在折腾RAG(检索增强生成)相关的项目,那你肯定经历过这种时刻:精心构建的向量数据库,配上强大的大…...