当前位置: 首页 > article >正文

InfiniBand(IB)网络介绍 (英伟达/Mellanox)的IB卡,从2022年底起就已经正式对中国断供;你现在用的shca IB卡,是国产替代的曙光自研IB卡

InfiniBandIB物理上IB专用网卡HCA IB专用交换机 光纤/铜线协议完全独立的IB协议不是TCP/IP定位超级高铁专线——只给超算、AI集群、高性能存储用核心黑科技RDMA远程直接内存访问数据直接从一台机器内存 → 另一台机器内存绕过操作系统内核几乎不占CPU延迟低到 ~0.5–1μs美国原厂英伟达/Mellanox的IB卡从2022年底起就已经正式对中国断供你现在用的shca IB卡是国产替代的曙光自研IB卡。**1. 美国是不是断供了是而且是硬断以前全球IB卡基本只有一家以色列Mellanox迈络思后来被英伟达收购。2022年10月美国出口管制新规把高性能计算、超算用的IB卡/IB网络列入管制禁止对华出口、技术支持、新订单。2023–2025年持续加码高端Mellanox ConnectX‑5/6/7100G/200G/400G IB完全禁售想申请许可几乎不给过就算过也极贵、数量受限、随时可吊销。现状2026国内买不到新的美国原厂IB卡存量旧卡老款、二手还能跑但不能扩容、不能升级、没官方支持。2. 你用的“shca IB卡”是什么shca 曙光自研的国产IB网卡中科曙光和海光深度绑定。背景因为美国断供Mellanox国内超算/AI集群必须国产替代曙光就做了scaleFabricshcaIB从芯片到驱动全自研。对应关系以前Mellanox ConnectX‑6mlx5→ IB卡现在曙光shca → 国产IB卡你服务器里的就是这个。3. 对你来说意味着什么美国原厂IB卡买不到、不能扩容、没支持。shca国产IB卡替代方案专门给海光BW/DCU集群做的驱动叫mlxtoshca把Mellanox驱动改成shca适配。性能shca ≈ 中高端Mellanox IB能跑100G/200G足够大模型训练解决了“断供后没高速网络可用”的问题。4. 总结大白话✅美国Mellanox IB卡2022年底起正式断供中国。✅shca曙光国产IB卡用来替代被禁的Mellanox。✅你在海光BW服务器上装的就是国产shca IB驱动用来跑国产IB高速网络。国产原生IB/类IB高速网卡不止海光/曙光一家但能做到“原生IB、万卡集群、对标Mellanox”的目前主要是曙光SHCA 和华为自研封闭)其他厂商多做RoCEv2以太网RDMA不算原生IB。一、原生IB你现在用的这种✅中科曙光海光绑定SHCAscaleFabric国内首款全栈自研原生IB2026年3月发布400G、时延1μs适配海光DCU集群就是你服务器里的卡✅华为自研IB内部代号未公开仅用于昇腾910/310集群不对外单独卖卡原生IB自研交换机性能强但生态封闭、不兼容x86/海光二、类IBRoCEv2以太网跑RDMA非原生IB✅浪潮InCloud RDMA网卡100G/200G RoCEv2适配Intel/海光CPU集群✅锐捷自研RDMA网卡交换机200G RoCEv2用于AI训练集群✅盛科通信/安路科技交换芯片网卡方案提供RDMA芯片供服务器厂商做网卡三、一句话总结原生IB和Mellanox完全兼容只有曙光SHCA你用的华为自研封闭RoCEv2以太网RDMA非原生IB浪潮、锐捷、盛科等很多家海光本身不做IB卡是曙光做SHCA专门适配海光DCU不是国产原生IB/类IB高速网卡不止海光/曙光一家但能做到“原生IB、万卡集群、对标Mellanox”的目前主要是曙光SHCA其他厂商多做RoCEv2以太网RDMA不算原生IB。一、原生IB你现在用的这种✅中科曙光海光绑定SHCAscaleFabric国内首款全栈自研原生IB2026年3月发布400G、时延1μs适配海光DCU集群就是你服务器里的卡✅华为自研IB内部代号未公开仅用于昇腾910/310集群不对外单独卖卡原生IB自研交换机性能强但生态封闭、不兼容x86/海光二、类IBRoCEv2以太网跑RDMA非原生IB✅浪潮InCloud RDMA网卡100G/200G RoCEv2适配Intel/海光CPU集群✅锐捷自研RDMA网卡交换机200G RoCEv2用于AI训练集群✅盛科通信/安路科技交换芯片网卡方案提供RDMA芯片供服务器厂商做网卡三、一句话总结原生IB和Mellanox完全兼容只有曙光SHCA你用的华为自研封闭RoCEv2以太网RDMA非原生IB浪潮、锐捷、盛科等很多家海光本身不做IB卡是曙光做SHCA专门适配海光DCU原生IB vs RoCEv2 大白话对比国产高速网络两种主流路线先记核心结论你现在用的 SHCA 是 原生IB其他大部分国产厂商做的是 RoCEv2以太网RDMA1 本质区别原生IB曙光SHCA、老迈络思自己独立专用网络不走以太网协议硬件、交换机、网线、驱动全是IB一套专属就像专用高铁轨道不和普通公路共用RoCEv2浪潮/锐捷/大部分国产网卡借光纤以太网的路在以太网上跑RDMA加速用普通以太网交换机、普通网线就像在普通高速公路上画一条专用超车道2 关键维度对比维度原生IBSHCA/迈络思RoCEv2 以太网RDMA延迟最低最稳0.51μs稍高波动大一点丢包敏感几乎 no 丢包集群极稳容易受网络风暴、广播影响多卡大模型训练完美适配大集群不掉速小集群还行万卡大集群容易卡、超时占用CPU极低RDMA 卸载彻底略高一点建设成本贵要专用IB交换机便宜复用现有光纤以太网交换机兼容性完美兼容NCCL原生IB生态要额外调参数适配不如原生IB顺滑国内代表曙光SHCA你正在用、华为自研IB浪潮、锐捷、盛科、其他大部分国产网卡3 跟你海光BW集群有什么关系超算、大模型多卡训练优先上原生IB追求稳、低延迟、不卡顿所以曙光给海光DCU/BW 直接配套SHCA 原生IB卡替代被美国断供的迈络思其他便宜机房、普通业务集群就用RoCEv2 国产RDMA凑合用成本低。4 最简单一句话记住原生IB专业赛道又快又稳给超算/大模型训练用你现在这套RoCEv2公用赛道改的加速道便宜够用适合一般AI和业务集群为什么大模型多卡训练必须要用原生IB用普通以太网为啥跑不动吗为什么大模型多卡训练必须上原生IB普通光纤以太网根本扛不住全程大白话不讲虚理论。先搞懂大模型多卡训练在干嘛大模型LLaMA、DeepSeek、千亿级参数巨大一张卡装不下必须拆到多张海光BW 64G卡上。每跑一小步都要做两件事每张卡算自己的梯度所有卡互相疯狂传数据、同步参数特点数据量超大每秒要同步几百次不能卡顿、不能等待、不能延迟高三种网络直白对比1. 普通千兆/万兆以太网常规网线相当于乡村小路延迟高、堵车、中转多多卡一同步就排队等待大模型训练慢到离谱、时不时超时中断2. 普通光纤以太网你以为很快的那种相当于城市快速路、普通高速虽然带宽大但走TCP/IP协议要经过系统内核、CPU拷贝、打包拆包延迟高、抖动大大模型多卡能跑但速度砍半、训练不稳、容易NCCL超时3. 原生InfiniBand你现在的SHCA国产IB相当于独立城际高铁专线RDMA直写内存不经过CPU、不经过系统内核延迟极低、几乎无抖动、不堵车多卡成千上万张互相通信都稳得住大模型唯一能跑满性能、稳训不断的网络核心关键普通光纤网输在哪延迟高以太网几十微秒IB只要0.5~1微秒差几十倍。大模型每步都要等通信延迟一高整体速度直接崩盘。占CPU极高以太网传数据要CPU不停处理、打包、校验IB用RDMA绕过CPU显卡自己直接互传。容易丢包、抖动以太网是共享网络别人传数据你就受影响IB是独占专用网络只给GPU训练用不受干扰。NCCL集群通信天生优先IBNCCL多卡通信底层库优先识别IB → 全速运行没有IB自动降级到以太网 → 性能暴跌放到你海光BW 64G集群身上美国迈络思IB卡断供买不到了超算不能没有IB不然大模型根本没法正经训练曙光就做了SHCA国产原生IB完美顶替所以老师才让你装那个mlxtoshca.sh驱动 设IB环境变量目的只有一个让系统启用国产IB高速通道不走慢腾腾的普通光纤网。极简总结一句话普通光纤网带宽看着大实际多卡训练又慢又不稳原生IBSHCA延迟极低、不占CPU、专属高速通道是大模型多卡训练的刚需你现在用的海光BW超算集群标配国产SHCA-Ib就是为了替代被美国断供的进口IB保证大模型能全速稳定跑。要不要我再给你通俗讲下RDMA到底是什么为什么它能绕过CPU、速度快这么多

相关文章:

InfiniBand(IB)网络介绍 (英伟达/Mellanox)的IB卡,从2022年底起就已经正式对中国断供;你现在用的shca IB卡,是国产替代的曙光自研IB卡

InfiniBand(IB) 物理上:IB专用网卡(HCA) IB专用交换机 光纤/铜线协议:完全独立的IB协议,不是TCP/IP定位:超级高铁专线——只给超算、AI集群、高性能存储用核心黑科技:RD…...

【通信】D2D通信中基于Qlearning强化学习算法的联合资源分配与功率控制算法matlab仿真

✅作者简介:热爱科研的Matlab仿真开发者,擅长毕业设计辅导、数学建模、数据处理、程序设计科研仿真。🍎完整代码获取 定制创新 论文复现点击:Matlab科研工作室👇 关注我领取海量matlab电子书和数学建模资料 &#x1f3…...

【图像去噪】基于自适应掩码和稀疏表示的自监督图像去噪研究(含PSNR)附Matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长毕业设计辅导、数学建模、数据处理、程序设计科研仿真。🍎完整代码获取 定制创新 论文复现点击:Matlab科研工作室👇 关注我领取海量matlab电子书和数学建模资料 &#x1f3…...

BooruDatasetTagManager:终极图像标签管理工具,10倍提升AI训练数据预处理效率

BooruDatasetTagManager:终极图像标签管理工具,10倍提升AI训练数据预处理效率 【免费下载链接】BooruDatasetTagManager 项目地址: https://gitcode.com/gh_mirrors/bo/BooruDatasetTagManager 还在为数千张训练图像的繁琐标注工作而烦恼吗&…...

从GAN到领域自适应:揭秘‘特征对齐’如何让AI模型跨域工作

从GAN到领域自适应:特征对齐如何突破AI模型的跨域瓶颈 想象一下,你花费数月训练的视觉识别模型在实验室测试集上准确率高达98%,但部署到真实场景后性能骤降至60%。这种"实验室到现实"的落差,正是领域自适应(Domain Adap…...

【硬件实战】串口通信排障指南:从RS-232到RS-422的链路诊断与修复

1. 串口通信故障排查的起点:物理层检查 当你面对一台死活不通信的设备时,先别急着怀疑人生。我经历过太多次这种场景:项目deadline就在眼前,现场客户盯着你调试,结果串口死活不出数据。这时候最忌讳的就是一上来就改波…...

Python函数中的全局变量详解

1、什么是全局变量?在Python中,全局变量指的是可以作用于函数内部和外部的变量。在这里有两种情况:在函数的外部定义和内部定义添加global关键词变成全局变量。2、在函数外部定义的变量是全局变量。假设一个变量在函数的外部定义,…...

打破语言壁垒:Translumo屏幕实时翻译工具的终极使用指南

打破语言壁垒:Translumo屏幕实时翻译工具的终极使用指南 【免费下载链接】Translumo Advanced real-time screen translator for games, hardcoded subtitles in videos, static text and etc. 项目地址: https://gitcode.com/gh_mirrors/tr/Translumo 你是否…...

深入了解Python并发编程

并发方式 线程([Thread]) 多线程几乎是每一个程序猿在使用每一种语言时都会首先想到用于解决并发的工具(JS程序员请回避),使用多线程可以有效的利用CPU资源(Python例外)。然而多线程所带来的程…...

视频怎么去水印?视频去水印软件哪个好用?2026实测方法盘点

视频怎么去水印?视频去水印软件哪个好用?2026实测方法盘点 刷到一条好视频想保存下来,打开相册发现角落里有个大水印,二次使用直接废了。做自媒体的更懂这种痛:从各个平台扒下来的素材,水印各不相同&#x…...

保姆级教程:在Win10上从零配置OpenSSH服务器,并用Termius实现iPad远程连接(含防火墙和用户权限避坑指南)

从零构建Win10 SSH服务:用Termius实现iPad远程开发的完整指南 当你躺在沙发上用iPad突然想修改一段代码,或是出差时急需访问家中电脑的文件,Win10自带的OpenSSH服务配合Termius这款优雅的SSH客户端,能让你摆脱物理距离的限制。但官…...

保姆级教程:手把手教你搞定Automation Studio 4.7.2.98安装与90天试用授权(含官方第三方学习资源指北)

从零开始掌握Automation Studio 4.7:完整安装指南与学习资源全景图 第一次打开Automation Studio时,那个闪烁的授权提示框就像一堵高墙。作为工业自动化领域的重要工具,这款由贝加莱(现属ABB集团)开发的集成开发环境&a…...

终极指南:用ViGEmBus免费解决Windows游戏手柄兼容性难题

终极指南:用ViGEmBus免费解决Windows游戏手柄兼容性难题 【免费下载链接】ViGEmBus Windows kernel-mode driver emulating well-known USB game controllers. 项目地址: https://gitcode.com/gh_mirrors/vi/ViGEmBus 你是否曾经遇到过这样的情况&#xff1a…...

ContextMenuManager终极指南:如何快速清理Windows右键菜单提升系统效率

ContextMenuManager终极指南:如何快速清理Windows右键菜单提升系统效率 【免费下载链接】ContextMenuManager 🖱️ 纯粹的Windows右键菜单管理程序 项目地址: https://gitcode.com/gh_mirrors/co/ContextMenuManager 你是否厌倦了每次右键点击文件…...

为你的自动化工作流集成Taotoken提供稳定的大模型调用

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 为你的自动化工作流集成Taotoken提供稳定的大模型调用 在构建自动化工作流时,无论是定时生成报告、处理用户反馈&#…...

英伟达巨额投资,四大云巨头财报亮眼,半导体产业扩张背后隐忧浮现

物理世界产能成为瓶颈云收入快速增长支撑巨头大规模投资。2026年第一季度,谷歌云、微软Azure、亚马逊AWS云业务表现出色,四家公司云业务合计季度营收超700亿美元,同比增长超40%。但物理世界产能受限,谷歌、微软、亚马逊订单积压严…...

DeepSeek拟融500亿,低价开源下营收堪忧,爆款产品能否撑起515亿美元估值?

融资消息与行业对比 5月8号晚上,The Information爆料,并有两位知情人士确认,DeepSeek要融500亿人民币,约73.5亿美元。此前,中国大模型公司单轮融资最高纪录是Kimi的20亿美元(约136亿人民币)&…...

2026 年豆包开启付费订阅,中国 AI 大模型商业化迎来大考!

豆包更新付费订阅,打破行业免费格局2026 年 5 月 4 日,字节跳动旗下 AI 产品豆包在苹果 App Store 悄然更新付费订阅方案。标准版 68 元/月、加强版 200 元/月、专业版 500 元/月,这三档价格梯度划破了中国 AI 大模型行业持续两年的“免费狂欢…...

洛谷 P1333:瑞瑞的木棍 ← 欧拉回路 + 并查集

【题目来源】 https://www.luogu.com.cn/problem/P1333 【题目描述】 瑞瑞有一堆的玩具木棍,每根木棍的两端分别被染上了某种颜色,现在他突然有了一个想法,想要把这些木棍连在一起拼成一条线,并且使得木棍与木棍相接触的两端颜色…...

Logseq AI助手插件:在知识管理笔记中集成ChatGPT智能写作与编辑

1. 项目概述:在Logseq中引入你的AI副驾驶 如果你和我一样,是个重度依赖Logseq来构建个人知识库的笔记爱好者,同时又对AI辅助写作和思考的潜力充满好奇,那么你肯定不止一次想过:要是能把ChatGPT的能力无缝集成到Logseq…...

独立开发者工具箱:2026年全栈与AI应用高效开发技术栈指南

1. 项目概述与核心价值作为一名在独立开发领域摸爬滚打了十多年的老兵,我深知一个道理:工具选型,是决定项目成败的第一道分水岭。你花在纠结技术栈、寻找合适API、调试部署环境上的每一分钟,都是从产品核心价值中偷走的时间。今天…...

基于Vue.js与AI对话的智能思维导图生成器开发实践

1. 项目概述:一个能“对话”的思维导图生成器最近在整理项目文档和梳理学习笔记时,我总感觉传统的思维导图工具少了点什么。要么是手动拖拽节点太繁琐,打断了思考的连贯性;要么是生成的导图结构僵化,难以体现思考的动态…...

LinkSwift:九大网盘直链解析工具使用指南

LinkSwift:九大网盘直链解析工具使用指南 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云盘 / 迅雷云…...

终极指南:如何用NPYViewer快速查看和可视化NumPy数组数据

终极指南:如何用NPYViewer快速查看和可视化NumPy数组数据 【免费下载链接】NPYViewer Load and view .npy files containing 2D and 1D NumPy arrays. 项目地址: https://gitcode.com/gh_mirrors/np/NPYViewer 还在为NumPy数组数据查看而烦恼吗?当…...

如何快速提升英文打字速度:Qwerty Learner完整打字练习指南

如何快速提升英文打字速度:Qwerty Learner完整打字练习指南 【免费下载链接】qwerty-learner 为键盘工作者设计的单词记忆与英语肌肉记忆锻炼软件 / Words learning and English muscle memory training software designed for keyboard workers 项目地址: https:…...

Adobe-GenP 3.0终极指南:5步免费解锁Adobe全家桶完整功能

Adobe-GenP 3.0终极指南:5步免费解锁Adobe全家桶完整功能 【免费下载链接】Adobe-GenP Adobe CC 2019/2020/2021/2022/2023 GenP Universal Patch 3.0 项目地址: https://gitcode.com/gh_mirrors/ad/Adobe-GenP Adobe-GenP是一款专业的Adobe Creative Cloud通…...

3步解锁AcFunDown:你的A站视频离线保存专家

3步解锁AcFunDown:你的A站视频离线保存专家 【免费下载链接】AcFunDown 包含PC端UI界面的A站 视频下载器。支持收藏夹、UP主视频批量下载 😳仅供交流学习使用喔 项目地址: https://gitcode.com/gh_mirrors/ac/AcFunDown 你是否曾经遇到过这样的情…...

如何通过Noto Emoji实现跨平台表情符号统一:技术原理与应用实践

如何通过Noto Emoji实现跨平台表情符号统一:技术原理与应用实践 【免费下载链接】noto-emoji Noto Emoji fonts 项目地址: https://gitcode.com/gh_mirrors/no/noto-emoji 在数字通信日益全球化的今天,表情符号已成为跨越语言障碍的重要视觉语言。…...

Display Driver Uninstaller (DDU):彻底清理显卡驱动的终极解决方案

Display Driver Uninstaller (DDU):彻底清理显卡驱动的终极解决方案 【免费下载链接】display-drivers-uninstaller Display Driver Uninstaller (DDU) a driver removal utility / cleaner utility 项目地址: https://gitcode.com/gh_mirrors/di/display-drivers…...

ThinkPad风扇控制终极指南:TPFanCtrl2让你的笔记本更安静高效 [特殊字符]

ThinkPad风扇控制终极指南:TPFanCtrl2让你的笔记本更安静高效 🚀 【免费下载链接】TPFanCtrl2 ThinkPad Fan Control 2 (Dual Fan) for Windows 10 and 11 项目地址: https://gitcode.com/gh_mirrors/tp/TPFanCtrl2 作为ThinkPad用户,…...