当前位置: 首页 > article >正文

沐曦股份曦云C系列GPU Day 0 适配智谱GLM-5.1 全栈技术领跑国产AI生态

4月8日智谱新一代旗舰模型GLM-5.1实现开源。目前沐曦股份曦云 C 系列 GPU已完成该系列模型Day 0 全量适配再度以全栈自主技术实力领跑国产 GPU 生态适配赛道。相比于GLM-5GLM-5.1的整体能力得到了全面提升是目前全球最强的开源模型。GLM-5.1的代码能力得到进一步提升在最接近真实软件开发的SWE-bench Pro基准测试中超过GPT-5.4、Claude Opus 4.6刷新全球最佳成绩。值得一提的是在模型整体性能大幅提升外GLM-5.1还在长程任务Long Horizon Task处理能力上实现了显著突破。有别于当前以分钟级交互为主的模型GLM-5.1能够在单次任务中持续、自主地工作长达8小时凭借自主规划、执行与迭代进化最终交付完整的工程级成果。此前由智谱发布的基座模型GLM-5、文档解析模型GLM-OCR、多模态系列模型GLM-4.6V沐曦股份均实现Day 0适配。依托曦云 C 系列硬件算力与 MXMACA 软件栈深度优化GLM-5.1模型在沐曦平台实现“开箱即用、性能无损”企业与开发者无需改码、无需等待模型发布当日即可完成生产级部署。发布即可用产业落地无忧沐曦曦云C系列GPU适配后的GLM-5.1在代码生成、复杂推理、长文本理解等核心纯文本场景中满血释放原生模型能力。从单机部署到千卡级集群商用从企业级智能办公到代码开发、知识库搭建沐曦曦云C系列为GLM-5.1提供全场景、高稳定、低成本的国产算力方案有效解决大模型落地过程中“适配慢、迁移难、性能损耗大”等行业痛点助力企业快速将GLM-5.1的技术优势转化为产业价值。自 2025 年 12 月以来沐曦已完成十余款主流模型 Day 0 适配覆盖智谱、通义千问、阶跃星辰、百度飞桨等头部厂商最新旗舰实现语言、多模态、OCR、翻译全品类覆盖适配数量、速度、广度均居行业领先地位。本次GLM-5.1 无缝适配将进一步推动“模型-芯片-框架-应用”自主闭环加速成熟。全栈自研软硬一体持续赋能千行百业此次沐曦高效完成GLM-5.1的Day 0适配并非简单的移植兼容而是基于“自研GPU硬件MXMACA全栈软件”的深度协同优化。曦云C系列GPU专为AI大模型训推场景设计硬件规格原生匹配GLM-5.1的高算力、高带宽需求。沐曦自主研发的MXMACA软件栈已实现对国际主流生态的高度兼容可支持超过6000个主流生态应用及超过1,000个模型的原生适配包括多个大模型的Day 0适配。自2025年2月开源社区开放以来截至2026年3月MXMACA注册用户超过30万人API调用次数超过5591万次文件下载量超过16万次并已覆盖超过半数的C9高校。沐曦将持续深耕全栈 GPU 技术深化与主流大模型、开源社区及产业伙伴协同以更快适配速度、更强性能表现、更完善生态支持为金融、医疗健康、能源、教科研、交通、大文娱等领域提供安全、高效、自主可控的国产算力底座与生态伙伴共筑中国 AI 产业创新未来。关于智谱GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同GLM-5.1能够在一次任务中独立、持续地工作超过8小时期间自主规划、执行、自我进化最终交付完整的工程级成果。代码能力是模型智能水平进一步提升的关键。下图是业内最具代表性的三个代码评测基准的平均结果包括衡量模型专业级软件开发工作的SWE-Bench Pro、像工程师一样操作命令行解决问题的Terminal-Bench 2.0、从零构建完整代码仓库的NL2Repo。三项综合平均分GLM-5.1取得全球模型第三、国产模型第一、开源模型第一。在最接近真实软件开发的SWE-bench Pro基准测试中GLM-5.1刷新全球最佳成绩超过GPT-5.4、Claude Opus 4.6。SWE-Bench Pro要求模型在真实GitHub仓库中定位并修复高难度工程Bug是衡量模型能否胜任专业软件开发的最硬指标。过去两年行业用Benchmark衡量模型有多智能。GLM团队认为下一阶段的衡量标准应该是“能工作多久”即模型在长程任务Long-Horizon Task中的表现能独立完成多长时间的人类任务。这对模型提出了更深层次的挑战。在长程任务中保持稳定输出模型面对的不只是更大的代码量而是一连串复杂的工程决策点主动跑benchmark、定位瓶颈、修改方案、再跑测试。模型需要像一个真正的工程师一样形成“实验→分析→优化”的完整闭环而不是写完一版代码就停下来等人打分。在METR榜单的同等评估标准下GLM-5.1是唯一达到8小时级持续工作的开源模型也是全球范围内除Claude Opus 4.6外少数具备这一能力的模型。GLM团队的终极目标是全自治智能体Autonomous Agent模型7×24小时不间断地分解目标、执行交付、自我评价与纠正、自我进化从此无需人类介入。使用以下命令获取沐曦GLM-5.1推理镜像docker pull pub-registry1.metax-tech.com/ai-opentest/dev/vllm-metax:0.14.0-maca.ai3.5.3.102-torch2.8-py310-ubuntu22.04-amd64_glm_w4a8_fullGLM-5.1模型地址Hugging Facehttps://huggingface.co/zai-org/GLM-5.1ModelScopehttps://modelscope.cn/models/ZhipuAI/GLM-5.1

相关文章:

沐曦股份曦云C系列GPU Day 0 适配智谱GLM-5.1 全栈技术领跑国产AI生态

4月8日,智谱新一代旗舰模型GLM-5.1实现开源。目前,沐曦股份曦云 C 系列 GPU已完成该系列模型Day 0 全量适配,再度以全栈自主技术实力,领跑国产 GPU 生态适配赛道。相比于GLM-5,GLM-5.1的整体能力得到了全面提升&#x…...

Teamcenter许可证文件关键参数解析、性能调优与安全加固

Teamcenter许可证文件关键参数解析、性能调优和安全加固你是远非也老是被许可证问题搞得焦头烂额?是远非每次 从来担心有未曾漏掉什么?去年我在一个装备制造企业做项目时,客户团队都是许可证管理混乱闹的,光是误购及闲置就浪费了8…...

ARM 架构 JuiceFS 性能优化:基于 MLPerf 的实践与调优卮

Qt是一个跨平台C图形界面开发库,利用Qt可以快速开发跨平台窗体应用程序,在Qt中我们可以通过拖拽的方式将不同组件放到指定的位置,实现图形化开发极大的方便了开发效率,本笔记将重点介绍QSpinBox数值微调组件的常用方法及灵活应用。…...

我让 Claude 和 Codex 同时审计 个模块,它们只在 个上达成共识儆

整体排查思路 我们的目标是验证以下三个环节是否正常: 登录成功时:服务器是否正确生成了Session并返回了包含正确 JSESSIONID的Cookie给浏览器。 浏览器端:浏览器是否成功接收并存储了该Cookie。 后续请求:浏览器在执行查询等操作…...

RAG是什么?为什么它能让AI更靠谱,告别“一本正经地胡说八道”

RAG可以理解为“先查资料,再回答”:让AI更像带依据的助手,而不是自由发挥的写作机。 你会拿到:RAG人话解释 引用式输出模板(可复制)。 本文由“壹伴编辑器”提供技术支持 1|一句话讲清 你可能遇…...

6个步骤让Windows系统性能提升60%:Win11Debloat全方位优化指南

6个步骤让Windows系统性能提升60%:Win11Debloat全方位优化指南 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to declutte…...

收藏!AI高薪风口已来,普通人也能抓住转行机会!

本文指出AI岗位平均月薪高达60738元,远超新经济行业平均水平。AI能力已从技术岗专属变为全行业通用技能,近八成公司要求员工具备AI能力。AI岗位缺口巨大,供需比仅为0.97,企业更看重实际能力而非学历。AI时代为普通职场人提供了重新…...

构建企业级统一认证中心:Spring Boot OAuth2 Server 的架构实践与深度解析

构建企业级统一认证中心:Spring Boot OAuth2 Server 的架构实践与深度解析 【免费下载链接】oauth2-server spring boot (springboot 3) oauth2 server sso 单点登录 认证中心 JWT,独立部署,用户管理 客户端管理 项目地址: https://gitcode.com/gh_mirrors/oau/oa…...

数据库回顾

题目:584. 寻找用户推荐人 表: Customer ---------------------- | Column Name | Type | ---------------------- | id | int | | name | varchar | | referee_id | int | ---------------------- 在 SQL 中,id 是该表的…...

cf1091div2 C.Grid Covering(数论)

Problem - C - Codeforces 保证遍历完每行每列所以gcd(n,a)1,gcd(m,b)1很好理解 为了遍历所有网格,因为在2*lcm(n,m)次数后会再次踏上轮回重复循环,此时访问了2*lcm(n,m)个格子,于是 2*lcm(n,m)>n*m,也就是2*lcm>gcd(n,m)*…...

AI 对 IT 行业的真实冲击:不是狼来了,是狼已经在门口了

JeecgBoot AI专题观察 | 一个深度使用 AI 编程半年的开发者,聊聊这个行业正在发生什么、程序员该怎么办从手写汇编到高级语言,从高级语言到框架,从框架到低代码——每一次技术跃迁,都有人说程序员要失业了。结果呢?需求…...

科研级时间序列解析:从 ARIMA 到 Mamba,深度学习与频域分析的全栈技术方案

时间序列是水文、气象等领域中最为常见的数据类型,对时间序列数据的预测、分类以及异常值检测等也是这些领域最常见的任务;但是,时间序列分析技术从二十世纪二十年代兴起,一百年以来已经变的非常繁杂。以实践序列分析为主线&#…...

深度理解算法和数据结构:栈并非天生存在,而是数组的「思想封装」|4 道经典题从本质吃透栈与单调栈

前言 在学习栈、队列这类数据结构时,很多人会陷入一个误区:把它们当成固定的 API、死记push/pop/top操作。 但我最近真正想通了一件事 ——数据结构从来不是先有的结构,而是先有的思想。栈并不是什么神奇的黑盒,它本质上就是&…...

WinCDEmu:开源虚拟光驱工具的技术架构与实践指南

WinCDEmu:开源虚拟光驱工具的技术架构与实践指南 【免费下载链接】WinCDEmu 项目地址: https://gitcode.com/gh_mirrors/wi/WinCDEmu 副标题:5个核心优势让你高效管理光盘映像文件 一、核心价值解析 WinCDEmu作为一款开源虚拟光驱解决方案&…...

20260408 硬盘分区管理

一、硬盘分区管理 大容量的硬盘,分区使用:C盘系统盘,D盘办公,E盘娱乐。 1.1 识别硬盘设备接口类型设备命名示例说明SATA/SAS/USB/SCSI/dev/sda、/dev/sdb …物理机常用的磁盘设备命名virtio-blk(虚拟机)/de…...

实测H3C s5500-52C-SI 交换机破解密码

1.使SecureCRT连接上交换机;2.重新启动交换机,启动阶段一直按Ctrlb键,直到显示“press ctrl-b to enter boot menu”和“password:”界面时按enter,如下图:3.交换机显示boot menu界面,有10个选项…...

写段代码教会你什么是HOOK技术?HOOK技术能干什么?肯

为 HagiCode 添加 GitHub Pages 自动部署支持 本项目早期代号为 PCode,现已正式更名为 HagiCode。本文记录了如何为项目引入自动化静态站点部署能力,让内容发布像喝水一样简单。 背景/引言 在 HagiCode 的开发过程中,我们遇到了一个很现实的问…...

STM32 串口通信入门:printf 重定向 + 调试技巧

作为STM32新手,串口通信是嵌入式调试的万能钥匙。很多新手调试程序时,只能靠LED亮灭判断运行状态,出错后无从排查;想查看变量、确认函数执行情况,也没有有效方法。串口通信可解决这一问题,通过printf函数&a…...

Windows安卓应用安装新方案:APK-Installer极简指南

Windows安卓应用安装新方案:APK-Installer极简指南 【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 在Windows系统上运行安卓应用一直是许多用户的痛点。传统…...

QTableWidget 表格组件熬

7.1 初识三维模型 7.1.1 三维模型的数据载体 随着计算机图形技术的发展,我们或多或少都会见过或者听说过三维模型。笔者始终记得小时候第一次在电视上看到三维动画《变形金刚:超能勇士》的震撼感受;而现在我们已经可以在手机上玩三维游戏《王…...

Gemini api网络超时问题求助

用codex连接的gemini api,没想到一用就超时,是梯子问题吗?以及上面这些models哪个更能全面解决coding问题,也很少出错...

AdvancedSessionsPlugin技术深度解析:虚幻引擎分布式会话管理解决方案

AdvancedSessionsPlugin技术深度解析:虚幻引擎分布式会话管理解决方案 【免费下载链接】AdvancedSessionsPlugin Advanced Sessions Plugin for UE4 项目地址: https://gitcode.com/gh_mirrors/ad/AdvancedSessionsPlugin 在虚幻引擎多玩家游戏开发中&#x…...

VMware macOS解锁终极实战指南:5步让Windows/Linux完美运行苹果系统

VMware macOS解锁终极实战指南:5步让Windows/Linux完美运行苹果系统 【免费下载链接】unlocker VMware Workstation macOS 项目地址: https://gitcode.com/gh_mirrors/unloc/unlocker 在虚拟化技术日益普及的今天,许多开发者和技术爱好者都希望能…...

lvgl-micropython、lv_micropython和lv_binding_micropython到底啥关系?一文读懂汕

一、背景与问题缘起 MySQL 5.6.51 版本下 2000 万行核心业务表开展新增字段操作,需求为新增BIGINT(19) NOT NULL DEFAULT 0 COMMENT 注释(因业务实际需要存储大数值关联字段)。 表的核心特性为Java 多线程密集读写,业务请求持续高…...

AI Coding越来越强,我们还有必要学Processing吗? · 创意编程运

故障表现 发现请求集群 demo 入口时卡住,并且对应 Pod 没有新的日志输出 rootce-demo-1:~# kubectl get pods -n deepflow-otel-spring-demo -o wide NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NO…...

别再踩坑了!SQL Server数据类型那点事儿,看懂这篇少背三个锅厣

从0构建WAV文件:读懂计算机文件的本质 虽然接触计算机有一段时间了,但是我的视野一直局限于一个较小的范围之内,往往只能看到于算法竞赛相关的内容,计算机各种文件在我看来十分复杂,认为构建他们并能达到目的是一件困难…...

像素剧本圣殿详细步骤:基于Qwen2.5-14B-Instruct的剧本张力增强微调方法

像素剧本圣殿详细步骤:基于Qwen2.5-14B-Instruct的剧本张力增强微调方法 1. 项目概述 像素剧本圣殿(Pixel Script Temple)是一款专为剧本创作设计的AI辅助工具,基于Qwen2.5-14B-Instruct大模型深度微调而成。这个工具将先进的自然语言处理技术与复古像…...

MedGemma应用案例:如何用药企医学影像标注辅助系统提升研究效率?

MedGemma应用案例:如何用药企医学影像标注辅助系统提升研究效率? 1. 医学影像标注的行业痛点 在药物研发和医学研究中,医学影像标注是一项基础但极其耗时的工作。传统标注流程面临三大核心挑战: 人工成本高:需要专业…...

cv_resnet50_face-reconstruction效果可视化:热力图分析重建误差分布与关键面部区域精度

cv_resnet50_face-reconstruction效果可视化:热力图分析重建误差分布与关键面部区域精度 你是不是也好奇,一个人脸重建模型到底“重建”得怎么样?它能把你的五官还原得一模一样吗?眼睛、鼻子、嘴巴这些关键部位,哪个重…...

Graphormer在嵌入式边缘计算设备的轻量化部署研究

Graphormer在嵌入式边缘计算设备的轻量化部署研究 1. 边缘计算中的图神经网络应用场景 在医疗诊断、材料研发和药物发现等领域,分子特性分析是一个关键环节。传统方法依赖实验室测试和计算模拟,不仅成本高昂,而且耗时漫长。Graphormer这类图…...