当前位置: 首页 > article >正文

国产最强开源模型 GLM-5.1 来了!Ollama 一键部署,开启 8 小时自主 AI 工作

引言GLM-5.1的开源确实是近期AI圈的一则重磅消息。为了让内容更充实我将上一版的介绍与GLM-5的详细对比融合在了一起这样能更清晰地看到它的进化。一图看懂GLM-5 vs. GLM-5.1为了让你直观感受GLM-5.1的进化幅度先看这张对比表格对比维度GLM-5GLM-5.1升级变化总参数规模744BMoE稀疏架构744BMoE稀疏架构架构一致激活参数约40B约40B推理效率相当上下文窗口200K200K保持一致最大输出Tokens128K128K保持一致训练数据量28.5T tokens28.5T tokens基础数据一致训练硬件华为昇腾910B芯片华为昇腾910B芯片约10万张全栈国产化开源协议MITMIT商业友好核心架构创新DSA稀疏注意力、Slime异步RLDSA深度优化、Slime框架升级工程优化推理效率DSA降低计算成本1.5-2倍推理成本再降20%Token效率提升15%成本效率双升长程任务能力分钟级交互长程易偏离目标8小时级持续工作自主闭环质变编程能力官方基准35.4分45.3分28%SWE-Bench Pro真实开发—58.4分超Opus 4.6开源新标杆向量数据库优化早早就见顶600轮迭代QPS从3.5k到21.5k6倍持续进化能力GPU内核优化早早就见顶1000轮迭代3.6倍加速vs torch.compile 1.49倍质的飞跃独立交付能力需人工干预1200步自主完成4.8MB Linux桌面系统工程化交付一句话总结GLM-5.1在架构参数基本不变的前提下通过后训练工程的深度优化实现了从“会写代码”到“能独立工作8小时”的能力质变。① 8小时级长程任务从“分钟级”到“工程级”的质变这是GLM-5.1最核心、最颠覆性的突破。以往的模型包括GLM-5有一个通病开局猛如虎跑着跑着就没招了到了瓶颈就开始原地踏步[reference:0]。GLM-5.1最大的突破在于运行时间越长结果越好[reference:1]。智谱用三个真实场景展示了这种质变场景一向量数据库优化——600轮自主迭代在VectorDBBench任务中GLM-5.1不限制迭代轮次让模型自主决定何时提交新版本。经过600多次迭代、6000多次工具调用最终查询吞吐量从3,547 QPS飙升至21,500 QPS是此前的6倍[reference:2]。更关键的是优化过程呈现6次阶梯式跃升每次都是模型分析自己的性能日志后主动发起的架构级改进[reference:3]。作为对比GLM-5在这个任务上早早就见顶了而GLM-5.1到后期还在持续进步[reference:4]。场景二GPU内核优化——1000轮持续加速在KernelBench Level 3任务中GLM-5.1将PyTorch参考实现优化成了更快的GPU kernel最终达到3.6倍加速比远超torch.compile默认设置的1.15倍和max-autotune的1.49倍[reference:5]。虽然Claude Opus 4.6的4.2倍稍高但GLM-5.1相比GLM-5的进化是质的飞跃——后者早早就停滞不前了[reference:6]。场景三8小时构建Linux桌面——1200步自主交付这是一个最夸张的案例给模型一个提示词“用网页技术构建一个Linux风格桌面环境”没有模板代码没有设计稿没有中间指导[reference:7]。GLM-5.1套了一个外循环每轮执行完后审视自己的输出找出可以改进的地方——缺少的功能、粗糙的样式、有bug的交互——然后继续。这个循环跑了8个小时历经1200多步最终产出了一套功能完善的Linux桌面系统包含完整的桌面、窗口管理器、状态栏、应用程序、VPN管理器、中文字体支持和游戏库等4.8MB配套文件相当于一个4人团队一周的开发量[reference:8]。对比意义大多数模型——包括早期版本的GLM——很快就放弃了搞个静态任务栏加一两个占位窗口就宣布完成了。GLM-5.1做到了真正的自主闭环实验 → 分析 → 优化[reference:9]。② 智能体与推理从“写代码”到“做工程”GLM-5.1在智能体工程Agentic Engineering方向的提升同样显著。在长程任务中保持稳定输出模型面对的不仅是更大代码量而是一连串复杂的工程决策点主动跑benchmark、定位瓶颈、修改方案、再跑测试[reference:10]。GLM-5.1实现了从“需求分析-框架搭建-代码编写-漏洞调试-优化迭代”的全流程工程化开发[reference:11]。在异步强化学习框架Slime上的深度优化让模型能从多步骤任务中持续迭代解决了上代模型长任务容易偏离目标的问题[reference:12]。在推理效率上GLM-5.1对DeepSeek稀疏注意力机制做了专属优化在保持200K长上下文效果无损的前提下推理成本降低20%以上Token效率提升15%普通服务器也能高效运行[reference:13]。而这一切的算力支撑完全来自国产芯片——GLM-5/5.1训练于约10万张华为昇腾910B芯片没有使用任何NVIDIA GPU[reference:14]。③ 多维度评测国产模型首次超越Opus 4.6GLM-5.1是唯一达到8小时级持续工作的开源模型也是全球范围内除Claude Opus 4.6外少数具备这一能力的模型[reference:15]。在最接近真实软件开发的SWE-Bench Pro基准测试中GLM-5.1以58.4分刷新全球最佳成绩超越了GPT-5.457.7和Claude Opus 4.657.3成为开源模型新标杆[reference:16]。SWE-Bench Pro要求模型在真实GitHub仓库中定位并修复高难度工程Bug是衡量模型能否胜任专业软件开发的最硬指标[reference:17]。此外在衡量专业软件开发、操作命令行解决问题、从零构建完整代码仓库等三个代表性代码评测基准的平均结果中GLM-5.1取得全球模型第三、国产模型第一、开源模型第一[reference:18]。④ 编程能力飞跃28%的巨大提升编程能力是GLM-5.1最直观的升级。官方编程评测数据显示GLM-5.1的编程基准分数从GLM-5的35.4分直接飙升至45.3分提升幅度达28%[reference:19][reference:20]。这意味着什么45.3分已达到Claude Opus 4.6编程性能的94.6%距离全球最强编程模型仅差2.6分直接超越了多款国际主流闭源模型[reference:21][reference:22]。在推理与知识方面GLM-5.1在AIME 2025数学竞赛中取得92.7%优于DeepSeek、Gemini和Llama等主流模型在GPQA Diamond上达到86.0%在MMLU上达到88-92%均展现出扎实的基础能力[reference:23]。结语GLM-5.1不是一次架构革新而是一次后训练工程的深度胜利[reference:24]。它在GLM-5的基石上通过多任务SFT、推理强化学习、智能体强化学习等渐进对齐技术[reference:25]在不到两个月的时间里将编程能力提升了近三成让长程自主任务从“概念”变成了“现实”。MIT协议 Ollama一键部署 国产芯片全栈适配的组合意味着开发者不需要昂贵的GPU集群在自己的电脑上就能拥有一个能“工作8小时”的AI工程师。现在去终端里敲下ollama pull glm-5.1亲自感受一下国产最强开源模型的生产力吧。

相关文章:

国产最强开源模型 GLM-5.1 来了!Ollama 一键部署,开启 8 小时自主 AI 工作

引言 GLM-5.1的开源,确实是近期AI圈的一则重磅消息。为了让内容更充实,我将上一版的介绍与GLM-5的详细对比融合在了一起,这样能更清晰地看到它的进化。 一图看懂:GLM-5 vs. GLM-5.1 为了让你直观感受GLM-5.1的进化幅度&#xff…...

开源工具助力音频内容管理:打破平台限制的跨平台解决方案

开源工具助力音频内容管理:打破平台限制的跨平台解决方案 【免费下载链接】xmly-downloader-qt5 喜马拉雅FM专辑下载器. 支持VIP与付费专辑. 使用GoQt5编写(Not Qt Binding). 项目地址: https://gitcode.com/gh_mirrors/xm/xmly-downloader-qt5 你是否曾遇到…...

5分钟快速上手BilibiliDown:跨平台B站视频下载终极指南

5分钟快速上手BilibiliDown:跨平台B站视频下载终极指南 【免费下载链接】BilibiliDown (GUI-多平台支持) B站 哔哩哔哩 视频下载器。支持稍后再看、收藏夹、UP主视频批量下载|Bilibili Video Downloader 😳 项目地址: https://gitcode.com/gh_mirrors/…...

OpenStack中cinder-volume服务异常排查与时间同步修复指南

1. 当cinder-volume服务突然罢工时 最近在维护OpenStack集群时,遇到一个挺典型的问题:cinder-volume服务状态突然变成了down。这直接导致云平台上的块存储功能无法正常使用,虚拟机创建、卷挂载等操作都受到了影响。经过排查,发现问…...

突破网盘下载限速的效率工具:技术突破与提速方案全解析

突破网盘下载限速的效率工具:技术突破与提速方案全解析 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼…...

docker-2025-tech-blog

Docker 零基础入门:2026 年还值不值得学?一篇讲清镜像、容器与 Compose DockerDocker 零基础入门:2026 年还值不值得学?一篇讲清镜像、容器与 Compose前言一、Docker 到底能解决什么问题?二、什么是 Docker&#xff1f…...

3步彻底优化:如何让Windows系统性能飙升30%?

3步彻底优化:如何让Windows系统性能飙升30%? 【免费下载链接】windows-defender-remover A tool which is uses to remove Windows Defender in Windows 8.x, Windows 10 (every version) and Windows 11. 项目地址: https://gitcode.com/gh_mirrors/w…...

微服务为什么会走到 RPC,以及 gRPC 到底解决了什么

大多数 gRPC 文章都从 .proto、代码生成、四种调用模式开始讲,读完之后你通常知道“怎么写”,但不一定真的明白“为什么会有这套东西”。 而工程里真正棘手的,恰恰不是语法,而是当系统从单体走向微服务之后,原来那些理…...

从监控盲区到业务洞察:深入解读 APMPlus 生产指标

在数字化浪潮席卷各行各业的今天,企业系统规模持续扩张,服务间调用关系日益交错,这使得许多“看不见的问题”正逐渐成为业务稳定性的巨大隐患。 你是否也曾遇到过这些棘手的场景? 偶发错误难量化:用户反馈“系统偶尔会…...

代码随想录 Day22 | 回溯算法-part01(77. 组合、216.组合总和III、17.电话号码的字母组合)

今日总结 回溯和组合问题、剪枝 题目 77. 组合 题目链接 题目题解 第一想法 自己实现 class Solution:def combine(self, n: int, k: int) -> List[List[int]]:# 回溯,用一个path数组存储路径res []def dfs(i,path):if len(path) k:res.append(path.copy())return…...

0基础Go语言Eino框架智能体实战-chatModel

0基础Go语言Eino框架智能体实战-chatModel 摘要:本文详细介绍如何使用Go语言、Eino框架和Gin框架构建一个完整的智能聊天服务。涵盖环境搭建、大模型调用、API创建、日志输出、异常处理等核心知识点,适合零基础入门人工智能应用开发,源码在此…...

代码随想录算法训练营Day-21 | 669. 修剪二叉搜索树、108.将有序数组转换为二叉搜索树、538.把二叉搜索树转换为累加树

669. 修剪二叉搜索树1.递归函数作用:返回修剪后的二叉树的新的根节点2.终止条件:遇到空节点返回NULL;遇到范围之外的节点执行删除操作:如果该节点值小于最小值,说明右子树有可能还有符合要求的节点,所以返回…...

飞腾D2000/FT2000全国产化标准COMe模块

板贴DDR4,有8GB 16GB 32GB等容量,标准type6 COMe模块,有少量现货。...

OneDrive-Uninstaller:Windows 10 平台 OneDrive 彻底卸载工具

OneDrive-Uninstaller:Windows 10 平台 OneDrive 彻底卸载工具 【免费下载链接】OneDrive-Uninstaller Batch script to completely uninstall OneDrive in Windows 10 项目地址: https://gitcode.com/gh_mirrors/on/OneDrive-Uninstaller 项目价值&#xff…...

BilibiliDown终极指南:3步掌握B站视频下载完整流程

BilibiliDown终极指南:3步掌握B站视频下载完整流程 【免费下载链接】BilibiliDown (GUI-多平台支持) B站 哔哩哔哩 视频下载器。支持稍后再看、收藏夹、UP主视频批量下载|Bilibili Video Downloader 😳 项目地址: https://gitcode.com/gh_mirrors/bi/B…...

AI赋能表情包创作:从Midjourney到微信变现全流程解析

1. 为什么AI表情包创作是普通人也能玩的赚钱机会 记得去年帮朋友设计一套生日主题表情包,光是草图就改了七八遍,前后折腾两周才勉强能用。现在用Midjourney生成类似质量的素材,从输入提示词到导出成品,实测最快9分38秒就能完成——…...

douyin-downloader完全指南:批量下载抖音无水印视频高效采集工具零门槛上手

douyin-downloader完全指南:批量下载抖音无水印视频高效采集工具零门槛上手 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and br…...

csv文件生成与读取

1.csv 文件解析入库方法(少量) private boolean doProcessNew(FileInputStream fileInputStream) {long start System.currentTimeMillis();List<JtComplaintPredictionResultEntity> csvFileList new ArrayList<>();try (BufferedReader reader new BufferedRe…...

构建企业级视频监控平台:WVP-GB28181-Pro的3大技术架构突破

构建企业级视频监控平台&#xff1a;WVP-GB28181-Pro的3大技术架构突破 【免费下载链接】wvp-GB28181-pro 基于GB28181-2016、部标808、部标1078标准实现的开箱即用的网络视频平台。自带管理页面&#xff0c;支持NAT穿透&#xff0c;支持海康、大华、宇视等品牌的IPC、NVR接入。…...

py每日spider案例之网pan搜索接口

import requests import jsonheaders = {"accept": "application/json","accept-language": "zh-CN,zh;q=0.9","cache-control": "no-cache","content-type":...

英雄联盟终极工具箱:League Akari 完整使用指南与功能解析

英雄联盟终极工具箱&#xff1a;League Akari 完整使用指南与功能解析 【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power &#x1f680;. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit 还在为英雄联盟客户端的…...

长清大学城AI大模型培训公司哪家强?

在长清大学城&#xff0c;AI大模型技术培训公司如雨后春笋般涌现&#xff0c;大家都想找一家靠谱的公司提升自己的技能。到底哪家强呢&#xff1f;今天就来好好唠唠。教学质量对比教学质量可是培训公司的核心。像达内教育&#xff0c;它在IT培训领域是老牌子了&#xff0c;有一…...

VideoDownloadHelper:一站式网页视频下载神器,告别视频保存烦恼

VideoDownloadHelper&#xff1a;一站式网页视频下载神器&#xff0c;告别视频保存烦恼 【免费下载链接】VideoDownloadHelper Chrome Extension to Help Download Video for Some Video Sites. 项目地址: https://gitcode.com/gh_mirrors/vi/VideoDownloadHelper 还在为…...

零基础部署Clawdbot+Qwen3-32B:一键开启智能对话Web界面

零基础部署ClawdbotQwen3-32B&#xff1a;一键开启智能对话Web界面 1. 为什么选择这个方案 你是否遇到过这样的困境&#xff1a;好不容易在本地部署了大语言模型&#xff0c;却卡在了如何让团队成员方便使用的环节&#xff1f;传统的API调用方式对非技术人员极不友好&#xf…...

MATLAB与ROS2 Humble跨平台通信实战:从零搭建联合仿真环境

1. 环境准备&#xff1a;搭建跨平台通信的基础 在开始MATLAB与ROS2 Humble的联合仿真之前&#xff0c;我们需要确保两个平台的环境配置正确。这里我以Windows 11上的MATLAB 2024a和Ubuntu 22.04上的ROS2 Humble为例&#xff0c;分享我实际搭建过程中的经验。 1.1 MATLAB环境配置…...

突破硬件限制的开源游戏串流方案:Sunshine跨设备游戏体验指南

突破硬件限制的开源游戏串流方案&#xff1a;Sunshine跨设备游戏体验指南 【免费下载链接】Sunshine Self-hosted game stream host for Moonlight. 项目地址: https://gitcode.com/GitHub_Trending/su/Sunshine 当你拥有一台高性能游戏PC&#xff0c;却只能在固定位置享…...

Git-RSCLIP图文检索实战:根据文字描述快速找到对应卫星图

Git-RSCLIP图文检索实战&#xff1a;根据文字描述快速找到对应卫星图 1. 为什么需要遥感图文检索&#xff1f; 在遥感图像分析领域&#xff0c;我们经常面临这样的挑战&#xff1a;面对海量卫星图像&#xff0c;如何快速找到符合特定描述的场景&#xff1f;传统方法需要人工标…...

如何让AirPods在非苹果设备发挥全部潜能?AirPodsDesktop跨平台支持方案解析

如何让AirPods在非苹果设备发挥全部潜能&#xff1f;AirPodsDesktop跨平台支持方案解析 【免费下载链接】AirPodsDesktop ☄️ AirPods desktop user experience enhancement program, for Windows and Linux (WIP) 项目地址: https://gitcode.com/gh_mirrors/ai/AirPodsDesk…...

【Python机器学习】零基础掌握SGDOneClassSVM线性分类器

如何高效地识别异常数据点? 在数据分析、金融风控、网络安全等多个领域,识别异常数据点是一个常见但又具有挑战性的问题。传统的方法可能需要复杂的计算和专门的知识背景,但有没有一种更简单、更直观的方式来解决这个问题呢? 假设一个金融公司需要识别可能的欺诈信用卡交…...

【Python机器学习】零基础掌握SGDClassifier线性分类器

如何准确地分类两种不同的水果? 在日常生活中,人们经常需要区分事物,比如水果。假设有两种水果:苹果和橙子,它们在颜色、重量、直径等多个方面有所不同。那么,如何从这些属性中准确地识别这两种水果呢? 想象一下,某个水果店想要自动化他们的库存管理系统。他们有两种…...