当前位置: 首页 > article >正文

中国科学院发布类脑大模型瞬悉2.0,打破长序列与低功耗部署核心瓶颈

来源ScienceAI 本文约3000字建议阅读5分钟验证了类脑机制与高效模型架构结合的广阔前景。当前大模型发展正从「参数和数据规模驱动」逐步延展至「上下文能力驱动」。在智能体、代码理解、长文档分析等应用中模型需要处理数十万甚至百万级 token。但传统 Transformer 在长序列处理及资源受限场景下的部署仍面临诸多痛点。因此如何以极低成本构建基础模型打破 Transformer 在不同序列长度、不同硬件平台下的能耗瓶颈成为大模型领域的关键探索方向。近日中国科学院自动化研究所李国齐、徐波团队在类脑脉冲大模型「瞬悉 1.0」研究基础上针对当前大模型长序列处理与低功耗部署等核心瓶颈推出 SpikingBrain2.0-5B简称 SpB2.0-5B模型系列通过引入更丰富的类脑机制 —— 包括稀疏化记忆建模、更精细化的脉冲激活值编码等在瞬悉 1.0 的基础上实现了全方位升级。论文地址https://arxiv.org/abs/2604.22575开源地址https://github.com/BICLab/SpikingBrain2.0此次发布的瞬悉 2.0 以超过瞬悉 1.0 十倍的训练开销节省续训数据量从瞬悉 1.0 的 150B 降低至瞬悉 1.0 的 14B即仅需 32 张 A100 显卡9 天内即可完成对当前主流 Transformer 架构大模型如 Qwen3 系列模型的持续预训练通用知识如 MMLU、ARC-C、BBH 等任务以及 SFT 后推理能力如数学推理 GSM8K、MATH代码 HumanEval、MBPP 等任务的表现可与强基线 Qwen3 比肩且实现比瞬悉 1.0 更优综合性能并在 4M 序列长度下达到主流 Transformer 模型 Qwen3 的 10.13 倍首 Token 生成加速FP8 量化路径下 4M 长度下相比 Qwen3 BF16 基线提速达 15.13 倍整数 - 脉冲化编码路径下精度损失仅为 0.69%且脉冲稀疏度高达 64.3%模拟结果显示该方案在测试场景下相比 INT8 矩阵乘法基线有望使得面向类脑大模型的神经形态芯片面积减小 70.6%在 250/500MHz 工作频率下功耗降低 48.1%/46.5%。瞬悉 2.0 在长序列处理效率、训练开销、综合 Benchmark 性能、跨硬件平台适配性及应用场景拓展等方面显著提升为轻量级、多模态高效脉冲基础模型的研发提供了可行路径为新一代人工智能创新发展注入新动力。瞬悉 2.0 与 Qwen-3 速度对比演示架构设计短序列场景中Transformer 的计算瓶颈源于大量前馈矩阵乘法长序列场景中计算瓶颈则向注意力模块转移导致推理效率大幅下降。瞬悉 2.0 因此对注意力和前馈矩阵乘操作分别做出针对性设计期望缓解 Transformer 的能耗问题。1双空间混合稀疏注意力瞬悉 2.0 提出双空间稀疏注意力Dual-Space Sparse Attention, DSSA用于在层间混合稀疏 Softmax 注意力 MoBA 与稀疏线性注意力 Sparse State Expansion SSE。其中MoBA 对完整的 KV cache 进行块级稀疏计算SSE 则对压缩式状态表征进行稀疏计算。这一设计对应类脑化的稀疏记忆机制实现了优良的长序列性能 - 效率权衡 (图 2)。瞬悉 2.0 架构概览2双路径激活值编码策略瞬悉 2.0 采用了包括 FP8 和 INT8-Spiking 两种对偶激活值编码路径图 31.FP8 编码路径利用低比特 Tensor Core 加速矩阵乘运算该路径面向工业 GPU 部署如 NVIDIA Hopper GPU2.INT8-Spiking 编码路径把激活值转为脉冲序列可将密集矩阵乘法替换为事件驱动的整数累加大幅降低部署功耗该路径面向异步神经形态芯片部署。瞬悉 2.0 对偶编码路径转换训练流程瞬悉 2.0 采用比瞬悉 1.0 更高效、模态更广的架构转换流程Transformer-to-Hybrid Conversion依托极少量开源数据和计算资源分别为语言模型与多模态模型构建两条独立的续训转换路径大幅降低开发成本图 4。1LLM 转换路径包括短上下文蒸馏、三阶段长上下文扩展最高至 512k以及两阶段的通用加推理 SFT同时开展了在策略蒸馏探索。2VLM 转换路径包括知识蒸馏与指令微调。本文还同时分享了实践过程中的关键 Takeaways为社区研究提供参考。瞬悉 2.0 转换训练 Pipeline模型性能1. 长序列处理效率显著提升。1在 Huggingface 序列并行框架下瞬悉 2.0 在 4M 长度相比 Qwen3 实现 10.13 倍的首 token 生成时延TTFT加速2在 vLLM 张量并行框架下512k 长度端到端生成延迟降低 4.3 倍128k 长度下总吞吐提升 1.57 倍、请求并发数提升 3.17 倍3依托 vLLM 框架8 卡 A100 即可支持长达 10M 序列的推理而 Qwen3 基线在 4M 长度时已超出显存限制展现出突出的长序列处理优势。2. 训练成本大幅降低。瞬悉 2.0-5B 语言与多模态模型的总转换开销低至 7k A100 卡时以下仅需 32 张 A1009 天内即可完成对 Qwen3-4B 和 Qwen3-VL-4B 的全部转换训练相较于 SpB1.0训练成本减少 10 倍以上LLM CPT 数据量从 150B 降至 14B实现了高效低成本的模型开发。3. 模型性能保持竞争力。1瞬悉 2.0 语言模型在通用知识如 MMLU、ARC-C、BBH 等任务以及 SFT 后推理能力如数学推理 GSM8K、MATH代码 HumanEval、MBPP 等任务的表现与强基线 Qwen3 比肩综合性能优于 Qwen2.5 和更大规模的瞬悉 1.0-7B 模型。2瞬悉 2.0-VL 模型性能实现对 Qwen3-VL 的有效恢复可与强基线 Qwen2.5-VL 比肩如图表推理 AI2D、通用视觉推理 MMStar 等任务在瞬悉 1.0 的基础上实现了多模态能力的突破。4. 跨硬件平台适配性突出。瞬悉 2.0 可灵活适配不同硬件平台1采用 FP8 路径时精度损失仅为 0.24%在 H100 上实测显示256k 序列长度下 TTFT 提速相比瞬悉 2.0 BF16 版本超 2.5 倍同时在 4M 长度下相比 Qwen3 BF16 基线提速达 15.13 倍2采用 INT8-Spiking 路径时精度损失仅为 0.69%且脉冲稀疏度高达 64.3%后仿模拟结果显示该方案在测试场景下相比 INT8 矩阵乘法基线面积减小 70.6%在 250/500MHz 工作频率下功耗降低 48.1%/46.5%有望破解端侧部署的功耗瓶颈。瞬悉 2.0 系列模型的发布为轻量级、多模态高效脉冲基础模型的研发提供了可行路径进一步验证了类脑机制与高效模型架构结合的广阔前景。同时该模型为端侧、资源受限场景的大模型部署提供了高性价比解决方案也为低功耗神经形态计算的后续研发提供重要参考。研究团队将继续秉承类脑大模型技术「概念一致、迭代升级」的理念持续研发可比肩主流大模型的低功耗神经形态计算。作者介绍李国齐论文通讯作者中国科学院自动化所研究员脑认知与类脑智能全国重点实验室副主任通用类脑智能大模型北京市重点实验室主任国家杰出青年基金获得者在 Nature、Nature 子刊、Science 子刊等期刊和 AI 顶会上发表论文 200 余篇。徐波论文通讯作者中国科学院自动化所研究员中国科学院自动化所所长科技创新 2030「新一代人工智能」重大项目专家组组长中国科学院大学人工智能学院院长。潘昱锜论文一作中国科学院自动化研究所博士生2024 年本科毕业于南京大学匡亚明学院。研究方向为通用类脑大模型与长序列基础模型架构瞬悉 SpikingBrain 类脑大模型 1.0/2.0 核心团队成员以第一作者在 ICLR 2026、TMLR 2026 等 AI 顶刊顶会上发表多篇论文。编辑文婧关于我们数据派THU作为数据科学类公众号背靠清华大学大数据研究中心分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识努力建设数据人才聚集平台、打造中国大数据最强集团军。新浪微博数据派THU微信视频号数据派THU今日头条数据派THU

相关文章:

中国科学院发布类脑大模型瞬悉2.0,打破长序列与低功耗部署核心瓶颈

来源:ScienceAI 本文约3000字,建议阅读5分钟验证了类脑机制与高效模型架构结合的广阔前景。当前,大模型发展正从「参数和数据规模驱动」逐步延展至「上下文能力驱动」。在智能体、代码理解、长文档分析等应用中,模型需要处理数十万…...

云原生 Kubernetes 核心概念与组件详解

目录 一、Kubernetes 是什么? 核心功能概览 二、部署演进:从物理机到容器 1. 传统部署时代 2. 虚拟化部署时代 3. 容器部署时代 三、Kubernetes 集群架构 1. 控制平面组件(集群大脑) (1)kube-apise…...

保姆级教程:小白也能轻松上手 AI 硬件

大家好,我是siuser小伟如果你是一个小白,又想玩一下硬件的话,那我一定推荐你去接触 AI 小智。因为他们的生态非常好,教程非常详细,你也可以跑一个专属于你自己的 AI 硬件。这篇文章专门写给第一次部署小智 Go 后端的人…...

PHP怎么处理Eloquent Attribute Harmonization属性协调_Laravel解决数据冲突【教程】

Eloquent 属性协调失败源于 $casts、访问器、序列化逻辑等机制作用域与执行顺序不一致;应优先用 $casts 处理类型转换,访问器仅用于动态计算,JSON 字段需显式标记 dirty 或拆分为关联模型。PHP 中 Eloquent 的 “Attribute Harmonization” 并…...

Go语言匿名函数如何写_Go语言匿名函数和闭包教程【对比】

Go匿名函数写作func(参数)返回类型{函数体},需完整声明;闭包是匿名函数引用外层局部变量并逃逸出作用域时形成的行为结果,捕获变量引用而非值。Go 里匿名函数怎么写,直接上手就用Go 的匿名函数就是没名字的函数字面量,…...

5步精通:Windows风扇智能控制终极指南

5步精通:Windows风扇智能控制终极指南 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Trending/fa/FanControl.Rel…...

终极指南:如何解决FanControl风扇突然“隐身“问题 - 快速恢复硬件识别的完整教程

终极指南:如何解决FanControl风扇突然"隐身"问题 - 快速恢复硬件识别的完整教程 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: http…...

碧蓝航线Perseus补丁:零偏移设计实现全皮肤解锁的终极指南

碧蓝航线Perseus补丁:零偏移设计实现全皮肤解锁的终极指南 【免费下载链接】Perseus Azur Lane scripts patcher. 项目地址: https://gitcode.com/gh_mirrors/pers/Perseus 在碧蓝航线这款广受欢迎的海战游戏中,玩家们常常为那些精美的限定皮肤只…...

联想刃7000k BIOS解锁终极指南:安全释放隐藏性能的3种方法

联想刃7000k BIOS解锁终极指南:安全释放隐藏性能的3种方法 【免费下载链接】Lenovo-7000k-Unlock-BIOS Lenovo联想刃7000k2021-3060版解锁BIOS隐藏选项并提升为Admin权限 项目地址: https://gitcode.com/gh_mirrors/le/Lenovo-7000k-Unlock-BIOS 对于联想刃7…...

3步解锁网易云音乐NCM文件:ncmdump让你的音乐自由播放

3步解锁网易云音乐NCM文件:ncmdump让你的音乐自由播放 【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 还在为网易云音乐下载的加密NCM文件无法在其他设备播放而烦恼吗?ncmdump作为一款专业的网易云音乐NCM文件…...

如何在5分钟内将你的普通鼠标变成macOS生产力神器

如何在5分钟内将你的普通鼠标变成macOS生产力神器 【免费下载链接】mac-mouse-fix Mac Mouse Fix - Make Your $10 Mouse Better Than an Apple Trackpad! 项目地址: https://gitcode.com/GitHub_Trending/ma/mac-mouse-fix 还在为macOS上鼠标滚轮生硬、侧键闲置而烦恼吗…...

别再只用fitInView了!Qt QGraphicsView自适应显示避坑指南与高级技巧

别再只用fitInView了!Qt QGraphicsView自适应显示避坑指南与高级技巧 在Qt图形界面开发中,QGraphicsView作为展示复杂图形的核心组件,其自适应显示功能经常让开发者又爱又恨。许多开发者第一次遇到需要自适应显示的场景时,都会欣喜…...

Encaustic不是滤镜!揭秘热蜡媒介物理特性如何反向重构MJ提示词结构:材料科学×AIGC的跨学科实践

更多请点击: https://intelliparadigm.com 第一章:Encaustic不是滤镜!——热蜡媒介的本质祛魅 Encaustic(热蜡绘画)常被误认为是数字图像处理中的一种“复古滤镜”,实则是一种拥有两千多年历史的实体绘画媒…...

Midjourney蓝莓印相技术白皮书(2024V2.3权威修订版):基于1726张A/B测试图谱验证的色阶偏移阈值与CMYK映射规则

更多请点击: https://intelliparadigm.com 第一章:Midjourney Blueberry印相技术的演进脉络与核心定义 Midjourney Blueberry印相技术并非官方术语,而是社区对Midjourney V6中基于蓝光敏感通道(Blue Channel Emulation&#xff0…...

QMC-Decoder深度解析:解锁QQ音乐加密音频的高效实战指南

QMC-Decoder深度解析:解锁QQ音乐加密音频的高效实战指南 【免费下载链接】qmc-decoder Fastest & best convert qmc 2 mp3 | flac tools 项目地址: https://gitcode.com/gh_mirrors/qm/qmc-decoder 在数字音乐版权保护日益严格的今天,你是否曾…...

【ElevenLabs企业级语音AI落地指南】:20年音视频架构师亲授——3大合规陷阱、4类集成断点、1套可审计部署框架

更多请点击: https://intelliparadigm.com 第一章:ElevenLabs Enterprise方案全景认知 ElevenLabs Enterprise 是面向中大型组织构建的语音合成与语音智能平台,提供高保真、低延迟、多语言、可定制的语音生成能力,并深度集成企业…...

告别PPO采样地狱!用SAC算法在连续控制任务中实现高效训练(附PyTorch代码)

SAC算法实战:突破PPO采样瓶颈的连续控制解决方案 在机器人控制、自动驾驶和游戏AI开发中,强化学习工程师们经常面临一个共同困境:算法需要与环境进行海量交互才能学到有效策略。以Ant机器人行走任务为例,传统PPO算法可能需要500万…...

8 款最强 AI 文字转语音横评:中文方言谁最强、免费党有没有真王者?

👉 这是一个或许对你有用的社群🐱 一对一交流/面试小册/简历优化/求职解惑,欢迎加入「芋道快速开发平台」知识星球。下面是星球提供的部分资料: 《项目实战(视频)》:从书中学,往事上…...

Abaqus 6.12 保姆级教程:手把手教你搞定悬臂梁的动力学仿真(附阻尼设置与结果动画)

Abaqus 6.12 悬臂梁动力学仿真全流程实战:从阻尼优化到动画渲染 悬臂梁作为结构动力学分析的经典案例,在机械振动、建筑抗震等领域具有广泛的应用价值。本文将基于Abaqus 6.12平台,通过一个完整的动力学仿真案例,深入解析从模型建…...

【Midjourney水墨风创作终极指南】:20年AI视觉专家亲授7大不可外传的Ink Wash参数配方与避坑清单

更多请点击: https://intelliparadigm.com 第一章:水墨风AI创作的认知革命与历史语境 水墨艺术承载着东方哲学中“虚实相生”“气韵生动”的深层认知范式,而当生成式AI介入水墨风格建模时,其本质并非简单纹理迁移,而是…...

高性能服务架构缓存设计:Redis+Caffeine

👉 这是一个或许对你有用的社群🐱 一对一交流/面试小册/简历优化/求职解惑,欢迎加入「芋道快速开发平台」知识星球。下面是星球提供的部分资料: 《项目实战(视频)》:从书中学,往事上…...

TlbbGmTool:从数据库小白到《天龙八部》单机版管理大师的蜕变之旅

TlbbGmTool:从数据库小白到《天龙八部》单机版管理大师的蜕变之旅 【免费下载链接】TlbbGmTool 某网络游戏的单机版本GM工具 项目地址: https://gitcode.com/gh_mirrors/tl/TlbbGmTool 你是否曾经面对《天龙八部》单机版数据库的复杂结构感到无从下手&#x…...

Windows风扇控制终极指南:5分钟学会FanControl智能调校

Windows风扇控制终极指南:5分钟学会FanControl智能调校 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Trending/f…...

STM32+EMMC+GL3227E固件调试:从扇区偏移到数据同步的实战解析

1. 问题现象与背景分析 最近在调试一个嵌入式存储系统时遇到了奇怪的现象:STM32主控将数据写入EMMC存储后,通过GL3227E桥接芯片连接电脑却无法识别。更诡异的是,电脑格式化后的EMMC,STM32写入的数据在电脑端又"消失"了。…...

2026 流量卡办理全攻略:从下单、激活到售后,新手一遍看懂不踩坑

现在人人都离不开手机流量,不管是日常刷视频、追剧观影,还是备用机上网冲浪,一张划算又正规的通用流量卡,已经成为大众刚需。但很多新手第一次在线办理优惠号卡,普遍一头雾水:分不清流量卡是否正规靠谱、办…...

终极解决方案:3分钟快速修复VC++运行库缺失问题,彻底告别软件启动失败

终极解决方案:3分钟快速修复VC运行库缺失问题,彻底告别软件启动失败 【免费下载链接】vcredist AIO Repack for latest Microsoft Visual C Redistributable Runtimes 项目地址: https://gitcode.com/gh_mirrors/vc/vcredist 你是否经常遇到游戏或…...

点云成像三维焊缝识别与机器人跟踪【附代码】

✨ 长期致力于点云成像、焊缝识别定位、机器人、点云拼接、焊缝轨迹跟踪研究工作,擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅如需沟通交流,点击《获取方式》 (1)基于圆柱体拟合与ICP拼接的点云…...

CTR预估实战:DeepFM模型在Criteo数据集上的调参避坑指南(附PyTorch代码)

DeepFM模型在Criteo数据集上的调优实战:从79%到81% AUC的进阶之路 当CTR预估模型的AUC指标卡在79%的瓶颈时,真正的挑战才刚刚开始。本文将以工业级数据集Criteo为战场,分享如何通过系统化的调参策略和特征工程技巧,将DeepFM模型的…...

AVL许可排队严重?不想买新许可,回收闲置即刻算例

AVL许可排队严重?不买新许可,回收闲置许可就能解决,我就踩过这个坑关键词分析:AVL里藏着的宝藏AVL许可排队严重?别急着买新许可!我们先来看看这个问题到底藏哪儿。2026年我帮某制造业客户做系统优化时&…...

Chromatic:掌握Chromium/V8的终极通用修改器,开启浏览器调试新纪元

Chromatic:掌握Chromium/V8的终极通用修改器,开启浏览器调试新纪元 【免费下载链接】chromatic Universal modifier for Chromium/V8 | 广谱注入 Chromium/V8 的通用修改器 项目地址: https://gitcode.com/gh_mirrors/be/chromatic 还在为浏览器调…...