当前位置: 首页 > article >正文

小米开源 MiMo-V2.5 系列模型:低 token 消耗,能否取代封闭前沿模型?

小米开源 MiMo 模型提供低成本选择小米发布并开源了 MiMo-V2.5 和 MiMo-V2.5-Pro 模型二者均遵循 MIT 许可协议为开发者构建能执行编码和工作流自动化等长任务的 AI 智能体提供了一个潜在的低成本选择。这两款模型都支持 100 万 token 的上下文窗口。两款模型各有侧重MiMo-V2.5 拥有 100 万 token 的上下文窗口并采用稀疏混合专家MoE设计主要面向构建自主编码和工作流智能体的开发者。MiMo-V2.5-Pro 则专为复杂的智能体和编码任务而设计而 MiMo-V2.5 是原生全模态模型可处理文本、图像、视频和音频。智能体 AI 成本压力凸显MIT 许可协议有吸引力当前智能体 AI 工作负载给企业的 AI 预算带来了新压力。这些系统在规划、调用工具、编写代码和从错误中恢复时会消耗大量 token因此成本和部署控制对开发者来说愈发重要。小米表示通过采用 MIT 许可协议允许商业部署、持续训练和微调无需额外授权。Kadence International 高级副总裁 Tulika Sheel 认为MIT 许可协议很有吸引力“它允许企业自由修改、部署和商业化该模型不受限制这在如今的 AI 领域十分罕见。”MiMo 模型测试表现出色成本控制佳小米在博客文章中称在 ClawEval 测试中MiMo-V2.5-Pro 仅使用每条轨迹约 7 万个 token就能达到 64% 的 Pass^3 准确率相比同等能力水平的 Claude Opus 4.6、Gemini 3.1 Pro 和 GPT-5.4token 消耗减少了约 40 - 60%。这两款模型采用稀疏混合专家MoE设计来控制计算成本。参数为 3100 亿的 MiMo-V2.5 每次请求仅激活 150 亿参数而参数为 10.2 万亿的 Pro 版本则激活 420 亿参数。小米还提到Pro 模型的混合注意力设计在长上下文任务中可将 KV 缓存存储减少近 7 倍。长期测试成果显著小米列举了多项长期测试结果例如 MiMo-V2.5-Pro 在 4.3 小时内通过 672 次工具调用完成了一个用 Rust 编写的 SysY 编译器通过了全部 233 项隐藏测试该模型还在 11.5 小时的自主工作中通过 1868 次工具调用生成了一个 8192 行的桌面视频编辑器。企业会采用 MiMo 吗小米的 MiMo-V2.5 系列模型能否在智能体编码和自动化工作负载方面在企业开发者中取代封闭前沿模型将取决于企业对性能、成本和风险的评估。Omdia 首席分析师 Lian Jye Su 表示“企业开发者在评估小米的 MiMo-V2.5 及其变体时应考虑总体拥有成本TCO包括 token 效率、每项成功任务的成本以及与专有模型相关的许可成本。封闭前沿模型在通用任务和最具挑战性的边缘情况上可能仍具优势但开放权重模型在大量的智能体工作中表现出色。”MiMo 可作高性价比选择Pareekh Consulting 首席执行官 Pareekh Jain 认为企业不应将 MiMo-V2.5 视为 Claude 或 GPT 的替代品而应将其作为处理高 token 工作负载的高性价比智能体模型。“关键指标不仅是准确性还有每项成功任务的 token 消耗。前沿模型在复杂编码基准测试中往往能达到更高的成功率但会产生大量推理开销。MiMo-V2.5 旨在提高 token 效率意味着它能用显著更少的输入和输出 token 取得相当的结果。”Jain 指出这使得类似 MiMo 的模型可作为重复性编码、质量保证、迁移、文档编写、测试和自动化工作负载的“经济主力”而封闭前沿模型仍将是最难任务的质量标杆。MiMo 或改变企业 AI 经济模式Gartner 高级首席分析师 Ashish Banerjee 表示像 MiMo 这样的模型可能会显著改变企业长期智能体的 AI 经济模式。“当任务涉及数百万 token 时按使用量计费的专有 API 就不再方便而更像是对迭代的一种负担。相比之下MiMo 的 MIT 许可协议、开放权重、100 万 token 的上下文窗口和相对较低的价格使私有云或自托管部署在战略上更具可行性。”不过Banerjee 也指出这并不意味着企业会放弃专有 API。“企业将继续使用专有 API 以获得前沿的准确性和低运营消耗同时将大规模、可重复的智能体工作流转向开放模型因为在这些场景中成本可预测性、数据控制和定制化更为重要。简而言之长期、大量的智能体 AI 将发展成一个混合市场像 MiMo 这样的开放模型将打破对纯 API 的依赖。”MiMo 采用或面临挑战此外Su 补充说由于源自中国的模型可能会引起受监管的西方组织的担忧MiMo 的采用可能会面临挑战。

相关文章:

小米开源 MiMo-V2.5 系列模型:低 token 消耗,能否取代封闭前沿模型?

小米开源 MiMo 模型,提供低成本选择小米发布并开源了 MiMo-V2.5 和 MiMo-V2.5-Pro 模型,二者均遵循 MIT 许可协议,为开发者构建能执行编码和工作流自动化等长任务的 AI 智能体提供了一个潜在的低成本选择。这两款模型都支持 100 万 token 的上…...

Android Studio中文语言包:告别英文界面困扰,3分钟打造母语开发环境

Android Studio中文语言包:告别英文界面困扰,3分钟打造母语开发环境 【免费下载链接】AndroidStudioChineseLanguagePack AndroidStudio中文插件(官方修改版本) 项目地址: https://gitcode.com/gh_mirrors/an/AndroidStudioChineseLanguage…...

当显微镜遇上大语言模型:用自然语言交互革新生物图像分析

1. 项目概述:当显微镜遇上大语言模型如果你和我一样,长期泡在生物信息学或者显微图像分析的圈子里,那你肯定对napari不陌生。它早已从一个“有潜力”的开源工具,成长为生物图像分析领域事实上的标准平台之一,其插件生态…...

抖音内容采集终极方案:douyin-downloader批量下载工具全攻略

抖音内容采集终极方案:douyin-downloader批量下载工具全攻略 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback…...

KMS智能激活工具:一站式解决Windows和Office激活难题的高效方案

KMS智能激活工具:一站式解决Windows和Office激活难题的高效方案 【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO 还在为Windows系统频繁弹出激活提示而烦恼吗?Office文档突…...

通过 curl 命令快速测试 Taotoken API 密钥与连通性

通过 curl 命令快速测试 Taotoken API 密钥与连通性 1. 准备工作 在开始测试之前,请确保您已获取有效的 Taotoken API 密钥。登录 Taotoken 控制台,在「API 密钥」页面可以创建和管理您的密钥。同时确认您的网络环境能够正常访问 Taotoken 的服务端点。…...

手把手教你配置TMS320F28335的SCI串口(从寄存器到代码实战)

深入解析TMS320F28335的SCI串口开发:从寄存器配置到代码实战 在嵌入式系统开发中,串口通信是最基础也最关键的通信方式之一。对于使用德州仪器(TI)TMS320F28335数字信号处理器的开发者来说,掌握其串行通信接口(SCI)的底层配置是必备技能。本文…...

避开这3个坑,你的SAM模型训练效果才能翻倍

避开这3个坑,你的SAM模型训练效果才能翻倍 训练一个高性能的Segment Anything Model(SAM)就像在迷宫中寻找出口——即使你掌握了基本路线,也难免会踩中几个隐藏的陷阱。作为计算机视觉领域最令人兴奋的突破之一,SAM以其…...

别再死记硬背了!用Hierholzer算法搞定‘一笔画’问题(附C++代码实战)

用Hierholzer算法玩转‘一笔画’:从游戏到算法的思维跃迁 小时候玩过的"一笔画"游戏,你是否曾为某些复杂图形抓耳挠腮?其实,这个看似简单的游戏背后隐藏着图论中一个优雅的算法——Hierholzer算法。本文将带你从游戏出发…...

Palantir的秘密及缺点

Palantir 的 FDE 模式(Forward Deployed Engineer,前方部署工程师)是他们最核心(也是最笨的)、也最被硅谷研究的组织创新之一。FDE 不是传统意义上的 sales engineer 或 solutions architect,而是真正会写代…...

python3 安装

1.安装 dnf install python3 python3-pip python3-devel -yAlmaLinux 将 Python 3 和虚拟环境工具(venv)分成了不同的包。你需要同时安装 python3(解释器)和 python3-pip(包管理器),以及 python…...

Wireshark ExpertInfo是什么?一文讲透异常分级、适用场景、和传统抓包阅读的区别与排查标准

Wireshark Expert Info 是什么?一文讲透异常分级、适用场景、和传统抓包阅读的区别与排查标准 很多人第一次打开 Wireshark,都先盯着红色报文、黑色高亮,越看越慌;结果抓了半天包,最后定位结论还是一句“网络好像有问题…...

如何在Cesium中实现动态风场可视化:完整指南

如何在Cesium中实现动态风场可视化:完整指南 【免费下载链接】cesium-wind wind layer of cesium 项目地址: https://gitcode.com/gh_mirrors/ce/cesium-wind 如果你正在寻找一种简单高效的方法来在三维地球模型中展示风场数据,那么cesium-wind正…...

终极Total War模组编辑器:10个技巧让你从新手变专家!

终极Total War模组编辑器:10个技巧让你从新手变专家! 【免费下载链接】rpfm Rusted PackFile Manager (RPFM) is a... reimplementation in Rust and Qt6 of PackFile Manager (PFM), one of the best modding tools for Total War Games. 项目地址: h…...

将 Taotoken 作为后端服务的统一 AI 网关支撑多业务线需求

将 Taotoken 作为后端服务的统一 AI 网关支撑多业务线需求 1. 多业务线 AI 接入的挑战与需求 在中大型企业环境中,不同业务部门对 AI 能力的需求往往存在显著差异。内容团队可能需要长文本生成模型,数据分析部门偏好结构化输出,而客服系统则…...

RK3576 单板机高清视频图像处理开发实战手册(三)

3 gst_rtsp_dec_display案例3.1案例说明使用GStreamer API实现ARM端从网络摄像头获取H.264格式视频流,通过mppvideodec进行H.264硬件解码,再将解码后的视频输出至显示设备。(1)GStreamer管道框图。(2)程序流…...

Windows快捷键神器​,有了它,你的键盘比鼠标还好用

昨儿看同事还在满屏幕找Excel图标,我已经在表格里算完数据了。突然觉得,省下找图标的时间,每天能多摸鱼半小时!好工具就像键盘上的魔法,一按就搞定。咱就是说,打工人的时间,一秒都不能浪费。每天…...

2026届学术党必备的十大降重复率平台实际效果

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 被作为人工智能技术于教育领域应用而存在的AI论文网站,为学术写作给予多元化辅助…...

2026届毕业生推荐的六大AI学术助手推荐榜单

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 此刻,AI论文网站已然成了学术写作里十分重要的辅助工具,这类平台一般…...

SL Server数据库服务器内存问题排查

一、语言特性:Java 26 与模式匹配进化 1.1 Java 26 语言级别支持 IDEA 2026.1 EAP 最引人注目的变化之一,就是新增 Java 26 语言级别支持。这意味着开发者可以提前体验和测试即将在 JDK 26 中正式发布的语言特性。 其中最重要的变化是对 JEP 530 的全面支…...

经典通路再解读:TGF‑β 如何掌控细胞命运与疾病发生

转化生长因子-β(TGF-β)信号通路是真核细胞内高度保守、功能关键的信号传导系统,广泛调控细胞增殖、分化、凋亡、迁移、免疫应答、细胞外基质合成、组织修复等生命过程,与癌症、器官纤维化、自身免疫病等多种疾病的发生发展密切相…...

解决UE5 Lumen下那些恼人的阴影Bug:Nanite模型出错、植被透明、远景剔除全攻略

解决UE5 Lumen下那些恼人的阴影Bug:Nanite模型出错、植被透明、远景剔除全攻略 当虚幻引擎5的Lumen全局光照系统成为项目标配时,技术美术们常常在深夜的显示器前对着诡异的阴影问题抓狂——远处突然消失的物体投影、Nanite模型表面出现的幽灵般的光影错位…...

5分钟快速上手:OBS RTSP服务器插件完整安装配置指南

5分钟快速上手:OBS RTSP服务器插件完整安装配置指南 【免费下载链接】obs-rtspserver RTSP server plugin for obs-studio 项目地址: https://gitcode.com/gh_mirrors/ob/obs-rtspserver 想要将OBS Studio的专业直播画面轻松分享给监控系统、智能电视或局域网…...

破解类风湿关节炎的分子密码:生物标志物全景与高通量检测新策略

一、引言类风湿关节炎的早期诊断与精准治疗长期面临挑战,其核心难题在于该疾病具有高度异质性。单一生物标志物难以全面反映患者体内复杂的免疫网络紊乱与组织破坏进程。随着多因子高通量检测技术的发展,研究者能够在同一份微量样本中同时捕捉数十种病理…...

NF-κB信号通路的机制、生物学功能、疾病关联及靶向治疗研究进展

一、NF-κB信号通路在疾病机制与靶向治疗中的研究进展一项关于NF-κB信号通路的研究《 NF-κBin biology and targeted therapy: new insights and translational implications》发表于Signal Transduction and Targeted Therapy期刊。该研究系统梳理了NF-κB信号通路的组成、激…...

从协议到代码:深入理解5G NR中SMTC的三种配置(smtc1/smtc2/smtc2-LP)及其在开源仿真中的应用

从协议到代码:深入理解5G NR中SMTC的三种配置及其在开源仿真中的应用 当你在深夜调试5G UE模拟器时,是否曾被SMTC配置的三种模式搞得晕头转向?作为协议栈开发中最容易被忽视却又至关重要的测量时序控制机制,SMTC配置直接决定了终端…...

别再纠结了!Mapbox、Leaflet、OpenLayers 三大地图库保姆级选型指南(附真实项目踩坑经验)

三大地图库实战选型:从技术参数到真实项目避坑指南 刚接手智慧园区管理后台项目时,面对Mapbox、Leaflet和OpenLayers这三个主流地图库,我花了整整三天做技术选型。这不是简单的"哪个更好"的问题,而是要在项目预算、团队…...

Windows Cleaner终极指南:5步让卡顿电脑重获新生!

Windows Cleaner终极指南:5步让卡顿电脑重获新生! 【免费下载链接】WindowsCleaner Windows Cleaner——专治C盘爆红及各种不服! 项目地址: https://gitcode.com/gh_mirrors/wi/WindowsCleaner 还在为C盘爆红而烦恼吗?每次…...

为什么92%的数据团队卡在Tidyverse 2.0安装环节?资深R架构师亲授7大避坑清单(含Windows/macOS/Linux全平台适配)

更多请点击: https://intelliparadigm.com 第一章:Tidyverse 2.0自动化数据报告插件的核心价值与架构演进 Tidyverse 2.0 并非简单版本迭代,而是围绕“可重复性”“可审计性”与“低代码交互性”三大原则重构的数据科学工作流中枢。其核心插…...

破解亚马逊风控:安全搭建买家号上评系统,提升店铺竞争力

在如今竞争激烈的电商市场中,搭建一套亚马逊自养账号评测系统是一项极具挑战且需要高度精细化操作的任务。它不仅仅是简单的账号管理,而是涉及到从硬件与网络基础架构搭建,到账号注册管理、培育、购物行为模拟,再到订单追踪、评价…...