当前位置: 首页 > article >正文

千亿企业级存储市场,产品逻辑变了

国家数据局相关数据显示截止今年3月我国日均Token调用量已超过140万亿相比于2024年初增长1000多倍同时OpenAI公布数据也显示其API调用量为每分钟60亿Tokens月度总量更是达到惊人的260万亿。作为大模型处理信息的最小单元Token调用量的爆炸性增长充分表明AI进入到应用爆发期OpenClaw的“龙虾效应”、Hermes的“异军突起”……智能体Agent的火爆不仅带来海量Token的消耗也直接将数据存储需求推向新高峰更对于千亿规模的企业级存储市场产生深远影响。过去三十年当谈及企业级存储时“存得下、保得住”是众多用户的核心诉求如今随着智能体Agent的爆发“供得上、效率高”成为存储产品的新目标这也直接推动存储产品逻辑全面走向重构。诚如浪潮信息存储产品线副总经理郭海峰所言“过去的数据像一个湖它是静态且等待挖掘的AI时代数据更像是源源不断流淌的河流预处理、标注、向量化、应用等阶段是一个动态的过程这对于存储架构、产品和能力提出一系列全新挑战。”存储产品逻辑变了Gartner预测到2026年底40%的企业应用将集成任务特定型智能体到2027年将有50%的商业决策直接由智能体辅助或自动完成将深刻改变组织与企业的运行方式。IDC更预测到2030年活跃智能体数量将从2025年的2860万增至22.16亿。与传统应用不同智能体并不是简单的“读取数据”而是“理解和使用数据”。显然随着智能体数量的爆发并在越来越多的业务场景中承担分析、决策和执行任务数据使用范式也会发生根本性变化对于数据形态、加工方式和供给效率提出全新要求这也推动着存储在AI时代的角色改变。“进入到AI时代存储不再是配角。存储正成为数字经济与智能生产力的核心底座为AI赋能千行百业搭建起高效的数据平台。”郭海峰如是说。事实上随着智能体爆发存储角色的改变传统存储产品很难胜任起数据平台的重任。基于CPU通算架构发展而来的传统存储其在数据供给效率、Token成本挑战和隐私安全等方面的短板愈发凸显。例如随着人工智能从“重训练”转向“重推理”智能体开始走向规模化落地记忆能力就成为落地的关键点。智能体长上下文记忆、多轮对话和复杂逻辑等直接导致KV Cache缓存数据量爆炸性增长存储需要在性能、容量和效率上为智能体提供连续支撑。同样Token成本问题也亟待存储侧想办法化解。众所周知进入到多智能体时代Token大规模消耗将成为常态Token成本就是竞争力。但GPU对于数据的渴求几乎“贪婪”存储如无法提供低时延、高带宽的数据供给不能更好地进行存算协同不仅造成昂贵的算力资源闲置还带来推理和Token成本高居不下。更加关键的是存储迎来一系列全新的数据安全问题例如原始数据投毒、隐私数据泄露等存储需要在数据校验、权限管理与容错机制上与时俱进更好地支撑起AI训练、推理等需求。“本质上过去存储的数据、算法和应用都是围绕CPU设计展开现在存储产品需要围绕GPU去设计从架构设计、底层硬件、数据链路和软件栈全部重构同时存储作为数据保护的最后一道屏障需要设计出适合AI时代的安全机制。”郭海峰如是说。A9000系列AI数据平台的一次重要探索无疑进入到智能体时代传统存储系统与现代企业需求之间的差距正迅速扩大面向人工智能而设计的存储不仅仅是基础设施更是企业在AI时代生产、竞争和创新的基础。Gartner在《Hype Cycle for Storage Technologies, 2025》报告中认为AI就绪存储AI-Ready Storage带来产品变革生成式AI存储平台将成为存储创新触发期的关键技术同时Gartner还预测到 2028 年超过 20%的企业将在本地数据中心运行包括训练和推理等AI工作负载。这并不是对云价值的否定。相反Gartner的预测反映出AI走向全面落地的重要趋势即基于成本、隐私和合规性的综合权衡未来会相当大比例的AI工作负载返回本地数据中心尤其是那些看重数据安全与合规的重要行业会寻求企业存储平台来打造Agent AI时代高性能的数据基座。事实上当前整个存储行业都在围绕AI未来趋势在演进相关产品。以浪潮信息为例其最新的A9000系列以AI原生并行架构设计为核心针对Agent Memory高频访问进行专项优化并内置AI原生KV Cache将Token吞吐量提升超20倍支持基于租户的统一资源管理、精细化权限管理及数据完整性校验。“A9000系列推动存储从传统数据承载介质升级为深度参与推理过程、支撑多业务安全并行、保障结果可信的数据平台是浪潮信息在AI数据平台领域的一次重要探索。”郭海峰介绍道。具体来看A9000系列从底层软件栈到硬件链路进行全方位重构采用全用户态AI原生并行架构通过全链路免锁与零拷贝技术大幅缩短存储访问路径并支持海量上下文状态的实时检索与瞬时唤醒确保记忆“随用随取”。例如企业级智能体要想真正落地仅依靠对话级记忆能力是解决不了真实场景中的复杂任务。因此A9000系列针对企业级智能体设计了新的记忆机制确保智能体在多轮交互中能快速调取历史记忆彻底规避因数据供给不及时导致的逻辑“断片”为智能体提供连续性支撑。郭海峰表示“A9000系列采用GPU-Direct 链路实现端到端的延迟降低可提供单节点160GB/s带宽、200万IOPS和百μs级时延使TTFT降低达97%。”同时由于HBM、显存等成本居高不下加上显存占用高、重复计算多等问题智能体涌现让KV Cache数据呈现爆炸性增长。因此针对KV Cache的优化就成为存储领域重要的创新方向目前业界存在着包括压缩与量化、分层存储与卸载以及池化等方向。浪潮信息A9000系列的解决思路是内置AI原生KV Cache能力利用创新 KV Cache 卸载与重用技术实现上下文数据的跨请求复用大幅减少重复计算带来的算力损耗。据悉在典型推理测试环境下A9000系列实现Token吞吐量提升超20倍 TPOT降低96%大幅优化单Token推理成本。“企业级存储领域发展多年的数据全生命周期理论在AI场景同样适用根据数据冷热程度来匹配不同的方案。现阶段出现3.5层更像是一个临时性产品旨在解决推理效率不高的问题。未来随着底层闪存颗粒、CXL等底层通信协议的革新在存储第四层就可能解决这些挑战。”郭海峰表示。此外考虑到企业复杂的业务场景以及AI生产环境中多业务并行、多角色协同的需求A9000系列构建了面向AI的安全机制基于租户的多维强隔离架构实现数据、访问、配置的三重物理级隔离确保多业务场景下的数据安全与访问边界同时基于Zero-trust安全架构实现更细颗粒度的权限管理与过程可追溯守护用户数据隐私安全与业务运行可信。“A9000系列产品并不是AI数据平台的最终形态。随着智能体应用的持续发展存储相关产品与方案也将持续迭代创新。浪潮信息将会坚持存储平台化战略瞄准一个平台或者一套方案来支撑起AI端到端流程需求。”郭海峰总结道。AI需要存储新生态事实上基于企业级存储构建的AI数据平台未来将成为企业智能体全面走向落地的核心抓手向下对接企业真实海量数据向上连接模型与算力决定着智能体在业务场景中“用起来、用得起和持续用”的关键。不过AI大模型、智能体等均处于高速发展阶段技术路线尚未收敛新协议、新标准、新应用层出不穷这不仅驱动着存储产品进入到“持续迭代”的演进阶段也酝酿着存储新生态的形成。存储生态将从过去简单的“分销”关系将转向深度“共创”。“浪潮信息将搭好台子与合作伙伴共同唱好AI这场戏。”郭海峰在2026“数海同舟”存储生态合作伙伴大会上介绍道。为此浪潮信息首先会帮助合作伙伴完成AI时代的转型利用全栈能力根据AI最先进趋势将最新成果转化为产品帮助合作伙伴抛弃原有简单的分销模式和产品平滑演进到最先进的AI方案以实现快速转型。此外浪潮信息还将致力于兼容性、标准化相关建设工作上。众所周知智能体等AI应用要想成为垂直行业的主流应用接口对接和兼容性至关重要浪潮信息将携手合作伙伴深入定制和联合开发致力于应用兼容和互联互通、互操作并积极携手业界共同制定标准构建起AI时代的存储新生态。综合观察IDC认为AI是重塑未来十年存储市场格局的根本性力量。从“数据湖”到“数据河”从“存数据”到“供数据”千亿存储市场的产品逻辑的重构本质上回答了一个核心命题当数据不再是静止的资产而必须成为实时流动的生产力时存储应该扮演怎样的角色答案随着A9000系列的发布而逐渐浮现存储已成为AI产业链的“主角”之一它不再是简单的容器而是数据的“理解者”和“调度者”。当模型能力不再是瓶颈当应用落地成为主战场存储将承载起数据的奔涌、托举住算力的吞吐、守护好业务的安全。

相关文章:

千亿企业级存储市场,产品逻辑变了

国家数据局相关数据显示,截止今年3月,我国日均Token调用量已超过140万亿,相比于2024年初增长1000多倍;同时,OpenAI公布数据也显示,其API调用量为每分钟60亿Tokens,月度总量更是达到惊人的260万亿…...

数电3|传输门、三态门、开路门

二、CMOS集成1.传输门2.三态门3.漏极开路门(OD门)...

用Gemini做竞品分析:从截图识别到对比表格生成的完整教程

做竞品分析时,最耗时间的往往不是“分析”,而是前期整理:截图、提取页面信息、归纳功能点、做对比表。现在可以把这部分交给Gemini辅助完成。如果想先对比不同模型的图片理解和表格整理能力,也可以通过 AI模型聚合平台 t。877ai。…...

除了恢复数据,binlog2sql还能这么玩?解锁MySQL二进制日志的3个高级用法

解锁binlog2sql的隐藏技能:MySQL二进制日志的三大高阶应用 MySQL的二进制日志(binlog)是数据库运维中不可或缺的组成部分,它记录了数据库的所有变更操作。大多数开发者对binlog的认知停留在数据恢复层面,而binlog2sql作…...

KORG logue SDK音频开发实战:从DSP原理到嵌入式音乐合成器编程

1. 项目概述:深入KORG logue SDK的音频开发世界如果你是一位嵌入式开发者,同时对音乐合成器抱有浓厚的兴趣,那么“korginc/logue-sdk”这个项目标题,很可能已经让你心跳加速了。这不仅仅是GitHub上的一个代码仓库,它更…...

构建AI Agent技能库:从零到一打造个人与团队的智能体工具箱

1. 项目概述:构建你自己的AI Agent技能库如果你和我一样,每天都要和Claude、Cursor、Codex这些AI助手打交道,那你肯定也遇到过这样的问题:面对浩如烟海的Agent技能,每次需要的时候都得临时去搜,搜到了还得验…...

kode:harness:统一团队AI编码方向的工程框架

1. 项目概述:kode:harness,一个为团队AI编码对齐方向而生的工程框架如果你在一个团队里,发现每个开发者用AI助手写代码时,项目就像被几匹脱缰的野马往不同方向拉扯,那么kode:harness就是那套统一的缰绳和导航系统。这不…...

2025届最火的五大AI学术神器横评

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 在人工智能技艺得以普遍应用的情形下,免费的AI论文生成器具给学术创作予以了便利…...

ACM新版伦理准则解读:从代码到公共福祉的开发者责任转型

1. 从“单打独斗”到“协同共生”:计算伦理更新的时代背景1992年,当ACM上一次修订其伦理准则时,一个开发者单枪匹马写出一款影响深远的软件,还是可能发生的事情。但即便在那个时代,软件开发的方式也已经在悄然改变。自…...

2025届毕业生推荐的五大降重复率平台推荐

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 基于先进深度学习算法构建的AI写作工具,具备强大功能,能为用户提供多…...

JavaScript 打开小窗口的实现方法

function openCenteredWindow(url ) {const width 600;const height 400;// 计算居中位置const left Math.round((screen.width - width) / 2);const top Math.round((screen.height - height) / 2);window.open(url,"_blank",width${width},height${height},lef…...

00后下场整顿Agent:啥都不学就能用好AI,这才是正确打开方式

允中 发自 凹非寺量子位 | 公众号 QbitAIAI圈有个怪现象:模型越来越强,确实是好事;但随着AI用法越发多样,用起来的门槛却越来越高。ChatGPT、Gemini、Claude……即便这些模型的能力已经够强了,但真到上手干活的时候&am…...

一年磨一剑,今年最炸机器人Demo来了!1亿美元种子轮团队出手,单个模型解锁单手打蛋解魔方弹钢琴

henry 发自 凹非寺量子位 | 公众号 QbitAI看过的人已经傻眼了,因为这可能是今年为止最炸的机器人demo。刚刚,Genesis AI发布首个机器人基础模型GENE-26.5,让机器人能自主打鸡蛋,拧试管盖,弹钢琴,玩魔方&…...

教育机构在AI课程实验中采用Taotoken管理学生模型调用的实践

教育机构在AI课程实验中采用Taotoken管理学生模型调用的实践 在高校或职业培训机构的AI课程中,让学生亲手调用大模型API完成实验是提升实践能力的关键环节。然而,直接让学生使用个人账户或共享密钥会带来成本不可控、权限混乱、行为难以追溯等一系列管理…...

2026 生物医药融资技术趋势:AI 制药、CGT、ADC 成资本主战场

一、核心数据截至 2026 年 5 月 7 日,全球生物医药行业融资活动呈现显著回暖态势,中国市场表现尤为突出。根据医药魔方等行业报告,2026 年第一季度 1-3 月核心数据如下:进入 4 月,市场热度不减,深圳泽安生物…...

坤和静界·春藤计划:一场针对青少年休学的标准化心理干预实

青少年休学问题正在变得不容忽视。有调查显示,在患有抑郁症等精神障碍的儿童青少年中,超过半数有过休学经历,首次休学的平均年龄只有13.74岁。而在休学之后,近六成家长对复学感到焦急,却找不到系统性的解决方案。 市面…...

为AI智能体注入Power BI专家级能力:OpenClaw技能包全解析

1. 项目概述:为AI智能体注入Power BI专家级能力 如果你正在探索如何让AI助手(或者说,智能体)真正理解并操作像Power BI这样复杂的企业级商业智能工具,那么你很可能已经遇到了瓶颈。传统的提示词工程往往只能让大语言模…...

CC-Switch 下载、安装与使用全指南(2026.5.7--最新v3.14.1)

CC-Switch 下载、安装与使用全指南(2026最新v3.14.1) CC-Switch 是跨平台AI API一键切换管理器,统一管理 Claude Code、DeepSeek、Kimi、智谱、MiniMax 等模型,不用改环境变量、不用手动改配置文件,VS Code/终端一键切…...

开源 | 我是怎么用 ai-memory 让 Cursor 每次开新对话都自动知道项目背景的

开源 | 我是怎么用 ai-memory 让 Cursor 每次开新对话都自动知道项目背景的开源地址:https://github.com/hyxnj666-creator/ai-memory npm:npx ai-memory-clilatest(内置免费模型,无需配置 API Key) 协议:M…...

基于AI与RPA的智能求职自动化系统设计与实现

1. 项目概述:当求职自动化遇上AI与RPA最近在技术社区里,看到不少朋友在讨论一个叫auto_job__find__chatgpt__rpa的项目。光看这个标题,就让我这个在招聘和自动化领域摸爬滚打了十来年的老鸟眼前一亮。这名字拆开来看,auto_job_fin…...

SQL Server如何实现编写表与字段注释_Navicat兼容操作步骤

ASSM表空间不能设为MANUAL,因LMT不支持手动段管理,10g执行SEGMENT SPACE MANAGEMENT MANUAL会报ORA-12913;新建表空间必须用AUTO,FREELIST在LMT下无效。ASSM 表空间为什么不能关自动段管理本地管理表空间(lmt&#xff…...

用SystemVerilog玩转约束:除了`inside`和`dist`,你还能这样写条件约束

用SystemVerilog玩转约束:超越基础语法的创意实践 在芯片验证的世界里,随机测试就像一把瑞士军刀——它能帮你发现那些手工测试难以触及的角落。但真正的高手都知道,随机测试的质量取决于约束的质量。当你在验证PCIe或DDR这类复杂协议时&…...

5分钟搞懂BERT tokenizer:用encode_plus为你的NLP模型准备‘标准餐’(附PyTorch/TF代码适配)

5分钟搞懂BERT tokenizer:用encode_plus为你的NLP模型准备‘标准餐’(附PyTorch/TF代码适配) 想象一下,你正在为一位挑剔的米其林大厨准备食材——每一片蔬菜的厚度、每一块肉的纹理都必须精确到毫米级。在自然语言处理&#xff0…...

AI编程助手选型指南:从GitHub Awesome清单到高效开发实践

1. 项目概述与价值定位最近在GitHub上闲逛,又发现了一个宝藏仓库——CodandoTV维护的“awesome-ai-coding-assistants”。作为一名在代码堆里摸爬滚打了十多年的老开发,我第一眼看到这个标题就来了兴趣。这不仅仅是一个简单的工具列表,它更像…...

OpenClawWeChat:基于Wechaty的插件化微信机器人开发与部署实战

1. 项目概述与核心价值最近在折腾微信机器人,想找一个能稳定、灵活地处理消息,还能对接各种外部服务的方案。市面上工具不少,但要么功能单一,要么配置复杂,要么就是稳定性堪忧,动不动就被风控。直到我深度体…...

SQL中如何对聚合后的数据进行二次计算_GROUP BY与算术组合

GROUP BY后不能在同层SELECT或HAVING中直接复用聚合结果做二次计算,需用子查询或CTE先聚合再运算,并注意NULLIF防除零、COALESCE处理空值、ROUND控制精度及WHERE/HAVING分工。GROUP BY 后不能直接用聚合字段做算术运算写 SELECT SUM(a) * 2 FROM t GROUP…...

浏览器自动化技能化实践:从Selenium到模块化流程编排

1. 项目概述:从“技能”到“浏览器自动化”的桥梁最近在折腾浏览器自动化的时候,发现了一个挺有意思的仓库,叫browser-act/skills。乍一看这个名字,你可能会有点懵:“技能”和“浏览器自动化”有什么关系?这…...

从IDF 2012看英特尔技术十字路口:Haswell能效革命与Atom移动困局

1. 从IDF 2012看英特尔的技术十字路口:Haswell的辉煌与Atom的迷雾 2012年9月的旧金山,空气中弥漫着一股熟悉的、属于硅谷的躁动。英特尔开发者论坛(IDF)即将拉开帷幕,而就在同周,苹果也计划发布新品。对于当…...

Vue3项目里用ArcGIS SDK加载地图,保姆级配置流程(含样式避坑)

Vue3项目集成ArcGIS SDK全流程指南:从配置到样式优化实战 在当今数据驱动的时代,地理信息系统(GIS)已成为现代Web应用不可或缺的一部分。作为行业领先的GIS平台,ArcGIS提供了强大的JavaScript SDK,而Vue3的响应式特性和组合式API则…...

突破OBS音频局限:揭秘如何为直播软件添加专业级VST插件支持

突破OBS音频局限:揭秘如何为直播软件添加专业级VST插件支持 【免费下载链接】obs-vst Use VST plugins in OBS 项目地址: https://gitcode.com/gh_mirrors/ob/obs-vst 想要在OBS Studio中实现专业级的音频处理,却受限于内置的基础滤镜&#xff1f…...