当前位置: 首页 > article >正文

Agent才不会“赢家通吃“,证据来了……

Claude Code已经赢成这样了顺带又做了CMA定义下一代企业级Agent infra。Claude Code『同款』infra谁不想用。谁又不想卖可复用的工具呢。这样下去做Agent infra须有爆款Agent证明自己吗肯定很多人反对因为随着模型能力持续增强Harness的重要性会持续下降。然而我还是想说让Agent好好干活这件事的工程含量极高。先看一个对话客户我想做Agent且知道做成什么样才有用。AI infra公司用我的工具你能做出最好的Agent。客户那你拿出一个最好的Agent我看看AI infra公司...我们专注做工具不做产品客户那你怎么知道你的工具能做出好Agent?甚至有更激进的观点如果你自己的Agent都做不好我凭什么用你的Agent infra?话糙理不糙。更甚者口喷卖Agent infra的公司自家做不出像样的Agent你的工具肯定有缺陷。话糙理不糙。这话有理性之处因为Agent这件事的复杂度极高光看公司品牌部门『捏造的材料』根本判断不了只有看你自己做出来的产品才能验证你的工具到底能不能用。而且阵营也有不同第一阵营有自家爆款Agent也做Agent infra。Anthropic公司有爆款ClaudeCode。反例一下就能找出来。第二阵营LangChainLangGraphAgent框架但没有自家的爆款Agent代表作;当然还有很多Agent框架创业公司。不过最近我观察又跑出了第三阵营。一个垂直的科研智能体Kosmos。Kosmos是一个极其强的,垂直Agent案例且推到了让Anthropic和OpenAI这些公司尤其其通用Agent infra团队都该警惕的位置。Kosmos的强大有哪些关键事实第一一次运行能读1500篇论文跑42000行分析代码在数千万token上保持研究目标的连贯性。简直令我震惊。第二79.4%结论准确率Beta用户估计一次运行能干完科学家6个月的工作已经做出7项科学发现3项重现已有发现4项是真实的新贡献还包括神经科学、材料科学、统计遗传学。这也太能干了。第三按次收费不是订阅定价200美元/run。什么是run你给它一个研究目标它从头到尾跑一遍12 小时的研究循环这一整次叫一个run。反正都『自主研究』了收费模式也得跟上卷王用得强度大躺平用得少订阅费明显不适合要我说钱数简直逆天了。Agent行业普遍按订阅收费常见几十美元。Claude Code月费也才200美元。为什么敢这么定价?因为它产出的价值实在太高。不是自动发个邮件省5分钟自动跑个报销省15分钟发个小红书省20分钟而这是替代掉一个专业团队几个月的高价值工作。Kosmos给所有Agent公司一个教科书级别的示范。打破了Agent收费的天花板。这个例子直接验证了前面那个激进观点Kosmos背后这家公司Edison Scientific不是先做Agent infra再做Agent它是先做出Agent能干6个月科学家活儿的再用这个Agent来证明自己的能力。爆款是给客户用你工具能做到什么程度的证据。成功归成功再聊更深一层的事。一个是硬科技技术含量一个是开辟新赛道。Kosmos的核心创新是structured world models中文是结构化世界模型它发明了一套机制让Agent能在数千万token的context上保持研究目标的连贯。结构化世界模型。这个东西是Kosmos团队在科学发现这个垂直场景里硬卷出来的。可理解为外部结构化数据库这是通用Agent里没有的能力是科学实体关系实验结果未解问题的数据库。原理很简洁不是把所有信息塞进一个超长context而是把信息结构化存进一个外部数据库worldmodelAgent每次只查相关的部分塞进context解决的是LLM之外的问题。是一个科考笔记本系统。这个需求来自于科学研究的上下文规模特别大动不动读1500篇论文跑42000行代码。不仅巨大而且需结构化关联不是简单的我之前说过什么的好记忆力而是基因A和疾病B的关系这种知识图谱总有人说做模型才牛做Agent就是套个壳这个观点大错特错。Kosmos的structured world model这个零件技术门槛极高是垂直Harness是专为科学研究设计的Harness。再者有人只看到Kosmos是产品没看到它背后是一个完整的双层体系Agent产品Agent infra。第一层Agent产品子Agent专家团队。专家不再围观而是任务专用。专家Crow文献问答专家Falcon深度文献综述专家Owl重复性检查专家Phoenix化学实验设计。这四个Agent每个都是一个独立的产品。当然还有旗舰产品Kosmos。有产品收费变现就方便了第二Agent infra其实有两件一个开源一个闭源开源框架PaperQA2是Agentic RAG引擎吸引研究社区使用贡献反馈建立技术口碑前面讲了structured world model技术门槛极高。这玩意肯定闭源了。所以Kosmos是经典的开源拉新闭源变现策略。且做了非常聪明的边界名称是否开源作用框架PaperQA2开源做生态专家智能体1.Crow2.Falcon3.Owl闭源API访问平台模式旗舰智能体Kosmos闭源商业化主力看出来了吧Kosmos不只是垂直爆款Agent它是infra垂直爆款的完整一体。肯定还有不出来的Harness设计。所有四个专家Agent和智能体Kosmos都跑在这套infra之上。很显然当Harness设计出真正的领域创新时产品差异化是真实的巨大的。所以Agent infra的护城河可以是针对垂直场景做出独特的Harness零件。一个Agent产品公司顺手开源了部分infra来做生态。纯粹做Agent infra的公司也就是只卖工具不做产品目前的商业回报普遍不如做产品的。结论很有意思Agent infra可能不会赢家通吃,反而是通用和垂直并存的格局。One More ThingKosmos这种深耕垂直的Agent可能正在另开一个赛道这个赛道是Anthropic和OpenAI这种公司其通用Agent infra 覆盖不到的。Kosmos这种垂直爆款或者说科研爆款只对外强调Agent能力科学发现质量。而且拿走最多价值模型公司只能拿到底层token那一块。当垂直Agent产品做到Kosmos这样它有资格成为模型层的上游且是议价方。这Agent时代模型公司尴尬处境又多了一个要是做不出好的Agent那就等着被强大的Agent变成无感层。当Agent和Harness创新足够强时模型回归水电。水电谁都能买模型谁都能换当然水电也有利润还不低只是利润空间被价值链上游压住了天花板。《AI产品和技术模块》1.Kimi Agent产品很厉害然后呢2.搞懂“记忆”必看吃透Engram坐等Deepseek新模型3.实属踩踏了深水炸弹Seedance掩盖Seed2.04.少瞎吹系列AI智能体基础infra就不基础5.Harness内心OS大模型只管想剩下烂摊子全我的6.纠缠软件是什么Agent还是Harness?7.排行榜是别人的手感是自己的Kimi K2.6体感报告《具身智能》1.“26年具身智能根本做不过来”含陶大程教授独家2.漫画大模型“强控”具身智能机器人《AI医疗》1.独家深度丨夸克健康大模型调研报告2.熬夜三年肝损害AI博主也靠AI学“续命”医学知识3.为什么AI能预警心脏主动脉“血管炸弹”4.对话作者全球首个开源手术视频大模型SurgMotion第一期《AI底层系列》1.对抗NVLink简史10万卡争端英伟达NVL72超节点挑起2.英伟达『照抄者死』阿里华为AI集群狂飙『全解耦』3.阿里华为『血战』英伟达AI超节点悲观者正确乐观者赚钱4.抢在英伟达护城河合拢前硅光的冲刺与最后窗口5.OCP现场 l 北美AI巨头罕见共识ESUN为利益『握手』6.为什么有些『闪断的锅』硅光不背?7.为了Token阿里云竟然出了一个TPN

相关文章:

Agent才不会“赢家通吃“,证据来了……

Claude Code已经赢成这样了, 顺带又做了CMA, 定义下一代企业级Agent infra。 Claude Code『同款』infra, 谁不想用。 谁又不想卖可复用的工具呢。 这样下去, 做Agent infra须有爆款Agent证明自己吗? 肯定很多人反对&am…...

AI代码助手评测体系构建:从原理到实践的完整指南

1. 项目概述:AI代码助手评测,到底在测什么?最近在GitHub上看到一个挺有意思的项目,叫ameerkhan9394/ide-ai-benchmark。光看名字,你大概能猜到,这是一个给集成开发环境(IDE)里的AI助…...

中间件与依赖系统:构建高效 Web 后端的双重利器

文章目录一、 中间件(Middleware):全局的“拦截器”1.1 核心概念1.2 执行原理1.3 代码实现1.4 多中间件执行顺序二、 依赖系统(Dependency Injection):精细化的“业务注入”2.1 为什么要用依赖系统&#xf…...

2026年3月 电子学会青少年软件编程机器人技术六级等级考试试卷真题【理论综合】

答案和更多内容请查看网站:【试卷中心 ----->电子学会 ---->机器人技术 ----> 六级】 网站链接 青少年软件编程历年真题模拟题实时更新 2026年3月电子学会青少年机器人技术(六级)等级考试试卷 一、单选题 第 1 题 TCP/IP四…...

轻量级Web代理moltron:架构解析与生产级部署实战

1. 项目概述:一个轻量级、高性能的Web代理工具在开发和运维的日常工作中,我们经常需要处理不同网络环境下的服务访问问题。比如,本地开发需要调试一个部署在内网测试环境的API,或者需要安全地访问某些仅限特定网络访问的资源。传统…...

comsol导出高分辨率stl文件

笔者在做毕设时想要从comsol 6.4中导出高分辨率的stl文件,但是发现comsol不能调节分辨率。故此,做以下解决措施①从comsol导出step这种通用格式文件②用solidworks打开step文件③在sw中进行featurework这种操作,也就是说这一步先将step文件转…...

为 Cursor 构建 API 协议转换网关:解决多模型兼容性问题

1. 项目概述:为 Cursor 打造一个全能的 API 协议转换网关如果你和我一样,深度依赖 Cursor 作为主力开发工具,同时又想灵活地使用各种第三方大模型 API(比如那些性价比更高的中转站服务),那你一定遇到过这个…...

从零构建AI编程助手:Rust实现与模型上下文协议实践

1. 项目概述:一个从零开始的教学型AI编程助手如果你和我一样,对Cursor、GitHub Copilot这类AI编程助手背后的工作原理感到好奇,甚至有点“黑盒恐惧症”,那么这个名为Groundhog的项目,绝对值得你花时间深入研究。它不是…...

构建更优Godot MCP:AI助手与游戏开发工作流深度集成方案

1. 项目概述:为什么我们需要一个更好的Godot MCP?如果你是一个长期使用Godot引擎的开发者,尤其是当你尝试将AI能力,比如大型语言模型(LLM),集成到你的游戏开发工作流中时,你很可能听…...

开源AI导航站:从数据结构到社区协作的实战解析

1. 项目概述:一个AI导航站是如何炼成的作为一个长期混迹在AI工具圈的老鸟,我深知一个痛点:每天都有新的AI应用冒出来,但想找到一个靠谱、好用、还免费的,往往得在搜索引擎、社交媒体和各个论坛里“大海捞针”。直到我遇…...

同样是投手为什么分析能力相差很大

做广告投放分析能力是核心能力账户常见三个终极问题: 1:不起量 2:成本高 3:量不够简单的说,投手要做的,是从纷繁复杂的账户信息中,整理出有用的数据,并基于它们给出合理的假设&#…...

Dive开源MCP主机:统一AI工具调用,打造跨模型智能体桌面应用

1. 项目概述:Dive,一个开源的MCP主机桌面应用如果你和我一样,每天都在和各种大语言模型打交道,从ChatGPT到Claude,再到本地部署的Ollama,那你肯定也遇到过这样的烦恼:每个模型都有自己的界面&am…...

AI时代DevSecOps脚手架:5分钟构建安全可靠的React+TypeScript应用

1. 项目概述:一个为AI编码时代量身定制的DevSecOps启动器 如果你和我一样,经常用 Cursor、Lovable 这类 AI 编程工具来快速构建应用原型,那你肯定遇到过这个痛点:点子出来得飞快,代码生成也很快,但一到要部…...

口令猜测—PCFG

PCFG 口令猜测方法介绍 1. PCFG 是什么 PCFG 全称是 Probabilistic Context-Free Grammar,即概率上下文无关文法。 在口令猜测研究中,PCFG 的核心思想是:人类设置口令并不是完全随机的,而是具有明显的结构和习惯。例如&#xff0c…...

企业知识库RAG到底有多难:实战3:向量化与存储

文章目录(零)项目位置(一)整体功能介绍(二)程序入口与参数(三)向量数据库初始化(四)文档 node 构建流程(五)为什么 debug 模式非常重要…...

Transformer注意力机制数据流优化与MMEE方法实践

1. 注意力机制数据流优化概述在Transformer架构和大型语言模型(LLM)中,注意力机制的计算开销通常占整体工作负载的60%以上。随着模型处理序列长度的不断增加,注意力计算面临的性能瓶颈日益凸显——其计算复杂度与序列长度呈二次方关系。这种特性使得传统…...

Java版Dify SDK:构建AI应用的高效开发指南

1. 项目概述:为什么我们需要一个Java版的Dify SDK?如果你正在用Java构建AI应用,并且已经接触过Dify这个开源的LLM应用开发平台,那你大概率会遇到一个痛点:官方SDK主要面向Python和JavaScript生态。当你想在Spring Boot…...

2026年,想要靠谱美缝团队?看完这篇你就知道选哪家!

在高端住宅、别墅装修中,美缝是彰显整体质感的关键环节。选对美缝团队,不仅能提升家居美观度,还能确保美缝效果长效耐用。2026年,如果你正在寻找靠谱的美缝团队,不妨看看长沙匠心徐师傅美缝团队,以下将为你…...

手机端数据恢复神器,值得收藏

今天给大家推荐一款好用的安卓端数据恢复工具,非常好用的,还有一款Wifi信号检测工具,有需要的小伙伴及时下载收藏! 软件介绍 第一款:数据恢复大师dumpster 提到数据恢复大师,之前好像也有推荐过&#xff0…...

IDEA(2021.3.2)模块右侧Maven中不显示Dependencies问题

前言:今天在B站大学上想学点东西的时候,发现了这个问题,根目录中有两个模块,分别是01,02我嫌麻烦就复制了一份为03,在刷新maven的过程中报错(主要就是不展示Dependencies)然后百思不得其解&…...

猫瘟爆发季,我为什么把全院空气消毒换成了净博阳?宠物医生手记

先说背景:我经营一家中型宠物医院,3个诊室、1个手术室、1个输液区、1个住院部(15个笼位),日均接诊量30-40例。干过临床的同行都知道,宠物医院有一个隐形的生死线——院内交叉感染。你这边刚抢救回来一只猫瘟…...

AI编程工具实战指南:从Claude Code到Cursor的深度技巧与工作流设计

1. 项目概述:一份写给实干派开发者的AI编程工具实战手册 如果你和我一样,是个在一线写代码写了十来年的老程序员,那你肯定已经感受到了,这两年AI编程工具的出现,彻底改变了我们写代码的方式。从最开始GitHub Copilot那…...

Anthropic研究院议程:不止做AI大模型,更要定义AI时代的全球规则

当大模型竞赛进入白热化,多数科技公司都在比拼参数、速度、模型能力时,OpenAI竞品Anthropic走出了一条完全不同的路。 近期,Anthropic 正式公布 Anthropic Institute(Anthropic研究院)全新研究议程,不再只埋头做模型研发,而是站在行业顶层视角,深度拆解AI对经济、安全、…...

Windows下CLion配置NDK的CMake项目,为什么你的Android.toolchain.cmake总报错?一篇讲清所有参数

Windows下CLion配置NDK的CMake项目:破解android.toolchain.cmake报错全指南 当你第一次在CLion中尝试配置NDK的CMake项目时,那个看似简单的android.toolchain.cmake文件可能成了噩梦的开始。明明按照教程一步步操作,却在编译时遭遇各种莫名其…...

企业团队如何利用Taotoken统一管理API密钥与下载用量报告

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 企业团队如何利用Taotoken统一管理API密钥与下载用量报告 在团队协作开发与使用大模型API的过程中,如何安全、高效地管…...

奇点不是预言,是进度条:SITS 2026公布的87项技术里程碑中,已有23项进入工信部信创适配目录(附完整清单速查表)

更多请点击: https://intelliparadigm.com 第一章:CSDN主办SITS 2026:2026奇点智能技术大会亮点全解析 SITS 2026(Singularity Intelligence Technology Summit)由CSDN联合中国人工智能学会、中科院自动化所共同主办&…...

智能体工程:从氛围编程到结构化AI辅助开发方法论

1. 项目概述:从“氛围编程”到“智能体工程”如果你和我一样,在过去一年里深度使用过 Claude Code、Cursor 或者 GitHub Copilot 来写代码,大概率经历过两种极端状态:一种是“哇,这 AI 太神了,我动动嘴皮子…...

告别明文传输:手把手教你为open62541 OPC UA服务器配置OpenSSL加密(附证书生成避坑指南)

工业物联网安全实战:基于open62541与OpenSSL构建OPC UA加密通信体系 在工业控制系统与物联网设备的数据交互中,明文传输就像在公共场所用明信片传递商业机密。想象一下工厂里的PLC控制器将生产参数以原始文本形式发送到SCADA系统,或者智能传感…...

FiveM服务器全栈运维指南:从零搭建到高效管理的结构化技能体系

1. 项目概述与核心价值如果你正在运营一个基于 FiveM 的 GTA V 角色扮演服务器,那么你肯定对“服务器炸了”、“脚本冲突了”、“玩家卡得动不了”这些日常运维噩梦深有体会。我自己从零开始搭建、维护一个中等规模的 FiveM 服务器,到后来管理一个拥有数…...

Godot 4项目模板实战:模块化架构与工程化开发指南

1. 项目概述与核心价值最近在社区里看到不少朋友对 Godot 引擎跃跃欲试,但往往卡在第一步:如何快速搭建一个结构清晰、易于维护的初始项目?很多新手会直接从官方文档的“Hello World”开始,但随着功能增加,代码很快就变…...