当前位置: 首页 > article >正文

上下文是新的算力吗?

在过去六个月里前沿级AI能力的推理成本下降了约85%。来自Meta、阿里巴巴等公司的开放权重模型如今在关键基准测试上已经能匹敌上个季度最好的闭源模型。一个曾经每月花费数千美元运行在领先专有模型上的生产工作负载现在可以用开源替代方案以极低的成本运行。大多数关于这些进展的报道都将其定位为一个成本故事。虽然这当然没错但在更深层面上这是一个战略故事——它改变了团队尤其是在企业层面构建AI系统的方式。当模型本身变成一种商品时竞争并不会结束。它会转移到技术栈的其他地方。我认为它实际上会大幅向数据层靠拢。1、刚刚发生了什么过去几年里AI工程团队面临的最重要决策之一就是模型选择。哪个提供商能提供最好的推理能力哪个能很好地处理你的业务领域哪个在生产规模上是你真正负担得起的这些问题仍然重要但它们已不再是真正的差异化因素。最好的闭源前沿模型与最好的开放权重替代方案之间的性能差距已经急剧缩小而且这种压缩正在加速。根据MIT的研究基础设施和算法效率的提升正在以大约每年10倍的速度降低前沿级性能的推理成本。半年前还需要前沿算力预算才能运行的模型现在已可通过通用API或自托管部署来获取。这具有关键意义。构建持久的AI优势并不意味着你需要最大的模型预算而是需要极其谨慎地规划和判断确定哪些内容需要输入模型以最大化其潜力。这指向了喂养你所选模型的数据质量以及数据AI组合生态系统的基础设施——它必须高度健壮和可靠。2、不会商品化的部分如果两家公司运行着相同的模型是什么让一个AI系统明显优于另一个我认为不是prompt模板或agent框架。这些东西高度可复制而且被开源的速度比任何人构建专有版本的速度都快。不可复制的是上下文context。具体来说我指的是你的组织多年来积累的制度知识、历史数据、跨系统信号和组织记忆——这些东西无论怎么优化prompt都无法从零重建。想想任何AI agent要在你的组织中良好运作实际需要什么。它可以读取你当前的系统状态查询你的数据库调用你的API遍历你的基础设施。所有这些都越来越成为基本要求——仅MCP生态系统就足以让agent开箱即用地接入大多数企业工具。它做不到的是走进门就了解人类工程师所知道的一切——那些随着时间推移在组织内部生长起来的制度记忆。我指的是系统中的故障历史及其复杂的根源、你的团队多年积累的解决模式、以及那些从未被记录的判断决策。这些都不存在于基础模型的训练数据中。但它确实存在于你的系统、日志、人员中以及你为捕获这些信息而构建的工具中。这就是不会商品化的部分。无状态工具向agent展示的是当前的真实状态。制度记忆告诉它的是几天、几个月或几年前什么是真实的。它揭示了故障模式和行之有效或无效的解决模式。对于一个试图对实时情况进行推理的agent来说——比如客户投诉或异常指标——这种历史上下文通常是有用答案和自信幻觉之间的分水岭。我们在Monte Carlo亲身体验了这一点当我们问一个AI agent到底需要从我们的平台获取什么——那些它无法通过直接连接Snowflake或dbt获得的东西——答案实际上是过去出过什么问题的累积记录以及这些信息的深层含义。这种上下文需要构建并随着时间和使用而复合增长。更重要的是与模型能力不同它不能被购买、开源或被运行相同基础模型的竞争对手复制。3、上下文是新的算力吗我认为这是目前大多数企业AI战略对话中缺失的视角。过去几年里将认真的AI团队与其他团队区分开来的资源是算力——具体来说是对前沿模型能力的访问。它昂贵、稀缺并且真正具有差异化。随着模型性能之间的差距持续缩小下一个时代将是关于上下文的。上下文具有不同的属性它具有复利效应。每一次故障解决、每一条数据管道的分诊、每一个决策都会成为制度记忆的一部分让你的AI系统随时间推移变得更加准确。这种优势随着使用而增长而不是需要持续的资本支出。它具有独特性。通用基础模型是在通用数据上训练的。你的竞争上下文是别人没有的数据——你的客户使用模式、你产品的边缘情况、你组织的决策历史。这是本质上不可复制的。它需要基础设施而不仅仅是数据。存放在数据仓库中的原始数据不会给AIagent提供有用的上下文。它必须被组织、可访问、并以agent实际需要的形式可查询——这通常与为人类可读格式构建的数据结构截然不同。现在着手解决这些问题是一项前瞻性任务。它在基准测试中可能看起来不起眼但一年后将变得极难复制。4、这对你的构建方式意味着什么如果上下文才是真正的差异化因素那你的AI战略应该围绕的问题就需要改变。问题不再仅仅是我们应该使用哪个模型而是扩展到更大的问题……“我们的AI需要知道哪些从其他地方无法获取的信息我们是否在构建基础设施来提供这些信息”后半部分要求你诚实地审视你的组织积累的知识中哪些是真正独有的并投资于让这些知识对AI系统可访问——不仅仅是对人类可访问。这也意味着要抵制将每次新模型发布视为战略重置的诱惑。这并不是说模型选择无关紧要。模型仍然是引擎前沿公司每天都在推出令人惊叹的能力。但它正在成为一个商品化的引擎——越来越强大、越来越普及、越来越实惠。竞争优势在于你往油箱里加了什么。原文链接上下文是新的算力吗 - 汇智网

相关文章:

上下文是新的算力吗?

在过去六个月里,前沿级AI能力的推理成本下降了约85%。来自Meta、阿里巴巴等公司的开放权重模型,如今在关键基准测试上已经能匹敌上个季度最好的闭源模型。一个曾经每月花费数千美元运行在领先专有模型上的生产工作负载,现在可以用开源替代方案…...

3大止损策略拯救你的交易:backtrader实战指南

3大止损策略拯救你的交易:backtrader实战指南 【免费下载链接】backtrader Python Backtesting library for trading strategies 项目地址: https://gitcode.com/gh_mirrors/ba/backtrader 作为一名量化交易者,你是否经常面临这样的困境&#xff…...

DV-LAE:基于差异向量的机器学习势函数高效数据筛选方法

1. 项目概述:为什么我们需要更聪明的数据筛选?在材料模拟和计算化学的世界里,我们常常面临一个两难困境:一方面,基于第一性原理(如密度泛函理论,DFT)的计算虽然精度高,但…...

机器学习在考古学中的应用:从数据准备到模型选择的完整工作流指南

1. 考古学中的机器学习:从“黑箱”工具到研究伙伴如果你是一位考古学家,面对堆积如山的陶片、覆盖数平方公里的遥感影像,或是成千上万个需要分类的动物骨骼碎片,你是否曾感到力不从心?十年前,处理这些数据可…...

集成学习驱动的智能黑盒测试:基于模型分歧的用例生成方法

1. 项目概述与核心价值在软件开发的漫长周期里,测试环节始终是保障质量、控制风险的关键闸口。然而,无论是手动编写测试用例,还是依赖传统的自动化脚本,都面临着效率瓶颈和覆盖度不足的挑战。尤其是在面对复杂的黑盒系统时&#x…...

高性能Python多智能体建模框架:Mesa 3.0架构解析与工程实践指南

高性能Python多智能体建模框架:Mesa 3.0架构解析与工程实践指南 【免费下载链接】mesa Mesa is an open-source Python library for agent-based modeling, ideal for simulating complex systems and exploring emergent behaviors. 项目地址: https://gitcode.c…...

从‘拍脑袋’到‘有章法’:用Python实战Embedded与Wrapper方法,为你的模型精准选特征

从‘拍脑袋’到‘有章法’:Python实战Embedded与Wrapper方法的高阶特征选择指南在金融风控和医疗诊断这类对模型精度要求严苛的领域,数据科学家们常常面临这样的困境:当特征数量膨胀到数百甚至上千维时,盲目依赖过滤法选特征就像在…...

5分钟掌握DLSS Swapper:免费开源游戏性能优化神器

5分钟掌握DLSS Swapper:免费开源游戏性能优化神器 【免费下载链接】dlss-swapper 项目地址: https://gitcode.com/GitHub_Trending/dl/dlss-swapper DLSS Swapper是一款专为PC游戏玩家设计的免费开源工具,能够智能管理、下载和替换游戏中的DLSS、…...

终极指南:如何用roop-unleashed三分钟制作专业AI换脸视频

终极指南:如何用roop-unleashed三分钟制作专业AI换脸视频 【免费下载链接】roop-unleashed Evolved Fork of roop with Web Server and lots of additions 项目地址: https://gitcode.com/gh_mirrors/ro/roop-unleashed 你是否曾梦想过轻松制作专业级的AI换脸…...

床通道轨到轨CMOS运放:LMC6482AIM

简 介: 本文测试了TI公司LMC6482AIM双通道轨到轨CMOS运算放大器的基本特性。该芯片具有3V-15.5V宽工作电压范围、超低20fA输入偏置电流和轨到轨输入输出特性,适用于高阻抗传感器信号调理。测试发现其5V供电时工作电流仅0.8mA,15V时约1mA&…...

高效拦截微信撤回消息:WeChatIntercept一站式解决方案

高效拦截微信撤回消息:WeChatIntercept一站式解决方案 【免费下载链接】WeChatIntercept 微信防撤回插件,一键安装,仅MAC可用,支持v3.7.0微信 项目地址: https://gitcode.com/gh_mirrors/we/WeChatIntercept 还在为微信聊天…...

在多地域部署服务中体验Taotoken路由能力对API延迟的优化

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 在多地域部署服务中体验Taotoken路由能力对API延迟的优化 1. 场景与挑战 在构建面向全球用户的服务时,一个常见的架构…...

使用Taotoken CLI工具一键配置开发环境,简化团队协作的接入流程

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 使用Taotoken CLI工具一键配置开发环境,简化团队协作的接入流程 在团队协作开发大模型应用时,一个常见的挑…...

【太阳能】基于matlab PEM电解模拟了24小时太阳能绿色氢电厂(每小时太阳能发电量、氢气产量、用水量、储罐动态以及每公斤H₂的成本【含Matlab源码 15561期】

💥💥💥💥💥💥💞💞💞💞💞💞💞💞欢迎来到海神之光博客之家💞💞💞&#x1f49…...

【流体】基于matlab对沼气厂管道系统进行流体动力学设计和成本优化(最小化总年化成本TAC)【含Matlab源码 15560期】

💥💥💥💥💥💥💞💞💞💞💞💞💞💞欢迎来到海神之光博客之家💞💞💞&#x1f49…...

i茅台自动预约系统终极指南:从零搭建智能抢购平台 [特殊字符]

i茅台自动预约系统终极指南:从零搭建智能抢购平台 🚀 【免费下载链接】campus-imaotai i茅台app自动预约,每日自动预约,支持docker一键部署(本项目不提供成品,使用的是已淘汰的算法) 项目地址…...

通达信ChanlunX缠论插件:3步实现自动化技术分析的终极指南

通达信ChanlunX缠论插件:3步实现自动化技术分析的终极指南 【免费下载链接】ChanlunX 缠中说禅炒股缠论可视化插件 项目地址: https://gitcode.com/gh_mirrors/ch/ChanlunX 还在为复杂的缠论分析而烦恼吗?ChanlunX通达信缠论插件正是您需要的解决…...

因果机器学习在制造业返工决策中的应用:以白光LED产线为例

1. 项目概述:当因果推断遇上产线返工在制造业,尤其是像白光LED芯片制造这样的精密流程工业里,每天都有成千上万个生产批次(Lot)在产线上流转。每个批次在经过磷光体转换(Color Conversion)这一关…...

5分钟解锁Cursor Pro:免费使用AI编程助手的终极指南

5分钟解锁Cursor Pro:免费使用AI编程助手的终极指南 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached your trial…...

选择Taotoken的Token Plan套餐,为长期项目锁定更优成本

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 选择Taotoken的Token Plan套餐,为长期项目锁定更优成本 对于有长期、稳定大模型调用需求的企业或独立开发者而言&#…...

机器学习可复现性危机:八大维度解析与工程实践指南

1. 项目概述:为什么我们需要重新审视机器学习的“可复现性”?如果你在机器学习领域摸爬滚打过几年,大概率遇到过这样的场景:兴冲冲地打开一篇顶会论文的GitHub仓库,按照README的指示安装依赖、运行脚本,结果…...

多保真度机器学习加速卟啉-粘土体系激子动力学模拟

1. 项目概述:当机器学习遇见量子化学,破解卟啉-粘土体系能量转移之谜在人工光合作用和下一代太阳能电池材料的研发前沿,科学家们一直致力于模仿自然界的高效光捕获系统。想象一下,植物和某些细菌中的叶绿素分子,能够近…...

机器学习势函数评估新范式:从力误差到分子动力学模拟的物理性质验证

1. 项目概述与核心挑战在计算材料科学和凝聚态物理领域,分子动力学模拟是我们理解原子尺度下物质行为不可或缺的“显微镜”。它的核心在于求解牛顿运动方程,而驱动原子运动的力,则完全依赖于描述原子间相互作用的势能面。长久以来&#xff0c…...

集成学习在恒星自转周期估计中的应用:从特征工程到模型投票

1. 项目概述与核心挑战在系外行星探测领域,我们常常面临一个“信号分离”的难题:如何从恒星持续变化的光度信号中,准确无误地揪出那颗可能存在的行星划过恒星表面时产生的微弱“凌星”信号。这就像在一场喧闹的摇滚音乐会上,试图听…...

机器学习数据安全新视角:高价值样本的脆弱性与差异化防御策略

1. 项目概述与核心问题在机器学习的实际部署中,我们常常面临一个看似矛盾的局面:那些对模型性能提升贡献最大的“高价值”数据,是否也恰恰是系统中最脆弱的环节?这个问题在过去几年里一直萦绕在我的心头。无论是构建一个图像分类器…...

GTA5线上小助手:智能助手让你的洛圣都冒险更精彩

GTA5线上小助手:智能助手让你的洛圣都冒险更精彩 【免费下载链接】GTA5OnlineTools GTA5线上小助手 项目地址: https://gitcode.com/gh_mirrors/gt/GTA5OnlineTools 想要在《侠盗猎车手5》线上模式中获得更流畅的游戏体验吗?GTA5线上小助手为你提…...

170家!具身智能公司名单

点击下方卡片,关注“CVer”公众号AI/CV重磅干货,第一时间送达具身智能:人工智能的下一个浪潮!今年再次被写入《政府工作报告》中,已经成为国家未来重点培育产业。市场方面,具身智能近一年融资更是爆火&…...

AI 伪造图像在电信诈骗攻防中的应用与治理研究 —— 以韩国诱捕诈骗快递员案为例

摘要 2026 年 5 月 22 日韩国首尔西部地方法院审理的投资类电信诈骗案件中,受害人在遭遇假冒分析师诱导、虚假证券 APP 欺诈并已损失 1200 万韩元后,面对诈骗团伙以 “提现手续费” 为名进一步索要 1990 万韩元现金的行为,利用 AI 生成伪造现…...

ComfyUI-WanVideoWrapper:新手必看的AI视频生成终极指南

ComfyUI-WanVideoWrapper:新手必看的AI视频生成终极指南 【免费下载链接】ComfyUI-WanVideoWrapper 项目地址: https://gitcode.com/GitHub_Trending/co/ComfyUI-WanVideoWrapper 在AI视频生成领域,你是否曾因复杂的代码和繁琐的配置而望而却步&…...

终极指南:如何在Windows上使用iperf3进行专业网络性能测试

终极指南:如何在Windows上使用iperf3进行专业网络性能测试 【免费下载链接】iperf3-win-builds iperf3 binaries for Windows. Benchmark your network limits. 项目地址: https://gitcode.com/gh_mirrors/ip/iperf3-win-builds iperf3-win-builds项目为Wind…...