当前位置: 首页 > article >正文

AI Agent 开发者都在狂塞上下文,却集体忽略了这个“隐形路由表”

在生产级 AI Agent 系统中技能Skills堆到 40 个、知识文件超过 2 万行后系统却开始悄无声息地“失忆”。任务响应变慢、归档错乱、能力明明存在却无法触发——这些不是模型不够聪明而是上下文管理出了系统性问题。Garry Tan 在亲手打造个人 Agent 体系GBrain GStack OpenClaw的过程中用 200 行 Resolver 取代了 2 万行 CLAUDE.md把看似“生产力爆炸”的混乱变成了真正能复合智能的稳定架构。我起初也和很多人一样认为把所有经验、模式、边缘案例一股脑塞进系统提示词就能让模型“无所不知”。后来深入分析他的实际系统日志和技能调用链后发现这恰恰是让模型“失明”的根源。模型不是靠信息量取胜而是靠在正确时刻拿到正确上下文。Resolver 就是那个路由表——它让知识按需加载而不是一次性淹没整个上下文窗口。那个 2 万行“忏悔录”背后的代价Garry Tan 的 CLAUDE.md 曾经膨胀到 2 万行每一次被 Claude Code “烧”过的 quirk、每一条代码规范、每一次被坑的边缘场景都被塞了进去。表面上看这是在“喂”模型知识实际却是让注意力机制持续过载。响应变慢、精度下滑连模型自己都开始建议“能不能删一点”。这就像你给一位顶级厨师塞满一整个厨房的食材却不告诉他今晚要做的是川菜还是法餐。厨师不是变笨了而是被噪声淹没了。真正的聪明是在客人点菜的那一刻只把需要的调料和菜谱推到他面前。解决办法只有 200 行一个编号决策树 文档指针。任务类型 X 出现时先加载文档 Y。整个知识库仍然存在但不再污染上下文。系统立刻变快、更准、幻觉更少——不是模型升级了而是噪声被清除了。Resolver 的本质上下文的“交通警察”Resolver 说白了就是一个路由表。它在三个层面同时生效形成 fractal分形结构技能 ResolverAGENTS.md用户查询 → 匹配技能文件。例如“检查我的签名” → executive-assistant 技能。归档 ResolverRESOLVER.md内容类型 → 目录结构。人 → /people/公司 → /companies/政策分析 → /civic/。技能内部 Resolver每个胖技能自己也有子路由比如邮件分拣走一条路径签名追踪走另一条。下面是我根据 Garry Tan 实践逻辑重构的一个精简版 Resolver 示例已增加中文关键行注释便于生产落地# RESOLVER.md - AI Agent 上下文路由决策树 # 核心原则永远按主题主体归档而非来源格式或技能名称 # 任务类型判断优先级从高到低 if query 包含 谁是 或 个人信息: # 加载 /people/ 目录下的对应文档 load_context(/people/{entity_name}.md) elif query 涉及 公司 或 投资人更新: # 加载 /companies/ 目录优先匹配公司实体 load_context(/companies/{entity_name}.md) elif query 是政策分析、监管或 OpenAI 相关: # 明确映射到 civic 目录避免掉进 sources/ 垃圾桶 load_context(/civic/{topic}.md) elif query 是 ingest PDF / 文章 / 会议记录: # 必须先读 _brain-filing-rules.md 再决定路径 consult_filing_rules() route_to_correct_dir() # 严禁技能内部硬编码默认路径 else: # 兜底 日志记录触发 check-resolvable 审计 log_unresolved_task()这个 200 行文件取代了原来 2 万行的“全家桶”。它让系统从“知识抽屉”变成了结构化智能层。真实事故复盘一次归档错误引发的全链路审计Garry Tan 让 Agent 摄入一篇 Will Manidis 的政策分析文章《No New Deal for OpenAI》。结果被扔进了sources/——那是给 CSV、API 导出、原始数据准备的目录。而这篇明显属于civic/。问题出在idea-ingest 技能里硬编码了默认路径完全没咨询 Resolver。13 个写脑技能里只有 3 个正确引用了 Resolver其余 10 个各自为政。这就是典型的“技能自治导致系统性漂移”。]就像公司里 40 个员工技能每个人都有自己的一套文件归档习惯最后整个知识库变成 1.47 万个文件的“杂物间”。表面功能齐全实际检索和关联完全失效。解决路径不是逐个修技能打地鼠而是新建_brain-filing-rules.md记录所有常见误归档模式强制所有写脑技能在创建页面前先读 RESOLVER.md 和 filing-rules每周跑一次check-resolvable元技能扫描 unreachable skills unreachable 技能占比一度高达 15%。老方案 vs 新方案生产级权衡矩阵维度传统“狂塞上下文”方案Resolver 胖技能方案生产环境真实影响响应速度与注意力上下文窗口迅速饱和响应变慢按需加载仅 200 毫秒读取路由表速度提升 3-5 倍精度不降长尾风险与漂移知识逐渐腐烂归档错乱不可逆触发评估 自愈循环漂移可被主动发现90 天内零误归档开发者/架构师心智负担每次新增技能都要手动同步提示词Resolver 文档化改一行 Markdown 即可生效上手门槛降低新技能 5 分钟接入系统可扩展性技能到 20 个就崩溃fractal 结构轻松支持 50 技能 2.5 万文件从玩具 Demo 到日处理 200 输入Resolver 的自我进化从静态表格到自愈治理层Resolver 不是一劳永逸。它会腐烂新技能在半夜由子 Agent 建好却没注册、用户真实表述和 trigger description 逐渐脱节、优先级错位……Garry Tan 正在探索的终极方案是用强化学习环RL loop让 Resolver 自我迭代观察每一次任务分发 → 记录实际命中技能 → 夜间重写 trigger description 和优先级。这不是科幻而是把“AutoDream”式的记忆整合机制专门应用在路由层。一旦 Resolver 实现自愈整个 Agent 系统就从“堆技能”变成了“设计组织”技能是员工Resolver 是组织架构图filing rules 是内部流程check-resolvable 是合规审计trigger evals 是绩效复盘。这才是真正让人脊背发凉的洞察——我们以前以为在造工具其实在无意中构建了一个需要管理层的“组织”。在生产环境落地前你必须做的三件事立即创建 RESOLVER.md 和 _brain-filing-rules.md把所有技能的触发描述和归档逻辑全部文档化给每个写脑技能增加两行强制前置先读 Resolver再执行每周定时跑 check-resolvable 元技能把 unreachable capabilities 曝光在团队周会上。当你把 Resolver 真正跑通的那一刻你会发现模型从来没变笨是我们终于学会了“在正确时刻给它正确的书”。AI Agent 的下一次进化不再是把模型变更大而是把治理层建得更聪明。Resolver 就是那个被严重低估、却决定系统能否长期存活的隐形基础设施。基于 YC 总裁 Garry Tan 在 X 平台上的深度分享与 GBrain/GStack 开源实践我把这些硬核模式重构为可直接落地的生产资产。我是紫微AI在做一个「人格操作系统ZPF」。后面会持续分享AI Agent和系统实验。感兴趣可以关注我们下期见。

相关文章:

AI Agent 开发者都在狂塞上下文,却集体忽略了这个“隐形路由表”

在生产级 AI Agent 系统中,技能(Skills)堆到 40 个、知识文件超过 2 万行后,系统却开始悄无声息地“失忆”。任务响应变慢、归档错乱、能力明明存在却无法触发——这些不是模型不够聪明,而是上下文管理出了系统性问题。…...

Cortex-M7中断系统架构与优化实践

1. Cortex-M7中断系统架构解析在嵌入式实时系统中,中断机制是实现快速响应外部事件的关键。Cortex-M7的中断系统由嵌套向量中断控制器(NVIC)和系统控制块(SCB)两大模块构成,它们共同管理着处理器的异常和中断行为。NVIC作为中断系统的核心控制器&#xf…...

七段数码管时钟设计:从原理到实现的完整指南

1. 七段数码管时钟的核心原理 七段数码管时钟本质上是通过电子计数器驱动数字显示器件。你可能在车站、银行等场所见过这种显示方式——由7个发光二极管(LED)排列成"8"字形,通过不同段的点亮组合显示0-9的数字。这种设计之所以经典…...

HLS高层次综合编程

一、HLS高层次综合语言 1.可综合的C语言开发 2.可综合的C语言开发 3.可综合的System C语言开发二、三种语言解决的问题 1.可综合C语言 90%的HLS高层次综合开发是可以使用c语言设计的,但是一些情况下的设计C语言无能为力。2.c函数模板设计 函数模板设计为是在可综合C…...

SQL如何避免不同团队修改同一张表_基于前缀名的授权GRANT ON语法

不可行。GRANT ON 不支持表名前缀通配符,MySQL 和 PostgreSQL 均报错;权限最小粒度为单表、库或列,无表名模式授权;唯一可靠方案是物理分库(MySQL)或分 schema(PostgreSQL)并单独授权…...

别再死记硬背了!用GDB和Perf动手实验,搞懂CSAPP里的虚拟内存与缓存机制

从GDB到Perf:用实验揭开CSAPP中虚拟内存与缓存的神秘面纱 在计算机系统的学习过程中,虚拟内存和缓存机制常常是让初学者感到困惑的"拦路虎"。教科书上的理论描述虽然严谨,但缺乏直观感受,就像只给了一张地图却从未让你真…...

Golang怎么实现配置校验_Golang如何在启动时检查必填配置项是否缺失【技巧】

必填环境变量校验必须在main()开头用os.LookupEnv集中检查,禁止在init()中校验;mapstructure需关闭WeaklyTypedInput或二次校验;第三方env库须显式处理Parse返回error。启动时 panic 之前先检查 os.Getenv 是否为空Go 没有内置配置校验机制&a…...

LaTeX2Word-Equation:一键解决数学公式复制难题的终极方案

LaTeX2Word-Equation:一键解决数学公式复制难题的终极方案 【免费下载链接】LaTeX2Word-Equation Copy LaTeX Equations as Word Equations, a Chrome Extension 项目地址: https://gitcode.com/gh_mirrors/la/LaTeX2Word-Equation 你是否曾在撰写学术论文时…...

Optimizer 梯度下降优化算法

1. 前言 当前使用的许多优化算法,是对梯度下降法的衍生和优化。在微积分中,对多元函数的参数求偏导数,把求得的各个参数的导数以向量的形式写出来就是梯度。梯度就是函数变化最快的地方。梯度下降是迭代法的一种,在求解机器学习算…...

数据可视化实战:如何通过Python定制个性化图表样式

1. Python数据可视化基础:从默认样式到个性化定制 第一次用Matplotlib画图时,我被它默认生成的蓝色折线图震惊了——这配色和PPT里的图表简直如出一辙。但当我学会调整第一个参数后,整个数据呈现方式发生了翻天覆地的变化。Python的可视化库之…...

【SLAM导航实战解析】- 基于已知地图的AMCL定位与move_base路径规划

1. AMCL定位与move_base导航的核心原理 第一次接触机器人导航时,我被AMCL算法中那些跳动的粒子云深深吸引。想象一下,你的机器人就像在玩一场高科技版的"躲猫猫"游戏——它不知道自己在哪里,但通过不断观察周围环境特征&#xff0c…...

一、组合逻辑设计实战——从波形图到上板验证的多路选择器

1. 从零开始搭建多路选择器工程 第一次接触FPGA开发的朋友可能会觉得无从下手,其实只要按照标准流程一步步来,很快就能上手。我刚开始做数字电路设计时,最头疼的就是工程文件管理混乱,后来养成了规范化的习惯,效率提升…...

《我的世界》Python编程实战:从零搭建你的自动化游戏世界

1. 环境准备:搭建你的Python版《我的世界》控制台 十年前我第一次用Python控制《我的世界》时,那种用代码生成城堡的震撼感至今难忘。现在让我们从零开始,用最新稳定版本的工具链,带你快速搭建这个神奇的环境。整个过程就像组装乐…...

如何用AI技术将单张图片转换为专业PSD分层文件:Layerdivider完全指南

如何用AI技术将单张图片转换为专业PSD分层文件:Layerdivider完全指南 【免费下载链接】layerdivider A tool to divide a single illustration into a layered structure. 项目地址: https://gitcode.com/gh_mirrors/la/layerdivider Layerdivider是一款基于…...

HTML5中Vuex持久化插件中WebStorage的底层配置

Vuex 持久化依赖插件(如 vuex-persistedstate),底层调用 localStorage/sessionStorage 或自定义 storage,通过 key、paths 控制存储键名与字段,JSON 序列化限制数据类型,reducer 可过滤敏感信息或动态控制持…...

为Git设置全局勾子,自动追加提交信息

当多人一起开发软件时,我们通常希望 Git 提交日志里能自动带上一些额外内容,比如项目名称、任务编号(像 JIRA ID)或者分支类型,因为这些信息对之后做代码审查、追踪修改记录,或者配合自动化流程都很有帮助&…...

Windows远程桌面mstsc命令的隐藏玩法:从编辑RDP文件到多显示器适配

Windows远程桌面mstsc命令的隐藏玩法:从编辑RDP文件到多显示器适配 远程桌面连接(Remote Desktop Connection)是Windows系统中一个极为实用的功能,尤其对于需要频繁管理多台计算机的IT专业人员来说。大多数人可能只使用过图形界面…...

【Windows】使用启动U盘重装Windows10系统

一、准备 启动盘,详情见:【Windows】制作Windows10系统U盘,启动盘制作步骤要重装系统的电脑。 提示 重装系统前一定要备份自己的数据 二、重装系统 (一)BIOS设置(以惠普战66为例) 这一步的…...

Vue项目里用腾讯地图API把地址转成经纬度,我踩过的坑你别再踩了

Vue项目实战:腾讯地图地址解析避坑指南 第一次在Vue项目里集成腾讯地图API时,我天真地以为这不过是个简单的接口调用。直到连续三个晚上被各种报错折磨得怀疑人生,才意识到每个环节都藏着意想不到的坑。本文将分享我从零开始实现地址转经纬度…...

别再为4G视频卡顿发愁!手把手教你用阿里云ECS和coturn搭建专属TURN中继服务器

4G视频传输卡顿终结者:基于阿里云ECS的TURN中继服务器实战指南 当你在偏远工地调试RV1106芯片的监控摄像头时,是否经历过这样的崩溃瞬间——4G网络下视频画面频繁卡顿,关键帧丢失得像打满马赛克的抽象画?这往往不是信号强度的问题…...

AXI Memory Mapped to PCI Express IP核在Vivado中的高效集成与应用

1. AXI Memory Mapped to PCI Express IP核基础解析 第一次接触这个IP核时,我盯着文档发了半小时呆——名字实在太长了!后来在实际项目中摸爬滚打才发现,它其实就是个"翻译官",专门解决AXI4总线和PCIe协议之间的语言不通…...

自媒体内容没人看,可能不是你写得差,是“开头”就把人劝退了

你有没有过这种体验:辛辛苦苦写了一篇稿子,自己觉得挺好,发出去阅读量却惨淡。你安慰自己“可能是选题不好”,但同样的选题,别人写就能火。问题可能不在选题,在开头。我统计过自己近30篇文章的数据&#xf…...

Teamocil与tmux深度集成:核心命令和API完全解析

Teamocil与tmux深度集成:核心命令和API完全解析 【免费下载链接】teamocil Theres no I in Teamocil. At least not where you think. Teamocil is a simple tool used to automatically create windows and panes in tmux with YAML files. 项目地址: https://gi…...

从项目管理到芯片设计:聊聊DAG最长路径在‘关键路径’计算中的那些事儿

从项目管理到芯片设计:DAG最长路径在关键路径计算中的实战应用 在软件研发项目中,你是否遇到过这样的困境:明明每个任务都按时完成,但项目总工期却一再延误?或者在芯片设计流程中,如何确定哪些工序的延迟会…...

《异常检测——从经典算法到深度学习》3 基于One-Class SVM的工业时序数据异常检测实战

1. One-Class SVM算法在工业时序数据中的独特价值 第一次接触工业设备振动数据时,我被密密麻麻的波形图搞得头晕眼花。工厂老师傅指着屏幕上突然出现的尖峰说:"这就是轴承快坏了的征兆,但人工看太费劲了"。这正是One-Class SVM大显…...

Android13 Launcher3自定义Workspace网格布局与图标间距实战

1. 理解Launcher3的Workspace布局机制 在Android系统中,Launcher3是负责管理桌面、应用抽屉和快捷栏的核心组件。Workspace作为Launcher3的关键部分,决定了应用图标、文件夹和小工具的排列方式。Android13对Launcher3的架构做了进一步优化,使…...

逆向实战:手把手教你用Node.js复现QQ音乐sign生成算法(附完整代码)

逆向工程实战:Node.js还原QQ音乐API签名生成机制 每次打开QQ音乐播放器,那些流畅跳动的音频数据背后都藏着一套精密的加密舞蹈。作为开发者,当我们试图通过程序化方式获取这些资源时,总会遇到那个令人头疼的sign参数——它像一道电…...

Python实战:Intel RealSense D435i多模态数据采集与可视化全流程解析

1. 环境准备与设备连接 第一次接触Intel RealSense D435i时,我也被它丰富的传感器配置惊艳到了。这款深度相机不仅能采集彩色图像,还能同步获取深度图和左右红外图像,非常适合做三维重建、手势识别等应用。不过刚开始用Python操作它时&#x…...

告别Windows和TwinCAT:用树莓派+开源IgH搭建低成本EtherCAT主站测试平台

树莓派IgH:低成本搭建工业级EtherCAT主站全指南 工业自动化领域长期被高价商业解决方案垄断,直到开源项目IgH EtherCAT的出现打破了这一局面。本文将手把手教你用树莓派和IgH搭建一个功能完整的EtherCAT主站测试平台,成本不到商业方案的1/10。…...

RS232、RS485与Modbus:工业通信协议与接口标准的深度解析

1. 工业通信的基石:RS232与RS485的前世今生 第一次接触工业通信时,我被各种接口标准搞得晕头转向。直到在某个自动化产线调试现场,老师傅指着设备后面密密麻麻的接线端子说:"搞懂RS232和RS485,你就掌握了工业通信…...