当前位置: 首页 > article >正文

深度解析三大 Agent 上下文工程:Claude Code、OpenClaw、Hermes 的设计哲学

在Harness之前更底层的则是上下文工程很多时候模型的幻觉、失忆是因为上下文窗口乱了如果我们把所有的事情“平权”的放在上下文里就像大海捞针模型会很难找到自己想要的东西。那我们要怎么设计AI产品的上下文呢Claude Code 把上下文做成了渐进式调度OpenClaw 则做成了开放性的生态而 Hermes 则更强调带交接语义的上下文压缩与回忆。通过理解这三个Agent的上下文机制能够给予我们Agent设计的启发。上下文工程是什么提示词工程决定了AI怎么运行而上下文工程决定模型每一轮对话中能看见的内容它能够帮助我们提升AI对任务的理解、指令的遵循程度、任务的执行表现。而提示词工程其实是上下文的一部分模型在真正运作的时候会看见持久的记忆Openclew的Soul模型的记忆Memory 全局的规则CLAUDE.md、AGENTS.md 系统提示词System PromptAI的工作说明 用户提示词User Prompt用户的输入以及我们帮助用户注入的变量。 MCP、Function等工具的描述信息 工具调用返回的结果 近x轮的对话历史 压缩后的摘要……所有这些东西每一轮模型推理时怎么组合、怎么裁剪、什么时候出现、什么时候消失其实都在上下文工程的范畴。Contextrefers to the set of tokens included when sampling from a large-language model (LLM). Theengineeringproblem at hand is optimizing the utility of those tokens against the inherent constraints of LLMs in order to consistently achieve a desired outcome. Effectively wrangling LLMs often requiresthinking in context— in other words: considering the holistic state available to the LLM at any given time and what potential behaviors that state might yield.Effective context engineering for AI agentsAnthropic 的官方博客给上下文的定义是通过持续优化上下文来保障大模型在固有约束下持续地实现预期效果。我们需要在不断演变的信息中筛选出有价值的信息将其放入有限的上下文窗口。而LangChain 也提供了一个四维框架Write把信息分门别类记录例如记忆、状态写到窗口外面Select按需选择信息包括工具、记忆、知识库Compress总结、裁剪上下文保留高价值的信息Isolate隔离上下文不同agent使用不同的内容那上下文到底在解决什么问题呢模型的窗口有上限文件读取、工具输出、推理过程、输出结果会迅速累积不仅很快会触发上限也会因为大量的噪音影响到模型的推理。随着上下文变长会变笨随着上下文变长模型的表现会变差内容越多注意力就会变差就像我们也很难从800字里迅速的找到某句话。上下文越长会越贵、速度越慢过多默认注入的内容不仅会抬高 token 成本也会让模型响应更慢而且重复发送大段上下文本身就是一笔持续成本。新会话信息丢失在不同的窗口其实模型是不会主动记住上次发生了什么除非是我们要求它记住。工具噪音日志、文件内容、搜索结果会吞掉真正重要的推理空间。如果说我们的AI容易失忆、跑偏、又或者一本正经的胡说八道背后往往是上下文工程做得不好。Claude Code渐进式上下文压缩第一个部分是不怎么变化的内容系统提示词、CLAUDE.md以及自动记忆。系统提示词约束了Claude Agent的表现它不会出现在我们的对话框里。而CLAUDE.md是指令、规则它会在启动时自动加载它为 Agent 提供了长期的行为约束和项目知识。官方的Explore the context window可以看到整个过程在你输入任何事情之前会开始阅读环境数据、可以用的工具、Skills项目级的CLAUDE.md这些其实已经提前占用了你的上下文窗口。如果发现刚开始说几句话就上下文窗口超了有可能是你的MCP、Skill装太多了。另一个部分是输入后的内容在我们输入指令后Claude会进行一系列复杂的过程阅读你的项目文件、思考怎么解决这个问题、开始执行修改代码…直到最后才给我们一个总结。但这些所有的过程都会占据我们的上下文窗口。那官方是怎么解决这个问题的呢从第三方对泄露代码的逆向分析来看Claude Code 采用了一套可被概括为 5 层的压缩思路。按第三方逆向整理Claude Code 不是一上来就总结全部历史而是先处理高噪音的工具结果再做历史裁剪以及带缓存感知的轻量压缩。再往后才会进入更重的上下文折叠或自动压缩。前者更像把全文换成摘要继续工作后者则意味着对旧上下文做更激进的取舍。最重要的是Claude Code在压缩后自动恢复最近5个读取的文件激活的skills它避免了重新读取刚刚编辑得到文件不用重新激活skills。这也是Claude Code没有那么容易失忆、动作不容易变形的原因。OpenClaw极度开放的上下文框架OpenClaw 和Claude Code的初始区别是上下文占用的文件列表相较于Claude Code更多会包括Soul、Identity、User等等而这些可能在Claude Code里只是系统提示词、CLAUDE.md还有记忆。而随着龙虾对我们的理解变深这些内容也会变长和变多这也是为什么我们经常性的超限了。。。而在裁剪、压缩机制上面是相似的它也会丢弃旧的工具输出结果。但Openclaw的会话重置没有像 Claude Code 那样更强调工作集恢复。而比较有意思的是Openclaw的context-engine插件。它是OpenClaw 里的一个可替换组件负责决定每次调用模型时把哪些历史消息塞进上下文窗口以及窗口满了怎么压缩。默认用的是内置的 legacy 引擎但你可以写一个插件替换它实现自己的上下文管理策略。你可以自己选择什么信息要存储、什么时候压缩以及上下文要按照什么结构梳理还可以调整需要构建的上下文。再配合内置的 /context list、/context detail 和 usage 视图我们就能看到到底注入了什么、每一项大概占了多少成本。果说 Claude Code 像一套调优精细的内建策略OpenClaw 更像一个把上下文生命周期开放出来的平台。但框架的开放性、扩展性不等于开箱即用的可靠性每个人的风格不同如果我们没有主动配置和调优上下文策略Agent 的表现可能不如预期。Hermes把交接当成常态和 OpenClaw、Claude Code 不太一样的是Hermes 明确采用了双层压缩。Gateway 层设了 85% 的高阈值更像是一个兜底机制在上下文瞬间膨胀过大时介入处理。而 Agent 层则是 50% 的阈值只要超过 50% 就主动压缩尽早处理上下文换取后续步骤的稳定性。但最重要的地方在于它会生成结构化的摘要它把压缩的摘要当成了交接文件。每一次压缩都明确说明了目标是什么完成进度怎么样核心的决策是什么阅读、修改创建的相关文件下一步又要做什么这是 Hermes 设计品味最集中的表现它不是宽泛的总结一下之前做了什么下一个窗口AI可以基于交接文档快速的接收工作。它还支持增量更新多次压缩后不会从零重新总结而是在上一次的摘要上追加更新。信息在多次压缩中是递进保持的而不是每压缩一次丢掉一些信息。给我们做 Agent 的 5 条设计启发1. 上下文分层区分短期会话和长期记忆不要把上下分当垃圾桶什么都往里塞的结果是既记不住重要的事又被大量无关信息拖慢。至少应该拆成4层1长时记忆跨会话保持的东西2稳定不变的规则包括系统提示词、CLAUDE.md3当前使用的技能、工具、文件4当前的任务进展2. 能删就删不要做没必要的压缩例如无意义的你好、再见例如不需要关心过程的工具输出结果不需要花成本让模型去总结。3. 缓存的稳定性是一等公民system prompt、记忆快照、工具描述不要频繁变更稳定才能省钱、才能高效才能保护稳定性。这一点可能是我最近意识到我以前的误区我原本以为当我们拥有了无数优化算力调度的机制Token会更便宜但无论国内外大厂都在涨价产品同学可能要更早的具备成本意识。4. 压缩结果写成交接文档不是总结Hermes 的结构化交接模板告诉我们压缩不是泛泛而谈而是给下一轮模型准备一份可继续执行的交接清单。5. 压缩后要记得恢复至少要补充回当前工作集比如关键文件、已激活的技能和当前任务状态否则 Agent 压缩完很容易重新读一遍刚刚做过的事。模型的编程能力溢出于是我们有了Cursor。而Openclaw微信或者飞书又进一步把使用门槛拉低Hermes把上下文从压缩变成交接也更早的压缩避免模型不稳定再叠加上自我进化的机制。于是Hermes的Star又迅速的提升大量Openclaw的用户切换到了Hermes。但Hermes的交接机制其实类似HANDOFF而自我进化的skill在Openclaw之前就已经出现过。AI时代不仅止于技术创新还在于把技术上的创新点以一个用户可感知的方式展示了出来。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相关文章:

深度解析三大 Agent 上下文工程:Claude Code、OpenClaw、Hermes 的设计哲学

在Harness之前,更底层的则是上下文工程,很多时候,模型的幻觉、失忆是因为上下文窗口乱了,如果我们把所有的事情“平权”的放在上下文里,就像大海捞针,模型会很难找到自己想要的东西。 那我们要怎么设计AI产…...

2026年4款主流降AI率工具横评:嘎嘎降AI性价比碾压同行

2026年4款主流降AI率工具横评:嘎嘎降AI性价比碾压同行 这两年降AI率工具冒出来一堆,挂着"免费试用""全网最低"的招牌,进去一跑结果五花八门。我这半年前前后后把市面上叫得上名字的降AI率工具都试了一遍,真正…...

【开发者福利】免费行政区划API实战:从adcode到城市树,构建你的地理数据核心

1. 为什么你需要这个免费行政区划API 做开发这么多年,我见过太多项目在地址选择功能上栽跟头。上周还有个做电商的朋友跟我吐槽,他们花了两周时间手动维护省市区数据,结果上线第二天就发现某个县级市行政区划调整了。这种痛,我懂。…...

如何免费获取VMware Workstation Pro 17许可证密钥:终极激活指南

如何免费获取VMware Workstation Pro 17许可证密钥:终极激活指南 【免费下载链接】VMware-Workstation-Pro-17-Licence-Keys Free VMware Workstation Pro 17 full license keys. Weve meticulously organized thousands of keys, catering to all major versions o…...

别再傻傻分不清了!QA、QE、QC到底谁负责啥?一张图帮你理清软件测试岗位分工

软件测试岗位全解析:QA、QE、QC的核心差异与职业选择 刚踏入软件测试领域的新人,面对QA、QE、QC这些缩写时,往往会感到一头雾水。这些看似相似的岗位名称背后,其实隐藏着完全不同的职责边界和发展路径。记得我刚开始接触这个领域时…...

基于python租房房源数据分析可视化系统 租房大数据 房屋信息 Hadoop 房源信息分析

1、项目介绍 Python 租房数据分析可视化系统 爬虫 Flask框架、Layui前端框架、Echarts可视化、requests爬虫、MySQL数据库 基于Python爬虫的租房数据分析可视化系统已初步成型,核心目标为解决应届毕业生就业与租房两大难题。系统通过挖掘拉勾网就业数据与链家网租房…...

GHelper:华硕笔记本终极优化指南 - 3步实现性能翻倍的免费神器

GHelper:华硕笔记本终极优化指南 - 3步实现性能翻倍的免费神器 【免费下载链接】g-helper Lightweight, open-source control tool for ASUS laptops and ROG Ally. Manage performance modes, fans, GPU, battery, and RGB lighting across Zephyrus, Flow, TUF, S…...

Python实现移动平均平滑技术的时间序列分析

1. 移动平均平滑技术概述在时间序列分析和预测领域,数据预处理的质量往往直接决定了模型的最终表现。移动平均平滑(Moving Average Smoothing)作为一种经典且高效的数据平滑技术,通过消除短期波动、突出长期趋势,为后续…...

无人机飞控、游戏角色旋转:聊聊卡尔丹角顺序(Yaw-Pitch-Roll)的那些坑

无人机飞控与游戏开发中的旋转顺序陷阱:Yaw-Pitch-Roll实战指南 第一次在无人机飞控项目中遇到姿态解算问题时,我盯着屏幕上疯狂跳动的欧拉角数值百思不得其解——理论上完美的控制算法,在实际飞行中却导致无人机像醉汉一样失控旋转。直到凌晨…...

岭回归原理与Python实战:解决多重共线性问题

1. 岭回归模型基础概念解析岭回归(Ridge Regression)是线性回归的一个改良版本,专门用于处理数据中的多重共线性问题。我第一次接触这个算法是在处理一组房地产数据时,当普通最小二乘法(OLS)回归系数出现反…...

Windows API实战:从局部热键到全局钩子,构建键盘鼠标监控系统

1. 从局部热键到全局钩子的技术演进 在Windows开发中,键盘鼠标监控是自动化工具和辅助软件的基础功能。我刚开始接触这个领域时,也是从最简单的RegisterHotKey函数入手。记得第一次成功实现CtrlAltD快捷键弹出调试窗口时的兴奋感,就像找到了通…...

Python机器学习优化技术:从基础到实践

1. 机器学习优化速成课程概述在机器学习实践中,优化是核心技能之一。无论是调整超参数还是选择特征子集,决策树算法寻找最佳分割点,神经网络优化权重,我们都在使用各种计算算法进行优化。本课程将带你快速掌握Python中的函数优化技…...

打卡信奥刷题(3150)用C++实现信奥题 P7682 [COCI 2008/2009 #5] TRESNJA

P7682 [COCI 2008/2009 #5] TRESNJA 题目描述 Lana 住在一个快乐的小村庄里。主街旁边有一排樱桃树。Lana 注意到每棵树用从 111 开始的连续整数编号。经过大量研究,Lana 注意到树的编号唯一地决定了树的樱桃数量。对于一棵树,考虑将树编号中的连续数字…...

一文速览最新发布的《CMMI中国2025优秀实践案例集》

为推动软件产业高质量发展、推广工程领域优秀实践,近日,由CMMI研究院中国卓越中心、中关村智联软件服务业质量创新联盟联合编纂的《CMMI中国2025年度优秀实践案例集》(以下简称《CMMI案例集》)正式发布。2025年得CMMI案例筛选出代…...

打卡信奥刷题(3149)用C++实现信奥题 P7677 [COCI 2013/2014 #5] LADICE

P7677 [COCI 2013/2014 #5] LADICE 题目描述 有 NNN 个物品,LLL 个抽屉,每个抽屉只能放 111 个物品,每个物品都能被放进抽屉 AiA_iAi​ 或 BiB_iBi​ 中。 放物品的规则如下(按照顺序执行,即满足条件 111 时就立刻执…...

结构体进阶

文章目录全局/局部变量重命名方式初始化结构体类型结构体内存对齐位段例如:小端存储枚举联合全局/局部变量 重命名方式 初始化 结构体类型 结构体内存对齐 位段 位段(Bit-Field)是 C 语言结构体里的一种特殊用法,它允许你按 “位…...

建第四个 AI 爬虫逆向 500 人交流群

跟猿人学平哥共建一个 AI 爬虫逆向交流群,三月建了三个 AI 逆向 500 人交流群,很快就满了,大家对 AI 的热情很大,看着各大厂不予余力的让全员用 AI ,今年下半年各大厂在人员结构、人员规模上也许会有更大的变化。今天跟…...

利用云函数做一个钉钉机器人提醒功能教程

今天在业务开发中帮助客户实现了一个通过钉钉实时提醒平台订单的功能,发现还挺好使的,而且接入也比较简单,分享一下,这个功能的泛用性挺强的,基本所有的需要实时提醒通知一类的都可以通过这个来实现。首先就是你需要有…...

别再手动复制DLL了!Qt Creator + CMake一键配置OpenCV库(附完整配置流程)

Qt Creator CMake自动化配置OpenCV全攻略:告别手动DLL搬运时代 每次新建Qt项目都要手动复制OpenCV的DLL文件?还在为项目迁移后找不到依赖库而头疼?今天我要分享的这套工作流,能让你的开发效率提升300%。作为一个在计算机视觉领域…...

不依赖对话日志检测Prompt注入,一套隐私优先的实现方案

来源:DeepHub IMBA 本文约2600字,建议阅读5分钟如果只保留遥测数据(关于会话行为的数值信号)实际上能保留多少检测能力?检测 Prompt 注入和越狱攻击的方法,大多建立在系统可以访问对话日志这个前提上。但是…...

名画检测数据集412张VOC+YOLO格式

名画检测数据集412张VOCYOLO格式数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):412 标注数量(xml文件个数):412 标注数量(txt文…...

SQL中如何查找特定的空值行:WHERE IS NULL深度解析

...

避开STC15定时器的那些坑:从模式选择到中断响应,我的调试笔记

避开STC15定时器的那些坑:从模式选择到中断响应,我的调试笔记 第一次用STC15W408AS的定时器时,我天真地以为它和传统8051没什么区别。直到项目中的LED闪烁频率飘忽不定,串口通信出现乱码,我才意识到自己掉进了多少&quo…...

服务型AI设计:从自助陷阱到智能服务革命

1. 技术演进与人类角色的转变人类与技术的关系始终处于动态变化之中。从最初的工具使用者到如今的服务提供者,这种角色转换背后隐藏着深刻的技术哲学思考。早期技术产品如电报、电话需要专业操作人员作为中介,这种模式在20世纪中期开始发生根本性转变。1…...

STC89C52单片机玩转NE555:手把手教你实现一个简易频率计(附完整工程)

STC89C52单片机玩转NE555:手把手教你实现一个简易频率计(附完整工程) 在电子DIY的世界里,频率测量是基础却至关重要的技能。无论是调试振荡电路、校准信号发生器,还是分析传感器输出,一个可靠的频率计都能让…...

告别数据丢失!深入解析M24C08 EEPROM的页写缓冲与自定时写入周期

告别数据丢失!深入解析M24C08 EEPROM的页写缓冲与自定时写入周期 在嵌入式系统开发中,数据可靠性往往决定着产品的成败。想象这样一个场景:你的设备刚刚完成了一次关键数据写入,系统立即读取验证却发现数据异常——这不是代码逻辑…...

免费跨平台绘图神器:drawio-desktop让你的Visio文件在Windows/macOS/Linux上无缝编辑

免费跨平台绘图神器:drawio-desktop让你的Visio文件在Windows/macOS/Linux上无缝编辑 【免费下载链接】drawio-desktop Official electron build of draw.io 项目地址: https://gitcode.com/GitHub_Trending/dr/drawio-desktop 还在为Visio文件的跨平台兼容性…...

告别内核打印:用devmem2在嵌入式Linux上直接读写寄存器的保姆级教程

嵌入式Linux寄存器调试利器:devmem2从编译到实战全解析 调试嵌入式Linux驱动时,最让人头疼的莫过于反复修改内核代码、添加打印语句来查看寄存器状态。这种传统方法不仅效率低下,还会拖慢整个开发流程。想象一下,当你需要快速验证…...

ESP32玩转网络转发:除了做中继,你的AP+STA模式还能这样用(附IoT项目思路)

ESP32网络转发进阶指南:解锁APSTA模式的5种创新应用 在物联网开发领域,ESP32的APSTA双模工作能力常被简化为无线中继功能,这就像只使用瑞士军刀的剪刀功能而忽略了其他十几种工具。实际上,这种双模协同能够实现更复杂的网络架构设…...

大一新生组队玩转CUIT智能车:从零到跑完赛道,我们的STM32电磁循迹调车全记录

大一新生玩转CUIT智能车:STM32电磁循迹开发手记 第一次接触智能车竞赛时,我们团队五个人对着规则手册面面相觑——电磁感应、PID控制、差比和算法这些名词就像天书。作为刚结束高考的大一新生,唯一能确定的是:我们要用这块蓝色的小…...