当前位置: 首页 > article >正文

20轮对话后GPT开始“胡说八道“:我用Subagent分层架构让上下文永不清零

复杂任务跑20轮后Agent开始胡说八道——重复已做过的操作、提出已否决的方案。这不是模型变笨了是上下文窗口被污染。本文用Subagent分层架构让父Agent保持清醒子Agent承担脏活实现20轮对话上下文仅2k tokens。小李的噩梦当Agent开始失忆帮我审查src/utils.py的代码质量。小李对Agent说。Agent开始工作 read_file src/utils.py读到500行代码 bash pip install flake8安装检查工具 bash flake8 src/utils.py输出200个警告 read_file src/utils.py又读一遍因为忘了内容 ...20轮后Agent说“根据分析建议安装flake8检查代码…”小李懵了“你不是已经安装并运行过了吗”发生了什么复杂任务的中间过程安装工具的错误尝试、调试输出像垃圾一样堆积。模型开始失忆——忘记自己已经做过的事。核心洞察操作系统的进程隔离思想操作系统怎么处理进程隔离每个进程有独立内存空间一个进程崩溃不影响其他进程。这正是Subagent的灵感来源。Subagent分层模式用户任务父Agent战略层委派: PEP8检查Subagent A独立上下文返回摘要3个警告委派: 复杂度分析Subagent B独立上下文返回摘要复杂度正常汇总摘要生成报告单Agent模式用户任务Agent处理安装flake8运行flake8输出50行安装radon运行radon输出30行上下文爆炸30k tokens模型失忆项目经理与外包团队类比方案A自己全做单Agent模式所有细节都在你脑子里越来越乱最后忘了最初的客户需求是什么方案B委派外包Subagent模式团队A做市场调研给你一份5页摘要团队B做竞品分析给你一份5页摘要团队C做技术评估给你一份5页摘要你基于三份摘要写最终方案关键洞察父Agent保持干净的上下文只关心任务和结果Subagent在隔离环境中折腾中间过程不污染父上下文只返回最终摘要相当于进程的退出码和输出技术实现独立上下文是关键# ❌ 错误继承父Agent的上下文污染sub_messagesparent_messages[new_task]# ✅ 正确全新的独立上下文隔离sub_messages[{role:user,content:prompt}]这就像父Agent是项目经理知道整个项目背景Subagent是临时外包只知道自己要做的那一小块外包搞砸了就换一家不影响项目经理的决策代码实现50行核心逻辑defrun_subagent(prompt:str,max_iterations:int30)-str: 在独立上下文中运行Subagent 关键fresh messages不受父Agent历史影响 # ⭐ 核心创建全新的messages不继承父Agent历史sub_messages[{role:user,content:prompt}]foriinrange(max_iterations):# 安全限制responseclient.messages.create(modelMODEL,systemSUBAGENT_SYSTEM,# 子Agent的System Prompt不同messagessub_messages,toolsBASE_TOOLS,# ⭐ 子Agent只有基础工具不能递归spawnmax_tokens4000)sub_messages.append({role:assistant,content:response.content})# 如果Subagent完成了返回最终答案ifresponse.stop_reason!tool_use:returnextract_final_answer(response)# 执行工具调用resultsexecute_tools(response)sub_messages.append({role:user,content:results})return(stopped after max iterations)# 父Agent使用Subagentdefparent_agent_loop(messages):whileTrue:responsellm.call(messagesmessages,toolsPARENT_TOOLS)forblockinresponse.content:ifblock.typetool_use:ifblock.nametask:# ⭐ 父Agent有委派工具# 在隔离上下文中执行子任务outputrun_subagent(block.input[prompt])results.append({tool_use_id:block.id,content:output})else:# 父Agent自己执行基础工具results.append(execute_tool(block))messages.append({role:user,content:results})关键设计独立上下文sub_messages [{role: user, content: prompt}]工具集裁剪Subagent只有基础工具不能递归spawn防止爆炸摘要驱动Subagent只返回最终摘要不返回完整工具调用历史迭代限制max_iterations防止无限循环运行效果代码审查场景对比无Subagent单Agent模式Round 1-5: 检查PEP8安装flake8运行输出50行警告 Round 6-10: 检查复杂度安装radon运行输出30行分析 Round 11: 模型开始混淆根据PEP8检查我建议安装radon...已经做过了 Round 15: 模型忘记原始文件内容重新读取 Round 20: 上下文已满模型开始胡言乱语有Subagent分层模式Parent: Delegating: PEP8检查 Worker: 完成返回摘要3个警告已修复2个 Parent: Delegating: 复杂度分析 Worker: 完成返回摘要Cyclomatic复杂度平均5.2正常 Parent: Delegating: 安全检查 Worker: 完成返回摘要未发现SQL注入风险 Parent: 综合分析所有摘要生成最终报告差异单Agent20轮后失忆上下文爆炸~30k tokens分层模式父Agent只处理3个摘要综合上下文干净~2k tokens给你的团队3种Subagent设计模式模式1MapReduce分而治之# 分析src/目录下所有Python文件filesglob(src/**/*.py)# 为每个文件启动Subagent并行summaries[]forfileinfiles:summaryrun_subagent(f分析{file}的代码质量)summaries.append(summary)# 父Agent汇总final_reportsynthesize(summaries)模式2流水线工序分解# 代码审查流水线syntax_checkrun_subagent(检查语法错误)style_fixrun_subagent(f基于{syntax_check}修复代码风格)optimizationrun_subagent(f基于{style_fix}优化性能)模式3专家会诊多维度分析security_expertrun_subagent(从安全角度审查代码)performance_expertrun_subagent(从性能角度审查代码)maintainability_expertrun_subagent(从可维护性角度审查代码)# 父Agent综合三位专家意见final_reviewsynthesize(security_expert,performance_expert,maintainability_expert)避坑指南❌ 陷阱1让Subagent继承上下文# 错误把父Agent的messages传给Subagentsub_messagesparent_messages[{role:user,content:prompt}]这会污染Subagent的上下文失去隔离意义。❌ 陷阱2Subagent返回太多细节# 错误返回所有工具调用历史returnjson.dumps(sub_messages)# 太冗长Subagent应该返回结构化摘要父Agent只关心结果。❌ 陷阱3递归spawn# 危险Subagent也有task工具可能无限递归PARENT_TOOLSBASE_TOOLS[task_tool]# 父有taskCHILD_TOOLSBASE_TOOLS[task_tool]# 子也有task错误✅ 最佳实践明确边界在System Prompt中强调角色边界PARENT_SYSTEM你是项目经理。专注于 - 任务分解与委派 - 结果汇总与综合 - 不处理具体实现细节 SUBAGENT_SYSTEM你是技术专家。专注于 - 高效完成分配的任务 - 返回简洁的结构化摘要 - 不描述过程只描述结果 总结分层架构的威力Subagent不是多此一举而是复杂任务管理的必要分层战略层父Agent保持清醒掌控全局战术层Subagent承担脏活隔离污染这就像操作系统的进程隔离——不是多余的复杂性而是可靠性的基石。 互动投票你的场景中哪种任务最适合用SubagentA. 代码审查多维度分析B. 数据 processing大批量文件C. 重构任务多文件协调D. 探索性任务可能失败的尝试思考题你的场景中哪些任务适合委派给Subagent如何设计Subagent的返回格式让父Agent能高效汇总如何防止Subagent滥用递归限制预算控制

相关文章:

20轮对话后GPT开始“胡说八道“:我用Subagent分层架构让上下文永不清零

复杂任务跑20轮后,Agent开始"胡说八道"——重复已做过的操作、提出已否决的方案。 这不是模型变笨了,是上下文窗口被污染。本文用Subagent分层架构,让父Agent保持清醒,子Agent承担脏活,实现20轮对话上下文仅…...

如何分析AWR中的Top SQL_通过执行次数与物理读定位低效查询

Top SQL中Executions与Physical Reads需结合分析:执行次数多但物理读低可能暴露应用逻辑缺陷,物理读/执行>1000在OLTP中属异常,需结合执行计划、对象访问、缓存命中率等综合判断根因。怎么看 Top SQL 里的执行次数和物理读是否异常awr 报告…...

c++如何读取BMP位图文件并精确提取每个像素点的RGB值【实战】

直接用fread读BMP会错乱因像素数据BGR存储、行末补零对齐且从左下到右上排列;需跳过bfOffBits,按每行字节数对齐读取并反向索引,再手动转为RGB。为什么直接用 fread 读 BMP 文件会得到错乱的 RGB 顺序?BMP 文件头和信息头之后&…...

2026.4.5总结

今天是清明节,祭祖的日子。晚上跟妹妹和姐姐捞了不少家常。聊的是关于上一年自己做过的一些愚蠢事。读书的时候没接触过社会,导致在毕业时,吃了不少亏,也被坑了不少钱。我妹称这叫见世面。确实,刚毕业时,感…...

Python集合怎么去重_Set数据结构特性与交并差集合运算

set()去重不生效因只支持不可变类型,含列表、字典等会报TypeError;需转为可哈希形式如tuple(sorted(d.items()));自定义类须实现__hash__和__eq__;set无序,保序用dict.fromkeys();符号运算要求两边为set&am…...

CSS如何实现文字加粗而不改变宽度_利用text-shadow模拟加粗

会,text-shadow模拟加粗因软边阴影导致文字模糊,尤其小字号或Retina屏;需设blur-radius为0,用多方向1px硬边阴影(如-1px 0 0, 1px 0 0等)并启用GPU加速。text-shadow模拟加粗会导致文字模糊?会&…...

硬件发烧友玩法:多GPU分配OpenClaw调用Qwen3-32B

硬件发烧友玩法:多GPU分配OpenClaw调用Qwen3-32B 1. 为什么需要多GPU分配 作为一个长期折腾AI本地部署的硬件爱好者,我最近在尝试用OpenClaw对接Qwen3-32B模型时遇到了显存瓶颈。单卡RTX4090D的24GB显存在处理复杂任务时经常捉襟见肘,特别是…...

揭秘openGauss向量化执行引擎代价模型

揭秘openGauss向量化执行引擎代价模型openGauss的向量化执行引擎针对列存,生成执行计划后根据配置项是否开启直接决定是否将执行计划转换成向量化执行计划来执行。若向量化执行引擎在行存上执行就需要将数据转换成VectorBatch即列存的形式才可执行,这个转…...

Spring AI:Java开发者的AI应用开发利器

Spring AI:Java开发者的AI应用开发利器 一、什么是Spring AI Spring AI是一个专为AI工程应用设计的AI应用程序框架,它将AI模型的能力集成到Spring生态系统之中。作为Spring家族的新成员,Spring AI秉承了Spring的设计理念,为Java…...

C语言内存管理常见错误与防御性编程技巧

1. 指针未初始化引发的段错误1.1 结构体成员指针未初始化在C语言中,结构体内部的指针成员并不会自动分配内存。很多初学者会犯这样的错误:struct student {char *name;int score; }stu;int main() {strcpy(stu.name, "Jimy");stu.score 99;re…...

将浮点数转换成字符串时的注意事项

String s 11625907.5798 "";这串代码存入s的不是“11625907.5798”,而是“1.16259075798E7” ,用科学计数法进行存储,所以要注意字符串的长度加了2...

RoboCore SMW_SX1276M0 LoRaWAN协议栈开发指南

1. 项目概述RoboCore SMW_SX1276M0 是一款面向嵌入式物联网终端的 LoRaWAN 协议栈封装库,专为 RoboCore LoRaWAN Bee v2.0 模块设计。该模块核心采用 Semtech SX1276 射频收发器,集成高灵敏度 LoRa 调制解调器、前向纠错(FEC)、自…...

注重自己的感受 您的感受才是衡量一切的标准

人这一辈子,最拖垮你的,从来不是没钱、没机会、没天赋,是刻在骨子里的 “模糊感”。你肯定有过这种时刻:睡前刷了两小时手机,看别人搞副业月入五位数就热血沸腾,看别人裸辞环游世界就心潮澎湃,看…...

Go的unsafe.Pointer与uintptr:手动内存管理的风险与收益

Go语言以其简洁的内存管理模型著称,但标准库中的unsafe包却为开发者提供了手动操作内存的能力。unsafe.Pointer与uintptr这两个类型,允许绕过Go的类型安全检查,直接与底层内存交互。这种能力虽然强大,却也伴随着极高的风险。本文将…...

【Overview Effect】 -在抵达月球之前,让我们最后一次眺望地球

“当我们前往月球时,我们专注于探索月球,但实际上我们发现的是地球。” —— 这种视角让人们意识到,地球不仅是家园,更是一艘在寒冷宇宙中孤立无援的“救生船”。在抵达月球之前,让我们最后一次眺望地球。这张地球照片…...

OpenClaw排错大全:Phi-3-mini-128k-instruct接口连接失败7种解决方案

OpenClaw排错大全:Phi-3-mini-128k-instruct接口连接失败7种解决方案 1. 问题背景与排查思路 上周我在本地部署Phi-3-mini-128k-instruct模型时,遇到了OpenClaw连接失败的棘手问题。控制台不断报错"Model connection timeout",但…...

告别抓瞎!手把手教你用Wireshark解密TLS 1.3流量(附SSLKEYLOGFILE环境变量配置)

从密文到明文:实战解密TLS 1.3流量的完整指南 当你在调试一个API接口时,发现请求总是返回异常状态码,但查看Wireshark抓包却只能看到一堆加密的TLS 1.3数据包,这种"睁眼瞎"的感觉确实令人沮丧。TLS 1.3作为目前最安全的…...

告别龟速下载!在VMware里给UOS 20和CentOS 8配置本地yum源(保姆级图文)

企业级虚拟化环境下的高效软件管理:UOS与CentOS本地源深度配置指南 当你在企业内网或隔离开发环境中,是否经历过这样的场景:急需安装一个关键依赖包,却因为网络限制或带宽瓶颈,眼睁睁看着进度条以KB/s的速度缓慢爬行&a…...

OpenClaw开源贡献:为Qwen3.5-9B-AWQ-4bit开发社区技能

OpenClaw开源贡献:为Qwen3.5-9B-AWQ-4bit开发社区技能 1. 为什么选择为OpenClaw开发技能? 去年冬天,当我第一次在本地部署OpenClaw时,就被它的设计理念所吸引——一个真正能在个人电脑上运行的AI智能体框架。但很快我发现&#…...

[复现]神经网络(NN)+模型预测控制(MPC)算法、四旋翼无人机+非线性机器人汽车系统研究(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…...

如何高效提取Android OTA包:payload-dumper-go完整使用指南

如何高效提取Android OTA包:payload-dumper-go完整使用指南 【免费下载链接】payload-dumper-go an android OTA payload dumper written in Go 项目地址: https://gitcode.com/gh_mirrors/pa/payload-dumper-go 在Android系统开发和维护过程中,处…...

用Docker三分钟部署MetaGPT开发环境(附LLM本地化方案)

三分钟容器化部署MetaGPT全栈开发环境实战指南 容器化部署的价值与优势 在当今快速迭代的AI开发领域,环境配置一直是困扰开发者的首要难题。传统部署方式需要处理Python版本管理、依赖冲突、CUDA驱动兼容等复杂问题,而容器化技术为这一痛点提供了优雅的解…...

seo北京优化和网站内容优化有什么联系

SEO北京优化与网站内容优化的紧密联系 在当今互联网时代,对于任何企业来说,网站的优化是至关重要的一环。尤其是在竞争激烈的北京市场,SEO(搜索引擎优化)和网站内容优化之间的关系更加紧密。本文将从问题分析、原因说…...

西门子1500T插补控制从入门到精通:手把手教你配置直线与圆弧轨迹(附程序源码)

西门子1500T插补控制从入门到精通:手把手教你配置直线与圆弧轨迹(附程序源码) 在工业自动化领域,精确控制多轴协同运动一直是核心挑战。想象一下机械臂需要画一个完美的圆,或者CNC机床要切割复杂曲线——这些场景都离不…...

SAP MM新手避坑指南:手把手教你搞定UB型STO库存调拨(从ME21N到MIGO全流程)

SAP MM新手避坑指南:手把手教你搞定UB型STO库存调拨(从ME21N到MIGO全流程) 刚接触SAP MM模块的新手,面对库存转储订单(STO)这个看似简单实则暗藏玄机的功能时,往往会在UB型订单的创建和操作过程…...

开发环境神器:OpenClaw+Qwen3-14B镜像自动化调试与日志分析

开发环境神器:OpenClawQwen3-14B镜像自动化调试与日志分析 1. 为什么开发者需要自动化调试助手 作为一名全栈开发者,我每天要面对各种复杂的调试场景:前端页面渲染异常、后端接口返回500错误、数据库查询性能低下...传统的调试方式需要手动…...

从零到一:基于XXL-JOB构建企业级分布式任务调度中心实战指南

1. 为什么选择XXL-JOB作为分布式任务调度方案 第一次接触分布式任务调度时,我像大多数开发者一样面临选择困难。市面上既有成熟的商业产品,也有各种开源方案。经过多个项目的实战验证,XXL-JOB以其轻量级架构和易用性脱颖而出。这个由国内开发…...

CVPR2025新思路:把对抗扰动本身当成‘训练数据’,聊聊PSP-UAP背后的设计哲学

CVPR2025新思路:对抗扰动作为训练数据的革命性设计哲学 对抗样本研究领域正在经历一场范式转变——从单纯制造攻击工具到重新思考扰动本身的语义价值。PSP-UAP(Pseudo-Semantic Prior Universal Adversarial Perturbation)的突破性在于&#…...

从零到一:STM32 SPWM逆变器设计全流程解析

从零到一:STM32 SPWM逆变器设计全流程解析 在新能源和电力电子领域,逆变器作为直流转交流的关键设备,其设计能力已成为工程师的核心竞争力之一。而基于STM32的SPWM逆变器设计,因其高性价比和灵活可控的特点,正成为工业…...

Manim进阶技巧:如何用Python代码制作复杂的数学动画

Manim进阶技巧:如何用Python代码制作复杂的数学动画 数学可视化是理解抽象概念的有力工具,而Manim作为3Blue1Brown开发的数学动画引擎,已经成为科研、教育和科普领域的首选工具。当你已经掌握了基础图形的创建和简单动画效果后,如…...