当前位置: 首页 > article >正文

Anthropic工程师亲述:打造Claude Code,我学会了“像Agent一样思考”

大家好今天分享一篇AI圈近期很火的实战干货——来自Anthropic核心工程师Thariq Shihipartrq212的深度复盘主题是《Lessons from Building Claude Code: Seeing like an Agent》《构建Claude Code的经验像Agent一样看世界》。作为Claude Code的核心开发者Thariq没有讲空泛的理论而是把团队在搭建Agent工具过程中踩过的坑、迭代的思路拆成了4个真实案例每一个都能直接复用在我们自己的Agent设计中。0 核心前提Agent设计最难的不是“加工具”而是“选对工具”在开始分享案例前先明确一个核心观点——构建Agent框架最关键的不是“工具越多越好”而是“工具要匹配模型的能力”。Thariq用一个很形象的比喻帮我们理解这个逻辑假设你被困在一道复杂数学题里需要什么工具答案完全取决于你自身的能力纸笔是最低配但会被手动计算限制效率计算器更高效但你得会用它的高级功能电脑最快最强但你必须懂代码、会执行。Agent的工具设计也是如此给模型的工具既不能太简单限制能力也不能太复杂模型不会用。而要找到这个平衡点唯一的方法就是——仔细观察模型的行为学会“像Agent一样思考”。下面就是Thariq团队在打造Claude Code时通过真实实践总结的4个核心经验每一个都带着具体的迭代过程干货拉满。1 案例1从“混乱提问”到“高效交互”AskUserQuestion工具的3次迭代核心目标让Claude能更自然、更低成本地向用户提问比如确认需求、补充信息提升双方的沟通效率。一开始团队走了不少弯路最终才找到最优解整个过程分为3个阶段尝试1在现有工具里“凑数”语义混乱最开始图省事直接给现有工具ExitPlanTool加了一个参数让模型在提交计划时顺便带上要问用户的问题。结果很糟糕模型一边要做计划一边要提问逻辑混乱如果用户的回答和计划冲突系统不知道该优先信哪一个甚至会出现模型反复调用工具、陷入循环的情况。结论工程上最简单但语义不清晰完全不可行。尝试2修改输出格式稳定性差接着团队尝试让Claude用固定的Markdown格式提问比如带选项的项目符号再由前端解析成可视化UI。这个思路没问题但实际用起来发现模型根本“不听话”有时会多写无关内容有时会漏了选项有时直接自己换了格式。这里藏着一个关键教训让模型“模仿结构化输出”和让模型“真正调用结构化接口”可靠性完全不是一个等级。尝试3专门做工具完美适配最终团队开发了专门的AskUserQuestion工具Claude可以在任何需要的时候调用它工具触发后UI会弹出规范的问题列表并且暂停Agent的运行直到用户完成回答。这个工具的优势很明显输出结构稳定、可以强制包含选项、交互顺滑还能在不同场景下复用。最关键的是——Claude喜欢用而且能用对。毕竟一个再强大的工具如果模型不会用、不知道什么时候用也是白费功夫。2 案例2随模型进化而迭代从Todo到Task的升级这个案例告诉我们工具不是一成不变的随着模型能力的提升曾经的“帮手”可能会变成“枷锁”。早期Todo工具只为“不跑偏”Claude Code刚推出时模型的能力还不够强很容易忘记自己的目标。于是团队给了它一个TodoWrite工具让它创建待办列表并且在工作中逐项勾选。即便如此模型还是经常忘事团队只能每5轮就插入一次系统提醒反复强调目标。后期Task工具适配更强模型随着模型不断升级副作用出现了模型不再需要频繁提醒固定的Todo列表反而限制了它的灵活调整而且不同子代理之间也无法共享和协同Todo状态。于是团队用Task工具替换了TodoWrite工具——两者的核心区别的是Todo只是简单的待办列表目的是“让模型别跑偏”Task更像一个可共享的任务载体支持子任务、依赖关系还能跨代理同步更新、修改、重组。关键教训做Agent工具设计一定要不断重新审视“我们需要什么工具”跟着模型的能力一起迭代不能一成不变。3 案例3范式转变让模型“自己找上下文”对Claude来说“找到正确的上下文”比如代码库、文档是很重要的能力。早期团队用的是大家熟悉的RAG向量数据库帮模型提前找好上下文再喂进去。RAG很快但有三个致命问题需要预先索引和维护在不同环境下容易出问题更重要的是——上下文是系统“替”模型找的不是模型自己找到的剥夺了模型的主动性。既然Claude能自己上网搜索为什么不能让它自己搜索代码库于是团队给了Claude一个Grep工具让它自己搜索文件、自己探索、自己构建上下文。这是一个核心的范式转变过去系统替模型准备好所有上下文现在给模型探索上下文的能力让它自己找。后来团队又引入了“渐进式披露”的思路让Agent通过探索逐步发现相关的上下文——比如Claude可以读取技能文件这些文件又能引用其他文件模型可以递归读取慢慢找到自己需要的信息。经过一年多的优化Claude已经从“几乎无法自己构建上下文”进化到能在多层文件中嵌套搜索精准找到需要的内容。4 案例4少即是多不新增工具也能扩展能力目前Claude Code只保留了约20个核心工具团队对新增工具的门槛要求很高——因为每多一个工具模型就多一个决策点反而会降低效率。举个例子团队发现Claude对“如何使用Claude Code本身”了解不够比如用户问“怎么配置MCP”“斜杠命令是什么”它经常答不好。如果把所有相关文档都塞进系统提示会让上下文变得臃肿还会干扰Claude的主任务——写代码。于是团队又用了“渐进式披露”的思路没有新增工具而是做了一个“Claude Code指南子代理”当用户问的是关于Claude Code自身的问题时提示Claude调用这个子代理而这个子代理专门负责搜索相关文档、返回精准答案。虽然不是完美解决方案但比之前好太多——关键是在不新增工具、不增加模型决策负担的前提下成功扩展了Claude的能力。最后Agent工具设计是艺术也是科学Thariq在文章结尾强调如果你想找一套“构建Agent工具”的严格规则很遗憾没有这样的规则。为模型设计工具既是一门科学需要遵循技术逻辑也是一门艺术需要结合模型能力、Agent目标、运行环境灵活调整。而最核心的方法论只有一句话多实验、读输出、尝新方法。像Agent一样看世界。

相关文章:

Anthropic工程师亲述:打造Claude Code,我学会了“像Agent一样思考”

大家好,今天分享一篇AI圈近期很火的实战干货——来自Anthropic核心工程师Thariq Shihipar(trq212)的深度复盘,主题是《Lessons from Building Claude Code: Seeing like an Agent》(《构建Claude Code的经验&#xff1…...

**标题:发散创新:基于Python的多模态融合实践——从图像到文本的跨域语义对齐**在人工智能快速发展的今天,**

标题:发散创新:基于Python的多模态融合实践——从图像到文本的跨域语义对齐 在人工智能快速发展的今天,多模态融合已成为提升模型理解能力的关键路径之一。不同于单一模态的数据处理方式(如仅用图像或仅用文本)&#x…...

STM32智能灯光控制实战:红外+语音+按键三合一方案(附完整代码)

STM32智能灯光控制实战:红外语音按键三合一方案(附完整代码) 在智能家居领域,灯光控制系统正经历着从单一控制向多模态交互的演进。传统方案往往局限于单一控制方式,而现代用户期望的是能够根据场景自由切换的无缝体验…...

基于爬山搜索法的风力发电MPPT控制Simulink仿真探究

基于爬山搜索法的风力发电MPPT控制Simulink仿真模型,包括定步长与变步长算法,变步长仿真效果更好,发电机采用的是永磁同步发电机,在风速改变情况下,变步长跟踪的速度更快、偏差更小。在风力发电系统中,最大…...

我用 AI 生成测试用例,效率提升 3 倍但发现了这 5 个问题

专栏:《AI 测试实战手册》第 5 篇 作者:一线测试工程师 适合人群:手工测试转型、自动化测试提效、测试人搞副业开篇:真实项目案例 这是我上个月在一个电商项目中的真实经历。 项目背景: 新上线一个会员积分系统需求文档…...

手把手教你用Playwright+TestNG搭建H5巡检系统:从数据库驱动到钉钉告警

构建企业级H5自动化巡检系统:Playwright与TestNG深度整合实战 在移动优先的互联网时代,H5页面已成为企业与用户交互的核心门户。一次意外的白屏或功能异常,可能导致数百万的营收流失和品牌信任危机。本文将带你从零构建一套完整的H5自动化巡检…...

高价加了根24g的内存条,试试qwen 3.5 35b-3b的模型本地部署速度如何。关闭思考模式

1,下载lmstuduio https://lmstudio.ai/ 2, 执行: #先添加执行权限 chmod x LM-Studio-0.4.6-1-x64.AppImage#执行 ./LM-Studio-0.4.6-1-x64.AppImage --no-sandbox 在这个模型库里面搜索qwen3.5-35ba3b,下载那个unsloth的。 关闭思考模式:在…...

2026 九大 AI 毕业论文格式排版工具实测:Paperxie 领衔,精准适配 4000 + 高校模板

paperxie-免费查重复率aigc检测/开题报告/毕业论文/智能排版/文献综述/aippthttps://www.paperxie.cn/format/typesettinghttps://www.paperxie.cn/format/typesetting 毕业季的收尾阶段,格式排版始终是本科生、研究生跨越毕业门槛的 “关键一关”。从字体行距的精准…...

效率翻倍!统信UOS批量重命名文件的4种玩法,太实用了

原文链接:效率翻倍!统信UOS批量重命名文件的4种玩法,太实用了 在日常办公中,很多人都会遇到这样一个问题: 几十个文件需要统一改名 图片、文档命名混乱 一个一个改名太浪费时间 如果你正在使用统信UOS桌面操作系统…...

小米新模型让社区对 DeepSeek V4 耿耿于怀:但真正的变量,可能根本不在 benchmark 上

小米新模型让社区对 DeepSeek V4 耿耿于怀:但真正的变量,可能根本不在 benchmark 上 最近,Reddit 的 LocalLLaMA 社区里出现了一条很有代表性的讨论帖:“What the hell is Deepseek doing for so long?” 帖子的情绪并不复杂&…...

Qwen3.5-9B可审计部署:模型权重可验证,推理过程可追溯

Qwen3.5-9B可审计部署:模型权重可验证,推理过程可追溯 1. 项目概述 Qwen3.5-9B是通义千问团队推出的新一代多模态大语言模型,基于创新的混合架构设计,在保持高效推理的同时,提供了前所未有的可审计能力。该模型特别适…...

Java开发必看:NullPointerException的5种常见场景及实战避坑指南

Java开发必看:NullPointerException的5种常见场景及实战避坑指南 在Java开发中,NullPointerException(NPE)堪称最令人头疼的运行时异常之一。无论是初入职场的新手,还是经验丰富的老手,都难免会在某个深夜被…...

AI驱动的智能视频处理:FunClip精准剪辑工具完全指南

AI驱动的智能视频处理:FunClip精准剪辑工具完全指南 【免费下载链接】FunClip Open-source, accurate and easy-to-use video clipping tool, LLM based AI clipping intergrated || 开源、精准、方便的视频切片工具,集成了大语言模型AI智能剪辑功能 项…...

Fiber分布式追踪采样率:基于请求路径的动态调整

Fiber分布式追踪采样率:基于请求路径的动态调整 【免费下载链接】fiber ⚡️ Express inspired web framework written in Go 项目地址: https://gitcode.com/GitHub_Trending/fi/fiber 在现代微服务架构中,分布式追踪是排查系统问题、优化性能的…...

毕设程序java加盟平台推荐可视化系统 基于Java的连锁品牌加盟决策支持系统 SpringBoot框架下的创业加盟智能匹配与数据可视化平台

毕设程序java加盟平台推荐可视化系统ktdx2ldg (配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。在当今的商业环境中,加盟连锁模式因其较低的创业风险和成熟的运营模式而…...

喜报|腾讯云TDSQL TCCP(MySQL)理论高分通关!解锁数据库高薪赛道,云贝教育助你一战成“证”

热烈祝贺云贝教育CHEN学员在腾讯云TDSQL TCCP(MySQL版)高级认证理论考试中斩获高分佳绩!顺利突破认证核心关卡,用实力诠释专业素养,用成绩彰显学习成效!成绩展示或许有小伙伴会问TDSQL TCCP(MySQL版)认证到底有多大价值?为什么越来…...

从代码反推UML类图:用Rational Rose 2007快速为现有Java/Python项目生成设计文档

逆向工程实战:用Rational Rose 2007从Java/Python代码生成UML类图 接手遗留项目时,面对数万行未经注释的代码就像闯入一座没有地图的迷宫。我曾花费两周时间逐行阅读某个电商平台的订单模块,直到发现Rational Rose 2007的逆向工程功能可以将代…...

Apktool ResFloatValue:Android APK 浮点数资源值的终极解析指南

Apktool ResFloatValue:Android APK 浮点数资源值的终极解析指南 【免费下载链接】Apktool A tool for reverse engineering Android apk files 项目地址: https://gitcode.com/GitHub_Trending/ap/Apktool Apktool 作为一款强大的 Android APK 逆向工程工具…...

毕设程序java仿淘宝购物网站的设计与实现 基于SpringBoot的在线电商交易平台的设计与实现 Java网络商城系统的设计与实现

毕设程序java仿淘宝购物网站的设计与实现x92b5h61 (配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。随着互联网技术的飞速发展,电子商务已经深度融入人们的日常生活&am…...

CLLC对称双向全桥谐振变换器仿真模型 - 变频控制下的输出电压闭环运行与自动正反向切换

CLLC对称双向全桥谐振变换器仿真模型。 电路采用变频控制,实现输出电压闭环运行。 正、反向两个方向的输出波形效果良好。 模型可实现自动正反向运行。 如展示图二所示,0.2s时由正向切换为反向。 运行环境有matlab/simulink等 ~ 搞电力电子的兄弟应该都懂…...

OSX-KVM网络隔离方案:构建安全的macOS测试环境终极指南

OSX-KVM网络隔离方案:构建安全的macOS测试环境终极指南 【免费下载链接】OSX-KVM Run macOS on QEMU/KVM. With OpenCore Big Sur Monterey Ventura support now! Only commercial (paid) support is available now to avoid spammy issues. No Mac system is re…...

轴承(二维圆柱、二维球模型及三维深沟球)有限元模型与ANSYS仿真计算指南

轴承(二维圆柱和二维球模型)和三维深沟球有限元模型画好网格,可直接拿去ansys仿真计算,适合小白学习上手较快。 以上都是博主学习过程中的一部分成果,保证真实有效。 可以看到轴承的动态受力图。 另外,资料…...

STM32F411+CUBEMX驱动WS2812B全流程:从PWM配置到DMA调优实战

STM32F411CUBEMX驱动WS2812B全流程:从PWM配置到DMA调优实战 在嵌入式LED控制领域,WS2812B因其独特的单线通信协议和丰富的色彩表现力,成为创客和工程师们的热门选择。然而,这种智能LED的精确时序控制对微控制器提出了严苛要求——…...

GitHub Linguist依赖管理终极指南:Ruby gems与外部库整合技巧

GitHub Linguist依赖管理终极指南:Ruby gems与外部库整合技巧 【免费下载链接】linguist Language Savant. If your repositorys language is being reported incorrectly, send us a pull request! 项目地址: https://gitcode.com/GitHub_Trending/li/linguist …...

LeetCode图算法实战:从省份数量到猫和老鼠的5种必会解法

LeetCode图算法精要:5种核心解法与实战技巧 1. 图算法基础与高频问题分类 图算法是算法面试中的核心考察点,掌握常见解题模式能显著提升解题效率。我们将LeetCode高频图问题分为以下几类: 连通性问题:省份数量、封闭岛屿统计路径问…...

小程序启动优化:冷热启动机制与强制更新策略解析

1. 小程序启动机制:冷启动与热启动的底层逻辑 第一次打开小程序时,页面加载总感觉有点慢?而第二次打开却快如闪电?这背后就是冷启动和热启动的差异在起作用。作为开发者,理解这两种启动方式的运行机制,是优…...

Exchange Server 2019用户必看:如何零成本升级到订阅版(附详细步骤)

Exchange Server 2019零成本升级订阅版全流程指南 对于仍在运行Exchange Server 2019的企业IT团队来说,2025年将迎来一个关键转折点。微软最新推出的订阅版解决方案,不仅延续了企业级邮件系统的核心功能,更通过灵活的许可模式降低了长期使用成…...

虚拟控制器驱动技术革新:ViGEmBus从基础配置到深度开发的实战指南

虚拟控制器驱动技术革新:ViGEmBus从基础配置到深度开发的实战指南 【免费下载链接】ViGEmBus 项目地址: https://gitcode.com/gh_mirrors/vig/ViGEmBus 在游戏开发与外设兼容领域,虚拟控制器技术正成为连接多样化输入设备与标准化系统接口的关键…...

ThinkPHP8.0与PHP8.1兼容性实测:这些新特性让你的开发效率翻倍

ThinkPHP8.0与PHP8.1深度兼容指南:解锁性能飞跃的实战密码 当PHP8.1的JIT编译器遇上ThinkPHP8.0的现代化架构,会产生怎样的化学反应?作为长期深耕企业级PHP开发的实践者,我完整经历了从PHP7.4到8.1的升级历程,特别是在…...

一站式毕业助手:选题、写作、答辩全搞定

作为一个去年从“选题迷茫”到“答辩优秀”一路摸爬滚打过来的老学长,今天我把亲测好用的5款论文神器一次性分享出来。不整虚的,只说怎么用、解决什么问题。希望能帮你少熬几个大夜,顺利上岸。一、写不出?这两款帮你“搭框架”痛点…...