当前位置: 首页 > article >正文

Anthropic 百万行代码库的官方最佳实践

随着AI 编程智能体的越来越深入到日常工作相信你也遇到了大型项目和和小型代码库完全不同的场景。正好最近也是在做大型项目的重构开发刷到这篇来自 Anthropic 官方的文章。系统梳理了 Claude Code 在大规模代码库中的运作机制、Harness 架构的七个扩展点以及在项目中成功使用的三种配置模式。本文介绍的模式具有普遍适用性可以为考虑采用 AI 智能体编程的团队提供一个业内领先公司的工程实践。如何浏览大型项目的代码首先需要解决的问题就是如何浏览代码库。Claude Code 会像开发工程师一样遍历目录、读取代码文件、用 grep 精确查找所需内容、在代码库中追踪引用关系。记得早期大家都是依赖 RAG 检索对整个代码库做嵌入索引查询时检索相关片段。但是在大规模场景下索引的速度跟不上提交速度。等到查询时它反映的已经是几天、几周甚至几小时前的代码了。返回的结果可能是两周前已重命名的函数或者是上个版本中已删除的模块而且没有任何过时提示。所以 Claude Code 的解决方案是采用 智能Agentic搜索。不需要RAG模式的嵌入embedding没有集中式索引无论多少工程师同时提交新代码每个人的实例都直接基于实时代码库工作。相应的代价就是Claude 需要足够的起始上下文才能知道去哪找。这就意味着 Claude 导航质量取决于代码库的配置程度核心就是 CLAUDE.md 文件和 Skills 的分层上下文设计。如果在十亿行代码库里模糊搜索就会遇到上下文窗口的限制而导致大模型什么都干不了。Harness框架与模型同等重要一个常见的误解是Claude Code 的能力完全取决于所用模型因为 Opus 4.7 是目前最好的大模型。实际上围绕模型构建的 Harness 生态即框架对实际表现的影响超过模型本身。Anthropic 把 Harness 拆成七个组件从基础到高级层层递进。第一层CLAUDE.md 文件CLAUDE.md 是 Claude 每个会话自动读取的上下文文件。根目录文件把握全局子目录文件描述本地惯例。因为每个会话都会加载内容必须聚焦在广泛适用的信息上否则会拖累性能。→ CLAUDE.md 文档https://code.claude.com/docs/zh-CN/memory第二层Hooks 让配置自我改进大多数团队把 Hooks 看作防止 Claude 犯错的脚本。但更有价值的用法是持续改进。Stop Hook 可以在上下文还新鲜时反思刚才的会话提出 CLAUDE.md 更新建议。Start Hook 可以动态加载团队专属上下文每个开发者打开对应模块时自动获得正确配置。对于 linting、格式化等自动化检查Hooks 比让 Claude 记住指令更可靠、更一致。→ Hooks 指南https://code.claude.com/docs/zh-CN/hooks-guide在这篇文章中万字深研 Harness 工程实践指令遵从率 20%Hook 执行率 100%研发团队就充分使用了Claude Code 的Hook 机制设计了8 门状态机8-Gate State Machine横跨七个阶段16个生命周期来保证智能体在大型开发项目中的指令遵循率。第三层Skills 按需加载专业知识大型代码库有几十种任务类型不可能每种专业知识都在每个会话中常驻。Skills 通过渐进式披露解决这个问题把专业工作流和领域知识卸载只在任务需要时加载。比如安全审查 Skill 在 Claude 评估代码漏洞时才加载文档处理 Skill 在代码变更需要更新文档时才加载。Skills 还可以限定在特定路径。支付服务团队把部署 Skill 绑定到自己的目录别人在仓库其他位置工作时它绝不会自动加载。→ Skills 文档https://code.claude.com/docs/zh-CN/skills第四层使用插件分发成熟解决方案大型代码库的通病是好的配置容易停留在内部团队层面。插件机制把 Skills、Hooks 和 MCP 配置打包成一个可安装包新工程师安装后第一天就能获得和资深工程师完全相同的上下文和能力。插件的更新可以通过插件托管市场统一分发。Anthropic 举了一个例子某大型零售组织构建了一个 Skill把 Claude 连接到内部分析平台业务分析师不用离开工作流就能拉取绩效数据。他们在全公司推广前先把这个 Skill 打包成插件分发。→ Plugins 文档https://code.claude.com/docs/zh-CN/plugins第五层语言服务器协议LSP 集成按函数/变量名查找大型代码库的 IDE 通常已经在运行语言服务器协议LSP提供跳转到定义和查找所有引用。把这一能力暴露给 Claude它就获得了符号级精确导航跟随函数调用找到定义、跨文件追踪引用、区分不同语言中的同名函数。没有 LSPClaude 只做文本模式匹配很容易命中错误的符号。一家大型企业软件公司在全组织推广 Claude Code 之前先部署了 LSP 集成目的就是让 C 和 C 代码的导航在大规模下保持可靠。对于多语言代码库这是投资回报率最高的配置之一。→ 代码智能 Pluginhttps://code.claude.com/docs/zh-CN/discover-plugins#code-intelligence我之前的文章有介绍开源的项目实现了类似的功能GitNexus 把代码库变成知识图谱审核 AI 产出更清晰改 Bug 更精准。可以将整个代码库索引成一个知识图谱追踪每一个依赖、调用链、功能集群和执行流程然后通过 MCP 协议暴露给 AI 代理。第六层MCP 服务器连接一切MCP 服务器让 Claude 连接它原本无法触及的内部工具、数据源和 API。成熟的团队把结构化搜索暴露为 Claude 可以直接调用的工具。其他团队则连接内部文档、工单系统或分析平台。这一层功能和操作相信大家多少都用过。比如通过MCP连接腾讯文档从生成到分享我把 OpenClaw 腾讯文档技能跑通了。又比如 WorkBuddy 默认提供的连接器管理以及可自定义的连接器。第七层子智能体Subagents探索与编辑分离Subagent 是拥有独立上下文窗口的隔离 Claude 实例。它接收任务、完成工作、只把最终结果返回给父 Agent。一些团队的做法是先启动一个只读 Subagent 梳理子系统并把发现写入文件然后主 Agent 在掌握全局后执行编辑。→ Subagents 文档https://code.claude.com/docs/zh-CN/sub-agentsClaude Code 的 Harness 架构为了更直观地对比官方给了一张表组件是什么何时加载最适合常见误区CLAUDE.md自动读取的上下文文件每个会话项目惯例、代码库知识把该放 Skill 的内容塞进来Hooks事件触发的脚本事件触发自动化行为、捕获经验用 Prompt 做本该自动运行的事Skills任务类型的打包指令按需加载跨会话的复用专业知识全塞进 CLAUDE.mdPluginsSkillsHooksMCP 打包配置后始终可用组织内分发好方案让好配置停在个人层面LSP语言服务器的实时智能配置后始终可用符号导航、类型错误检测以为它是自动的MCP 服务器外部工具数据连接配置后始终可用访问内部工具基础没搭好就搞 MCPSubagents独立 Claude 实例被调用时探索编辑分离、并行同一会话里又探索又编辑三种配置模式1. 让代码库可导航Claude 的能力上限取决于它能否找到正确上下文。加载太多会拖性能加载太少会让它盲目探索。下面六条是成功部署中较好的做法CLAUDE.md 精简且分层。Claude 遍历目录树时叠加加载根文件只管全局指针和关键注意事项其他内容都会变成噪声。在子目录中初始化不在仓库根目录。作用域限定在任务实际相关的部分时效果最好。Claude 会自动向上遍历并加载沿途的每个 CLAUDE.md所以根级别上下文不会丢。按子目录限定测试和 lint 命令。只改了一个服务就跑全量测试会超时并浪费上下文。子目录级的 CLAUDE.md 应指定该部分适用的命令。用 排除生成文件、构建产物和第三方代码。在.claude/settings.json中提交permissions.deny规则排除项受版本控制团队每个人自动获得相同的噪声过滤。开发代码生成器的人可以在本地设置中覆盖项目级排除项不影响其他人。当目录结构不够清晰时构建代码库地图。在仓库根目录放一个轻量 markdown 文件列出每个顶层文件夹及一行描述。对于数百个顶层文件夹的代码库用分层方式根文件只描述最高层子目录 CLAUDE.md 提供下一层细节。使用语言服务协议LSP按名称精确定位。grep 查找命令常见函数名可能返回几千个结果Claude 会浪费上下文逐个打开判断。LSP 只返回同一函数名/变量名的引用过滤在读取之前就完成了。需要注意的是分层的 CLAUDE.md 方案在极端情况下也会失效比如几十万文件夹、几百万文件的代码库或非 Git 版本控制的遗留系统。2. 随模型进化维护 CLAUDE.md为当前模型写的规则可能在下一个模型上变成束缚。比如一条告诉 Claude 每次只改一个文件的规则帮助了早期模型不跑偏但会阻止新模型做它擅长的跨文件协同编辑。为弥补特定模型限制而构建的 Skills 和 Hooks一旦限制不存在了就成了额外开销。在 Perforce 代码库中拦截写入执行p4 edit的 Hook在 Claude Code 增加原生 Perforce 模式后就多余了。团队应该每三到六个月做一次配置审查重大模型版本发布后如果感觉性能停滞也值得做一次。3. 分配责任人这一条是非技术的建议组织结构要适应AI 编程带来的变革。推广AI 编程最快的团队都在广泛开放前做了基础设施投入。一家公司的几位工程师提前构建了全套 Plugin 和 MCP第一天就可用。另一家公司有专门管理 AI 编码工具的完整团队推广前就准备好了基础设施。这两种情况下开发者的第一次接触就是高效的采用自然扩散。Claude Code 推广的阶段做这种事的人通常归属在开发者体验或开发者生产力部门。一个正在出现的新角色是智能体经理Agent Manager混合 PM 和工程师职能专门管理 Claude Code 生态。如果还没有专门团队最小可行版本是一个开发负责人对 Claude Code 配置拥有所有权的人有权决定设置、权限策略、Plugin 市场和 CLAUDE.md 惯例并有责任保持它们最新。对于大型组织最容易出现以下治理问题谁控制哪些 Skills 和 Plugins 可用怎么防止成千上万的工程师重复造轮子AI 生成的代码怎么走和人工代码一样的审查流程Anthropic 的建议是从已批准的 Skills、强制代码审查和有限初始访问开始随着信心增强逐步扩展。早期就建立跨职能工作组把工程、信息安全、治理代表拉到一起定义需求、制定路线图。比如这篇在国内碧桂园研发团队落地的实践经验总结AI Code 企业落地问题成本失控与无法持续记忆上下文及解决方案。在展开 AI Coding 后实现了改进过程的可观测然后在此基础上解决了 Token 消耗过大上下文优化问题。最后给出一份 Claude Code 的官方检查清单入门检查清单原文https://claude.com/blog/how-claude-code-works-in-large-codebases-best-practices-and-where-to-start推荐Lazyweb 免费的 25.7 万截图库让 AI 写出好看的前端页面Multica让 AI 智能体变为你的员工给 AI 装上真实浏览器camofox-browser 实战基于 DeepSeek 的编程智能体 TUIChatGPT 里的哥布林goblins是怎么来的不用一个违禁词 让 Claude 说出炸药配方红队攻击实录大模型黑箱揭秘GPT、Claude、Gemini、Grok、Hermes 系统提示词全公开jcode 深度解析纯 Rust 打造它凭什么号称「最强 Coding Agent」从73.7到89.5HALO 智能体用轨迹分析实现了递归自我进化小米模型 MiMo V2.5 全系列 Pro · TTS 免费用让 AI 帮你修 bug结果它把整个代码重写了一遍没人整理过的 DeepSeek 进化史25篇论文里的技术蜕变给 OpenClaw 接入10000工具和数据为你盯盘给出独家策略Claude Design 系统提示词被泄露AI 如何成为你的专业设计师

相关文章:

Anthropic 百万行代码库的官方最佳实践

随着AI 编程智能体的越来越深入到日常工作,相信你也遇到了大型项目和和小型代码库完全不同的场景。正好最近也是在做大型项目的重构开发,刷到这篇来自 Anthropic 官方的文章。系统梳理了 Claude Code 在大规模代码库中的运作机制、Harness 架构的七个扩展…...

3个实用技巧:如何彻底解决C盘爆红难题,让你的Windows系统重获新生

3个实用技巧:如何彻底解决C盘爆红难题,让你的Windows系统重获新生 【免费下载链接】WindowsCleaner Windows Cleaner——专治C盘爆红及各种不服! 项目地址: https://gitcode.com/gh_mirrors/wi/WindowsCleaner 你是否曾经遇到过这样的…...

基于Pomerium构建零信任网关:统一内部服务访问的实践指南

1. 项目概述与核心价值 最近在折腾一个内部应用,想把几个不同技术栈的服务(比如一个Go写的API、一个Python的Web界面、一个Java的管理后台)统一到一个入口,并且能安全地访问。直接暴露到公网肯定不行,用传统的反向代理…...

深度解析Beyond Compare 5密钥生成:从逆向工程到高效激活的实用指南

深度解析Beyond Compare 5密钥生成:从逆向工程到高效激活的实用指南 【免费下载链接】BCompare_Keygen Keygen for BCompare 5 项目地址: https://gitcode.com/gh_mirrors/bc/BCompare_Keygen 在软件授权验证领域,Beyond Compare 5的RSA加密机制一…...

从零到一:基于Playwright与OpenCV的滑块验证码自动化破解实战

1. 环境准备与工具介绍 第一次接触滑块验证码自动化破解时,我也被那些复杂的图像处理算法吓到了。但实际用下来发现,只要选对工具组合,整个过程比想象中简单得多。这里我推荐PlaywrightOpenCV这对黄金搭档——前者是微软开源的浏览器自动化工…...

从LED驱动到继电器控制:深入解析NPN与PNP三极管在电路设计中的选型避坑指南

从LED驱动到继电器控制:深入解析NPN与PNP三极管在电路设计中的选型避坑指南 在电子电路设计中,三极管作为基础却关键的元件,其选型直接影响着电路的可靠性和性能。特别是当我们需要驱动LED、继电器或电机等负载时,NPN与PNP三极管的…...

如何轻松搞定浏览器视频下载:3步安装免费插件完全指南

如何轻松搞定浏览器视频下载:3步安装免费插件完全指南 【免费下载链接】VideoDownloadHelper Chrome Extension to Help Download Video for Some Video Sites. 项目地址: https://gitcode.com/gh_mirrors/vi/VideoDownloadHelper 还在为无法保存网页视频而烦…...

CST实战指南 | 场路协同仿真中的元器件模型导入与验证

1. 场路协同仿真中的元器件模型导入基础 我第一次接触CST场路协同仿真时,最头疼的就是如何把各种元器件模型正确导入到仿真环境中。经过多次项目实践,我发现这其实是个系统性工程,需要根据不同的仿真场景和元器件类型采取不同的处理策略。 在…...

避开4D毫米波雷达性能坑:详解AWR2243天线通道失配原因与校准策略

避开4D毫米波雷达性能坑:详解AWR2243天线通道失配原因与校准策略 在自动驾驶与高级驾驶辅助系统(ADAS)领域,4D毫米波雷达正逐渐成为环境感知的核心传感器。德州仪器(TI)的AWR2243级联方案凭借其192个虚拟通…...

安卓位置伪装的终极指南:3步掌握应用级虚拟定位

安卓位置伪装的终极指南:3步掌握应用级虚拟定位 【免费下载链接】FakeLocation Xposed module to mock locations per app. 项目地址: https://gitcode.com/gh_mirrors/fak/FakeLocation 你是否曾因社交软件暴露真实位置而感到不安?是否需要在不同…...

[Cesium] 数字孪生实践 | 超图插件打通UE4/Unity三维GIS管线全解析

1. 数字孪生与三维GIS技术融合的现状 数字孪生技术正在改变我们理解和构建物理世界的方式。简单来说,数字孪生就是通过数字化手段,在虚拟空间中创建一个与真实世界完全对应的"双胞胎"。这个数字化的双胞胎可以实时反映真实世界的状态&#xff…...

OBS多平台直播插件:obs-multi-rtmp终极使用指南与架构解析

OBS多平台直播插件:obs-multi-rtmp终极使用指南与架构解析 【免费下载链接】obs-multi-rtmp OBS複数サイト同時配信プラグイン 项目地址: https://gitcode.com/gh_mirrors/ob/obs-multi-rtmp 在当今内容创作者蓬勃发展的时代,多平台同步直播已成为…...

Cesium实战:GeoJSON面数据贴地加载与边界线精准绘制方案

1. 问题背景:GeoJSON面数据贴地加载的边界线消失现象 第一次用Cesium加载GeoJSON面数据时,我遇到了一个让人抓狂的问题——当开启clampToGround: true实现贴地效果后,原本清晰的边界线突然消失了。这就像给地图蒙上了一层半透明的纱&#xf…...

(2024实战指南)从零到一:CTFd平台部署、Docker动态靶场构建与动态Flag生成全解析

1. CTFd平台部署全流程解析 搭建CTF竞赛平台的第一步就是部署CTFd。作为目前最流行的开源CTF平台,CTFd支持动态靶机、题目管理、积分排名等核心功能。我去年为学校搭建竞赛平台时,发现最新版的CTFd在Docker部署上有些变化,这里分享下2024年最…...

从RC电路到传递函数:一个实例讲透自动控制原理的建模核心

从RC电路到传递函数:一个实例讲透自动控制原理的建模核心 在自动控制原理的学习中,许多初学者常常陷入理论与实际脱节的困境。他们能够背诵拉氏变换的定义,却不知道如何将一个简单的电路转化为数学模型;他们熟悉传递函数的公式&am…...

别再硬编码IP了!深入Nacos 2.x源码,看它如何‘智能’又‘犯错’地选择服务端地址

Nacos 2.x服务端IP地址选择机制深度解析与实战调优 在分布式系统架构中,服务注册与发现是微服务架构的核心基础设施。作为阿里巴巴开源的服务发现和配置管理平台,Nacos凭借其简单易用、功能强大等特点,已成为众多企业微服务架构的首选组件。…...

如何3步完成B站视频转文字:开源工具Bili2text完整指南

如何3步完成B站视频转文字:开源工具Bili2text完整指南 【免费下载链接】bili2text Bilibili视频转文字,一步到位,输入链接即可使用 项目地址: https://gitcode.com/gh_mirrors/bi/bili2text 在信息爆炸的时代,视频内容占据…...

突破Cursor AI试用限制:技术实现与实战指南

突破Cursor AI试用限制:技术实现与实战指南 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached your trial request…...

NotebookLM如何3分钟解析薛定谔方程?——物理学者私藏的7个Prompt工程技巧曝光

更多请点击: https://intelliparadigm.com 第一章:NotebookLM物理学研究辅助 NotebookLM 是 Google 推出的基于 LLM 的研究型笔记工具,专为学者与科研人员设计。在物理学研究中,它可高效整合 PDF 论文、实验日志、LaTeX 公式片段…...

Midjourney v7艺术风格跃迁路径:从基础写实到超现实叙事的5阶能力模型,含GPT-4o协同提示链模板

更多请点击: https://intelliparadigm.com 第一章:Midjourney v7艺术风格跃迁路径总览 Midjourney v7 并非简单迭代,而是以扩散模型架构重构与多模态风格理解为内核的范式跃迁。其核心突破在于引入「语义风格锚点(Semantic Style…...

Win10下VSCode与OpenCV环境搭建:从零到一的避坑指南

1. 环境准备:安装必要工具链 在Windows 10上搭建OpenCV开发环境,首先需要准备好三个核心工具:MinGW、CMake和VSCode。这三个工具就像盖房子需要的钢筋、水泥和施工图纸,缺一不可。 MinGW是Windows下的GNU工具集,相当…...

ROS Melodic下UVC摄像头花屏?手把手教你修改usb_cam的pixel_format参数

ROS Melodic下UVC摄像头花屏问题深度解析与实战解决方案 当你在ROS Melodic环境下兴奋地插上UVC摄像头,准备开始你的机器人视觉项目时,突然发现屏幕上显示的是一堆杂乱无章的颜色块——这种"花屏"现象让许多ROS新手感到挫败。本文将带你深入理…...

Reddit内容获取引擎:从API调用到自动化管道的实战指南

1. 项目概述与核心价值 最近在折腾一个挺有意思的小玩意儿,叫 Cat-tj/reddit-reader 。乍一看名字,你可能觉得这又是一个简单的Reddit爬虫或者内容聚合器。但如果你深入了解一下,会发现它远不止于此。这个项目本质上是一个高度定制化、可编…...

基于RAG与本地LLM的智能代码库管理工具部署与优化指南

1. 项目概述:一个为开发者打造的智能代码库管理工具最近在整理自己过去几年的项目代码时,我遇到了一个几乎所有开发者都会头疼的问题:代码库越来越多,但想快速找到某个特定功能的实现、或者想复用一段之前写过的优质代码时&#x…...

小白程序员必看!收藏这份Agent入门指南,抢占未来运维高薪岗位

本文用通俗易懂的语言解释了什么是AI Agent,将其类比为能自主决策并调用工具的“实习生”,强调其与普通AI聊天的区别在于能自动完成任务。文章详细阐述了Agent的“感知-思考-行动”工作流程,并通过运维场景对比,展示了Agent在告警…...

蓝桥杯嵌入式CT117E-M4实战指南:从零搭建CubeMX开发环境

1. 为什么选择CubeMX开发环境 第一次接触蓝桥杯嵌入式竞赛的同学,往往会被各种开发工具搞得晕头转向。我当年备赛时,光是搭建开发环境就折腾了两天。直到后来发现了STM32CubeMX这个神器,开发效率直接翻倍。简单来说,CubeMX就像是…...

基于Three.js与WebSocket构建虚拟小镇:全栈技术架构与优化实践

1. 项目概述与核心价值最近在折腾一个叫“Alicization-Town”的开源项目,它来自GitHub上的ceresOPA组织。乍一看这个名字,可能会联想到某个动漫或者游戏里的场景,但实际接触后,我发现它远不止于此。这是一个围绕“虚拟小镇”或“数…...

忘记压缩包密码怎么办?5分钟学会用ArchivePasswordTestTool找回密码

忘记压缩包密码怎么办?5分钟学会用ArchivePasswordTestTool找回密码 【免费下载链接】ArchivePasswordTestTool 利用7zip测试压缩包的功能 对加密压缩包进行自动化测试密码 项目地址: https://gitcode.com/gh_mirrors/ar/ArchivePasswordTestTool 你是否曾经…...

GTNH中文汉化:从工业革命到魔法殿堂的语言桥梁

GTNH中文汉化:从工业革命到魔法殿堂的语言桥梁 【免费下载链接】Translation-of-GTNH GTNH整合包的汉化 项目地址: https://gitcode.com/gh_mirrors/tr/Translation-of-GTNH 你是否曾经面对GTNH整合包中那些晦涩的工业术语和神秘魔法词汇而感到迷茫&#xff…...

如何用淘金币自动化脚本每天节省20分钟?完整指南揭秘

如何用淘金币自动化脚本每天节省20分钟?完整指南揭秘 【免费下载链接】taojinbi 淘宝淘金币自动执行脚本,包含蚂蚁森林收取能量,芭芭农场全任务,解放你的双手 项目地址: https://gitcode.com/gh_mirrors/ta/taojinbi 淘金币…...