当前位置: 首页 > article >正文

字节面试被问“Claude Code怎么做搜索”?答RAG后就没后续了

最近和在社区看到有个求职者面试字节的时候聊到了一些rag相关问题正好这个求职者就说自己用过claude写代码面试官就问他那你知道Claude Code检索代码用的是什么方式吗他说是RAG吧现在不都这样做吗。后续面试官就没接着聊rag相关的了。其实乍一看很多人不去查的话还真的可能会回答出rag,但是Anthropic 的工程师不仅没有给 Claude Code 配 RAG甚至在早期真的试用过之后主动把它移除了——最终依赖的是最老派的 Grep 命令。这件事在技术圈引发了不小的争议的不过后面大家也可以理解。这到底怎么个说法呢为啥用grep呢这里详细解读一下。先说说那个最流行的误解好多人一听Claude Code用Grep不用RAG第一反应就是啊这么简答还可以这样啊难道是为了省钱吗。这也不能说全错把但这部分小伙伴只看到了最外面那层。调用 Embedding模型和向量数据库确实要花一些钱而且哈Grep 这种系统自带的工具成本几乎可以忽略不计。虽然这么想有点道理但是却是把那些工程师想得太简单了人家用这个Grep肯定也是有自己的考量的而且这部分人这么说也根本没碰到问题的核心。实际上据我了解哈Claude Code一开始并不是奔着 Grep 去的。Boris Cherny就是 Claude Code 的创造者也是 Anthropic 的主任工程师他在 Hacker News 上直接说过早期版本确实用了RAG加本地向量数据库但很快就发现 Agentic Search也就是基于 grep/glob 的主动检索效果更好。后来在 Latent Space 播客里他又补了一句说测试结果“好很多幅度大到团队自己也觉得意外”。你看人家不是没做人家是一开始想到的也是RAG的做法但是效果不好啊那服务广大用户肯定是要用效果好的啊。所以这根本不是一开始就没有理由的选择Grep而是跑过实验之后得出的结论所以实验才是验证真理的唯一标准啊。有看我之前内容的小伙伴应该知道我在claude code源码中对其中用到的一些工程技术进行了升入的分析且发现很多东西就是很简单但是简答的好啊。RAG有点小问题那最直接的问题是肯定就是时效性。RAG的思路大家肯定都知道的吧就是提前建索引怎么做呢先把代码库切块、向量化、存进数据库查的时候再去库里找。听着挺合理的吧可代码库是活的啊一个正常迭代的项目一天下来可能改动几十次。你的索引刚建完了第一个文件一改它就过时了。要想保持实时同步就得搭一套差量更新、重切块、重 Embedding 的流水线这套东西的维护成本比省下来的那几次 API 调用贵太多了。再一个就是精确性的问题这个很多小伙伴肯定没有想到而且这问题更根本哦面试的时候一定要答上来。代码检索和文档检索的需求不一样你搜的是函数名、类名、API 名称这些都是精确的字符串不是模糊的“概念”或者啥文本哦。语义搜索本来是为了处理“你想说的和文档里写的不是同一个词但意思差不多”的情况但在代码里你要找的东西只有唯一正确的写法语义相似反而会给你捞出一堆完全不相关的干扰项。所以就是要精确的找到就是要Grep去搜。还有安全和隐私的考量这个能答上来就最好了因为索引文件本身就是一个攻击面代码的 Embedding 向量也不是绝对安全的有研究表明在某些条件下可以从向量里部分还原出原始文本。对于企业用户来说代码是最核心的资产多一套外部系统就多一重风险。Agentic Search 的逻辑说到底争论 Grep 还是 RAG绕不开一个更根本的问题代码检索到底是一次性的查库行为还是一个需要来回确认的过程呢。RAG 默认选的是前者也就是你问问题它找代码然后就完事了。但实际写代码时候你很少能一次就把问题描述清楚。大多数时候第一次搜出来的结果只是个线索引出下一个问题。Agentic Search 恰恰顺应了这个规律每一轮 grep 的结果都成为下一轮搜索的判断依据不断收窄范围直到锁定目标。这有点像一个资深程序员排查陌生 Bug 时的工作方式——不会上来就把所有文件扫一遍而是先 grep 一个关键词看到结果之后判断往哪个方向走再接着往下挖。Claude Code 的 Agentic Search本质上是在用工具复现这种有目的、有反馈的探索节奏。这里还有个细节很多人注意到了但没说透答出来肯定是大大的加分项。Claude Code 在处理复杂的检索时候会拉起一个独立的子进程来专门跑 grep/glob/read 这些操作底层用的是响应速度最快的 Haiku 模型。这个子进程把混乱的搜索原始结果捋一遍然后只给主模型递一份摘要。为什么要这么设计因为 grep 的原始输出往往又长又杂如果每次搜索结果都直接塞进主模型的上下文跑几轮下来上下文窗口就满了。这个架构的核心其实是在做一件事隔离噪音。这点的话大家可以看我发的参考链接。对手的选择当然那肯定不是所有工具都做了同样的决定这个分歧本身也很值得看的。Cursor 从一开始就选了代码库索引路线把仓库切块、向量化需要上下文时语义检索。这是 RAG 在代码场景里的标准实现。有人评测说Cursor 在处理大型陌生代码库时确实更聪明找到的上下文更紧凑、冗余更少。[2]但这条路也有代价。路径屏蔽要做加密处理的权限边界要管的向量泄露要防的索引同步要维护的这基本上是在原有系统之外另起了一套。Claude Code 有意回避了这条路Boris Cherny 自己说过Claude Code 的定位是一个 Unix 工具不是一个产品设计原则就是先做最简单的能跑通的东西复杂度等到真正必要时再引入。所以这不是谁比谁高明而是两种价值取向的不同选择一个愿意投资基础设施换语义能力另一个选择保持极简换可靠性和可控性。[3]Grep 也不是没有短板说了这么多 Agentic Search 的优势也得说说它的问题不然就不公平了。反对声音里最有力的一条来自 Milvus,他认为grep 没有语义理解搜出来的东西里有大量不相关的匹配模型要从这堆结果里找有用的信息本身就在消耗大量 Token。他们基于这个痛点做了一个开源 MCP 插件叫 Claude Context引入向量检索之后声称 Token 消耗能降低 40%。其次哈规模也是个边界条件。对于 Google、Meta 这种量级的超大型 Monorepo几百万个文件、几十年积累下来命名惯例混乱纯靠 grep 确实会遇到天花板。在这种场景下提前建索引做语义预筛再配合 grep 精确确认反而是更合理的混合方案。所以更准确的说法不是Grep胜过RAG而是在大多数日常开发场景里Agentic Search 的性价比和可靠性更好但它没有解决所有问题边界条件是真实存在的。最后想说聊了这么多技术细节最后说点感受层面的东西。这场争论里最有意思的不是谁赢了而是为什么那么多工程师第一反应是RAG 肯定更好。大家太习惯用技术的新旧程度来判断优劣了——新的就该更好用旧的就是保守。Anthropic 这个决定之所以值得反复想不是因为 Grep 有多厉害而是因为他们真的跑了很多的实验、看了很多的数据然后做出了一个反直觉但有效的选择。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相关文章:

字节面试被问“Claude Code怎么做搜索”?答RAG后就没后续了

最近和在社区看到,有个求职者面试字节的时候,聊到了一些rag相关问题,正好这个求职者就说自己用过claude写代码,面试官就问他:那你知道Claude Code检索代码用的是什么方式吗?他说是RAG吧,现在不都…...

基于MCP协议的EVM区块链交互服务器:为AI智能体赋能Web3操作

1. 项目概述:为AI智能体打开区块链世界的大门 如果你正在构建一个AI智能体,并且希望它能像人类开发者一样,自由地查询以太坊上的余额、读取智能合约的状态,甚至帮你执行一笔代币转账,那么你很可能需要一个桥梁来连接A…...

RAG 实战:给 AI 接上私有知识库的完整方案

上一篇我们聊了 Agent 动态路由——任务交接时怎么把控流向。这次换个方向,聊一个大家问得最多的问题:怎么让 AI 能回答你自己公司的文档、产品手册、内部 Wiki? 你可能试过直接把文档塞进 System Prompt,结果 token 超限了。你也…...

ARM CP15协处理器架构与缓存控制技术详解

1. ARM CP15协处理器架构解析在ARMv7架构中,CP15协处理器承担着系统控制的核心职能。作为特权模式下才能访问的硬件模块,它通过一组专用寄存器实现对内存管理单元(MMU)、缓存子系统、TLB等关键组件的精细控制。与通用寄存器不同&a…...

小米手表表盘设计终极指南:用Mi-Create打造你的专属表盘

小米手表表盘设计终极指南:用Mi-Create打造你的专属表盘 【免费下载链接】Mi-Create Unofficial watchface creator for Xiaomi wearables ~2021 and above 项目地址: https://gitcode.com/gh_mirrors/mi/Mi-Create 还在为小米手表找不到心仪的表盘而烦恼吗&…...

光伏组件封装产线自动化通讯方案:三菱A系列PLC以太网多节点互联案例

一、行业背景与项目概况1.1 光伏行业技术需求光伏产业是实现“双碳”目标的核心支撑,光伏组件封装产线需实现电池片焊接、层压、裁切、检测等工序的高度自动化与数据互联互通,核心诉求涵盖设备协同联动、数据实时采集、远程运维效率提升,以保…...

我与AI的对话:当教科书思维撞上第一性原理 关于机器学习

一次让我重新思考“正确”的对话最近,我和AI进行了一次对话。起初我只是随口做了一个类比:“无监督学习和监督学习的分类,就像深度学习和机器学习一样。”AI立刻纠正我:这个类比不准确。它解释说,监督/无监督是按“是否…...

大模型API缓存的底层原理:从显存到网关

一、一个直觉引发的思考最近和一位朋友聊到API的缓存,他提出了一个很敏锐的问题:“其实tokens缓存都是假的吧?LLM本身就是无状态的。这种缓存只是一种计费规则。实际上跟上下文显存空间有关,你来用,他那边就会给你开一…...

一种通用的前端复刻思路:提取 UI 结构数据,交给 AI 生成代码

有时需要复刻一个已有的界面——可能是某个网页、一个 App 页面,或者微信小程序。传统做法是对着截图手动写代码,费时且还原度不稳定。最近试了一种方式:先把目标界面的 UI 结构数据提取出来,同时截一张高清截图,两者一…...

5分钟终极指南:一键解密网易云NCM音乐文件,免费高效转换音频格式

5分钟终极指南:一键解密网易云NCM音乐文件,免费高效转换音频格式 【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 你是否曾经下载了网易云音乐,却发现文件是加密的NCM格式,无法在其他播…...

JavaScript中利用宏任务拆分阻塞任务的实操案例

...

AutoJS无限制版安装使用教程:附送礼物与私信自动化脚本完整源码分享

AutoJS无限制版安装使用教程:附送礼物与私信自动化脚本完整源码分享 作为一名每天都在各种APP里“摸鱼”的打工人,我最近发现那些重复性的点击操作简直是在浪费生命。比如刷直播间、自动领福利、或者是给喜欢的博主发私信,点多了手都酸。 为了彻底解放双手,我研究了一下 A…...

EvaDB:用SQL桥接数据库与AI模型,构建声明式数据处理流水线

1. 项目概述:当数据库遇上AI,EvaDB想解决什么?如果你最近在关注AI应用开发,尤其是想让大语言模型(LLM)或者计算机视觉模型(CV Model)直接处理你的业务数据,那你大概率会遇…...

图记忆技术:构建LLM智能体的结构化记忆系统

1. 项目概述:图记忆库的兴起与价值如果你最近在关注大语言模型(LLM)和智能体(Agent)的前沿进展,那么“图”这个概念一定频繁地出现在你的视野里。从知识图谱到图神经网络,再到现在的图记忆&…...

医疗AI中的癌症生存率预测:神经网络模型构建与实践

1. 项目背景与核心目标癌症生存率预测一直是医疗AI领域的重要研究方向。基于临床数据构建神经网络模型,能够帮助医生更准确地评估患者预后情况,为个性化治疗方案制定提供数据支持。这个项目需要处理典型的医疗结构化数据,包含患者 demographi…...

图像分类中像素缩放算法选择与优化实践

1. 图像分类任务中的像素缩放方法概述在计算机视觉领域,像素缩放是图像预处理环节中最基础却至关重要的步骤。当我们把原始图像输入卷积神经网络(CNN)进行训练或推理时,绝大多数情况下都需要先将图像调整为统一尺寸。这个看似简单的操作,实际…...

Golioth ESP-IDF SDK:ESP32云端连接开发实战指南

1. Golioth ESP-IDF SDK:为ESP32开发者打造的云端连接利器作为一名长期深耕物联网领域的开发者,我最近在项目中频繁使用ESP32系列芯片,而Golioth新推出的ESP-IDF SDK彻底改变了我的开发体验。这个开源工具包让ESP32硬件与Golioth Cloud的连接…...

OpenPose与Stable Diffusion协同生成姿态控制图像

1. 项目概述:OpenPose与Stable Diffusion的协同工作流去年在开发一个动画项目时,我需要批量生成风格统一但姿态各异的人物图像。传统手动调整不仅效率低下,而且难以保持角色比例的一致性。这时OpenPose与Stable Diffusion的组合方案完美解决了…...

Python机器学习数据预处理实战与Scikit-Learn技巧

1. 数据预处理在机器学习中的核心价值用Python和Scikit-Learn做机器学习时,原始数据就像未经雕琢的玉石——潜在价值巨大但需要精细处理。我在金融风控和医疗影像分析项目中深刻体会到:数据预处理的质量直接决定模型效果上限,其重要性往往超过…...

机器学习核心概念与实践指南

1. 机器学习领域的边界与定位 作为一名在数据科学领域摸爬滚打多年的从业者,我经常被问到这样一个问题:"机器学习到底是什么?它和人工智能、数据挖掘有什么区别?"这个问题看似简单,但要准确回答却需要理清整…...

Reqwest 兼顾简洁与高性能的现代 HTTP 客户端

Reqwest 兼顾简洁与高性能的现代 HTTP 客户端 HTTP 客户端的选择往往面临易用性与性能的权衡,要么接口繁琐但性能出众,要么用法简洁却难以应对高并发场景。Reqwest 基于 Rust 异步运行时 tokio 构建,封装了简洁直观的 API,既能让…...

基于强化学习的浏览器自动化智能体:HyperAgent 架构与实战

1. 项目概述:当强化学习遇见浏览器自动化 最近在开源社区里,一个名为 hyperbrowserai/HyperAgent 的项目引起了我的注意。乍一看,这像是一个将“超”和“浏览器”结合的名字,很容易让人联想到某种增强版的浏览器工具。但深入探究…...

LoRA技术在Stable Diffusion中的高效微调与应用实践

1. LoRA技术概述与Stable Diffusion适配性LoRA(Low-Rank Adaptation)作为大模型微调领域的突破性技术,在Stable Diffusion生态中展现出独特价值。其核心原理是通过低秩矩阵分解,在原始模型参数旁添加可训练的小型适配层。具体到文…...

AI驱动开发工具全景解析:从GitHub Copilot到工作流重构

1. 项目概述:当AI成为你的编程搭档如果你是一名开发者,最近可能已经感受到了身边的变化。以前,我们写代码、查文档、调试Bug,大部分时间都在和IDE、搜索引擎、以及偶尔的Stack Overflow打交道。但现在,一个全新的“同事…...

《100个“反常识”经验11:删了30万行数据表还是那么大?》

本期摘要你用DELETE删了30万行数据,df -h一看磁盘空间没变,表文件还是那么大。这不是Bug,是InnoDB存储引擎的设计特性:DELETE只标记删除,不释放磁盘空间,留下的位置叫“空洞”。真正释放空间需要执行OPTIMI…...

LightGlue深度解析:从自适应剪枝到高速特征匹配的实战指南

LightGlue深度解析:从自适应剪枝到高速特征匹配的实战指南 【免费下载链接】LightGlue LightGlue: Local Feature Matching at Light Speed (ICCV 2023) 项目地址: https://gitcode.com/gh_mirrors/li/LightGlue 在计算机视觉领域,特征匹配作为三…...

MLP、CNN与RNN选型指南:深度学习三大经典网络解析

1. 神经网络选型指南:MLP、CNN与RNN的适用场景解析作为从业十余年的深度学习工程师,我经常被问到同一个问题:"我的项目该用哪种神经网络?"这确实是个值得深入探讨的话题。在本文中,我将结合工业界实战经验&a…...

分布式量子计算:架构演进与关键技术解析

1. 分布式量子计算的核心概念与技术演进量子计算正经历从单量子处理器(QPU)向多节点协同的分布式架构演进的关键阶段。这种转变类似于经典计算从单机走向集群的历史进程,但量子领域面临的挑战更为复杂。分布式量子计算的核心在于通过量子网络…...

Saga分布式事务:补偿事务与协同式的实现对比

Saga分布式事务:补偿事务与协同式的实现对比 在微服务架构中,分布式事务的处理一直是技术难点之一。Saga模式作为一种流行的解决方案,通过将长事务拆分为多个本地事务,并采用补偿或协同机制来保证最终一致性。本文将对比Saga的两…...

LibreDWG:开源CAD格式解析如何打破工程数据壁垒

LibreDWG:开源CAD格式解析如何打破工程数据壁垒 【免费下载链接】libredwg Official mirror of libredwg. With CI hooks and nightly releases. PRs ok 项目地址: https://gitcode.com/gh_mirrors/li/libredwg 你是否曾因无法打开一个DWG文件而陷入困境&…...