当前位置: 首页 > article >正文

假如LLM无限上下文了,RAG还有意义吗?

最近一年LLM的上下文长度有了非常长的扩展从早期的4096个token到最近kimi chat的200万token因此很多人就认为LLM不需要RAG了。实际上这个想法其实是错误的。RAG的本质是包含两个步骤一是召回检索二是推理。。大部分人以为RAG只是服务于私有知识库然而RAG的应用是可以很广泛的。例如我们设计一个带感情色彩的聊天机器人这个聊天机器人回答的语气的示例也就是few shot learning是可以通过RAG来召回的在这个例子中召回的是示例。再比如我们让LLM使用外部工具外部工具可能特别的多那么可以让RAG来帮忙对工具进行初步的召回和检索原因是过多的信息例如塞入全部工具的描述会增加LLM的失误率使得容错率降低。最后我们再以langchain的daniel在一个月前的分享来进一步说明为什么现在的长下文的LLM无法替代RAG。大家可能知道有一种实验叫做大海捞针实验Needle in a haystack目的是测试LLM在长下文中的检索和推理能力。这个实验的大致思路如下在一段长文本大海中随机插入一些短文本针。将这段文本输入给LLM向LLM提问让它捞出来这些针。正如我们前面说的RAG是包含了召回检索和推理两部分。因此在大海捞针实验中需要考察检索的准确率和推理的准确率。Langchain基于GPT-4做了如下的实验并得到了下面两个图。首先看左边这个图左边的图横坐标是有多少根“针”纵坐标是查全率。由于有检索和推理两个任务因此他们设计了两种问题。一个问题是问LLM这段文本中针在哪里也就是检索出针。第二个问题是推理问题不仅要找到针还需要对针进行推理例如让LLM告诉我们这些针的第一个字母是什么。左边的图告诉我们两个事实首先绿色的柱子是第一个问题红色的柱子是第二个问题。明显问题二的查全率低于问题一这说明推理比检索要难这个很好理解毕竟推理不仅要检索出来要需要基于检索结果做一些推理。其次随着插入大海中针的数量的增加查全率在降低。接着我们看第二个图第二个图横坐标是输入LLM的上下文也就是“海”的长度纵坐标是10个针的位置越上面的针表示在上下文的前面越下面的针表示在上下文的后面。这个图同样告诉我们两个事实。事实一是随着上下文长度的增加查全率在不断降低。事实二是靠近上下文尾巴的针更不容易被遗漏越靠前的针越容易被遗漏。实际上论文《Attention Sorting Combats Recency Bias In Long Context Language Models》提出了一个观点。在使用下一个token预测这种方式训练的时候实际上存在偏差(bias)因为我们训练语料中下一个token预测的真实值大部分和附近的token有关这导致LLM会倾向于更多的关注最近Recency的token而容易忽略前面的token论文中将这种现象称为Recency Bias。因此Recency Bias可以在一定程度上解释上面两个图的结果。综上目前LLM在长文本的语境中做检索加推理还有很大的局限性这种局限性甚至可能是由于下一个token预测这种训练范式导致的因此RAG并没有被替代掉。最后我认为应该将RAG视作一种LLM可以使用的外部工具在能使用外部工具的前提下肯定是要优先使用这些工具好比让人查询文档中的相关内容人也会根据结构化的标题以及ctrlf功能进行快速的检索和定位也就是借助外部工具而不是从头到尾通读整篇文档。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相关文章:

假如LLM无限上下文了,RAG还有意义吗?

最近一年,LLM的上下文长度有了非常长的扩展,从早期的4096个token到最近kimi chat的200万token,因此很多人就认为LLM不需要RAG了。实际上这个想法其实是错误的。 RAG的本质是包含两个步骤,一是召回(检索)&a…...

深入解析Claude Code:AI编程助手核心架构与工程实践

1. 项目概述与核心价值最近在深入研究AI编程助手领域,特别是那些能够真正理解代码上下文、执行复杂任务并自主学习的智能体(Agent)。在这个过程中,我系统性地拆解了市面上一个非常热门的项目——Claude Code。这不仅仅是一个简单的…...

如何将微信聊天记录转化为个人数字记忆库:WeChatMsg让你的对话永不遗忘

如何将微信聊天记录转化为个人数字记忆库:WeChatMsg让你的对话永不遗忘 【免费下载链接】WeChatMsg 提取微信聊天记录,将其导出成HTML、Word、CSV文档永久保存,对聊天记录进行分析生成年度聊天报告 项目地址: https://gitcode.com/GitHub_T…...

Obsidian技能包:让AI助手深度集成你的知识库工作流

1. 项目概述与核心价值 如果你和我一样,日常重度依赖 Obsidian 来管理知识、项目和思考,那你一定遇到过这样的场景:想快速在某个文件夹里新建一个符合特定模板的笔记,或者批量处理一批笔记的元数据,又或者想把一个复杂…...

YimMenu:GTA V开源模组菜单的完整指南

YimMenu:GTA V开源模组菜单的完整指南 【免费下载链接】YimMenu YimMenu, a GTA V menu protecting against a wide ranges of the public crashes and improving the overall experience. 项目地址: https://gitcode.com/GitHub_Trending/yi/YimMenu 你是否…...

ControlFlow实战:3个趣味AI应用开发指南

1. 项目概述:用ControlFlow构建3个趣味AI应用ControlFlow作为一款新兴的AI开发框架,正在改变普通人接触人工智能技术的方式。不同于传统开发工具的高门槛,ControlFlow通过可视化编程和模块化设计,让没有编程背景的爱好者也能快速搭…...

Python自动化:华为交换机配置批量备份与智能预处理

1. 华为交换机配置备份的痛点与Python自动化方案 每次月底备份几十台华为交换机的配置时,我都得挨个登录设备、输入命令、保存文件。最崩溃的是有次误操作覆盖了关键配置,花了整整两天才恢复。这种重复劳动不仅效率低下,还容易出错。后来我发…...

你还在为MCP网关扩容付费?C++专家团闭门复盘:如何用1套代码、0新增机器支撑3倍流量增长(含CMake跨平台成本建模模板)

更多请点击: https://intelliparadigm.com 第一章:C编写高吞吐量MCP网关成本控制策略的底层逻辑 MCP(Message Control Protocol)网关作为微服务间异步通信的核心枢纽,其吞吐量与资源开销直接决定云基础设施的TCO&…...

机载视频 SEI 解析与抽帧

机载视频 SEI 解析与抽帧 一、模块要解决什么问题 机载吊舱录制的视频中,常通过码流侧的补充增强信息附带 POS、姿态、时间、焦距 等。测绘内业需要两类产物: 仅解析 SEI:得到与解码帧对齐的记录列表,供质检、对时、与定拍数据融合…...

VSCode低代码插件踩坑实录:17个致命兼容性问题+官方未公开的API调用黑盒(内部泄露版)

更多请点击: https://intelliparadigm.com 第一章:VSCode 2026低代码拖拽插件的演进脉络与定位重构 VSCode 2026 版本正式将低代码拖拽能力从实验性扩展(Preview Extension)升格为核心编辑器原生能力层,其插件架构由传…...

农业IoT固件调试总卡壳?VSCode远程开发配置全拆解,12类国产传感器兼容方案首次公开

更多请点击: https://intelliparadigm.com 第一章:农业IoT固件调试的典型困局与VSCode破局价值 在田间部署的土壤温湿度传感器、智能灌溉控制器等农业IoT设备,常运行基于ESP32或nRF52的裸机固件或Zephyr RTOS应用。开发者普遍面临三大困局&a…...

最小生成树的 Kruskal 与 Prim 算法:从连通到最优,一篇文章彻底掌握

如何用最少的成本,把 n 个城市连接起来?如何铺设光纤、设计电路,既保证连通又成本最低?答案就在 最小生成树 中。最小生成树(Minimum Spanning Tree, MST)是图论中至关重要的概念,广泛应用在网络…...

长链思维推理:大模型深度思考的核心能力与工程实践指南

1. 项目概述:长链思维推理的演进与核心价值如果你最近关注大语言模型(LLM)的发展,尤其是像 OpenAI o1、DeepSeek-R1 这类“推理模型”的崛起,那么“长链思维推理”这个概念一定不会陌生。它不再是早期 GPT-3.5 那种简单…...

Whiz:基于AI的终端命令生成工具,提升开发效率

1. 项目概述:为你的终端装上“副驾驶”如果你和我一样,每天有超过一半的工作时间是在终端(Terminal)里度过的,那你一定也经历过这样的时刻:面对一个复杂的命令,需要反复查阅man手册;…...

如何快速部署开源实验室管理系统:面向中小型实验室的完整指南

如何快速部署开源实验室管理系统:面向中小型实验室的完整指南 【免费下载链接】senaite.lims SENAITE Meta Package 项目地址: https://gitcode.com/gh_mirrors/se/senaite.lims 在当今数字化时代,实验室管理面临着前所未有的挑战:如何…...

Loopi:本地优先的AI智能体自动化平台,打通大模型与真实世界操作

1. 项目概述:当AI拥有“双手”与“眼睛”如果你曾尝试将AI的能力与真实世界的操作结合起来,比如让AI自动帮你整理邮件、抓取网页数据并生成报告,或者搭建一个能自主处理客服工单的智能助手,你可能会发现一个巨大的鸿沟。一边是强大…...

Mesa 3.0:Python多智能体建模的架构革命与工程实践

Mesa 3.0:Python多智能体建模的架构革命与工程实践 【免费下载链接】mesa Mesa is an open-source Python library for agent-based modeling, ideal for simulating complex systems and exploring emergent behaviors. 项目地址: https://gitcode.com/gh_mirror…...

csp信奥赛C++高频考点专项训练之贪心算法 --【删数问题】:删数问题

csp信奥赛C高频考点专项训练之贪心算法 --【删数问题】:删数问题 题目描述 键盘输入一个高精度的正整数 nnn(不超过 250250250 位),去掉其中任意 kkk 个数字后剩下的数字按原左右次序将组成一个新的非负整数。编程对给定的 nnn 和…...

神经网络联合建模:分类与回归任务的高效解决方案

1. 神经网络在分类与回归联合任务中的应用价值在真实业务场景中,我们常常遇到需要同时预测离散类别和连续数值的问题。比如电商平台既要判断用户是否会点击商品(分类),又要预估点击后的停留时长(回归)&…...

深度解析:wxauto微信自动化框架的架构设计与实现原理

深度解析:wxauto微信自动化框架的架构设计与实现原理 【免费下载链接】wxauto Windows版本微信客户端(非网页版)自动化,可实现简单的发送、接收微信消息,简单微信机器人 项目地址: https://gitcode.com/gh_mirrors/w…...

DXVK 2.7.1:如何实现Linux游戏性能的终极突破与Vulkan图形转换技术

DXVK 2.7.1:如何实现Linux游戏性能的终极突破与Vulkan图形转换技术 【免费下载链接】dxvk Vulkan-based implementation of D3D8, 9, 10 and 11 for Linux / Wine 项目地址: https://gitcode.com/gh_mirrors/dx/dxvk 在Linux平台上运行Windows游戏一直面临着…...

游戏服务器分布式架构实战:cellmesh框架核心原理与应用

1. 项目概述:一个为游戏而生的分布式服务框架如果你在游戏服务器开发领域摸爬滚打过几年,大概率会对“服务拆分”和“通信治理”这两个词又爱又恨。爱的是,当你的在线玩家从几百人增长到几十万、上百万时,单体服务器架构必然崩溃&…...

SDF 文件深度解析

从格式解读到反标注实战,一文搞懂时序仿真的灵魂文件| 数字后端工程师必读 | STA & GLS 实战 | 避坑指南 |01 你的门级仿真,有没有踩过这些坑?做了几年芯片,最怕的不是综合报warning,也不是PR跑不完——而是门级仿…...

VSCode 2026远程文件同步提速412%:实测SSHFS+Rsync+DeltaFS三引擎协同优化方案

更多请点击: https://intelliparadigm.com 第一章:VSCode 2026远程文件同步提速412%:核心突破与技术背景 VSCode 2026 引入全新自适应增量同步引擎(AISE),彻底重构 Remote-SSH 和 Dev Containers 的文件同…...

nodejs 下国内最流行的框架

在国内企业、互联网公司、中小项目中,Node.js 最主流、使用最广泛的框架是:Express 和 NestJS,二者分属不同场景,占据绝对主导地位。一、按场景划分的主流排名1. 老牌通用王者:Express地位:国内最普及、生态…...

VCAM虚拟摄像头:安卓Xposed框架下的终极摄像头替换解决方案

VCAM虚拟摄像头:安卓Xposed框架下的终极摄像头替换解决方案 【免费下载链接】com.example.vcam 虚拟摄像头 virtual camera 项目地址: https://gitcode.com/gh_mirrors/co/com.example.vcam 在移动应用开发和内容创作领域,摄像头功能的重要性不言…...

缠论量化分析终极秘籍:从理论到实战的完整智能化解决方案

缠论量化分析终极秘籍:从理论到实战的完整智能化解决方案 【免费下载链接】Indicator 通达信缠论可视化分析插件 项目地址: https://gitcode.com/gh_mirrors/ind/Indicator 在金融市场的波动中,技术分析工具的质量直接影响着交易决策的精准度。今…...

字节开源trae-agent:Rust构建的高性能服务网格数据平面解析

1. 项目概述:一个现代服务网格数据平面的诞生最近在梳理服务网格生态时,我注意到了字节跳动开源的trae-agent。这个名字乍一看有点陌生,不像Envoy、Linkerd-proxy那样如雷贯耳,但深入了解后,我发现它代表了一种非常务实…...

AI老照片修复:Stable Diffusion技术实践与伦理考量

1. 老照片修复的艺术与技术挑战老照片承载着历史的记忆,但时间的流逝往往让这些珍贵的影像变得模糊、褪色甚至破损。作为一名长期从事数字影像修复的从业者,我深知传统修复方法需要耗费大量时间精力——在Photoshop中手动修复一张严重破损的照片可能需要…...

[嵌入式系统-267]:同一个型号的舵机如何支持Teacher模式和Student模式?如何设置?

在机械臂的“主从控制”(Teacher-Student)系统中,同一个型号的舵机完全可以同时支持两种模式。核心原理在于:模式不是由舵机硬件决定的,而是由控制器(主控板)赋予它的“角色”决定的。这就好比同…...