Retrieval-Augmented Generation for LargeLanguage Models: A Survey
标题:Retrieval-Augmented Generation for Large Language Models: A Survey
作者:Yunfan Gaoa , Yun Xiongb , Xinyu Gaob , Kangxiang Jiab , Jinliu Panb , Yuxi Bic , Yi Daia , Jiawei Suna , Meng Wangc , and Haofen Wang
1. By referencing external knowledge, RAG effectively reduces the problem of generating factually incorrect content. Its integration into LLMs has resulted in widespread adoption, establishing RAG as a key technology in advancing chatbots and enhancing the suitability of LLMs for real-world applications
2. The RAG research paradigm is continuously evolving, and we categorize it into three stages: Naive RAG, Advanced RAG, and Modular RAG
3. The Naive RAG:
Indexing starts with the cleaning and extraction of raw data
Retrieval. Upon receipt of a user query, the RAG system employs the same encoding model utilized during the indexing phase to transform the query into a vector representation.
Generation. The posed query and selected documents are synthesized into a coherent prompt to which a large language model is tasked with formulating a response.
4.
Advanced RAG introduces specific improvements to overcome the limitations of Naive RAG. Focusing on enhancing retrieval quality, it employs pre-retrieval and post-retrieval strategies.
5.
Pre-retrieval process. In this stage, the primary focus is on optimizing the indexing structure and the original query. The goal of optimizing indexing is to enhance the quality of the content being indexed.
Post-Retrieval Process. Once relevant context is retrieved, it’s crucial to integrate it effectively with the query
6. Innovations such as the Rewrite-Retrieve-Read [7]model leverage the LLM’s capabilities to refine retrieval queries through a rewriting module and a LM-feedback mechanism to update rewriting model
7. RAG is often compared with Fine-tuning (FT) and prompt engineering. Each method has distinct characteristics as illustrated in Figure 4.
8. In the context of RAG, it is crucial to efficiently retrieve relevant documents from the data source. There are several key issues involved, such as the retrieval source, retrieval granularity, pre-processing of the retrieval, and selection of the corresponding embedding model.
相关文章:
Retrieval-Augmented Generation for LargeLanguage Models: A Survey
标题:Retrieval-Augmented Generation for Large Language Models: A Survey 作者:Yunfan Gaoa , Yun Xiongb , Xinyu Gaob , Kangxiang Jiab , Jinliu Panb , Yuxi Bic , Yi Daia , Jiawei Suna , Meng Wangc , and Haofen Wang 1. By referencing ext…...
2025年2月16日(numpy-deepseek)
嗯,用户让我介绍一下这段使用numpy的代码。首先,我需要确认用户的需求是什么。他们可能刚开始学习Python或者数据科学,所以需要基础的解释。让我仔细看一下代码。 第一行是import numpy as np,这应该是导入numpy库,并…...
C#windows窗体人脸识别
一、创建一个数据库,名为TestFaceDB 里面有一张表就OK了,表名Users,表里面有几个字段我说明一下: id--------------------bigint----------------------编号 name--------------varchar(50)-----------------用户名 phone--------------v…...
【第11章:生成式AI与创意应用—11.1 文本生成与创意写作辅助的实现与优化】
凌晨三点的书房,作家李明第27次删除了刚写好的段落。窗外路灯在稿纸上投下斑驳光影,就像他此刻支离破碎的创作灵感。突然,写作软件弹出提示:"检测到情感转折生硬,建议尝试’雨夜独白’场景模板?"这个由生成式AI驱动的建议,不仅拯救了濒临崩溃的章节,更揭开了…...
【Elasticsearch】通过运行时字段在查询阶段动态覆盖索引字段
在 Elasticsearch 中,Override field values at query time是指通过运行时字段(runtime fields)在查询阶段动态覆盖索引字段的值,而无需修改原始索引数据。这种功能特别适用于以下场景: 1. 动态修改字段值:…...
电解电容的参数指标
容量 这个值通常是室温25℃,在一定频率和幅度的交流信号下测得的容量。容量会随着温度、直流电压、交流电压值的变化而改变。 额定电压 施加在电容上的最大直流电压,通常要求降额使用。 例如额定电压是4V,降额到70%使用,最高施…...
linux 内核编译报错 unknown assembler invoked
在编译内核时,出现如下错误 : scripts/gcc-wrapper.py aarch64-linux-gnu-gcc: unknown assembler invoked scripts/Kconfig.include:47: Sorry, this assembler is not supported. make[1]: *** [scripts/kconfig/Makefile:29:menuconfig] 错误 1 make…...
HTML,API,RestFul API基础
一文搞懂RESTful API - bigsai - 博客园 1. API 路径 开头必须 /,表示绝对路径,不支持 . 或 ..(相对路径)。API 结尾 / 通常不需要,但部分框架会自动处理 / → 无 /。 ✅ 推荐 GET /api/v1/products # 资源集合…...
js 使用缓存判断在规定时间内显示一次弹框
js 使用缓存判断在规定时间内显示一次弹框 功能拆分,新用户注册完成登录跳转首页 , js根据注册时间判断显示一个新手指引的弹窗,只在注册当天登录且显示一次 <script>jQuery(document).ready(function($) {getWinnerModalShow()});// 新…...
使用新版本golang项目中goyacc依赖问题的处理
背景 最近项目使用中有用到go mod 和 goyacc工具。goyacc涉及到编译原理的词法分析,文法分析等功能,可以用来生成基于golang的语法分析文件。本期是记录一个使用中遇到的依赖相关的问题。因为用到goyacc,需要生成goyacc的可执行文件。 而项目…...
洛谷 P2574 XOR的艺术/CF242E XOR on Segment 题解
1.XOR的艺术 题意 给定一个长度为 n n n的、只含有数字 0 , 1 0,1 0,1的字符串和两种操作。 对于每种操作,给定 o p , l , r op,l,r op,l,r: o p 0 op0 op0表示将字符串的 [ l , r ] [l, r] [l,r]区间内的 0 0 0变成 1 1 1, 1 1 1变成 0 …...
包管理器-汇总介绍
包管理器是一种在操作系统或软件开发环境中用于自动化软件包(程序、库等)的安装、升级、配置和卸载等操作的工具。它能帮助用户更方便地管理软件及其依赖关系,以下是不同操作系统和开发环境中常见的包管理器介绍: 操作系统层面的…...
mysql系列8—Innodb的undolog
背景 本文涉及的内容较为底层,做了解即可,是以前学习《高性能mysql》和《mysql是怎样运行的》的笔记整理所得。 undolog设计的初始目的是保证事务的原子性。mysql的修改操作发生后,如果所在的事务未被提交,如mysql服务或者操作系统…...
静默安装OGG for MySQL微服务版本,高效开展数据同步和迁移
一、背景 本文从Oracle GoldenGate微服务版的概念和组件介绍开始,从零介绍了怎么开始安装GoldenGate 21c for Oracle微服务版本的软件及部署。当然了,微服务版除新功能外包含传统版所有的功能。 二、安装部署 (一)下载OGG for …...
【Golang 面试题】每日 3 题(五十五)
✍个人博客:Pandaconda-CSDN博客 📣专栏地址:http://t.csdnimg.cn/UWz06 📚专栏简介:在这个专栏中,我将会分享 Golang 面试中常见的面试题给大家~ ❤️如果有收获的话,欢迎点赞👍收藏…...
PHP关键字入门指南:分类与功能全解析
如果你是刚接触PHP的新手,可能会对代码中那些“特殊单词”感到困惑。别担心!本文将用最通俗易懂的方式,带你认识PHP中的关键字——它们就像编程世界的“魔法咒语”,每个都有独特的作用。文末还附有代码示例,帮你快速上手! 一、什么是PHP关键字? PHP关键字是语言内置的特…...
消息中间件深度剖析:以 RabbitMQ 和 Kafka 为核心
在现代分布式系统和微服务架构的构建中,消息中间件作为一个不可或缺的组件,承担着系统间解耦、异步处理、流量削峰、数据传输等重要职能。尤其是在面临大规模并发、高可用性和可扩展性需求时,如何选择合适的消息中间件成为了开发者和架构师们…...
【万字详细教程】Linux to go——装在移动硬盘里的Linux系统(Ubuntu22.04)制作流程;一口气解决系统安装引导文件迁移显卡驱动安装等问题
Linux to go制作流程 0.写在前面 关于教程Why Linux to go?实际效果 1.准备工具2.制作步骤 下载系统镜像硬盘分区准备启动U盘安装系统重启完成驱动安装将系统启动引导程序迁移到移动硬盘上 3.可能出现的问题 3.1.U盘引导系统安装时出现崩溃3.2.不影响硬盘里本身已有…...
HCIA项目实践---OSPF的基本配置
9.5.12 OSPF的基本配置 (所搭环境如上图所示) A 先配置IP地址 (先进入路由器R1的0/0/0接口配置IP地址,再进入环回接口配置IP地址) (配置R2路由器的0/0/0和0/0/1以及环回接口的IP地址) (置R3路由器的0/0/0接…...
Vue 自动配置表单 el-switch等不常用组件覆盖默认值问题
有自动解析表单的vue组件如下,其原理是调用一个配置表单定义的接口,然后再调用获取表单配置的接口并将配置的数据覆盖表单的默认值。其中el-switch的配置值没有覆盖默认值,分析其原因。 主页面如下: <template> <div cla…...
3步掌握GetQzonehistory:永久备份QQ空间所有回忆的终极指南
3步掌握GetQzonehistory:永久备份QQ空间所有回忆的终极指南 【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说 项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory 你是否曾担心QQ空间里那些承载青春记忆的说说会随着时间消失&…...
AISMM模型深度拆解,从战略层到运维层全链路对齐:含工信部信通院最新L5认证路径图
更多请点击: https://intelliparadigm.com 第一章:AISMM模型与云原生成熟度 AISMM(Adaptive Intelligent Service Maturity Model)是一种面向云原生演进的动态评估框架,它将组织能力划分为服务感知、智能编排、弹性自…...
AI智能体安全治理实践:基于边车模式的Yigcore Sentinel部署与集成
1. 项目概述:为AI智能体戴上“紧箍咒” 最近在折腾各种AI智能体,比如OpenClaw这类能自主执行代码、操作文件的“数字员工”,功能确实强大,但用起来心里总有点发毛。相信不少同行都有过类似的经历:一个不留神ÿ…...
CodeMem:基于MCP为AI编程工具构建持久化项目记忆系统
1. 项目概述:为你的AI编程伙伴装上“持久记忆”如果你和我一样,每天在Cursor、Claude Code或者Windsurf里和AI结对编程,那你肯定遇到过这个烦人的问题:每次新开一个会话,AI就像得了健忘症,完全不记得我们之…...
mysql表结构发生变更如何记录_SQL版本管理与Migration工具
所有表结构变更必须通过带版本号的SQL文件执行,禁止直接在生产库运行ALTER命令;每个文件仅含一个操作、严格编号、开头注明影响范围。MySQL表结构变更必须走SQL文件,不能直接在生产库上ALTER线上表结构改了但没留痕,等于没改——下…...
抖音图片怎么无水印保存?2026 保存工具和方法实测对比指南
每当我们在抖音上看到喜欢的图片,总会想保存下来。但抖音默认保存的图片往往带着明显的水印,影响美观度。对于想要收藏素材、做内容创意参考,或者只是想干净地保存喜欢图片的人来说,无水印保存抖音图片就成了一个实际需求。2026 年…...
@PostConstruct、@PreDestroy 和 @DependsOn注解的使用和区别
这三个注解是 Spring 容器管理 Bean 生命周期的核心工具。如果把 Bean 比作一个员工,那么:DependsOn 是入职门槛(必须签入职合同,我才能入职)。PostConstruct 是入职仪式(拿到电脑和账号后,开机…...
JSM8837DTR 1.8A/12V 低压 H 桥电机驱动芯片
在消费电子、智能硬件、小型机器人与电池供电运动控制场景中,一颗小体积、低功耗、强驱动、高可靠的电机驱动芯片,往往决定产品续航、响应速度与长期稳定性。杰盛微半导体(JSMSEMI)推出的JSM8837DTR,正是面向这类场景打…...
LangChain vs LlamaIndex:从编排到数据,一文搞清核心区别
目录 摘要 一、核心区别:一句话版本 二、为什么我会觉得它们很像? 三、核心区别:完整对比 四、用 LangChain 的知识理解 LlamaIndex 五、LlamaIndex 的数据处理主线 1. Document 2. Node 3. Index 4. Retriever 5. QueryEngine 六…...
AI Agent团队数字档案库:用工程化方法管理角色人格与长期记忆
1. 项目概述:一个为AI工程师团队设计的“数字身份档案库”最近在整理团队知识库时,我一直在思考一个问题:在一个由AI Agent组成的虚拟工程团队里,如何让每个“成员”保持稳定、一致且富有深度的“人格”与“记忆”?这不…...
