当前位置: 首页 > article >正文

RAG检索增强生成技术及应用

首先是什么RAG是模型生成回答前从指定知识库中精准抓取信息再结合这些依据去生成内容回答问题给一个学霸配备一个随身图书馆方便随时查阅核心就是知识库存资料、检索器查资料、排序器整理需要的资料、生成器写答案然后为什么要用最关键的提升回答准确性减少事实错误幻觉RAG通过实时检索外部知识为模型提供可靠依据能显著降低模型“幻觉”生成更可信的回答。解决模型知识陈旧与数据局限大语言模型的知识受限于训练数据RAG可以动态接入最新或专有数据源动态实时检索让模型保持知识更新和专业性。突破输入长度限制处理大规模知识模型本身有输入长度限制RAG通过外部知识库承载大量信息使模型能够引用超出自身处理范围的专业或详细内容。增强通用性适配多领域任务结合检索与生成模型能灵活应对不同行业与用户需求扩展应用场景提升产品适用范围与实用性。最后怎么做它的工作流分三步一、数据预处理阶段知识库构建和文档解析与清洗→文档分块chunks→Embedding处理1.文档解析与清洗参考小红书AI观察者http://xhslink.com/o/pIBrQw0R0o2.文档切块3.Embedding处理对切块后的文档进行向量化的处理然后使用向量数据库进行存储向量数据库Milvus、Faiss、Elaticsearch、Chroma二、检索阶段查询向量数据库相似性检索→重排序相关性排序1.查询向量数据库相似性检索核心任务结合语义/关键词/图进行检索向量数据库Milvus、Faiss、Elaticsearch、Chroma2.reranking核心任务提升召回结果的相关性如果说相似性检索是尽可能召回多的候选内容那么重排序就是在候选里面挑出最优根据相关性选出top-k个chunk把真正相关的文档放在最前面这样可以显著提高召回率减少无关信息进入生成阶段降低LLM计算负担和幻觉风险。|| |具体技术路径可参考小红书荆言Winterhttp://xhslink.com/o/9iL0IYsDfZ三、生成阶段模型选型 → 上下文组装 → 提示词工程PE工程 → 生成参数调优 → 生成回答大模型基于“带依据的上下文”输出结构化回答结合 1.用户的Query 和 2.检索器从知识库中找到的相关文本块上下文生成一个最终的、连贯且信息丰富的回答这个过程就是“增强生成”。PSPE工程我们有机会单独讲这个很重要*补充1RAG中如何对用户问题进行Query的改写洞察问题此处请结合大家做过的项目/实习具体场景来谈1信息缺失用户仅说 “我要还多少”未明确贷款合同编号、账单所属月份、还款计划类型缺少指代主体。2表述模糊用户问 “逾期影响大吗”未明确逾期时长、贷款产品类型、逾期金额范围模糊影响维度包括征信、罚息、催收措施等。3依赖上下文多轮对话中用户先问 “我逾期 3 天能申请宽限期吗”接着问 “那这样还会收罚息吗”后一个 Query 依赖 “宽限期申请” 的上下文。4复杂多问用户问 “我现在逾期 10 天先还一半的话剩下的能延期吗另外我是担保人担保的这会影响担保人吗”包含 “逾期部分还款后延期可能性”“担保人责任影响” 两个子问题。选择策略1信息缺失 / 表述模糊零样本改写 HyDE零样本改写示例用户问 “我要还多少” → 改写为 “您编号为【XXX】的贷款合同XX 月的应还款金额是多少含本金、利息及手续费”。HyDE 示例用户问 “我的还款计划是怎样的” → 先让 LLM 生成假设答案 “用户想了解其贷款合同的分期还款计划包含每期还款金额、还款日期、剩余期数”再用该假设检索知识库中匹配的还款计划详情。2需要全面信息多查询生成典型场景用户问 “分期还款划算吗”生成多轮查询“分期还款的手续费率是多少”“分期还款对个人征信的影响”“分期还款的申请流程及审核时间”→ 检索后整合信息给用户清晰的成本、影响、流程说明。3多轮对话上下文压缩与注入LLM 总结对话历史成独立 Query 检索用户“我贷款逾期 5 天了客服说可以申请协商还款怎么弄”用户“那协商期间还会算罚息吗”→ LLM 总结上下文为 “用户贷款逾期 5 天询问协商还款流程及协商期间的罚息计算规则”再独立检索答案。4复杂问题问题分解用户问 “我担保的朋友逾期了他还了一部分剩下的没还我需要承担全部责任吗另外我自己的贷款还能正常申请吗”拆解为两个子问题“担保人在借款人部分还款后剩余未还债务的责任范围”“担保人自身贷款申请是否受被担保人逾期的影响”→ 分别检索后整合回答确保逻辑清晰、覆盖全面。权衡改写增加 LLM 调用成本和延迟简单问题直接检索更经济复杂场景值得投入参考小红书赵多金AI产品经理http://xhslink.com/o/6iH3PFJvdAo*补充2如何测评RAG的效果检索阶段核心指标精确率和召回率 其他指标效率、鲁棒性故意写一些错别字进行检测生成阶段 核心指标事实准确性幻觉率、事实冲突率、矛盾陈述率、信息完整性要素召回率、表达流畅性因果链是否完整如何测自动化评测人工评测四元组标注法陈述、来源、准确性、完整性参考小红书俊霖霖http://xhslink.com/o/1qC8UNfBXQG这里给大家精心整理了一份全面的AI大模型学习资源包括AI大模型全套学习路线图从入门到实战、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等资料免费分享扫码免费领取全部内容1. 成长路线图学习规划要学习一门新的技术作为新手一定要先学习成长路线图方向不对努力白费。这里我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。2. 大模型经典PDF书籍书籍和学习文档资料是学习大模型过程中必不可少的我们精选了一系列深入探讨大模型技术的书籍和学习文档它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。书籍含电子版PDF3. 大模型视频教程对于很多自学或者没有基础的同学来说书籍这些纯文字类的学习教材会觉得比较晦涩难以理解因此我们提供了丰富的大模型视频教程以动态、形象的方式展示技术概念帮助你更快、更轻松地掌握核心知识。4. 2026行业报告行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。5. 大模型项目实战学以致用当你的理论知识积累到一定程度就需要通过项目实战在实际操作中检验和巩固你所学到的知识同时为你找工作和职业发展打下坚实的基础。6. 大模型面试题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我们将提供精心整理的大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。7. 资料领取全套内容免费抱走学 AI 不用再找第二份不管你是 0 基础想入门 AI 大模型还是有基础想冲刺大厂、了解行业趋势这份资料都能满足你现在只需按照提示操作就能免费领取扫码免费领取全部内容

相关文章:

RAG检索增强生成技术及应用

首先,是什么? RAG是模型生成回答前从指定知识库中精准抓取信息,再结合这些依据去生成内容,回答问题(给一个学霸配备一个随身图书馆,方便随时查阅) 核心就是:知识库(存资料…...

Kubernetes与Istio服务网格最佳实践

Kubernetes与Istio服务网格最佳实践 1. Istio服务网格核心概念 1.1 什么是服务网格 服务网格是一种专门用于处理服务间通信的基础设施层,它负责在现代云原生应用的复杂服务拓扑中可靠地传递请求。 1.2 Istio架构组件 控制平面:包含Pilot、Galley、Citade…...

茉莉花插件:如何用3分钟完成中文文献元数据智能抓取与PDF大纲生成

茉莉花插件:如何用3分钟完成中文文献元数据智能抓取与PDF大纲生成 【免费下载链接】jasminum A Zotero add-on to retrive CNKI meta data. 一个简单的Zotero 插件,用于识别中文元数据 项目地址: https://gitcode.com/gh_mirrors/ja/jasminum 茉莉…...

深入剖析PHP 7.4.21开发服务器源码泄露漏洞及其复现过程

1. PHP开发服务器源码泄露漏洞初探 最近在测试PHP 7.4.21开发服务器时,我发现一个挺有意思的漏洞——源码可以直接被读取。这可不是闹着玩的,想象一下你的网站源代码像裸奔一样暴露在外,数据库配置、加密逻辑全都一览无余。这个漏洞影响所有P…...

thermalmonitordDisabler:突破iOS性能枷锁的终极方案——彻底解决过热降频问题指南

thermalmonitordDisabler:突破iOS性能枷锁的终极方案——彻底解决过热降频问题指南 【免费下载链接】thermalmonitordDisabler A tool used to disable iOS daemons. 项目地址: https://gitcode.com/gh_mirrors/th/thermalmonitordDisabler 当你在直播过程中…...

用Python和ROS 2 Humble手把手教你写一个简易机械臂仿真器(附完整代码)

用Python和ROS 2 Humble构建2自由度机械臂仿真器:从零实现运动学与轨迹可视化 在机器人开发中,机械臂的运动控制一直是核心难点。传统实体设备的高成本和复杂调试流程让许多开发者望而却步。本文将带你用Python和ROS 2 Humble构建一个完整的2自由度机械臂…...

Cytron PS2 Shield嵌入式驱动与极坐标映射原理

1. 项目概述Cytron PS2 Shield 是一款专为 Arduino 平台设计的 PlayStation 2(PS2)游戏手柄通信扩展板,其核心功能是将标准 PS2 手柄的串行协议解析为嵌入式系统可直接读取的结构化数据。该 Shield 通过 UART 接口与主控 MCU 连接&#xff0c…...

5个环保主题HTML网页设计实战:从零到一构建绿色网站

1. 环保主题网页设计入门指南 第一次接触环保主题网页设计时,我盯着空白的编辑器整整半小时不知从何下手。直到看到某公益组织的网站,才发现原来绿叶图标和自然色系能瞬间传递环保理念。对于前端新手来说,这类主题最大的优势在于视觉元素明确…...

Mojo调用Python生态的7种方式,第4种连PyTorch官方文档都没写!——混合编程兼容性白皮书首发

第一章:Mojo与Python混合编程全景概览Mojo 是一种兼具 Python 语法亲和力与系统级性能的现代编程语言,专为 AI 基础设施和高性能计算场景设计。它原生兼容 Python 生态,允许开发者在同一个项目中无缝调用 Python 模块、复用 NumPy/Torch 接口…...

StarRailAssistant:崩坏星穹铁道自动化终极解决方案,如何用开源脚本解放双手?

StarRailAssistant:崩坏星穹铁道自动化终极解决方案,如何用开源脚本解放双手? 【免费下载链接】StarRailAssistant 崩坏:星穹铁道自动化 | 崩坏:星穹铁道自动锄大地 | 崩坏:星穹铁道锄大地 | 自动锄大地 | …...

深入解析Franka ROS2控制器:关节位置、速度、阻抗控制有何不同?

深入解析Franka ROS2控制器:关节位置、速度、阻抗控制的核心差异与实战选择 在工业自动化和机器人研究领域,精确控制机械臂的运动是实现复杂任务的基础。Franka Emika机械臂凭借其高精度力控能力和开放的ROS2接口,已成为学术研究和工业应用的…...

数值分析实战指南:北航研究生大作业解析与代码实现

1. 数值分析大作业的核心价值 第一次接触北航研究生数值分析大作业时,我和大多数同学一样感到无从下手。直到在实验室熬了三个通宵后,我才真正明白这份作业的独特价值——它完美架起了理论与实践的桥梁。这份大作业最精妙之处在于,它不仅仅是…...

从医院呼叫器到智能家居:用Multisim 14.2复刻经典八路呼叫器(附完整仿真文件)

从医院呼叫器到智能家居:用Multisim 14.2复刻经典八路呼叫器(附完整仿真文件) 在电子技术发展的历史长河中,经典电路设计往往蕴含着跨越时代的智慧。八路呼叫器作为数字电子技术的经典教学案例,其核心模块——编码、锁…...

轻量级嵌入式按键驱动库:BartOS-button设计与多平台实践

1. BartOS-button 库概述BartOS-button 是为 BartOS 嵌入式实时操作系统项目配套开发的轻量级按键驱动库,专为资源受限的 IoT 终端设备设计。该库不依赖特定硬件抽象层(HAL),采用纯 C 实现,支持裸机(Bare-m…...

高效图像浏览:解锁90+格式的轻量级解决方案

高效图像浏览:解锁90格式的轻量级解决方案 【免费下载链接】ImageGlass 🏞 A lightweight, versatile image viewer 项目地址: https://gitcode.com/gh_mirrors/im/ImageGlass 在数字时代,我们每天都要与各种图像格式打交道&#xff0…...

OpenClaw+GLM-4.7-Flash:个人研究助手实战

OpenClawGLM-4.7-Flash:个人研究助手实战 1. 为什么需要AI研究助手? 作为一名经常需要查阅文献的研究者,我发现自己每天要花费大量时间在重复性劳动上:打开十几个浏览器标签页查找资料、手动整理参考文献格式、从零开始撰写综述…...

差分信号技术全景解析:从LVDS到SLVS-EC的工业与移动应用实战

1. 差分信号技术基础:为什么工业与移动设备都爱用它? 第一次接触差分信号是在十年前调试工业PLC背板时,当时单端信号在3米长的背板上频繁出现误码,换成LVDS后问题立刻消失。这种"用两条线传输一个信号"的技术&#xff0…...

eXoCAN:轻量级汽车电子CAN协议栈设计与实践

1. eXoCAN库概述:面向嵌入式汽车电子的轻量级CAN协议栈eXoCAN是一个专为资源受限嵌入式系统设计的轻量级、可移植CAN(Controller Area Network)驱动框架。其名称“eXoCAN”源自“eXtensible Open CAN”,强调其开放性、可扩展性与硬…...

别再为UVM环境发愁了!用路科V0虚拟机+《UVM实战》源码,10分钟搞定VCS/Verdi仿真

10分钟零配置玩转UVM验证:路科V0虚拟机《UVM实战》全攻略 当我在三年前第一次接触UVM验证时,花了整整三天时间在环境配置上——从EDA工具安装、环境变量配置到Makefile调试,每一步都踩过坑。直到发现路科V0预配置虚拟机这个"神器"&…...

数据科学入门指南:10周掌握数据分析核心技能 [特殊字符]

数据科学入门指南:10周掌握数据分析核心技能 🚀 【免费下载链接】Data-Science-For-Beginners 10 Weeks, 20 Lessons, Data Science for All! 项目地址: https://gitcode.com/GitHub_Trending/da/Data-Science-For-Beginners 想要在数据驱动的时代…...

ARM开发板与虚拟机Ubuntu桥接模式下的网络互通实战

1. 为什么需要桥接模式? 很多刚接触嵌入式开发的朋友都会遇到一个头疼的问题:ARM开发板和虚拟机里的Ubuntu系统死活ping不通。这就像两个人在同一个房间里却互相听不见对方说话,急死人。我当年第一次做嵌入式项目时,整整折腾了两天…...

Audacity音频编辑引擎深度解析:模块化架构设计与高性能音频处理技术

Audacity音频编辑引擎深度解析:模块化架构设计与高性能音频处理技术 【免费下载链接】audacity Audio Editor 项目地址: https://gitcode.com/GitHub_Trending/au/audacity Audacity作为一款开源跨平台专业音频编辑软件,其最新版本在架构设计和性…...

Vue3+Vant4移动端架构设计:现代化移动应用工程实践

Vue3Vant4移动端架构设计:现代化移动应用工程实践 【免费下载链接】vue3-vant4-mobile 👋👋👋 基于Vue3.2、vite3、vant4、pinia2、Typescript、windicss 等主流技术开发,集成 Dark Mode(暗黑)模式和系统主题色&#x…...

告别手动配置:利用Ansible Playbook自动化部署华为GaussDB数据库集群

从零到集群:Ansible Playbook全自动部署华为GaussDB实战指南 在数据库运维领域,重复性手动部署堪称效率杀手。我曾亲眼见证某金融科技团队为部署测试环境GaussDB集群,三名资深DBA耗费整整两天时间——从系统调优、依赖安装到配置文件修改&…...

告别动物实验?AI设计抗体成功率低怎么办?聊聊RFdiffusion的局限与未来优化方向

AI抗体设计的突破与挑战:从RFdiffusion看技术瓶颈与未来路径 当David Baker团队在bioRxiv上发布利用RFdiffusion实现抗体原子级精度从头设计的论文时,整个AI制药领域为之振奋。这项技术突破意味着,我们可能正站在抗体药物研发范式转变的临界点…...

WPF装饰器(Adorner)的妙用:打造可交互的矩形标注控件(附避坑指南)

WPF装饰器实战:构建智能矩形标注控件的完整指南 在图像处理、数据标注或UI设计工具中,矩形标注功能几乎是标配需求。想象一下这样的场景:用户双击图片生成标注区域,通过拖拽调整位置,自由缩放大小,所有操作…...

终极指南:深度解析ExplorerBlurMica如何用3大核心技术重塑Windows文件资源管理器透明美化体验

终极指南:深度解析ExplorerBlurMica如何用3大核心技术重塑Windows文件资源管理器透明美化体验 【免费下载链接】ExplorerBlurMica Add background Blur effect or Acrylic (Mica for win11) effect to explorer for win10 and win11 项目地址: https://gitcode.co…...

如何快速上手TegraRcmGUI:Switch破解注入完整指南

如何快速上手TegraRcmGUI:Switch破解注入完整指南 【免费下载链接】TegraRcmGUI C GUI for TegraRcmSmash (Fuse Gele exploit for Nintendo Switch) 项目地址: https://gitcode.com/gh_mirrors/te/TegraRcmGUI 你是否曾为Nintendo Switch的定制化需求而烦恼…...

ZYNQ7010核心板硬件设计实战——从原理图到PCB的工程化思考

1. 从零开始构建ZYNQ7010核心板 第一次接触ZYNQ7010这种集成了ARM处理器和FPGA的SoC芯片时,我既兴奋又忐忑。这种混合架构的芯片确实强大,但随之而来的硬件设计复杂度也让人头疼。特别是当看到官方推荐的8层甚至12层PCB方案时,作为个人开发者…...

不止于JWT:用FastAPI的Depends实现细粒度权限控制

📌 本文摘要 很多FastAPI初学者把JWT认证当成权限控制的终点,结果上线后频繁出现越权操作。本文通过一个真实的“多租户Todo”案例,带你从0搭建基于角色的访问控制(RBAC)和数据级权限(ABAC)&…...