当前位置: 首页 > article >正文

RAG:终结AI幻觉,让你的大语言模型秒变“知识渊博”!

本文深入浅出地介绍了检索增强生成RAG技术解释了其如何通过结合文档检索与大语言模型LLM有效减少AI幻觉现象。文章详细阐述了RAG的工作流程包括数据分块、嵌入转换、向量数据库存储、问题检索、上下文传递及基于事实的回答生成。此外还列举了RAG在PDF聊天机器人、客户支持、内部知识助手和电子商务等领域的应用场景并探讨了RAG可能失败的原因及优化策略。通过RAGAI系统能够利用特定、私有的数据进行回答从而避免因缺乏相关知识而产生幻觉。了解 RAG 的工作原理以及它为什么能够减少幻觉hallucinations如果我告诉你只需给我就接下来的 5 分钟你就能理解当今最重要的一项生成式人工智能GenAI概念会怎么样相信我这里不会有任何复杂的流行词也不会有令人困惑的架构图。我将展示一个简单的流程说明现代人工智能系统是如何利用你自己的文档和数据来回答问题的。本指南的真正目标是帮助你理解什么是检索增强生成RAG以及大语言模型LLMs为何会产生幻觉。你还将了解到 RAG 的应用场景以及它为何会成为最重大的突破之一。如果向量数据库、嵌入embeddings和检索流水线等术语听起来很复杂你完全不必担心。是时候让我们清晰地理解所有这些词汇了。问题所在像 GPT-4 或 Claude 这样的大语言模型是在来自互联网的大量文本上训练出来的。这包括来自博客、书籍、代码、维基百科以及更多渠道的内容。正是由于如此海量的学习大语言模型才能够回答你的查询。但那种训练是有过期时间的。我称之为“截止日期cutoff date”。这意味着大语言模型训练所依据的数据只截止到时间上的某一个特定节点。因此如果你询问在该日期之后发生的事情大语言模型可能无法准确回答因为这些内容从未包含在它的数据中。此外大语言模型也不了解你的个人或公司数据因为它从未见过这些数据。所以当你询问一个人工智能聊天机器人“我们的退款政策是什么”时它不会有正确的答案因为它没有针对你的退款政策进行过训练。它会说“我不知道”或者更糟糕的是自信地给出一个错误的答案。而这种自信地给出错误答案的部分就被称为“幻觉”。这是目前人工智能领域最大的问题之一。这是因为大语言模型的的目标是流畅地回答你的查询。该模型并非故意给出错误答案。由于它没有见过你的退款政策它便进行了一种猜测并最终得出了错误的答案。针对此类问题的解决方案就是 RAG。什么是 RAGRAG 代表检索增强生成Retrieval-Augmented Generation。相信我这是一个非常简单的概念。RAG 并不依赖于大语言模型LLM已经掌握的知识而是首先从你的文档中获取相关信息然后将该信息连同你的查询一起提供给大语言模型。这确保了大语言模型能够访问并利用你文档中存在的、经由验证的信息。让我们尝试用一个简单的例子来理解这一点。假设你是一名新员工一位客户打电话向你咨询某款特定产品的保修政策。由于你是新员工你并不了解该产品的保修条款。于是你迅速查阅了该产品的保修文档阅读了相关章节然后利用你刚刚读到的内容回答了客户。这正是 RAG 所做的事情。员工就是大语言模型LLM文档就是知识库而检索则是回答之前阅读相关章节的过程。RAG 的运作方式1. 将数据拆分为块Chunks我们不会将文档直接发送给大语言模型LLM因为文档的体积可能会非常庞大。所以请始终记住在 RAG 中第一步是将数据切割成更小的片段。每个片段可以是 300 到 500 个单词。这个过程被称为“分块chunking”。我们首先从对这些文档中存在的内容进行分块开始。2. 转换为嵌入Embeddings在这一步中我们刚刚创建的每一个数据块都会被转换成一串数字。这被称为“嵌入embedding”。它捕捉了该文本的语义。因此含义相似的词最终会得到相似的数字。这有助于进行语义搜索。3. 存储在向量数据库中既然我们已经创建了嵌入就需要将它们存储在某个地方。这些嵌入会被存储在一个被称为“向量数据库vector database”的特殊数据库中。一些常用的向量数据库包括Pinecone、Chroma 和 FAISS。4. 用户提出问题这是一个非常直接的步骤。在这里用户只需输入他们的问题。5. 查找最相关的块该问题也会被转换为一个嵌入。然后系统会在向量数据库中寻找其嵌入与问题嵌入最接近的数据。这意味着我们正在努力为你的查询寻找最相关的答案。6. 将上下文发送给大语言模型LLM一旦我们找到了最相关的块就会将它们连同原始问题一起作为最终的上下文发送给大语言模型。我们发送给大语言模型的提示词prompt看起来类似于“这里有一些信息检索到的块。现在请回答这个问题用户问题。”7. 基于事实的回答Grounded Answer现在大语言模型有了相关的素材可以利用。RAG 从中检索数据的文档起到了经由验证的源头作用。大语言模型此时将根据它所获得的信息来生成答案并且不会再有任何凭空猜测。一个简单的代码示例让我们来看看在 Python 中使用 LangChain 实现 RAG 架构是什么样的。不用担心代码理解逻辑就好。from langchain.document_loaders import TextLoaderfrom langchain.text_splitter import RecursiveCharacterTextSplitterfrom langchain.embeddings import OpenAIEmbeddingsfrom langchain.vectorstores import Chromafrom langchain.chains import RetrievalQAfrom langchain.chat_models import ChatOpenAI# Step 1: Load your documentloader TextLoader(company_policy.txt)documents loader.load()# Step 2: Split into chunkssplitter RecursiveCharacterTextSplitter(chunk_size500, chunk_overlap50)chunks splitter.split_documents(documents)# Step 3: Create embeddings and store in vector DBembedding_model OpenAIEmbeddings()vector_store Chroma.from_documents(chunks, embedding_model)# Step 4: Set up retrieval LLMllm ChatOpenAI(modelgpt-4, temperature0)qa_chain RetrievalQA.from_chain_type( llmllm, retrievervector_store.as_retriever())# Step 5: Ask a questionanswer qa_chain.run(What is our refund policy for digital products?)print(answer)这就是你能找到的最简化的 RAG 代码了。正如我们之前所探讨过的那样你从加载文件开始对其进行分块、生成嵌入、进行存储、检索最后给出回答。这就是以最简单明了的方式所诠释的整个 RAG 流水线pipeline。RAG 的应用场景RAG 已经变得非常流行并已成为众多真实世界人工智能工具的核心支柱。以下是几个 RAG 发挥主要作用的典型示例• PDF 聊天机器人 —— 上传一篇研究论文或学习文档并针对其内容提出问题。大语言模型LLM将根据该文档进行回答而不是根据其训练数据。• 客户支持机器人 —— 公司将其全部数据的使用权限开放给 RAG 系统。RAG 检索出正确的文章大语言模型则基于经由验证的信息进行回答而不是产生幻觉。• 内部知识助手 —— 公司可以拥有自己的助手用以回答有关公司的日常问题例如“新工程师的入职流程是什么”。这可以作为你公司的专属私人助手来解答内部的各种疑问。• 电子商务与产品搜索 —— 零售商利用 RAG通过将用户查询与现有的产品描述进行语义匹配来帮助用户找到合适的产品。你注意到这里的共同点了吗这些数据都是私有的、特定的或最新的。没有任何大语言模型针对它们进行过训练。为什么 RAG 有时仍会失败RAG 固然强大但它并非无懈可击的超级能力。你需要了解的最核心概念是如果检索阶段失败了那么后续的一切都会失败。 大语言模型LLM只能基于它接收到的信息进行处理。如果因为语义歧义而检索到了错误的文本块chunks那么大语言模型就会自信地生成错误的答案。 这就是为什么构建 RAG 系统的工程师会把大量时间花在以下几个方面•分块大小Chunk size—— 如果分块太大你可能会引入不必要的干扰信息如果分块太小则会丢失必要的上下文。•嵌入质量Embedding quality—— 不同的嵌入模型在处理不同类型的文本时性能表现各不相同。•检索策略Retrieval strategy—— 有时基础的相似度搜索就能正常工作但在绝大多数情况下混合检索将关键词检索与语义检索相结合的效果通常会更好。一个配备了卓越检索机制的普通大语言模型其表现将会超越一个配备了糟糕检索机制的强大大语言模型。回答的质量完全取决于检索内容的质量。总结与启示现在你已经了解了这样一个事实人工智能模型在时间上是固化的。它们并不知晓你的数据。而当它们不确定的时候就会产生幻觉。RAG 通过允许大语言模型LLM在得出答案之前先查阅经由验证的源文件从而解决了这一问题。通过这种方式大语言模型现在便能够知晓你的数据了。 而这一切正是通过我们前面所学到的流水线pipeline来实现的分块chunk、嵌入embed、存储store、检索retrieve、回答answer。 RAG 是防止幻觉并确保大语言模型利用你的特定数据进行回答的最佳方法之一。下一次当你向人工智能工具上传一份 PDF 文件而它能够准确回答时你就会完全明白其幕后正在发生着什么。说真的这两年看着身边一个个搞Java、C、前端、数据、架构的开始卷大模型挺唏嘘的。大家最开始都是写接口、搞Spring Boot、连数据库、配Redis稳稳当当过日子。结果GPT、DeepSeek火了之后整条线上的人都开始有点慌了大家都在想“我是不是要学大模型不然这饭碗还能保多久”我先给出最直接的答案一定要把现有的技术和大模型结合起来而不是抛弃你们现有技术掌握AI能力的Java工程师比纯Java岗要吃香的多。即使现在裁员、降薪、团队解散的比比皆是……但后续的趋势一定是AI应用落地大模型方向才是实现职业升级、提升薪资待遇的绝佳机遇这绝非空谈。数据说话2025年的最后一个月脉脉高聘发布了《2025年度人才迁徙报告》披露了2025年前10个月的招聘市场现状。AI领域的人才需求呈现出极为迫切的“井喷”态势2025年前10个月新发AI岗位量同比增长543%9月单月同比增幅超11倍。同时在薪资方面AI领域也显著领先。其中月薪排名前20的高薪岗位平均月薪均超过6万元而这些席位大部分被AI研发岗占据。与此相对应市场为AI人才支付了显著的溢价算法工程师中专攻AIGC方向的岗位平均薪资较普通算法工程师高出近18%产品经理岗位中AI方向的产品经理薪资也领先约20%。当你意识到“技术AI”是个人突围的最佳路径时整个就业市场的数据也印证了同一个事实AI大模型正成为高薪机会的最大源头。最后我在一线科技企业深耕十二载见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事早已在效率与薪资上形成代际优势我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我整理出这套 AI 大模型突围资料包【允许白嫖】✅从入门到精通的全套视频教程✅AI大模型学习路线图0基础到项目实战仅需90天✅大模型书籍与技术文档PDF✅各大厂大模型面试题目详解✅640套AI大模型报告合集✅大模型入门实战训练这份完整版的大模型 AI 学习和面试资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】①从入门到精通的全套视频教程包含提示词工程、RAG、Agent等技术点② AI大模型学习路线图0基础到项目实战仅需90天全过程AI大模型学习路线③学习电子书籍和技术文档市面上的大模型书籍确实太多了这些是我精选出来的④各大厂大模型面试题目详解⑤640套AI大模型报告合集⑥大模型入门实战训练获取方式有需要的小伙伴可以保存图片到wx扫描二v码免费领取【保证100%免费】

相关文章:

RAG:终结AI幻觉,让你的大语言模型秒变“知识渊博”!

本文深入浅出地介绍了检索增强生成(RAG)技术,解释了其如何通过结合文档检索与大语言模型(LLM),有效减少AI幻觉现象。文章详细阐述了RAG的工作流程,包括数据分块、嵌入转换、向量数据库存储、问题…...

Go 内存优化骚操作

1. 零内存占位符:struct{}{}原理:struct{} 是空结构体,Go 编译器对其做了特殊处理,它在内存中不占任何空间(大小为 0 字节)。场景 A:实现集合 (Set)map[string]struct{}。比起 map[string]bool&…...

凡亿AD22--AD软件泪滴的添加与移除

一、泪滴的基础认知1.1 泪滴的定义泪滴是PCB设计中,在走线与焊盘、走线与过孔(导孔)连接位置添加的「圆弧状或渐变状过渡结构」,本质是连接部位的“过渡加固层”,肉眼可见为类似水滴或圆弧的形态,核心作用是…...

2025_NIPS_Language Models Don‘t Always Say What They Think: Unfaithful Explanations in Chain-of-T...

文章主要内容与创新点总结 一、主要内容 该研究聚焦大语言模型(LLMs)的思维链(CoT)提示法,核心探讨CoT解释的“不忠实性”——即模型生成的分步推理过程可能无法真实反映其预测的底层逻辑,反而会系统性地误导用户。 研究背景:CoT提示法通过引导模型输出分步推理再给出…...

【项目实训(个人8)】

继续进行法律文书智能摘要系统的开发,新增了几个功能,并优化了用户体验概述本次开发为法律文书智能摘要系统新增了两项核心功能。其一是摘要版本管理,支持同一文档的多版本摘要生成、存储、对比和回滚。用户在生成摘要时,系统自动…...

运放电源端串联磁珠

在运放电源端串联磁珠,是一种常见的高频噪声抑制设计手段,但需结合具体应用场景谨慎使用。以下是关键要点:---作用与目的 - 抑制高频噪声:磁珠对高频信号(通常 >10 MHz)呈现高阻抗,将电源线上…...

Re: Linux系统篇(十八)进程篇·三:深度硬核!全面起底 Linux 进程状态变化与内核链表动态解绑

◆ 博主名称: 晓此方-CSDN博客 大家好,欢迎来到晓此方的博客。 ⭐️Linux系列个人专栏: 【主题曲】Linux ⭐️此方的GitHub: github_此方 ⭐️Re系列专栏:我们思考 (Rethink) 我们重建 (Rebuild) 我们记录 (Record…...

意识的“调谐客观还原”理论

“调谐客观还原”理论,通常称为 Orch-OR,是诺贝尔物理学奖得主罗杰彭罗斯与麻醉学家斯图尔特哈梅罗夫于20世纪90年代初提出的一种极具争议的意识假说。该理论的核心观点是:意识并非产生于神经元之间的经典电化学连接,而是源于神经…...

基于 Python 有限元法的光子微腔仿真:从理论到代码实现

引言:光子微腔与有限元法的结合实例# 安装基础依赖 pip install numpy matplotlib scipy# 安装GMSH网格生成器 pip install gmsh# 安装FEMWELL光子学有限元库 pip install femwell# 安装FEniCSx(FEMWELL的底层依赖) # 对于Ubuntu/Debian系统 …...

5分钟学会AnyFlip电子书一键下载:免费PDF转换终极指南

5分钟学会AnyFlip电子书一键下载:免费PDF转换终极指南 【免费下载链接】anyflip-downloader Download anyflip books as PDF 项目地址: https://gitcode.com/gh_mirrors/an/anyflip-downloader 你是否曾经在AnyFlip上找到一本精彩的电子书,想要永…...

多语言交易所源码/币币交易+期权交易+永续合约+Defi借贷+新币申购+矿机理财/前端uniapp纯源码+后端php

简介: 多语言交易所源码/币币交易期权交易永续合约Defi借贷新币申购矿机理财/前端uniapp纯源码后端php 语言:7种,看图 前端是uniapp纯源码,只有手机端,后端是php框架,清理了后门的,是最开始蓝…...

86、【Agent】【OpenCode】bash 工具提示词(完结)

【声明】本博客所有内容均为个人业余时间创作,所述技术案例均来自公开开源项目(如Github,Apache基金会),不涉及任何企业机密或未公开技术,如有侵权请联系删除 背景 上篇 blog 【Agent】【OpenCode】bash 工…...

根据等价类划分法,**有效等价类**是指符合系统规格说明、应被系统正常接受的输入范围

根据等价类划分法,有效等价类是指符合系统规格说明、应被系统正常接受的输入范围。 题目中密码长度要求为 6–12位(含端点),即最小长度为6,最大长度为12,且为整数位数。 因此,关于密码长度的有效…...

【软考高级架构】案例题考前突击——构建可观测与弹性服务架构的实践设计

案例分析题:构建可观测与弹性服务架构的实践设计 案例背景 某金融科技公司搭建了基于Spring Cloud 的微服务系统,用于支撑其多租户 SaaS 金融平台,核心功能包括用户管理、交易撮合、支付结算、风控审计等模块。由于业务快速扩张、团队并行开发,系统逐渐暴露出如下痛点: …...

Java全栈工程师面试实录:从基础到微服务的深度技术对话

Java全栈工程师面试实录:从基础到微服务的深度技术对话 面试官与程序员的对话 面试官(李哥): 你好,欢迎来参加我们公司的面试。我是李哥,负责技术面试。先简单介绍一下你自己吧。 程序员(张浩&a…...

【YOLOv8多模态融合改进】| IEEE2025 分层特征融合模块HFF 自适应权重 + 三重注意力,强化弱小目标细节保留

一、本文介绍 本文记录的是利用分层特征融合模块HFF改进YOLOv8的可见光-红外双模态目标检测。 HFF(Hierarchical Feature Fusion)通过浅层-深层特征逐元素融合、空间-通道-像素三重注意力建模与自适应加权分配结合,实现多模态来源下不同语义层级特征的自适应重要性学习与精…...

AI+HR 全生命周期智能管理实战指南:从概念到落地,解锁组织效能新增长!​

在企业数字化转型的浪潮中,人力资源管理正经历着前所未有的变革。据行业数据,61% 的 HR 领导者已进入 GenAI 实施进阶阶段,82% 的企业计划在 12 个月内部署 AI 智能体,而 AI 驱动的企业人均效能已实现3.2 倍提升。当传统 HR 深陷事…...

2026年AI面试准确率TOP榜:92%一致性背后,谁在定义行业新标准?

当年ChatGPT的横空出世,让全世界第一次见识到通用大模型的对话能力;DeepSeek 的爆发,则将AI的火种真正播撒到中国各行各业的毛细血管中,而在人力资源行业作为数字化转型的前沿阵地,首当其冲迎来了AI的全面渗透 &#x…...

如何优化鸿蒙 App 的启动速度?

子玥酱 (掘金 / 知乎 / CSDN / 简书 同名) 大家好,我是 子玥酱,一名长期深耕在一线的前端程序媛 👩‍💻。曾就职于多家知名互联网大厂,目前在某国企负责前端软件研发相关工作,主要聚…...

梳理尼日利亚外贸典型骗局分享高效避雷方法

与尼日利亚客户交易须防范D/P条款陷阱,信用证务必经第三国银行保兑,警惕提单信息泄露,掌握风控要点方能安全拓展西非市场。拒绝D/P托收条款切勿接受D/P付款方式。尼日利亚部分银行可能与客户勾结,在买方未付货款的情况下擅自放行提…...

ncmdumpGUI:免费解锁网易云音乐加密文件,3分钟实现跨设备播放自由

ncmdumpGUI:免费解锁网易云音乐加密文件,3分钟实现跨设备播放自由 【免费下载链接】ncmdumpGUI C#版本网易云音乐ncm文件格式转换,Windows图形界面版本 项目地址: https://gitcode.com/gh_mirrors/nc/ncmdumpGUI 你是否曾经遇到过这样…...

奇门对接顺丰电子面单:从200行“祖传代码”到优雅重构的经验分享

一、背景:那年写下的“能跑就行” 在我们的电商WMS系统中,发货环节需要通过菜鸟奇门电子面单接口向顺丰等快递公司申请运单号。这段核心代码写于多年前,当时的业务需求比较简单:只支持淘宝/天猫订单,快递也只有顺丰。…...

Java 程序员第 24 阶段:多 Agent 高阶实战,复杂业务场景完整落地实现

在多 Agent 基础篇中,我们探讨了角色协同、任务拆分的基本模式。本文进一步深入,聚焦高阶架构设计、跨服务协作与复杂场景完整落地,帮助读者构建生产级别的多 Agent 系统。一、高阶架构:从简单协同到生产级系统1.1 三层架构模型成…...

乒乓球教程

【课程教程资料】乒乓球入门必看,全方位发球技巧教学 文件大小: 3.9GB内容特色: 3.9GB高清发球拆解,握拍站位旋转全囊括适用人群: 零基础球友、校园社团、陪练家长核心价值: 20课时速成稳定发球,直接提升实战得分率下载链接: https://pan.qu…...

Esp32Robot入门04-服务端架构与本地Docker拉起(实战进阶:手把手教你用Docker部署小智助手服务端)

Esp32Robot入门04-服务端架构与本地Docker拉起(实战进阶:手把手教你用Docker部署小智助手服务端) 📌 文章简介: 在AI智能硬件开发中,ESP32-S3因高性价比备受青睐,但面对千亿参数的本地大模型与高…...

如何快速掌握DeepL翻译插件:浏览器跨语言阅读的终极解决方案

如何快速掌握DeepL翻译插件:浏览器跨语言阅读的终极解决方案 【免费下载链接】deepl-chrome-extension A DeepL Translator Chrome extension 项目地址: https://gitcode.com/gh_mirrors/de/deepl-chrome-extension DeepL翻译插件是一款基于DeepL API的高质量…...

抖音批量下载神器:5分钟掌握高效内容采集的终极指南

抖音批量下载神器:5分钟掌握高效内容采集的终极指南 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback support…...

算法实例分析:使数组相等的最小开销

使数组相等的最小开销通过题意分析可知要让所有值相等,必然不需要超出数据的最大最小值,因此左右边界可以预先缩小范围。然后根据我们上面的分析不断缩小搜索边界范围。关于函数的计算,只要统计所有数据与的差值再乘上权重即可。最后注意&…...

国内大学生必备的AI论文写作工具有哪些?

国内高校学生常用的 AI 论文写作工具,以本土化全流程工具为主,结合通用大模型与专业辅助功能,覆盖选题、框架搭建、初稿撰写、查重降重、格式调整等关键环节,以下是主流工具详解与对比:一、本土全流程论文 AI 工具&…...

太顶了!输入主题,这几款AI论文软件自动生成毕业论文初稿!

毕业季论文焦虑?还在为选题、查资料、写大纲、润色修改熬夜到凌晨?别担心,现在只需输入主题,几款AI论文工具就能自动生成图文并茂的毕业论文初稿,从开题到定稿全流程搞定!千笔AI、ThouPen、豆包、DeepSeek、…...