当前位置: 首页 > article >正文

RAG我懂你:从架构到知识库构建

导航传统大语言模型主要依赖参数中的隐式知识进行回答容易受到知识过期、幻觉和领域知识不足等问题影响。RAG 的核心思想是在生成答案之前先从外部知识库中检索相关信息再将这些信息作为上下文提供给大语言模型从而提升回答的准确性、可追溯性和时效性。检索增强生成架构架构类型是否修改大模型参数是否修改检索器参数代表方法特点无微调 RAG否否In-Context RALM简单、易落地检索器微调否是REPLUG适合黑盒大模型仅语言模型微调是否RETRO强化模型利用外部知识的能力检索器与模型协同微调是是Atlas效果潜力高但训练复杂黑盒增强架构黑盒增强架构指的是不修改或无法访问大语言模型内部参数主要通过Prompt、外部检索、检索器优化或输出反馈来提升生成效果。无微调无微调架构是所有RAG架构中形式最简单的。该架构中检索器和语言模型经过分别独立的预训练后参数不再更新直接组合使用。In-Context RALM是该框架下的代表性方法在实际工程中大多数企业级 RAG 系统最初都采用这种形式知识库、Embedding 模型、向量数据库和大语言模型相互独立只通过 Prompt 将检索结果注入上下文。检索器微调在检索器微调架构中大语言模型参数保持不变仅通过语言模型的输出反馈来优化检索器。其核心思想是如果某个文档能让语言模型更容易生成正确答案那么这个文档就应该被检索器赋予更高权重。REPLUG 是这类方法的代表之一。它利用语言模型对不同检索文档的困惑度变化作为监督信号训练检索器更倾向于召回那些能显著提升生成质量的文档。白盒增强架构大语言模型和检索器是独立预训练的二者可能存在匹配欠佳的情况。白盒增强架构通过微调大语言模型来配合检索器以提升RAG 的效果。根据是否对检索器进行微调分为两类• 仅语言模型微调• 检索器和语言模型协同微调仅微调语言模型仅微调语言模型指的是检索器作为一个预先训练好的组件其参数保持不变大语言模型根据检索器提供的上下文信息对自身参数进行微调。RETRO是微调语言模型的代表性方法之一。检索器和语言模型协同微调在该架构中检索器和语言模型同时进行微调以实现更好的协同效果。该方法的代表性方法是Atlas。知识库构建在RAG 框架中知识库构建主要涉及数据采集及预处理与知识库增强两个步骤。数据采集及预处理• 数据采集: 来自不同渠道的数据被整合、转换为统一的文档对象。这些文档对象不仅包含原始的文本信息还携带有关文档的元信息Metadata• 预处理: 预处理可以提升数据质量和可用性。数据预处理主要包括数据清洗和文本分块两个过程。• 数据清洗旨在清除文本中的干扰元素。• 文本分块是将长文本分割成较小文本块的过程文本分块的效果直接影响后续检索结果的质量知识库增强知识库增强是通过改进和丰富知识库的内容和结构以提升其质量和实用性• 查询生成 利用大语言模型生成与文档内容紧密相关的伪查询。这些伪查询从查询的角度来表达文档的语义可以作为相关文档的“键”供检索时与用户查询进行匹配。• 标题生成 利用大语言模型为没有标题的文档生成合适的标题查询与检索增强查询增强查询增强是指在检索阶段对用户输入的查询进行改进和优化以提升检索结果的相关性和准确性。查询增强的主要方法包括• 查询语义增强: 通过同义改写和多视角分解等方法来扩展、丰富用户查询的语义以提高检索的准确性和全面性• 查询内容增强: 通过生成与原始查询相关的背景信息和上下文从而丰富查询内容提高检索的准确性和全面性。查询内容增强方法通过引入大语言模型生成的辅助文档为原始查询提供更多维度的信息支持检索器检索器是RAG系统中的核心组件负责从知识库中检索出与用户查询相关的文档判别式检索器判别式检索器通过判别模型对查询和文档是否相关进行打分。判别式检索器通常分为两大类• 稀疏检索器 稀疏检索器Sparse Retriever是指使用稀疏表示方法来匹配文本的模型通过统计文档中特定词项出现的统计特征来对文档进行编码然后基于此编码计算查询与知识库中的文档的相似度来进行检索• 稠密检索器 稠密检索器一般利用预训练语言模型对文本生成低维、密集的向量表示通过计算向量间的相似度进行检索生成式检索器生成式检索器通过生成模型对输入查询直接生成相关文档的标识符。检索效率增强向量数据库可以实现高效的向量检索与查询。向量数据库的核心是设计高效的相似度索引算法。 常用的索引技术主要分为三大类• 基于空间划分: 将搜索空间划分为多个区域来实现索引• 基于乘积量化: 将高维向量空间划分为多个子空间并在每个子空间中进行聚类得到码本和码字以此作为构建索引的基础• 基于图: 构建一个邻近图将向量检索转化为图的遍历问题检索结果重排通过对检索结果重排可以提升检索结果的相关性和准确性。常见的重排方法包括• 基于交叉编码的方法 基于交叉编码的重排方法利用交叉编码器Cross-Encoders来评估文档与查询之间的语义相关性• 基于上下文学习的方法 基于上下文学习的方法是指通过设计精巧的Prompt使用大语言模型来执行重排任务RAG 系统评估RAG 系统的评估通常需要同时关注检索质量和生成质量。检索质量评估• Recall相关文档是否被召回。• Precision召回结果中有多少是真正相关的。• MRR正确文档是否排在靠前位置。• nDCG综合考虑相关性和排序位置。生成质量评估• 正确性答案是否符合事实。• 忠实性答案是否基于检索到的证据生成。• 完整性是否覆盖用户问题的关键方面。• 可引用性是否能给出明确来源。• 幻觉率是否编造不存在的信息。优化增强过程RAG 并不意味着每次生成都必须检索。是否检索、在哪里融合检索结果、是否需要多轮检索都会影响系统成本、延迟和答案质量。何时增强判断是否需要增强的核心在于判断大语言模型是否具有内部知识。判断模型是否具有内部知识的方法可以分为两类:• 外部观测法通过 Prompt 询问模型是否具备相关知识或通过置信度、困惑度等统计信号进行判断。• 内部观测法通过检测模型内部神经元或隐藏状态判断模型是否存储相关知识。这类方法通常需要访问模型内部参数更适合白盒场景。内部/外部观测法都存在一定局限性最好是定义一个决策链: 规则兜底 LLM 判断 检索质量评估 证据充分性验证.何处增强可以在输入端、中间层、输出端使用检索的结果:• 输入端: 直接将检索到的外部知识文本与用户查询拼接到Prompt中然后输入给大语言模型,主流方式。• 中间层: 先将检索到的外部知识转换为向量表示然后将这些向量插入通过交叉注意力融合到模型的隐藏状态中。黑盒架构中无法使用。• 输出端: 利用检索到的外部知识对大语言模型生成的文本进行校准是一种后处理的方法多次增强• 分解式增强 将复杂问题分解为多个子问题子问题间进行迭代检索增强最终得到正确答案• 渐进式增强 将问题不断细化然后分别对细化的问题进行检索增强力求给出全面的答案以覆盖用户需要的答案学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相关文章:

RAG我懂你:从架构到知识库构建

导航 传统大语言模型主要依赖参数中的隐式知识进行回答,容易受到知识过期、幻觉和领域知识不足等问题影响。RAG 的核心思想是:在生成答案之前,先从外部知识库中检索相关信息,再将这些信息作为上下文提供给大语言模型,从…...

RAG知识库全流程实操:从分块→检索→生成,逐步拆解

搭了个 RAG,文档灌进去,问题丢过来,回答出来了——看起来能用了。 但问它"RAG 四代架构是什么",它编了个"第一代 RTG"——这个术语根本不存在。问它"嵌入模型中文怎么选",它说"建…...

新手必看:Infineon UDE软件License加载保姆级教程(含永久/临时版区别与常见报错解决)

Infineon UDE软件License配置全指南:从加载到深度排错 引言 在嵌入式开发领域,Infineon UDE(Universal Debug Engine)作为一款功能强大的调试工具,被广泛应用于汽车电子、工业控制等高可靠性场景。然而对于刚接触这款工…...

推荐五家SF6在线监测报警系统

在有六氟化硫气体存在的场所,如小区配电室、变电站、电厂等,SF6在线监测报警系统起着至关重要的作用。它能实时监测现场气体浓度,在浓度超标时第一时间发出报警信号,及时消除隐患。今天就为大家推荐五家SF6在线监测报警系统品牌&a…...

GitHub下载速度提升10倍:Fast-GitHub终极解决方案

GitHub下载速度提升10倍:Fast-GitHub终极解决方案 【免费下载链接】Fast-GitHub 国内Github下载很慢,用上了这个插件后,下载速度嗖嗖嗖的~! 项目地址: https://gitcode.com/gh_mirrors/fa/Fast-GitHub 还在为GitHub的龟速下…...

Agent+用药提醒:真正难的不是提醒,而是结合病情和依从性管理

用药提醒如果只做成定时推送,本质上接近一个带药品名称的闹钟。医疗健康应用里更棘手的问题是:用户是否按计划执行、漏服后如何记录、连续异常时是否需要升级提醒,以及这些规则如何被机构确认并可审计。本文只讨论技术架构和工程流程示例&…...

免费开源AMD Ryzen调试工具:SMUDebugTool完整使用指南与性能调优实战

免费开源AMD Ryzen调试工具:SMUDebugTool完整使用指南与性能调优实战 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地…...

RabbitMQ连接报错ACCESS_REFUSED?别慌,手把手教你排查用户权限与vhost配置

RabbitMQ连接报错ACCESS_REFUSED?三步精准定位权限与vhost问题 深夜的报警短信总是格外刺眼——"RabbitMQ连接失败:ACCESS_REFUSED"。这个看似简单的权限错误背后,往往隐藏着vhost配置、用户权限和客户端参数的三重陷阱。本文将带您…...

从源码到蓝图:使用Visual Paradigm高效逆向工程UML图

1. 逆向工程的价值与Visual Paradigm定位 接手一个遗留项目时,最头疼的往往不是写新代码,而是理解前人留下的"天书"。上周我就遇到个典型场景:客户紧急要求给三年前的老系统加功能,但项目文档只有一张模糊的截图和半页残…...

出口欧美设备机箱:必须符合HASCO模架与DME顶针标准

在出口欧美市场的设备机箱领域,符合HASCO模架与DME顶针标准是至关重要的。这不仅关乎产品的质量和性能,还影响着企业在国际市场的竞争力。本文将深入探讨这一标准的重要性,并结合深圳市机汇五金制品有限公司(以下简称“机汇五金”…...

伊犁盛夏赴花海,霍城紫浪漫卷天山脚下

在新疆伊犁哈萨克自治州霍城县,天山北麓的缓坡地带铺展着国内规模最大的薰衣草种植区。每年夏季,这片土地被大面积的薰衣草覆盖,呈现出连绵的紫色景观。霍城与法国普罗旺斯、日本北海道富良野地处相近纬度,气候条件适宜薰衣草生长…...

为什么很多人学不会渗透?因为一开始就没学HTTP

最近刚开始系统学 Web 安全,发现很多人一上来就学 Kali、SQLMap、各种扫描器,但其实最应该先学的是 HTTP。因为后面很多 Web 漏洞,本质上都是在“修改 HTTP 请求”。比如:- SQL 注入 → 改参数 - XSS → 改输入内容 - 越权 → 改 …...

别再只跑测试了!用KAIR库从零训练你自己的SwinIR超分模型(附DIV2K/Flickr2K数据集处理避坑指南)

从测试到训练:SwinIR超分模型实战进阶指南 当你第一次用SwinIR的预训练模型将模糊照片变得清晰时,那种惊艳感可能让你跃跃欲试想训练自己的模型。但面对几十GB的数据集和复杂的训练配置,很多开发者停在了"只跑测试"的阶段。本文将带…...

手把手教你给M301H-BYT盒子刷当贝纯净桌面(附Hi3798芯片短接点位图)

从零开始:M301H-BYT盒子刷机实战指南 家里的老旧电视盒子用久了总是卡顿、存储不足,还限制应用安装?今天我们就来彻底解决这个问题。本文将手把手教你如何为M301H-BYT盒子刷入当贝纯净桌面系统,让你的老设备重获新生。不同于简单的…...

2026年青岛GEO优化排名前五,你选对了吗?

行业痛点分析随着AI大模型成为企业获客与品牌传播的核心入口,GEO(生成式引擎优化)已成为抢占AI流量红利的必争之地。然而,当前青岛企业在GEO优化领域面临三大核心挑战:地域匹配精准度低,测试显示65%本地企业…...

座机号码认证支持哪些机型?固话企业认证覆盖华为/小米/OPPO/vivo等手机

很多做业务的朋友都有这种体会:好不容易联系到一个精准意向客户,电话拨过去,还没等开口,对方直接挂断。更有甚者,手机屏幕上赫然跳出“疑似推销”四个大字。现在的职场沟通,信任成本高得离谱。如果你还指望…...

Vue3 表单深度解析

Vue3 表单深度解析 引言 随着前端技术的发展,Vue.js 已经成为最受欢迎的前端框架之一。Vue3 作为 Vue.js 的最新版本,带来了许多改进和新特性。其中,表单处理是 Vue3 中一个非常重要的部分。本文将深入解析 Vue3 表单的用法、特点以及最佳实践。 Vue3 表单概述 在 Vue3 …...

手把手教你给Ubuntu 22.04的Intel蓝牙‘补丁’:ibt-1040-1050固件缺失的保姆级修复指南

深度修复Ubuntu 22.04中Intel蓝牙固件缺失问题:从原理到实践的全方位指南 在Linux系统中,硬件设备的正常运行往往依赖于对应的固件支持。对于使用Intel AX200/AX201等无线网卡的用户来说,蓝牙功能突然失效是一个常见但令人困扰的问题。本文将…...

边缘计算与机器视觉在产线质检中的实战应用与优化

1. 项目概述:当产线质检遇上边缘计算与机器视觉在制造业的车间里,质检环节一直是效率与质量的“卡脖子”点。传统的人工目检,不仅劳动强度大、易受疲劳和情绪影响,而且标准难以统一,漏检、误检时有发生。而将高清相机拍…...

从开发板到工业边缘计算平台:UP Board二代的硬件解析与应用实战

1. 项目概述:从“开发板”到“边缘计算平台”的认知跃迁最近在整理手头的嵌入式设备,翻出了这块研扬的UP Board二代。说实话,第一次拿到它的时候,我下意识地还是把它归类为“一块性能不错的x86开发板”,就像树莓派之于…...

【优化求解】一种用于边缘计算中协作回归学习的分布式ADMM方法附matlab代码

‍✅作者简介:热爱科研的Matlab仿真开发者,擅长毕业设计辅导、数学建模、数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真🍎完整代码获取 定制创新 论文复现点击:Matlab科研工作室👇 关注我领取海量m…...

【路径规划】基于A星算法实现图结构中的多机器人路径规划附matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长毕业设计辅导、数学建模、数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎完整代码获取 定制创新 论文复现点击:Matlab科研工作室👇 关注我领取海量m…...

【信号处理】基于高斯函数的Caputo-Fabrizio分数阶导数闭式表达式及其在信号处理中的应用附matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长毕业设计辅导、数学建模、数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎完整代码获取 定制创新 论文复现点击:Matlab科研工作室👇 关注我领取海量m…...

【图像增强】基于Grünwald–Letnikov和Riesz分数阶算子的四种分数阶PDE图像增强算法的MATLAB实现

✅作者简介:热爱科研的Matlab仿真开发者,擅长毕业设计辅导、数学建模、数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室👇 关注我领取海量matlab电子书和…...

MIPI CSI调试实战:从时序不稳到稳定传输,我调了这三个关键点

MIPI CSI调试实战:从时序不稳到稳定传输的三大关键突破 调试MIPI CSI接口就像在解一道复杂的物理方程,每一个变量都可能成为图像花屏或数据丢包的罪魁祸首。去年在为一款工业摄像头模组开发驱动时,我遇到了令人抓狂的随机性图像撕裂问题——在…...

Ubuntu 22.04升级后,Chrome总提示‘连接中断’?别急着重装,试试检查这个代理设置

Ubuntu 22.04升级后Chrome连接中断的深度排查指南 最近不少Ubuntu 22.04用户在系统升级后遇到了一个令人困扰的问题——Chrome浏览器频繁提示"连接中断"。这个问题看似简单,实则可能隐藏着系统级网络配置变更的深层原因。本文将带你从多个维度全面排查&am…...

模态生成器:原理详解与推荐开源项目

把一种或多种输入模态,转换、补全或生成另一种目标模态的模块。例如: 文本 → 图像 图像 → 文本 文本 → 语音 语音 → 文本 图像 文本 → 视频 图像 文本 → 机器人动作 图像 → 深度图 / mask / 结构化检测结果 缺失模态 → 伪模态补全在 sVLM / ML…...

英雄联盟LCU工具集LeagueAkari:终极自动化游戏助手完整指南

英雄联盟LCU工具集LeagueAkari:终极自动化游戏助手完整指南 【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit LeagueAkari是一款基于…...

芯片HAST测试:通电工作下如何精准模拟极端环境挑战?

为了确保产品在高温、高湿等恶劣条件下仍能正常工作,HAST(Highly Accelerated Stress Test)测试成为不可或缺的一部分。本文将深入解析HAST测试,并探讨如何在通电工作状态下进行精准模拟,以应对极端环境挑战。什么是HA…...

汤姆供应链

1. 自营中泰专线渠道,泰国曼谷设有清关公司与海外仓,本地团队 24 小时响应;2. 与多家船公司签订特种柜舱位协议,旺季舱位有保障;3. 服务过机械制造、建材、跨境电商等行业客户,累计运输超 1000 票大件设备&…...