当前位置: 首页 > article >正文

大模型RAG (一)

一、RAG介绍1、LLM的缺陷LLM的知识不是实时的不具备知识更新.LLM可能不知道你私有的领域/业务知识.LLM有时会在回答中生成看似合理但实际上是错误的信息。2、为什么会用到RAG减少幻觉Hallucination回答基于真实资料大幅降低 AI 编造事实的概率。知识实时更新只需更新外部文档库无需重新训练昂贵的大模型。接入私有数据让通用 AI如 GPT使用企业内部文件、客户数据等私有知识。可追溯、可验证回答可附带来源链接 / 文档方便审核与查证。成本更低相比全量微调Fine-tuningRAG 是更经济的领域适配方案。总之提高准确性通过检索相关的信息RAG可以提高生成文本的准确性。减少训练成本与需要大量数据来训练的大型生成模型相比RAG可以通过检索机制来减少所需的训练数据量从而降低训练成本。适应性强RAG模型可以适应新的或不断变化的数据。由于它们能够检索最新的信息因此在新数据和事件出现时它们能够快速适应并生成相关的文本。3、RAG 定义RAG (Retrieval Augmented Generation 检索增强生成)是一种让大语言模型LLM在回答问题时先从外部知识库检索相关信息再基于检索到的内容生成回答的 AI 技术框架。简单来说就是让模型 **“开卷考试”**先查资料再作答4、RAG vs. 传统搜索 vs. 模型微调传统搜索返回文档片段需要用户自己阅读总结RAG直接返回自然语言答案。纯 LLM知识有截止日期、易编造RAG基于外部实时 / 私有数据。模型微调Fine-tuning修改模型权重、成本高、难更新RAG外挂知识库、成本低、易更新。RAG文档2312.109975、核心工作流程RAG 主要分为离线构建与在线查询两大阶段1. 离线构建知识库Indexing文档处理将 PDF、Word、网页等资料切割成小文本块Chunk。向量化Embedding用 Embedding 模型将每个文本块转换成数值向量代表语义。存储将向量与原文存入向量数据库Vector DB2. 在线查询与生成检索Retrieval用户提问 → 问题向量化 → 在向量库中做语义相似度搜索→ 找出最相关的几段文本。增强Augmentation将用户问题 检索到的参考资料拼接成一个新的 Prompt。生成Generation将 Prompt 送入 LLM模型严格依据参考资料生成最终回答。6、典型应用场景企业智能客服基于产品手册、内部规章回答员工 / 客户问题。法律 / 医疗助手引用法条、病历、文献生成专业分析。学术研究总结论文、基于最新文献回答专业问题。个人知识库基于自己的笔记、邮件、资料进行问答。7、核心技术栈简版向量数据库Milvus, FAISS, Pinecone, ChromaEmbedding 模型text-embedding-ada-002, BGE, E5LLMGPT-4o, Claude 3, Llama 3, 通义千问框架LangChain, LlamaIndex二、完整走一遍RAG检索增强生成流程。场景用公司内部产品手册做一个智能问答客服。一、先明确目标用户问“咱们这款智能门锁支持指纹解锁吗最多能录几个指纹”纯大模型会瞎编幻觉RAG 会先去查手册 → 再回答。二、第 1 步准备知识库离线你有一份智能门锁产品手册.pdf1. 文档切分Chunking把长 PDF 切成小段比如chunk1产品外观、材质chunk2解锁方式指纹、密码、NFCchunk3指纹录入上限说明chunk4电池续航...2. 向量化Embedding把每个 chunk 变成一串数字向量语义向量。比如“指纹最多支持 50 个” →[0.12, 0.45, 0.67, ...]3. 存入向量数据库把向量 原文一起存起来方便后面快速检索。三、第 2 步用户提问在线用户问题“智能门锁支持指纹吗能录多少个”1. 问题向量化把问题也变成向量[0.11, 0.46, 0.68, ...]2. 向量检索最关键一步系统在向量库里找最相似的 chunks最相似chunk2解锁方式次相似chunk3指纹上限返回结果chunk2本门锁支持指纹、密码、NFC 三种解锁方式。chunk3指纹最多支持录入 50 个。三、第 3 步构造 Prompt增强把问题 检索到的资料一起喂给大模型请根据以下资料回答问题不要编造。资料1. 本门锁支持指纹、密码、NFC 三种解锁方式。2. 指纹最多支持录入 50 个。问题智能门锁支持指纹吗能录多少个四、第 4 步大模型生成回答模型输出这款智能门锁支持指纹解锁最多可以录入 50 个指纹。这就是 RAG检索 → 增强 → 生成五、RAG 检索增强生成 标准技术架构框图六、RAG 干了啥传统 LLM闭卷考试容易瞎编RAG开卷考试先查资料再答题一句话极简版先查资料 → 再给答案检索 查书增强 把书里内容放进问题里生成 AI 整理成通顺回答先外挂知识库检索 → 再把资料喂给模型 → 最后生成可靠回答三、RAG系统搭建流程英文术语中文释义User用户Query查询Input输入Output输出Knowledge base知识库loader加载Documents文档Spliter切分document snippets文档片段Embedding Machine嵌入器Embeddings向量化Vetor Database向量数据库Similarity query相似度查询Relevant Snippets相关片段Combine Context and Prompt结合上下文和提示Indexing索引Retrieval检索索引(Indexing)索引首先清理和提取各种格式的原始数据如PDF、HTML、Word、Markdown然后将其转换为统一的纯文本格式。为了适应语言模型的上下文限制文本被分割成更小的、可消化的块【chunk】。然后使用嵌入模型将块编码成向量表示并存储在向量数据库中。这一步对于在随后的检索阶段实现高效的相似性搜索至关重要。知识库分割成chunks并将chunks向量化至向量库中。检索(Retrieval)在收到用户查询(Query)后RAG系统采用与索引I阶段相同的编码模型将查询转换为向量表示然后计算索引语料库中查询向量与块向量的相似性得分。该系统优先级和检索最高k(Top-K)块显示最大的相似性查询。例如二维空间中的向量可以表示为(x,y)表示从原点0,0)到点(x,y的有向线段1.将文本转成一组浮点数每个下标i对应一个维度2.整个数组对应一个n维空间的一个点即文本向量又叫Embeddings3.向量之间可以计算距离距离远近对应语义相似度大小

相关文章:

大模型RAG (一)

一、RAG介绍 1、LLM的缺陷 LLM的知识不是实时的,不具备知识更新.LLM可能不知道你私有的领域/业务知识.LLM有时会在回答中生成看似合理但实际上是错误的信息。 2、为什么会用到RAG 减少幻觉(Hallucination):回答基于真实资料&…...

深度剖析:LangGraph中的状态管理与循环逻辑

深度剖析:LangGraph中的状态管理与循环逻辑 副标题:从核心原理到工业级落地,彻底掌握LangChain生态中下一代Agent编排的灵魂 第一部分:引言与基础 (Introduction & Foundation) 1. 引人注目的标题 深度剖析:LangGraph中的状态管理与循环逻辑——从核心原理到工业级…...

微软新 Xbox 负责人阿莎·夏尔马忙不停:Game Pass 定价待调,“螺旋计划”影响几何?

承诺“Xbox 回归”后,负责人忙不停微软新任 Xbox 负责人承诺“Xbox 回归”后,一直忙得不可开交。阿莎夏尔马在 3 月游戏开发者大会上与发行商会面,最近几周走访微软旗下游戏工作室和产品团队。曾在微软 CoreAI 部门工作的她目前处于学习阶段&…...

vivo X300 Ultra长焦套件集市游玩体验佳,小巧轻便成家庭出游必备!

vivo X300 Ultra长焦套件体验:集市游玩拍出惊喜,小巧轻便再游必备!原本我以为 vivo X300 系列只是个博眼球、难促销售的噱头概念。然而,带着这部手机和精心设计、造型奇特的小镜头套件度过一个周末后,我玩得十分尽兴。…...

RAG基本流程

RAG(Retrieval-Augmented Generation,检索增强生成)是一种将外部知识检索与大语言模型(LLM)生成能力相结合的技术,用于提升回答的准确性、减少“幻觉”(Hallucination),并…...

Super Qwen Voice World智能语音助手开发:基于Python的完整项目实战

Super Qwen Voice World智能语音助手开发:基于Python的完整项目实战 1. 引言:语音交互的新时代 你有没有想过,给自己的项目加上一个能听会说的智能语音助手?就像电影里的科幻场景一样,用自然语言和机器对话&#xff…...

如何监控AWR数据收集Job_DBA_SCHEDULER_JOBS中的BSLN_MAINTAIN_STATS

BSLN_MAINTAIN_STATS状态需查DBA_SCHEDULER_JOBS中含%BSLN%MAINTAIN%STATS%的作业,若无结果则可能被禁用或功能未启用;还需确认维护窗口、AWR快照、statistics_level参数及磁盘空间是否正常。查 Job_DBASCHEDULER_JOBS 里 BSLN_MAINTAIN_STATS 的状态这个…...

【Gartner 2024 DevOps趋势验证】:已上线智能代码生成的团队,MTTR缩短61%,但89%未启用变更影响分析——你的流水线安全吗?

第一章:智能代码生成与DevOps流水线整合 2026奇点智能技术大会(https://ml-summit.org) 现代软件交付已从“人工驱动”转向“AI协同驱动”,智能代码生成不再仅限于IDE插件中的单点辅助,而是深度嵌入CI/CD流水线各阶段,实现从需求…...

Py之pycocotools:从COCO数据加载到自定义标注可视化的实战指南

1. 为什么你需要pycocotools 如果你正在做计算机视觉相关的项目,特别是目标检测、实例分割这类任务,那么COCO数据集一定不会陌生。作为计算机视觉领域最常用的基准数据集之一,COCO提供了超过20万张标注图像,包含80个常见物体类别。…...

阿里云国际版防火墙规则:从安全组配置到流量过滤的深度实操

在云计算的生产环境中,“防火墙规则”是保障业务安全的第一道、也是最关键的一道防线。很多开发者在阿里云国际版(Alibaba Cloud International)开通实例后,常会遇到“SSH连不上”、“Web页面打不开”或者“数据库连接超时”等问题…...

2026届最火的十大降AI率方案实测分析

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 让AIGC(人工智能生成内容)留下的痕迹得以降低,其关键之处…...

2026奇点智能技术大会核心成果发布(AI文档生成引擎v3.2正式开源)

第一章:2026奇点智能技术大会:AI接口文档生成 2026奇点智能技术大会(https://ml-summit.org) 在2026奇点智能技术大会上,AI驱动的接口文档自动生成技术成为核心议题之一。该技术依托多模态大模型对源码、注释、测试用例及通信日志的联合理解…...

ComfyUI-Impact-Pack终极指南:如何快速掌握AI图像增强与面部细化技术

ComfyUI-Impact-Pack终极指南:如何快速掌握AI图像增强与面部细化技术 【免费下载链接】ComfyUI-Impact-Pack Custom nodes pack for ComfyUI This custom node helps to conveniently enhance images through Detector, Detailer, Upscaler, Pipe, and more. 项目…...

20天速通LeetCode day07:前缀和

前言 今日练习目的:掌握前缀和思维。前缀和的核心价值是能实现在O(1)时间求区间和,是各类子数组问题的常用工具 560:和为k的子数组 题目要求:给定一个整数数组nums和整数k 要求:统计并返回和为k的子数组 核心思路&…...

给数学恐惧者的图解:用几何直觉理解SVM中的对偶问题与KKT条件

给数学恐惧者的图解:用几何直觉理解SVM中的对偶问题与KKT条件 第一次接触支持向量机(SVM)时,很多人都会被"对偶问题"和"KKT条件"这两个概念吓退。教科书上密密麻麻的数学推导让人望而生畏,仿佛在提…...

Python实战:从零实现Transformer中的多头注意力机制

1. 理解多头注意力机制的核心思想 多头注意力机制是Transformer架构中最关键的组成部分之一,它让模型能够同时关注输入序列的不同位置,并学习到丰富的上下文信息。想象一下你在阅读一篇文章时,大脑会同时关注当前句子、前文提到的关键概念&am…...

Jupyter Notebook代码补全插件安装踩坑实录:从nbextensions不显示到完美解决(Anaconda环境)

Jupyter Notebook代码补全插件安装踩坑实录:从nbextensions不显示到完美解决(Anaconda环境) 在数据科学和机器学习的工作流中,Jupyter Notebook因其交互式特性广受欢迎,而代码补全功能能显著提升开发效率。然而&#x…...

若依WMS仓库管理系统:企业级仓储管理的现代化解决方案

若依WMS仓库管理系统:企业级仓储管理的现代化解决方案 【免费下载链接】RuoYi-WMS-VUE 若依wms是一套基于若依的wms仓库管理系统,支持lodop和网页打印入库单、出库单。包括仓库/库区/货架管理,出入库管理,客户/供应商/承运商&…...

从零搭建思澈科技SiFli-Solution开发环境:避坑指南与实战演练

1. 环境准备:软件工具全家桶 第一次接触思澈科技的SiFli-Solution平台时,我像个刚拿到乐高套装的孩子——既兴奋又手足无措。这里给各位新手列个必备工具清单,都是我踩坑后验证过的稳定组合:Keil uVision5(5.32版&…...

Python实现图形化井字棋——人机对战

井字棋,英文名叫TicQ-Tac-Toe,是一种在3*3格子上进行的连珠游戏,和五子棋类似,由于棋盘一般不画边框,格线排成井字故得名。游戏需要的工具仅为纸和笔,然后由分别代表O和X的两个游戏者轮流在格子里留下标记&…...

MOPSO算法实战:如何用它搞定你的多目标优化项目?(从理论到调参全解析)

MOPSO算法实战:从理论到调参的全流程指南 想象一下你正面临一个棘手的工程优化问题——需要在云计算资源调度中同时优化成本和性能。传统的单目标优化方法让你不得不在两个相互冲突的目标之间做出妥协,而多目标粒子群优化(MOPSO)…...

5分钟上手LogcatReader:安卓设备日志查看神器

5分钟上手LogcatReader:安卓设备日志查看神器 【免费下载链接】LogcatReader A simple app for viewing logcat logs on an android device. 项目地址: https://gitcode.com/gh_mirrors/lo/LogcatReader 还在为复杂的ADB命令而烦恼吗?LogcatReade…...

【2026奇点智能技术大会权威解码】:AI原生数据结构生成的5大范式跃迁与工程落地路径

第一章:2026奇点智能技术大会:AI数据结构生成 2026奇点智能技术大会(https://ml-summit.org) 核心突破:语义驱动的数据结构合成引擎 本届大会首次公开发布StructGen v3.1——一个基于多模态推理与形式化约束求解的AI数据结构生成框架。它不…...

科学图像分析难题破解:3个步骤让Fiji成为你的得力助手

科学图像分析难题破解:3个步骤让Fiji成为你的得力助手 【免费下载链接】fiji A "batteries-included" distribution of ImageJ :battery: 项目地址: https://gitcode.com/gh_mirrors/fi/fiji 你是否曾经面对显微镜下的大量细胞图像束手无策&#x…...

英雄联盟智能工具箱:重新定义你的游戏体验

英雄联盟智能工具箱:重新定义你的游戏体验 【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit 在英雄联盟的竞技世界中,每一…...

【限时解密】GitHub Copilot Enterprise未公开的3项性能开关:启用后P99延迟下降63%,仅限前500名开发者获取配置清单

第一章:智能代码生成性能优化技巧 2026奇点智能技术大会(https://ml-summit.org) 智能代码生成模型(如基于LLM的Copilot类工具)在实际工程落地中常面临响应延迟高、上下文吞吐低、生成结果不稳定等问题。优化其端到端性能需兼顾推理效率、缓…...

YOLO优化|轻量化注意力机制实战对比

1. 为什么YOLO需要轻量化注意力机制? 在移动端和边缘计算场景下部署目标检测模型时,我们常常面临两个核心矛盾:计算资源有限和实时性要求高。以智能手机上的AR应用为例,处理1080P图像通常需要在30ms内完成推理,这对传统…...

ESP-12F腾讯云MQTT固件烧录避坑指南:常见问题与解决方案

ESP-12F腾讯云MQTT固件烧录实战:从问题排查到稳定连接 最近在帮朋友调试一个智能家居项目时,遇到了ESP-12F模块连接腾讯云MQTT服务器的问题。原本以为只是简单的固件烧录,没想到在实际操作中踩了不少坑。这篇文章将分享我在解决这些问题时积…...

Kali Linux实战:用SET工具包5分钟克隆一个钓鱼网站(附谷歌浏览器登录凭证捕获演示)

Kali Linux实战:5分钟构建钓鱼网站与凭证捕获全流程 在网络安全领域,渗透测试工具的应用能力直接决定了安全防护的有效性。Social Engineer Toolkit(SET)作为Kali Linux中的明星工具包,以其高度集成化和易用性著称&am…...

乐视三合一体感摄像头Astra pro开发实践2(多平台环境配置与数据采集优化)

1. 多平台环境配置实战 乐视三合一体感摄像头Astra Pro确实是个性价比超高的开发设备,我在Windows和Ubuntu双系统下都折腾过它的环境配置。先说Windows平台,最容易踩坑的就是OpenNI2的驱动问题。第一次安装时直接从GitHub下载了OpenNI2,结果死…...