当前位置: 首页 > article >正文

检索增强生成RAG基础架构与手动模拟

检索增强生成RAG基础什么是RAG?检索增强生成(RAG)是指对大型语言模型输出进行优化使其能够在生成响应之前引用训练数据来源之外的权威知识库。大型语言模型(LLM)用海量数据进行训练使用数十亿个参数为回答问题、翻译语言和完成句子等任务生成原始输出。在LLM本就强大的功能基础上RAG将其扩展为能访问特定领域或组织的内部知识库所有都无需重新训练模型。是一种经济高效地改进LM输出的方法让它在各种情境下都能保持相关性、准确性和实用性。简单理解:RAG就是从外部先检索对应的知识内容和用户的提问一起构成Prompt再让LLM生成内容。如果为前面开发的聊天机器人架构添加上RAG模块更新后的运行流程如下:RAG的重要性及优点我们可以将LLM 看成是一个过于热情的员工而且这个员工拒绝了解任何时事但是他总是会很自信地回答每一个问题更不幸的是这个员工回答态度非常好内容非常流畅一般情况下还很难看出是真是假!所以单纯利用LLM进行开发存在非常大的缺陷LLM的训练数据是静态的这意味着LLM掌握的知识是有时间限制的对于新知识不了解。当用户需要特定或者即时的数据时LLM 往往提供通用或者过时的数据。LLM回答的内容可能是从非权威来源创建响应。由于术语混淆不同的培训来源使用相同的术语来谈论不同的事情因此会产生不确定的响应。对比其他解决LLM幻觉的方案RAG带来的好处也非常明显:经济高效:预训练和微调模型的成本很高相比之下RAG是一种经济高效将新输入引入LLM的方案。信息即时:使用RAG可以为LLM提供最新的研究、统计数据或新闻确保数据的即时性。增强用户信任度:RAG允许LLM通过来源归属来呈现准确的信息。输出可以包括对来源的引文或引用。如果需要进一步说明或更详细的信息用户也可以自己查找源文档。这可以增加对您的生成式人工智能解决方案的信任和信心开发人员拥有更多控制权:借助RAG开发人员可以更高效地测试和改进他们的聊天应用程序。他们可以控制和更改LLM的信息来源以适应不断变化的需求或跨职能使用。开发人员还可以将敏感信息的检索限制在不同的授权级别内并确保LM生成适当的响应。此外如果LLM针对特定问题引用了错误的信息来源他们还可以进行故障排除并进行修复。组织可以更自信地为更广泛的应用程序实施生成式人工智能技术。ChatGPT手动模拟 RAG运行流程人类与大语言模型的主要交接方式就是通过 Prompt所以通过 Playground/ChatGPT 手动模拟 RAG 的过程其实也非常简单使用用户的提问 query 进行搜索得到搜索相关的内容将搜索的内容与预设的 Prompt 模板、用户的 query 拼接成最终提示词传递给大语言模型即可模拟最基础的 RAG 运行流程。例如用户提问: “公司有销售什么产品么”会触发一下流程:① 调用 检索器 并传递 公司有销售什么产品么? 作为搜索语句进行检索得到对应文档将这些文档整理合并得到对应的文本输出:1.潮汕手工牛肉丸 产品名称潮汕手工牛肉丸 电商网址:shop.example.com/beefballs 产品描述潮汕手工牛肉丸选用优质牛肉纯手工捶打制作口感 Q 弹有嚼劲。全程无添加防腐剂和人工色素确保天然健康适合家庭火锅、煮汤等多种烹饪方式。 原材料优质牛肉、生姜、盐、胡椒粉 制作工艺传统手工捶打 口感:Q 弹鲜美肉质紧实 净重:500克/袋、1000克/袋 保质期:6个月冷冻保存 发货方式顺丰冷链配送确保新鲜 物流信息:24小时内发货预计2-3天到货 推荐菜系:牛肉丸火锅搭配蔬菜、菌类煮至牛肉丸浮起即可享用。 牛肉丸煮汤与青菜、萝卜等食材同煮营养丰富。 价格500克:68元/袋、1000克:128元/袋2.潮汕猪肉卷 产品名称潮汕猪肉卷 电商网址shop.example.com/porkroll 产品描述潮汕猪肉卷采用猪后腿肉为主要原料配以特制香料腌制手工卷制而成。口感鲜嫩多汁香味四溢是潮汕传统名菜之一。 原材料猪后腿肉、香料、盐、糖 制作工艺精细切割、手工卷制 口感鲜嫩多汁咸香可口 净重400克/袋、800克/袋 保质期3个月冷冻保存 发货方式顺丰冷链配送确保新鲜 物流信息24小时内发货预计2-3天到货 推荐菜系 猪肉卷涮锅切片后涮煮口感爽脆 猪肉卷炒菜切块后与蔬菜同炒风味更佳 价格400克58元/袋、800克108元/袋3.潮汕三宝酱油、甜醋、虾酱 产品名称潮汕三宝 电商网址shop.example.com/chaoshanthree 产品描述潮汕三宝包含酱油、甜醋和虾酱。酱油由大豆、麦子自然发酵而成甜醋以糯米酿制虾酱选用新鲜海虾发酵是潮汕菜肴必备调味品。 酱油大豆、麦子自然发酵500ml/瓶 甜醋糯米酿制500ml/瓶 虾酱新鲜海虾发酵200克/瓶 保质期酱油和甜醋12个月虾酱6个月 发货方式顺丰配送确保完好 物流信息24小时内发货预计2-3天到货 推荐菜系 酱油适合调味、蘸料、炒菜。 甜醋用于凉拌菜、蘸料 虾酱适合炒菜、做蘸料 价格128元/套含酱油、甜醋、虾酱各一瓶4.潮汕鸭母捻 产品名称潮汕鸭母捻 电商网址shop.example.com/duckegg 产品描述潮汕鸭母捻是一种传统甜点使用糯米粉制作内馅有花生、芝麻、红豆等多种口味外皮软糯汤底清甜。 原材料糯米粉、花生、芝麻、红豆、糖 制作工艺手工包制 口感软糯香甜馅料丰富 净重500克/袋 保质期3个月冷冻保存 发货方式顺丰冷链配送确保新鲜 物流信息24小时内发货预计2-3天到货 推荐菜系 甜汤加入红糖水煮沸香甜可口。 咸汤搭配咸菜、肉片别有风味。 价格45元/袋② 接下来将用户的输入 query 和检索得到的文档文本 context 合并到预设的提示模板中如下你是一个由 OpenAI 开发的聊天机器人善于根据上下文内容帮助用户解决问题回复的内容尽可能简洁如果需要用户提供额外的信息请进行引导如果不知道就说不知道。context{context}/context用户的提问是{query}③将构建好的提示词传递给大语言模型得到对应的输出内容如下公司销售以下产品1.潮汕手工牛肉丸2.潮汕猪肉卷3.潮汕三宝酱油、甜醋、虾酱4.潮汕鸭母捻 每种产品都有详细的描叙价格和购买信息这样就可以完成一个手动RAG的过程模拟实际在代码中无论多么复杂的RAG无论如何进行RAG优化本质上都是执行外包检索然后对外部检索的内容和用户原始提问合并成最终Prompt再向大语言模型发起提问最终得到对应的内容。

相关文章:

检索增强生成RAG基础架构与手动模拟

检索增强生成RAG基础 什么是RAG? 检索增强生成(RAG)是指对大型语言模型输出进行优化,使其能够在生成响应之前引用训练数据来源之外的权威知识库。大型语言模型(LLM)用海量数据进行训练,使用数十亿个参数为回答问题、翻译语言和完成句子等任务生成原始输…...

Ubuntu 16.04 32位系统下RT-Thread开发环境搭建全攻略

1. 项目概述:为何要重温一个“过时”的旧系统环境?如果你在2024年看到这个标题,第一反应可能是:“Ubuntu 16.04?还是32位?这都什么年代的配置了,现在不都用Ubuntu 22.04或者24.04了吗&#xff1…...

TypeScript-------------类型收窄

//类型收窄 //typeof 类型收窄 function uppercase(content:string|number) {if(typeof content string)//收窄的类型有限{return content.toUpperCase();}return content; }//真值收窄 function getString(content?:string)//加?表示参数可传可不传 {if(typeof …...

为新项目申请API Key并设置访问权限与用量提醒

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 为新项目申请API Key并设置访问权限与用量提醒 当你开始一个新的AI应用项目,首要任务之一就是获取一个安全、可控的API…...

企业级AI Agent实战:如何解决异常考勤处理滞后与薪资核算难题?

摘要: 在2026年企业数字化转型步入深水区的今天,考勤管理与薪资核算的脱节已成为制约组织效能的隐形枷锁。作为一名在企业架构领域摸爬滚打15年的架构师,我观察到无数企业陷入“异常考勤处理滞后、员工满意度低、薪资核算频错”的恶性循环。传…...

异构多核处理器如何实现安卓、Linux与RTOS的原生融合?

1. 项目概述:一颗“三栖”处理器的诞生最近在嵌入式圈子和一些硬件开发者社区里,一个话题的热度悄然攀升:一颗号称能同时原生运行安卓、Linux和RTOS的国产CPU。这听起来有点像是“瑞士军刀”式的处理器,试图用一个硬件平台覆盖从消…...

工厂考勤数据分散怎么破?实在Agent助力企业数字化转型实现非侵入式数据整合

摘要: 我是企业架构师老王。在2026年的今天,尽管智能制造已进入深水区,但“工厂考勤数据分散、打卡请假加班数据无法自动整合”依然是困扰无数中大型制造企业的“顽疾”。传统的API集成方案在面对老旧系统和复杂的异构环境时,往往…...

实在Agent实战录:解决委外加工成本核算不准,实现项目利润精准统计的架构演进路径

摘要: 步入2026年,离散制造与复杂供应链体系下的“委外加工”已成为企业调节产能的核心手段,但随之而来的“成本黑盒”与“利润虚标”依然是首席财务官(CFO)与首席信息官(CIO)的头号难题。本文由…...

终极游戏加速指南:如何使用OpenSpeedy免费提升游戏体验

终极游戏加速指南:如何使用OpenSpeedy免费提升游戏体验 【免费下载链接】OpenSpeedy 🎮 An open-source game speed modifier. 项目地址: https://gitcode.com/gh_mirrors/op/OpenSpeedy 你是否厌倦了游戏中漫长的等待时间?是否想在单…...

ENSP USG6000防火墙CPU占用飙到99%?可能是你的“小云朵”网卡选错了(VMware网卡避坑指南)

ENSP USG6000防火墙CPU占用率优化实战:VMware虚拟网卡配置全解析 当你在ENSP中成功启动USG6000防火墙后,是否遭遇过整个系统突然变得异常卡顿?打开任务管理器,发现ENSP进程的CPU占用率直逼99%,仿佛你的电脑正在执行某种…...

LAMMPS GPU加速踩坑实录:CUDA driver error 4报错,原来问题出在CPU核数上

LAMMPS GPU加速实战:从CUDA driver error 4报错到性能调优全解析 当你在深夜的实验室里盯着终端不断刷新的红色报错信息,那种挫败感我深有体会。作为一名长期使用LAMMPS进行分子动力学模拟的研究者,我清楚地记得第一次遇到"CUDA driver …...

液压串联弹性驱动器融合的双足机器人运动控制方法【附算法】

✨ 长期致力于双足机器人、运动控制、液压SEA、导纳控制、参数优化、快速步行研究工作,擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流,点击《获取方式》 (1)基于无源性扰动观测器的…...

Matlab求解微分代数方程:从核心概念到工程实践

1. 项目概述:从“混合系统”到“微分代数方程”在工程仿真、电路设计、多体动力学这些领域里摸爬滚打久了,你一定会遇到一类让人又爱又恨的模型。它们看起来像是一组微分方程,描述了系统状态随时间的变化,但同时又夹杂着一堆代数约…...

3步彻底解决Windows程序启动失败:VisualCppRedist AIO终极修复指南

3步彻底解决Windows程序启动失败:VisualCppRedist AIO终极修复指南 【免费下载链接】vcredist AIO Repack for latest Microsoft Visual C Redistributable Runtimes 项目地址: https://gitcode.com/gh_mirrors/vc/vcredist 你是否遇到过新安装的软件无法启动…...

终极Windows风扇控制指南:5分钟掌握智能调速告别噪音烦恼

终极Windows风扇控制指南:5分钟掌握智能调速告别噪音烦恼 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Trending…...

芯片Signoff中的不确定性风险管理:工艺角、蒙特卡洛与签核验证

1. 项目概述:芯片Signoff中的不确定性风险管理在芯片设计的最后阶段,也就是我们常说的Signoff(签核),工程师们面临的最大挑战之一,就是如何与无处不在的“不确定性”共舞。这里的“不确定性”,专…...

Perplexity搜索响应延迟突增2100ms?内部API调用链路拆解,开发者必看避坑清单

更多请点击: https://codechina.net 第一章:Perplexity搜索响应延迟突增2100ms?现象复现与影响定性 近期监控系统捕获到Perplexity搜索API端点( /v1/search)在UTC时间2024-06-12T08:14:22Z起出现持续约17分钟的P99延迟…...

从黑盒到白盒:Testbench验证机制与FPGA/ASIC开发实践

1. 从“黑盒”到“白盒”:理解Testbench的本质在数字电路设计,尤其是FPGA和ASIC开发领域,我们常常把设计好的硬件描述语言(HDL)模块,比如一个Verilog写的加法器或者一个VHDL写的状态机,称为“待…...

别再手动分色了!用MaterialIDsRandomGenerator插件5分钟搞定游戏模型贴图规划

游戏美术革命:用MaterialIDsRandomGenerator实现材质ID智能分配 在独立游戏开发中,一把生锈的骑士剑模型正静静躺在3dMax视口中。它的剑刃需要金属质感,剑柄需要皮革纹理,护手部分则需要复杂的雕花细节。传统工作流程中&#xff0…...

使用coze为连锁服装品牌打造门店智能导购助手

### 业务背景:一线导购的“三座大山”客户是拥有 400 多家门店的快时尚品牌。一线导购每天面临的挑战很典型:- **信息记不住**:每周上百款新品上市,每款的成分、库存、搭配建议都要背,新员工培训周期长。 - **找货效率…...

operation backup

operation & backup 运维备份(多地)...

AI芯片性能优化实战:Polyhedral编译在深度学习部署中的挑战与解决方案

1. 项目概述:当AI算法遇上硬件“翻译官”最近几年,AI模型从实验室走向千家万户,从云端服务器部署到我们口袋里的手机,这个过程中有一个角色至关重要,却又常常被算法工程师们视为“黑盒”——那就是AI芯片。我们写的PyT…...

STM32F103驱动ST7567 LCD屏:手把手教你移植U8g2库(SPI接口,附完整工程)

STM32F103驱动ST7567 LCD屏:从零开始移植U8g2库实战指南 当你第一次拿到一块ST7567驱动的LCD屏时,可能会被各种引脚定义和初始化代码搞得晕头转向。本文将带你从硬件连接到软件移植,一步步完成U8g2库在STM32F103上的适配过程。不同于简单的代…...

Qlib实战:如何用自定义数据(比如可转债)跑通你的量化筛选器?

Qlib实战:从可转债数据到动态筛选策略的全流程解析 在量化投资领域,标准化的股票数据往往难以满足专业投资者的特殊需求。当我们需要处理可转债、加密货币或其他另类资产时,如何将这些非标准数据整合到强大的量化框架中,成为许多开…...

国自然最后冲刺:如何用ChatGPT把自查做到“零漏项”?

各位同仁好,我是七哥。一个在高校里从事人工智能相关领域研究,钻研用大模型AI实操的学术人。可以和七哥交流学术写作或Gemini、GPT、Claude等大模型学术实操相关问题,多多交流,相互成就,共同进步。 2026年是国自然改版元年,模板大变,旧套路失效,新坑又挖了不少。今天七…...

如何用智能去重工具高效清理重复图片:AntiDupl.NET完整使用指南

如何用智能去重工具高效清理重复图片:AntiDupl.NET完整使用指南 【免费下载链接】AntiDupl A program to search similar and defect pictures on the disk 项目地址: https://gitcode.com/gh_mirrors/an/AntiDupl 你是否曾面对电脑里杂乱无章的图片库感到束…...

别再只画折线图了!用Python的pyts库5分钟搞定时间序列的递归图(Recurrence Plot)可视化

解锁时间序列分析新维度:用Python高效构建递归图 时间序列分析早已超越了简单的折线图时代。当我们需要挖掘数据中隐藏的周期性、突变点或非线性特征时,传统可视化方法往往力不从心。递归图(Recurrence Plot)作为一种强大的分析工具,能够将时…...

实测!Gemini+ChatGPT赋能学术写作:我的论文写作SOP(附提示词)

各位同仁好,我是七哥。一个在高校里从事人工智能相关领域研究,钻研用大模型AI实操的学术人。可以和七哥交流学术写作或Gemini、GPT、Claude等大模型学术实操相关问题,多多交流,相互成就,共同进步。 为什么ChatGPT逻辑清晰却写不长?为什么Gemini能深入分析但废话连篇? …...

保姆级教程:用YOLOv5+DeepSort从零搭建一个车辆计数测速系统(附完整源码和数据集)

从零构建智能交通分析系统:YOLOv5与DeepSort实战指南 在智能交通管理领域,计算机视觉技术正发挥着越来越重要的作用。本文将带您一步步搭建一个完整的车辆计数与测速系统,结合YOLOv5目标检测和DeepSort多目标跟踪算法,实现从视频流…...

从NTC103到PT100:手把手教你为Arduino和STM32选型与编程(温度传感器实战)

从NTC103到PT100:手把手教你为Arduino和STM32选型与编程(温度传感器实战) 在物联网和智能硬件项目中,温度监测是最基础也最关键的环节之一。无论是恒温箱、环境监测站还是工业控制系统,选择一款合适的温度传感器往往决…...