当前位置: 首页 > article >正文

【大模型应用】6.RAG 场景下的向量+关键词混合检索

混合检索定义混合检索也叫多路召回或者融合检索不仅限于向量检索和关键词检索的叠加。比如同时从文档库和数据库检索或者同时用多个不同的 Embedding 模型做向量检索最后把结果融合起来都算混合检索。只不过在大模型 RAG 场景下混合检索最常见的形态就是向量检索 关键词检索。两种检索方式各有软肋● 向量检索擅长语义理解比如 “猫捕猎老鼠” 和 “猫追逐老鼠” 能匹配上但难以精准匹配专有名词如 “iPhone 15”。● 关键词检索精确匹配没问题但理解不了语义用户问 “怎么减肥”它匹配不到 “如何瘦身”。混合检索就是两条路并行走分别执行向量检索和关键词检索把两边的结果融合起来用权重加权或者 RRF 算法重排序取最优结果喂给大模型实现方案Elasticsearch 8.0原生支持dense_vector字段和 knn 查询可以在一个查询里同时做向量检索和关键词检索用bool query组合结果。Milvus 外部搜索引擎Milvus 专门做向量检索配合 Elasticsearch 做关键词检索在应用层做结果融合。LlamaIndex / LangChain这类框架封装了混合检索的能力简单配置即可使用适合快速搭建原型系统。结果融合策略两路检索的结果怎么合并是个技术活常见做法有两种加权求和给向量检索和关键词检索的分数分别乘以权重加起来算总分。比如向量检索权重 0.7关键词检索权重 0.3最后按总分排序。权重怎么定没有万能的黄金比例需要根据业务场景调文档里专有名词、ID 类查询多关键词检索权重可调高到 0.4-0.5主要是自然语言问答向量检索权重可给到 0.7-0.8调参技巧准备一批有标注的测试集跑不同权重组合观察召回率和准确率的变化找到最优点线上还可以做 A/B 测试持续优化。RRF 算法Reciprocal Rank Fusion不看分数只看排名对每个文档计算1/(krank)k 一般取 60然后把两路的分数加起来。好处不用关心两路检索分数的量纲差异直接用排名计算避免了分数归一化的问题。一些追问1. 向量检索和关键词检索的权重一般怎么定有什么调参技巧没有万能的黄金比例得根据业务场景调文档里专有名词、ID 类查询多关键词检索权重可调高到 0.4-0.5。主要是自然语言问答向量检索权重可给到 0.7-0.8。调参技巧准备一批有标注的测试集跑不同权重组合看召回率和准确率的变化找到最优点线上还可以做 A/B 测试持续优化。2. 混合检索和 Rerank 是什么关系能一起用吗能一起用而且建议一起用混合检索解决的是召回阶段的问题让召回的候选文档更全面。Rerank 解决的是精排阶段的问题让最终送给大模型的文档更精准。典型流程向量检索召回 Top 50关键词检索召回 Top 50RRF 融合后取 Top 100然后用 Rerank 模型精排最后取 Top 5 喂给大模型。两者是互补关系不是替代关系。3. 如果关键词检索和向量检索的结果完全没有交集怎么处理这种情况说明两路检索的视角差异很大需要分情况处理如果用户 Query 明显是搜专有名词或 ID关键词检索的结果更可信可以给关键词检索更高权重甚至只用关键词检索的结果。**如果用户 Query 是自然语言问题**向量检索的结果更可信。进阶方案做个简单的Query 分类器判断 Query 类型后动态调整两路的权重。

相关文章:

【大模型应用】6.RAG 场景下的向量+关键词混合检索

混合检索定义 混合检索也叫多路召回或者融合检索,不仅限于向量检索和关键词检索的叠加。 比如同时从文档库和数据库检索,或者同时用多个不同的 Embedding 模型做向量检索,最后把结果融合起来,都算混合检索。 只不过在大模型 RAG 场…...

ViGEmBus:4个突破硬件限制的系统级驱动实战指南

ViGEmBus:4个突破硬件限制的系统级驱动实战指南 【免费下载链接】ViGEmBus 项目地址: https://gitcode.com/gh_mirrors/vig/ViGEmBus 你是否曾因游戏不支持自定义控制器而苦恼?或者在开发自动化测试时难以模拟标准输入设备?ViGEmBus作…...

OBS多平台直播推流终极指南:一站式解决方案让直播更简单

OBS多平台直播推流终极指南:一站式解决方案让直播更简单 【免费下载链接】obs-multi-rtmp OBS複数サイト同時配信プラグイン 项目地址: https://gitcode.com/gh_mirrors/ob/obs-multi-rtmp 想要同时向多个平台直播,却为繁琐的重复设置而烦恼&…...

PPI 以太网模块应用解析:S7-200 PLC 与上位机数据采集 + 触摸屏木材加工工艺报警系统配置

一、行业痛点在木材切割的锯片转速、进料速度、切割精度,以及木材拼接的压合压力、胶层厚度、拼接对齐度等工艺参数在线监测与控制领域,西门子 S7-200 系列 PLC 凭借抗干扰性强、编程便捷、适配工业现场的优势,成为中小型木材加工生产线控制核…...

DLSS Swapper:智能优化NVIDIA显卡游戏性能的DLSS管理工具

DLSS Swapper:智能优化NVIDIA显卡游戏性能的DLSS管理工具 【免费下载链接】dlss-swapper 项目地址: https://gitcode.com/GitHub_Trending/dl/dlss-swapper 价值定位:为何选择DLSS Swapper优化游戏体验 在PC游戏领域,DLSS&#xff0…...

网工毕业设计最全选题大全

文章目录🚩 1 前言1.1 选题注意事项1.1.1 难度怎么把控?1.1.2 题目名称怎么取?1.2 选题推荐1.2.1 起因1.2.2 核心- 如何避坑(重中之重)1.2.3 怎么办呢?🚩2 选题概览🚩 3 项目概览题目1 : 深度学习社交距离检…...

Gnuradio模块开发实战:如何从零创建一个自定义信号处理模块(附常见编译错误解决方案)

Gnuradio模块开发实战:从零构建自定义信号处理模块的完整指南 在开源软件定义无线电(SDR)领域,Gnuradio无疑是最强大的工具链之一。它提供了丰富的信号处理模块库,但真正的威力在于允许开发者创建自定义模块来扩展其功能。本文将带你完整走过…...

LinkSwift:基于JavaScript的八大网盘直链下载助手技术解析与部署指南

LinkSwift:基于JavaScript的八大网盘直链下载助手技术解析与部署指南 【免费下载链接】Online-disk-direct-link-download-assistant 可以获取网盘文件真实下载地址。基于【网盘直链下载助手】修改(改自6.1.4版本) ,自用&#xff…...

解锁AMD Ryzen性能潜能:专业级硬件调试工具实战指南

解锁AMD Ryzen性能潜能:专业级硬件调试工具实战指南 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://gitc…...

uniapp集成leaflet地图避坑指南:为什么webview才是移动端的最佳选择

Uniapp集成Leaflet地图的终极解决方案:WebView架构深度解析 在跨平台移动应用开发领域,地图功能集成一直是技术选型的难点所在。当Uniapp框架遇上Leaflet地图库,许多开发者都会遇到一个令人头疼的问题:为什么在浏览器调试一切正常…...

嵌入式开发必备:如何用Arduino实现8种LED状态指示灯(附完整代码)

Arduino实战:8种专业级LED状态指示灯开发指南 在嵌入式系统开发中,LED状态指示灯是设备与用户交互最直接的窗口。一个精心设计的LED状态系统,能够在不增加额外硬件成本的前提下,显著提升产品的专业度和用户体验。本文将带您深入探…...

ANSYS Workbench网格划分实战:从入门到精通的5个关键技巧

ANSYS Workbench网格划分实战:从入门到精通的5个关键技巧 当你第一次打开ANSYS Workbench的Meshing模块时,面对密密麻麻的参数选项和复杂的几何体,是否感到无从下手?网格划分作为有限元分析的基础环节,直接影响计算效率…...

Scroll Reverser:macOS滚动方向终极解决方案免费快速配置指南

Scroll Reverser:macOS滚动方向终极解决方案免费快速配置指南 【免费下载链接】Scroll-Reverser Per-device scrolling prefs on macOS. 项目地址: https://gitcode.com/gh_mirrors/sc/Scroll-Reverser 还在为macOS系统触控板和鼠标滚动方向无法独立设置而烦…...

HR人力系统厂商选购指南:2026年如何选对适合企业的人力资源系统

企业数字化转型进入深水区,HR人力系统早已不是”能用就行”的后台工具,而是直接影响组织效率、人才竞争力和员工体验的核心基础设施。面对市场上数十家HR人力系统厂商,产品形态各异、宣传话术相似,企业决策者常常陷入选择困境&…...

Word转LaTeX必备:Zotero引用一键转换保姆级教程(含Better BibTeX配置)

Word转LaTeX学术写作革命:ZoteroBibTeX全自动引用转换实战指南 当你熬了几个通宵终于完成论文初稿,却在投稿前被告知需要提交LaTeX版本时,那种绝望感我太熟悉了。去年我的一篇核心期刊投稿就遭遇了这种"格式灾难"——手动转换87处…...

从Servlet到Spring WebFlux再到Gateway:一文理清WebFilter、@WebFilter与GatewayFilter的演进与适用场景

从Servlet到Spring WebFlux再到Gateway:Web过滤器的技术演进与实战选型 在Java Web开发的技术演进长河中,过滤机制作为请求处理的第一道防线,其设计理念随着架构范式的变革不断迭代。从传统的Servlet Filter到响应式编程浪潮下的WebFilter&am…...

W5500硬件协议栈 vs ENC28J60软件方案:STM32物联网项目选型指南

W5500硬件协议栈与ENC28J60软件方案深度对比:STM32物联网开发实战指南 在STM32物联网项目开发中,网络连接方案的选择往往决定了系统的稳定性和开发效率。面对市场上主流的W5500(硬件TCP/IP协议栈)和ENC28J60(软件协议栈…...

终极Windows任务栏美化指南:如何用TranslucentTB实现桌面透明化

终极Windows任务栏美化指南:如何用TranslucentTB实现桌面透明化 【免费下载链接】TranslucentTB A lightweight utility that makes the Windows taskbar translucent/transparent. 项目地址: https://gitcode.com/gh_mirrors/tr/TranslucentTB 在Windows个性…...

记录,借助git bash使用脚本批量删除远程tag

在长期的项目开发中,Git 仓库积累大量的标签(Tags),不仅占用空间,加载还卡顿。项目中采用 YYYYMMDD 格式命名标签,这给使用脚本批量删除标签提供了条件。 目录 核心简述 脚本原理解析 安全的执行模式控…...

手把手教你用DS18B20玩转1-Wire单总线协议(附实测代码)

从零构建1-Wire通信系统:基于DS18B20的实战指南 1. 初识1-Wire协议与DS18B20 第一次接触1-Wire协议时,我被它的简洁性震撼到了——仅用一根数据线就能完成双向通信?这听起来像是某种电子魔法。但当我真正把DS18B20温度传感器接入树莓派&#…...

AutoDL服务器上快速搭建Python3.8虚拟环境(含PyTorch版本匹配指南)

AutoDL服务器上Python3.8虚拟环境与PyTorch高效配置实战指南 深度学习项目的环境配置往往是阻碍初学者快速上手的首要门槛。本文将带您完成从零开始配置Python3.8虚拟环境到PyTorch版本精准匹配的全流程,特别针对AutoDL服务器优化操作步骤,同时解决CUDA工…...

RRT算法实战:用Python从零实现机器人路径规划(附完整代码)

RRT算法实战:用Python从零实现机器人路径规划 在机器人导航和自动驾驶领域,路径规划是核心挑战之一。想象一下,当你需要让机器人从客厅的沙发移动到厨房的冰箱前,它需要避开茶几、宠物和散落的玩具——这就是路径规划要解决的问题…...

Poppler Windows终极指南:快速掌握免费PDF处理工具

Poppler Windows终极指南:快速掌握免费PDF处理工具 【免费下载链接】poppler-windows Download Poppler binaries packaged for Windows with dependencies 项目地址: https://gitcode.com/gh_mirrors/po/poppler-windows 还在为PDF文档转换而烦恼吗&#xf…...

面向智慧军营的动态三维重建与轨迹推演关键技术研究

《面向智慧军营的动态三维重建与轨迹推演关键技术研究》副标题:基于 Pixel-to-Space 的空间认知与行为预测方法体系发布单位:镜像视界(浙江)科技有限公司一、研究背景与问题提出随着智慧军营与智能化作战体系的快速发展&#xff0…...

思特威推出全新升级8K16K高分辨率工业线阵CMOS图像传感器

思特威(上海)电子科技股份有限公司(股票简称:思特威,股票代码:688213)近日宣布,全新推出8K和16K超高分辨率高速线阵CMOS图像传感器——SC835LA&SC1635LA。两款新品均基于思特威S…...

无人机自主降落实战:基于Aruco码的精准定位与追踪(含Gazebo仿真教程)

无人机自主降落实战:基于Aruco码的精准定位与追踪(含Gazebo仿真教程) 在无人机自动化任务中,精准降落一直是技术难点。传统GPS定位误差可能达到米级,而视觉辅助定位能将精度提升至厘米级。Aruco码作为一种轻量级视觉标…...

国产小华芯片(HC32L196)和JLink的配合使用

一、硬件的连接 主控芯片:HC32L196PCTA 小华,国产芯片 有SWD和JTAG模式,我用的是SWD模式 日常开发用SWD模式就够了,接线少不容易接错 有电源供电,只需要接SWDIO,SWCLK和GND即可 我这个是有独立电源供电…...

如何用APK Editor Studio实现Android应用深度定制:提升逆向工程效率的完整指南

如何用APK Editor Studio实现Android应用深度定制:提升逆向工程效率的完整指南 【免费下载链接】apk-editor-studio Powerful yet easy to use APK editor for PC and Mac. 项目地址: https://gitcode.com/gh_mirrors/ap/apk-editor-studio APK Editor Studi…...

鸿蒙应用开发UI基础第二十六节:轻量级UI元素@Builder与@LocalBuilder区别示例演示

【学习目标】 理解 Builder 设计初衷,明确与 Component 核心差异;掌握 Builder 两种定义方式、参数传递(按值/按引用)规则;掌握 Builder 高级场景(嵌套、this指向)实战用法;掌握 Bui…...

RMBG-2.0多场景应用:跨境电商主图制作、小红书封面抠图、PPT素材生成

RMBG-2.0多场景应用:跨境电商主图制作、小红书封面抠图、PPT素材生成 1. 项目概述 RMBG-2.0是基于BiRefNet架构开发的智能背景扣除工具,能够精准识别并移除图像背景,保留主体对象的完整细节。这个工具就像一双能够看穿伪装的"境界剥离…...