当前位置：首页 > news >正文

Rerank进一步提升RAG效果

news 2026/2/9 5:09:51

RAG & Rerank

目前大模型应用中，RAG（Retrieval Augmented Generation，检索增强生成）是一种在对话（QA）场景下最主要的应用形式，它主要解决大模型的知识存储和更新问题。
在这里插入图片描述
简述RAG without Rerank的主要过程：

从向量库或其他存储召回的相关chunk list会按照检索时指定的距离计算公式由近及远排列，或者假设相似度得分记为distance_score，按distance_score大小从大到小排列。

Rerank指的是在检索结果的排序基础之上再排一次序，将对生成回复真正重要的chunk排在前面，排除干扰项，可以类比理解为推荐算法的粗排和精排过程。

为什么需要Rerank？

召回阶段使用向量库进行召回时，要求快速在大规模数据中检索到相关项，该过程需要度量当前question和库内全部向量的相似度，按指定窗口大小得到top x结果。也就是说，召回其实是个穷举过程，那么必然不能使用复杂度特别高的算法来计算相似度，为了召回的性能牺牲了召回的精度。

Rerank的概念在大模型之前就已经出现，比如推荐算法和搜索算法的精排过程，可以理解为在粗排结果的基础之上进行rerank（精排）。
在这里插入图片描述

RAG的Rerank必要性体现在3个方面：

精度提升：基于embedding的向量化检索过程可以通过一定程度的语义相似度来高效检索相关性较高的文本片段，但由于语义本身的复杂性和多义性，以及高维向量相似度匹配可能产生的噪音，向量检索可能会召回一些相关性较低的候选项。因而引入rerank模型，希望在向量召回（可以理解为粗排）的基础上进一步优化结果，降低为生成提供的参考内容中的无效信息。
语义匹配：向量库检索过程仅考察了query向量和候选向量在向量空间的语义距离，没有考虑query文本和候选文本其他方面的语义关系，比如上下文信息、句法结构等，而rerank模型有机会通过衡量query文本和候选文本之间更丰富的语义关系实现更精细的语义匹配。
场景适配：通过自训练rerank模型来进行精排，可以按照特定需求做进一步排序，从而提升QAG在特定应用场景下的表现。

二阶段检索

二阶段检索（Two-Stage Retrieval），即整个检索过程由原本的检索阶段和新增的精排阶段组成。很明显，这种组合方式能最大化利用向量库的检索速度，同时也能保证检索的效果，因而在RAG中广泛采用：检索过程使用基于向量的检索算法，精排过程使用rerank模型。Rerank模型一般基于双编码器（dual-encoder）架构，可以同时encode问题和知识库语料，从而进一步度量两者之间的语义相似度。
在这里插入图片描述
网易有道开源的QAnything采用流程的就是两阶段检索，可以理解为RAG with Rerank：

Rerank模型

Rerank模型效果公认效果比较好的是一家AI独角兽cohere发布的cohere rerank：https://cohere.com/rerank，不过该模型是一个闭源商用模型，个人使用有一定的免费额度。

国内中文开源rerank模型中效果比较好的有BAAI的bge系列模型（和这家公司的开源的embedding模型是同一个模型系列）：

Model	Base model	Language	layerwise	feature
BAAI/bge-reranker-base	xlm-roberta-base	Chinese and English	-	Lightweight reranker model, easy to deploy, with fast inference.
BAAI/bge-reranker-large	xlm-roberta-large	Chinese and English	-	Lightweight reranker model, easy to deploy, with fast inference.
BAAI/bge-reranker-v2-m3	bge-m3	Multilingual	-	Lightweight reranker model, possesses strong multilingual capabilities, easy to deploy, with fast inference.
BAAI/bge-reranker-v2-gemma	gemma-2b	Multilingual	-	Suitable for multilingual contexts, performs well in both English proficiency and multilingual capabilities.
BAAI/bge-reranker-v2-minicpm-layerwise	MiniCPM-2B-dpo-bf16	Multilingual	8-40	Suitable for multilingual contexts, performs well in both English and Chinese proficiency, allows freedom to select layers for output, facilitating accelerated inference.

详见：https://github.com/FlagOpen/FlagEmbedding/tree/master/FlagEmbedding/llm_reranker
模型可以在hugging face上下载使用：https://huggingface.co/BAAI/bge-reranker-large#model-list

参考文献

大模型相关技术-为什么需要rerank
ReRank 与 Embedding 模型的区别？如何选择 ReRank 模型？
NLP（八十三）RAG框架中的Rerank算法评估

Rerank进一步提升RAG效果

RAG & Rerank 目前大模型应用中，RAG（Retrieval Augmented Generation，检索增强生成）是一种在对话（QA）场景下最主要的应用形式，它主要解决大模型的知识存储和更新问题。简述RAG without R…...

编程日记 2024/5/12 19:39:56

使用train.py----yolov7

准备工作在训练之前，数据集的工作和配置环境的工作要做好数据集：看这里划分数据集，训练自己的数据集。_划分数据集后如何训练-CSDN博客划分数据集2，详细说明-CSDN博客配置环境看这里从0开始配置环境-yolov7_gpu0是inter g…...

编程日记 2024/5/12 19:37:54

机器学习第37周周报 GGNN

文章目录 week37 GGNN摘要Abstract一、文献阅读1. 题目2. abstract3. 网络架构3.1 数据处理部分3.2 门控图神经网络3.3 掩码操作 4. 文献解读4.1 Introduction4.2 创新点4.3 实验过程4.3.1 传感器设置策略4.3.2 数据集4.3.3 实验设置4.3.4 模型参数设置4.3.5 实验结果 5. 结论 …...

编程日记 2024/5/12 19:36:53

Baidu Comate：释放编码潜能，革新软件开发

Baidu Comate Baidu Comate，智能代码助手，凭借着文心大模型的强大支撑，结合了百度多年的编程实战数据和丰富的开源资源，形成了一款崭新的编码辅助利器。它不仅具备着高智能、多场景、价值创造的特质，更可广泛应用于各…...

编程日记 2024/5/12 19:35:51

MATLAB的Bar3函数调节渐变色(内附渐变色库.mat及.m文件免费下载链接)

一. colormap函数可以使用colormap函数： t1[281.1,584.6, 884.3,1182.9,1485.2; 291.6,592.6,896,1197.75,1497.33; 293.8,596.4,898.6,1204.4,1506.4; 295.8,598,904.4,1209.0,1514.6];bar3(t1,1) set(gca,XTickLabel,{300,600,900,1200,1500},FontSize,10) set…...

编程日记 2024/5/12 19:34:50

使用 TensorFlow.js 和 OffscreenCanvas 实现实时防挡脸弹幕

首先，要理解我们的目标，我们将实时获取视频中的面部区域并将其周围的内容转为不透明以制造出弹幕的“遮挡效应”。步骤一：环境准备我们将使用 TensorFlow.js 的 Body-segmentation 库来完成面部识别部分，并使用 OffscreenCanv…...

编程日记 2024/5/12 19:33:49

【计算机网络篇】数据链路层（10）在物理层扩展以太网

文章目录 🍔扩展站点与集线器之间的距离🛸扩展共享式以太网的覆盖范围和站点数量 🍔扩展站点与集线器之间的距离 🛸扩展共享式以太网的覆盖范围和站点数量以太网集线器一般具有8~32个接口，如果要连接的站点数量超过了…...

编程日记 2024/5/12 19:32:48

conan2 基础入门(03)-使用(msvc为例)

conan2 基础入门(03)-使用(msvc为例) 文章目录 conan2 基础入门(03)-使用(msvc为例)⭐准备生成profile文件预备文件和Code ⭐使用指令预览正确执行结果可能出现的问题 ⭐具体讲解conanconanfile.txt执行 install cmakeCMakeLists.txt生成项目构建 END ⭐准备在阅读和学习本文…...

编程日记 2024/5/12 19:31:47

uniapp this 作用域保持的方法

在 UniApp（或任何基于 Vue.js 的框架）中，this 关键字通常用于引用当前 Vue 实例的上下文。然而，当你在回调函数、定时器、Promise、异步函数等中使用 this 时，你可能会发现 this 的值不再指向你期望的 Vue 实例&#x…...

编程日记 2024/5/12 19:29:44

vue2 与vue3的差异汇总

Vue 2 与 Vue 3 之间存在多方面的差异，这些差异主要体现在性能、API设计、数据绑定、组件结构、以及生命周期等方面。以下是一些关键差异的汇总： 数据绑定与响应式系统 Vue 2 使用 Object.defineProperty 来实现数据的响应式，这意味着只有预…...

编程日记 2024/5/12 19:28:43

Java反射（含静态代理模式、动态代理模式、类加载器以及JavaBean相关内容）

目录 1、什么是反射 2、Class类 3、通过Class类取得类信息/调用属性或方法 4、静态代理和动态代理 5.类加载器原理分析 6、JavaBean 1、什么是反射 Java反射机制的核心是在程序运行时动态加载类并获取类的详细信息，从而操作类或对象的属性和方法。本质是JVM得…...

编程日记 2024/5/12 19:25:40

Scoop国内安装、国内源配置

安装配置源可参考gitee上的大佬仓库，里面的步骤、代码都很详细，实测速度也很好 glsnames/scoop-installer 也可以结合其它bucket使用使用Github加速网站，也可以换做其他代理方式，自行测试例如：https://mirror.ghprox…...

编程日记 2024/5/12 19:24:38

【软件开发规范篇】JAVA后端开发编程规范

作者介绍：本人笔名姑苏老陈，从事JAVA开发工作十多年了，带过大学刚毕业的实习生，也带过技术团队。最近有个朋友的表弟，马上要大学毕业了，想从事JAVA开发工作，但不知道从何处入手。于是&#xff0…...

编程日记 2024/5/12 19:23:35

数据结构与算法学习笔记三---循环队列的表示和实现(C语言)

目录前言 1.为啥要使用循环队列 2.队列的顺序表示和实现 1.定义 2.初始化 3.销毁 4.清空 5.空队列 6.队列长度 7.获取队头 8.入队 9.出队 10.遍历队列 11.完整代码前言本篇博客介绍栈和队列的表示和实现。 1.为啥要使用循环队列上篇文章中我们知道了顺序队列…...

编程日记 2024/5/12 19:22:34

vue3中的reactive和ref

在Vue 3中，reactive和ref是两个常用的响应式API，用于创建响应式的数据。它们的主要区别在于reactive用于创建对象或数组的响应式引用，而ref用于创建单个值的响应式引用。下面我将分别介绍它们的详细用法，并提供代码示例。 1. rea…...

编程日记 2024/5/12 19:21:33

Centos安装 docker和docker-compose

安装docker yum install -y yum-utils yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo sudo yum install docker-ce docker-ce-cli containerd.io sudo systemctl start docker sudo systemctl enable docker docker version 在L…...

编程日记 2024/5/12 19:20:31

Rerank进一步提升RAG效果

RAG & Rerank

为什么需要Rerank？

二阶段检索

Rerank模型

参考文献

相关文章：

Rerank进一步提升RAG效果

使用train.py----yolov7

机器学习第37周周报 GGNN

Baidu Comate：释放编码潜能，革新软件开发

MATLAB的Bar3函数调节渐变色(内附渐变色库.mat及.m文件免费下载链接)

使用 TensorFlow.js 和 OffscreenCanvas 实现实时防挡脸弹幕

【计算机网络篇】数据链路层（10）在物理层扩展以太网

conan2 基础入门(03)-使用(msvc为例)

uniapp this 作用域保持的方法

vue2 与vue3的差异汇总

Java反射（含静态代理模式、动态代理模式、类加载器以及JavaBean相关内容）

Scoop国内安装、国内源配置

【软件开发规范篇】JAVA后端开发编程规范

数据结构与算法学习笔记三---循环队列的表示和实现(C语言)

vue3中的reactive和ref

Centos安装 docker和docker-compose

VUE 或 Js封装通用闭包循环滚动函数

个人所得税计算器

网络工程师----第二十四天

后端常用技能：基于easy-poi实现excel一对多、多对多导入导出【附带源码】

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

idea大量爆红问题解决

基于IDIG-GAN的小样本电机轴承故障诊断

OD 算法题 B卷【正整数到Excel编号之间的转换】

tauri项目，如何在rust端读取电脑环境变量

【Kafka】Kafka从入门到实战：构建高吞吐量分布式消息系统

React核心概念：State是什么？如何用useState管理组件自己的数据？

轻量级Docker管理工具Docker Switchboard

C++11 constexpr和字面类型：从入门到精通

【2D与3D SLAM中的扫描匹配算法全面解析】