当前位置: 首页 > news >正文

【RAG 去噪】引入 NLI 模型来为 RAG 去噪

论文:Making Retrieval-Augmented Language Models Robust to Irrelevant Context

⭐⭐⭐

ICLR 2024, arXiv:2310.01558

Code: github.com/oriyor/ret-robust

论文速读

这篇论文引入 NLI(Natural Language Inference)模型来判定 retrieved doc 是否需要用于辅助 LLM 回答。

NLI 模型用于判定一个 hypothesis 与 premise 的关系如下三者之一:“蕴含(entailed)”、“中立(neutral)”、“矛盾(contradicted)”。具体到 RAG 中,question + LLM answer 作为 premise,retrieved doc 作为 hypothesis,由 NLI 模型判定两者是否是 entailed

  • 是的话,就辅助 LLM 再次生成 answer 作为最终答案
  • 不是的话,就使用标准的 LLM,防止无关上下文来分散 LLM 的注意力

该论文的工作,NLI 模型使用的是 BART-large

这其实这篇论文的假设是有问题的,以底座模型的答案作为基准来衡量检索信息是否是噪声,那其实把 RAG 通过检索召回额外信息增加 LLM 本身缺乏的知识的这部分的能力也损失了。这种假设在底座本身就能回答的问题上额外增加了相关召回信息,可能会让底座的答案更加详细精准。但是底座本身不能回答或者回答错误的部分,那基于底座的答案去做噪声判断会让让模型错上加错

此外,该论文工作还尝试训练一个健壮的用于 RAG 的 LLM。因为作者认为,原生的 LLM 由于其没有在 retrieved passages 上做训练,所以它对噪音上下文很脆弱是可以预料的。为此,作者特意收集一批带有噪音文档的数据来对 LLM 做 SFT,数据的收集其实就是将检索到的 top-1 和排名较低的文档共同作为 retrieved context。这种做法其实就是在训练样本中强行引入噪声,让模型学习识别噪声的能力,当引入噪声信息时能够基于底座本身具有的知识正确作答

实验结果

通过实验发现,论文提出的采用 NLI 来识别无关文档的方法,由于其假设有点问题,导致其底座模型在本身信息缺失的情况西,做降低 RAG 的性能,因为它把与底座答案不一致的正确信息都过滤了。

另外,使用含有噪音检索上下文的数据来对底座模型做 SFT 之后,即便加入不相关的召回信息都可以让 RAG 模型变好,这说明引入噪声做 SFT 的方式可以有助于帮助 RAG 模型在一定程度上去除噪声带来的影响。

反思

  • 在实际业务落地上可以借鉴引入随机噪声的思想,在 sft 阶段不仅只加入最相关的召回结果,同时以一定的比例加入随机召回信息作为噪声,可以提升模型识别噪声的能力,在线上推理阶段,如果 top 的召回信息是不相关的错误信息,模型有一定的识别能力。
  • 我们其实可以在 RAG 的过程中增加判断召回文档是否相关,以及结合相关文档给出正确答案这样的 cot 任务,这样输出的内容不会过长,不会带来额外的线上推理耗时,同时也能一定程度上缓解 RAG 检索信息存在噪声的问题。

相关文章:

【RAG 去噪】引入 NLI 模型来为 RAG 去噪

论文:Making Retrieval-Augmented Language Models Robust to Irrelevant Context ⭐⭐⭐ ICLR 2024, arXiv:2310.01558 Code: github.com/oriyor/ret-robust 论文速读 这篇论文引入 NLI(Natural Language Inference)模型来判定 retrieved d…...

SQLite利用事务实现批量插入(提升效率)

在尝试过SQLite批量插入一百万条记录,执行时长高达20多分钟后,就在想一个问题,这样的性能是不可能被广泛应用的,更不可能出现在真实的生产环境中,那么对此应该如何优化一下呢? 首先分析一下批量插入的逻辑 …...

使用Python处理Excel数据:去除列中的双引号

目录 引言 技术背景 步骤概述 代码示例 案例分析 扩展内容 1. 处理多个列中的双引号 2. 处理大型Excel文件 3. 自定义函数处理数据 4. 错误处理和日志记录 结论 引言 在当今信息爆炸的时代,数据已经成为了各个行业最宝贵的资源之一。而Excel&#xff0c…...

未来互联网:Web3的技术革新之路

引言 随着技术的不断发展和社会的日益数字化,互联网作为信息交流和社交媒介的重要平台已经成为我们生活中不可或缺的一部分。然而,传统的互联网架构在数据安全、隐私保护和去中心化等方面存在着诸多挑战。为了解决这些问题,Web3技术应运而生…...

【练习】分治--快排思想

🎥 个人主页:Dikz12🔥个人专栏:算法(Java)📕格言:吾愚多不敏,而愿加学欢迎大家👍点赞✍评论⭐收藏 目录 颜色分类 题目描述 题解 代码实现 排序数组 题目描述 题解 代码…...

Unity读书系列《Unity高级编程:主程手记》——C#技术要点

文章目录 前言一、业务逻辑优化技巧二、Unity3d中C#的底层原理三、List底层源码剖析四、Dictionary底层源码剖析五、浮点数的精度问题六、委托、事件、装箱、拆箱七、算法总结 前言 本文旨在总结某一概念的性质,并引出相关的技术要点。如果读者希望深入了解相关技术…...

Redis分片集群

哨兵集群虽然解决了高可用和高并发读问题,但是还是有缺陷 1. 因为是主节点是单节点,并发写存在瓶颈 2.数据量大了每个节点存储相同的数据,造成内存紧张,资源浪费 redis.conf文件 port 6379 # 开启集群功能 cluster-enabled yes…...

Math.Round()函数说明

Math.Round()并不是严格意义上的是四舍五入函数。它默认的执行的是“银行家舍入”算法,即四舍六入五取偶。概括为:四舍六入五考虑、五后非零就进一,五后皆零看奇偶,五前为偶应舍去、五前为奇要进一。 当为5时,取离着最…...

001 定期同步mysql数据到es 删除数据库记录同时删除es记录 es全文搜索分词和高亮

文章目录 ProductController.javaProduct.javaElasticsearchSyncListener.javaProductElasticSearchMapper.javaProductMapper.javaProductDeletedEvent.javaProductServiceImpl.javaSyncProductService.javaIProductService.javaElasticSearchSpringDemoApplication.javaServl…...

Vue 快速入门:Vue初级

语法规则 前端渲染 渲染有几种方式:原生js、js模板、Vue模板语法 原生js 使用字符串拼接 js模板语法 Vue.js 模板语法概述 Vue.js 是一个用于构建用户界面的渐进式框架,其模板语法非常灵活和直观。Vue 的模板语法基于 HTML,可以通过指令…...

什么是IP跳变?

IP 跳跃(也称为 IP 跳动)的概念已引起使用代理访问网站的用户的极大关注。但 IP 跳跃到底是什么?为什么它对于各种在线活动至关重要? 在本文中,我们将深入探讨 IP 跳跃的世界,探索其实际应用、用例、潜在问…...

Linux服务器lvm磁盘管理fdisk和df磁盘大小不同修改

服务器端由于硬盘是通过VCenter原来100G磁盘复制的虚拟机,复制完成后,原来100G的磁盘通过选择 磁盘重新复制出150G的磁盘,开机后发现还是原来的100G的磁盘,通过fdisk -l 查看有个sdb是150G, 但是已经划转的lvm盘只有100G, 通过df查看也是原来的100G: pvs查看pv里也是10…...

AOP是什么和OOP的区别

AOP(Aspect-Oriented Programming,面向切面编程)和OOP(Object-Oriented Programming,面向对象编程)是两种不同的编程范式,它们在多个方面存在显著的差异。 编程思想: AOP&#xff1…...

Clickhouse 字符串函数 - 2

reverse​ 反转字符串。 reverseUTF8​ 以Unicode字符为单位反转UTF-8编码的字符串。如果字符串不是UTF-8编码,则可能获取到一个非预期的结果(不会抛出异常)。 format(pattern, s0, s1, …)​ 使用常量字符串pattern格式化其他参数。pat…...

【个人成长】Fitten Code 测试案例分析

JS,Fitten Code 当插件,然后在代码分析的时候,有些小感悟,大模型写代码的思路,正常我理解的代码思路。 输入代码 (item.score* 100).toFixed(0)Prompt 得出的结果 5分,如果超过100按100算输出结果 con…...

管理Anaconda虚拟环境的实用指南

Anaconda是一个开源的Python数据科学平台,它提供了一个管理包和环境的强大工具。在这篇文章中,我们将探讨如何在Anaconda中创建、克隆、切换和管理虚拟环境,以及如何升级Python版本和更新conda本身。 切换Anaconda环境 在Anaconda中&#x…...

python如何在图片上写斜体字

在Python中,直接在图片上写斜体文字通常不是图像库(如PIL或OpenCV)的内置功能,因为这些库主要关注于图像处理而非复杂的文本渲染。然而,你可以通过几种方式在图片上创建斜体效果: 使用PIL(Pytho…...

算法练习第22天|39. 组合总和、40.组合总和II

39. 组合总和 39. 组合总和 - 力扣(LeetCode)https://leetcode.cn/problems/combination-sum/description/ 题目描述: 给你一个 无重复元素 的整数数组 candidates 和一个目标整数 target ,找出 candidates 中可以使数字和为目标数…...

CCF PTA 2022年11月C++大富翁游戏

【问题描述】 小明很喜欢玩大富翁游戏,这个游戏的规则如下: 1、游戏地图是有 N 个格子,分别编号从 1 到 N。玩家一开始位于 1 号格子。 2、地图的每个格子上都有事件,事件有以下两种类型: A)罚款 x 枚金币…...

React获取form表单值的N种方式

Ref模式&#xff08;非受控模式&#xff09; 非钩子模式 1.createRef()方式 js: userNameElcreateRef() <input type"text" name"userName" ref{this.userNameEl} /> 获取值的方式&#xff1a; this.userNameEl.current.value2.refs(废弃) js: con…...

告别BiSeNet的臃肿:手把手教你用STDC网络在MMSegmentation中实现更快的实时语义分割

从BiSeNet到STDC&#xff1a;在MMSegmentation中构建高效实时语义分割模型的实战指南 当你在深夜调试一个需要实时反馈的无人机视觉系统时&#xff0c;BiSeNet的多路径结构是否正在消耗你宝贵的计算资源&#xff1f;STDC网络的出现&#xff0c;为这类场景带来了新的可能性。本文…...

别再只会用HAL库了!手把手教你用寄存器操作STM32的SysTick定时器(附精准延时函数)

深入STM32 SysTick定时器&#xff1a;寄存器级精准延时实战指南 从库函数到寄存器&#xff1a;为什么需要更底层的控制&#xff1f; 在嵌入式开发领域&#xff0c;时间控制精度往往决定着系统性能的上限。许多开发者习惯使用HAL库或标准库提供的延时函数&#xff0c;却很少思考…...

Win10下通过桥接网卡实现QEMU虚拟机与宿主机及外网的无缝互联

1. 为什么需要桥接网卡&#xff1f; 在Windows 10环境下使用QEMU创建虚拟机时&#xff0c;很多朋友都会遇到一个头疼的问题&#xff1a;虚拟机虽然能上网&#xff0c;但宿主机和虚拟机之间就是无法互相访问。这种情况我遇到过太多次了&#xff0c;特别是需要调试web服务或者进行…...

OPNsense-从零部署:硬件选型与虚拟机安装实战

1. 为什么选择OPNsense&#xff1f; 第一次听说OPNsense是在三年前帮朋友公司排查网络问题时。当时他们用的某商业防火墙频繁死机&#xff0c;我试着在旧服务器上部署了OPNsense临时救急&#xff0c;没想到这台"临时工"不仅稳定运行了两年多&#xff0c;还解锁了流量…...

Cursor + Claude Code 双栈协作:3 种项目级配置同步方案落地实录

1. 项目级配置同步不是“配完就跑”,而是让 AI 真正理解你的项目语义 大多数人把 Cursor + Claude Code 当成一个“更聪明的自动补全”,装完插件、填个 API Key、点几下设置,就以为双栈协作完成了。我试过三个不同规模的项目——一个 2000 行的 Python 数据处理脚本集、一个…...

epub_to_audiobook开发者指南:如何扩展新的TTS提供商

epub_to_audiobook开发者指南&#xff1a;如何扩展新的TTS提供商 【免费下载链接】epub_to_audiobook EPUB to audiobook converter, optimized for Audiobookshelf, WebUI included 项目地址: https://gitcode.com/gh_mirrors/ep/epub_to_audiobook 想要为epub_to_audi…...

告别MobaXterm!VSCode Remote-SSH + SFTP插件,实现本地与Linux服务器的无缝代码同步

VSCode全栈远程开发&#xff1a;SSH连接、代码同步与Python环境管理一体化实战 远程开发已成为现代工作流的重要组成部分&#xff0c;但传统工具链的割裂体验让许多开发者头疼。本文将展示如何用VSCode构建完整的远程开发环境&#xff0c;从SSH连接到代码同步&#xff0c;再到P…...

React Fiber vs Vue 响应式:从调用栈到依赖图,前端两大架构的底层对决

写在前面 前端框架之争吵了快十年。但坦白说&#xff0c;大多数争论卡在"React 好用还是 Vue 好用"的层面&#xff0c;很少有人真正追问&#xff1a;这两个框架为什么从根上就是两套东西&#xff1f; 它们的差异不是 API 设计喜好不同&#xff0c;而是对"UI 的…...

统一去马赛克与降噪技术:ESUM模型解析与应用

1. 项目概述&#xff1a;统一去马赛克与降噪技术研究 在数字图像处理领域&#xff0c;去马赛克&#xff08;Demosaicing&#xff09;是图像信号处理&#xff08;ISP&#xff09;流水线中最关键的步骤之一。这项技术负责将传感器捕获的原始拜耳模式&#xff08;Bayer Pattern&am…...

NCM解密终极指南:3步解锁网易云音乐加密文件

NCM解密终极指南&#xff1a;3步解锁网易云音乐加密文件 【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 你是否曾经在网易云音乐下载了心爱的歌曲&#xff0c;却发现只能在官方客户端播放&#xff0c;无法在其他设备或播放器上欣赏&…...