当前位置：首页 > news >正文

【论文阅读】Reliable, Adaptable, and Attributable Language Models with Retrieval

news 2026/2/10 17:50:36

文章目录

Overview
Current Retrieval-Augmented LMs
- Architecture
- Training
Limitations & Future Work

Overview

在这里插入图片描述

Parametic language models的缺点：

事实性错误的普遍存在
验证的难度（可溯源性差）
难以在有顾虑的情况下排除某些序列
适应调整的计算成本高昂
模型规模过大

Retrieval-augmented languague models更加Reliable, Adaptable, and Attributable：

大幅度减少事实性错误
- 尤其是在long-tail知识上
更好的可溯源性
允许灵活的序列加入和退出（在检索的source里面增加和删除相应的sequence就可以）
很容易adapt到新领域
是更加参数高效的（不需要很大的参数量）

目前的Retrieval-augmented languague models面临的主要挑战：

现有的方法主要利用高语义相似度来检索外部信息，当知识库中没有相关信息或者不符合传统的相关性定义的时候，表现不好
- 比如对非knowledge-intensive任务，增益就不高
直接把检索到的文本拼接到输入中，导致语言模型和检索的交互不充分。这会引起：unsupported generations; susceptibility to irrelevant text; and challenges in handling information from multiple pieces of text
缺乏对提升检索增强型语言模型在大规模训练和推理中的效率的研究

Retrieval-augmented languague models未来的方向：

重新审视相关性的概念，并深入理解有效数据存储的构成，尤其是探索应从各种数据存储中检索的信息类型，以提升在更广泛任务中的表现
确保这两个组件之间更深入的交互，包括架构设计、预训练和后训练的调整，而不是仅关注对现有参数化语言模型的补充增强
呼吁在硬件、系统和算法领域开展更多开源的跨学科合作，来构建支持训练和推理的基础设施（e.g., scaling datastore to trillion tokens）

Current Retrieval-Augmented LMs

Architecture

在这里插入图片描述

现有的Retrieval-augmented LMs按照结合检索文档的方式，可以分为三类：1) input augmentation, 2) intermediate fusion, and 3) output interpolation.

input augmentation:
- 利用检索文档直接增强原始输入
- 缺点：redundancy and inefficiency-直接拼接文档会导致超出上下文长度限制，以及增加inference开销
  - FID用于缓解这个问题，但是对每个输入，相同的文档还是可能会重复编码。decoder需要解码序列长度还是会增大
intermediate fusion（以RETRO系列为代表）：
- takes many pre-encoded text chunks independent of query x and simultaneously incorporates them in intermediate spaces.
- 缺点：需要大量的架构改动，并对语言模型的新编码模块进行预训练
output interpolation（以KNN LM为代表）
- 将LM的token分布与检索到的token分布直接结合

Training

训练整个retrieval-augmented LMs可以分为两类：independent or sequential training and joint training

Independent or sequential training：
- Independent （以KNN LM和最近的一些开箱即用的方法为代表）：Retriever和LM是独立训练的，训练过程中没有交互。大家利用现有的训练pipeline和训练目标来分别增强检索和LM
- Sequential：先训练retriever或者LM，再利用训练好的这部分提供的信号，来训练另一部分
  - 先训retriever：以DPR为代表
  - 利用LM的信号来训retriever：以REPLUG为代表
Joint training:同时训练retriever和LM，以增强二者的交互和整个端到端的pipeline
- 一个最主要的问题就是巨大的开销：因为更新检索器之后需要对文本重新编码，而文本数量往往巨大。在每次更新完检索器都对datastore中的文档重新编码是不现实的
- 目前主要方法有两种
  - Asynchronous updating：在retriever更新n步之后再更新文档的编码，这样在训练的时候就可以像inference时一样，利用整个语料库
  - In-batch approximation：每次都对batch内的文本进行编码，仅在这个batch上进行优化，而不适应整个语料库
    - 这个我理解就是我们训练retriever时的，in-batch negative训练方法

Limitations & Future Work

在这里插入图片描述

【论文阅读】Reliable, Adaptable, and Attributable Language Models with Retrieval

文章目录 OverviewCurrent Retrieval-Augmented LMsArchitectureTraining Limitations & Future Work Overview Parametic language models的缺点： 事实性错误的普遍存在验证的难度（可溯源性差）难以在有顾虑的情况下排除某些序列适应调整…...

编程日记 2024/10/28 7:02:23

A-Frame负责人Diego Marcos分享WebXR与开源AI的未来

一、引言在最近的一次播客访谈中，《虚拟现实之声》的主持人Kent Bye与A-Frame的创始人Diego Marcos展开了一场关于WebXR技术及其未来发展潜力的对话。Diego不仅是A-Frame的创始人，同时也是WebXR规范的原创者之一。本次访谈不仅回顾了WebXR的发展历程，还探讨了开源AI技术在…...

编程日记 2024/10/28 7:01:22

【STM32-HAL库】火焰传感器（STM32F407ZGT6）(附带工程下载链接)

一、TEMT6000光照强度传感器火焰传感器是一种能够检测火焰的传感器，它通过检测空气中的特定波长的光线来检测火焰的存在，并输出一个信号来通知系统发生了火灾工作原理火焰传感器的工作原理基于光学检测技术。当火焰燃烧时，会产生一些特…...

编程日记 2024/10/28 7:00:20

git merge没有生成合并提交

有时候本地使用gitmerge命令的时候会发现，合并后的log里边并没有一次merge branch的log，而是把合并分支上的所有commit log都带过来。这是因为当执行合并操作时，如果目标分支的提交历史是源分支的直接延续（即，目标分支…...

编程日记 2024/10/28 6:59:19

算法题总结（十九）——图论

图论 DFS框架 void dfs(参数) { if (终止条件) {存放结果;return; }for (选择：本节点所连接的其他节点) {处理节点;dfs(图，选择的节点); // 递归回溯，撤销处理结果 } }深搜三部曲确认递归函数，参数确认终止条件处理目前搜索节…...

编程日记 2024/10/28 6:58:17

一、调整方法之一 buildscript {repositories {google()jcenter()//maven { url https://maven.aliyun.com/repository/google }//maven { url https://maven.aliyun.com/repository/central }}dependencies {// classpath "com.android.tools.build:gradle:4.1.1"c…...

编程日记 2024/10/28 6:56:15

基于SpringBoot的时装购物系统【源码】+【论文】

时装购物系统是一个基于Springboot框架开发的Web应用系统，数据库使用的是MySQL。该系统充分考虑了代码的可读性、实用性、扩展性和通用性，页面设计简洁、操作方便，易于后期维护。系统分为管理员和用户两大角色，前台页面提供了商品…...

编程日记 2024/10/28 6:55:12

自动化结账测试：使用 Playwright确保电商支付流程的无缝体验【nodejs]

使用 Playwright 掌握端到端结账测试在电商领域，结账流程是用户体验中至关重要的一环。确保这一流程的稳定性和可靠性对于维护客户满意度和转化率至关重要。在本文中，我们将探讨如何使用 Playwright 进行端到端的结账测试，确保您的结账系统…...

编程日记 2024/10/28 6:54:11

计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-25

计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-25 0. 前言大语言模型在很多领域都有成功的应用，在本期计算机前沿技术进展研究介绍中，我们将带来一篇用大语言模型进行诺贝尔文学作品分析的论文。虽然有一定趁最近诺贝尔奖热潮的意味&…...

编程日记 2024/10/28 6:52:08

【读书笔记-《网络是怎样连接的》- 5】Chapter2_4-网卡的工作过程

IP模块组装好的数据包，就可以交给网卡进行发送了。本篇就来介绍网卡在发送数据包时的工作过程。 1 以太网基础以太网是一种为多台计算机能够彼此自由和廉价地相互通信而设计的通信技术，原型如下图所示。这种网络的本质其实是一根网线，通过…...

编程日记 2024/10/28 6:51:07

qt QOperatingSystemVersion详解

QOperatingSystemVersion 是 Qt 提供的一个类，用于表示和管理操作系统的版本信息。它允许开发者获取操作系统的名称、版本号和平台信息。这个类对于需要根据操作系统版本执行特定操作的应用程序尤其有用。 1. 构造函数 QOperatingSystemVersion(): 默认构造函数&…...

编程日记 2024/10/28 6:49:05

openpnp - 解决“底部相机高级校正成功后, 开机归零时，吸嘴自动校验失败的问题“

文章目录 openpnp - 解决"底部相机高级校正成功后, 开机归零时，吸嘴自动校验失败的问题"概述笔记问题现象1问题现象2原因分析现在底部相机和吸嘴的位置偏差记录修正底部相机位置现在再看看NT1在底部相机中的位置开机归零，看看是否能通过所有校…...

编程日记 2024/10/28 6:46:03

Python字幕滚动：为视频添加专业级动态效果！

Python实现由下向上滚动字幕在数字媒体和编程领域，动态文本效果总能吸引观众的注意力。其中，滚动字幕是一种常见的视觉效果，经常用于视频、演示文稿和网页中。在Python中，我们可以通过多种方式来实现滚动字幕效果，比…...

编程日记 2024/10/28 6:45:02

Linux 系统中，将网络配置从 DHCP 改为静态 IP的几种方法

Linux 系统中，将网络配置从 DHCP 改为静态 IP 可以通过几种不同的方法来实现，下面是几种常见的方式： 方法一：使用 connman（Connection Manager） 如果你已经在使用 connman 管理网络，可以通过修…...

编程日记 2024/10/28 6:44:01

【jellyfin】解决Edge 浏览器播放 jellyfin 的 hevc/h265 视频“该客户端与媒体不兼容，服务器未发送兼容的媒体格式”错误

文章目录问题原因分析解决方法问题在 windows 系统自带的 Edge 浏览器里网页播放 jellyfin 媒体库里的 hevc/h265 编码的视频时，总是提示该客户端与媒体不兼容，服务器未发送兼容的媒体格式，无法播放视频。原因分析 Edge 浏览器默认不…...

编程日记 2024/10/28 6:43:00

企业管理系统设计思路——毕业论文设计

根据企业对人事管理的要求，本系统可以实现以下目标： l 操作简单方便、界面简洁美观。 l 在查看员工信息时，可以对当前员工的家庭情况、培训情况进行添加、修改、删除的操作。 l 方便快捷的全方位数据查询。 l 按照指定的条件对员工进行统…...

编程日记 2024/10/28 6:40:58

Android 默认去掉URL网络校验，设置不进行网络校验

Android 系统连接WIFI显示网络连接受限分析处理_安卓13类原生系统网络受限-CSDN博客 package\modules\NetworkStack\src\com\android\networkstack\util\NetworkStackUtils.java public static final String CAPTIVE_PORTAL_MODE "captive_portal_mode"; //0 不…...

编程日记 2024/10/28 6:39:57

Python | Leetcode Python题解之第515题在每个树行中找最大值

题目： 题解： class Solution:def largestValues(self, root: Optional[TreeNode]) -> List[int]:if root is None:return []ans []q [root]while q:maxVal -inftmp qq []for node in tmp:maxVal max(maxVal, node.val)if node.left:q.append(n…...

编程日记 2024/10/28 6:38:56

Java泛型：类型安全的艺术

Java泛型是JDK 5中引入的一项重要特性，它为Java带来了类型安全的机制，极大地提升了代码的可读性和可维护性。泛型允许程序员在编译时检测非法类型，从而避免了运行时的ClassCastException异常，使得代码更加健壮和可靠。泛型的基本…...

编程日记 2024/10/28 6:36:54

Redis 淘汰策略问题

前言相关系列《Redis & 目录》（持续更新）《Redis & 淘汰策略 & 源码》（学习过程/多有漏误/仅作参考/不再更新）《Redis & 淘汰策略 & 总结》（学习总结/最新最准/持续更新）《Redis &a…...

编程日记 2024/10/28 6:33:50

网络六边形受到攻击

大家读完觉得有帮助记得关注和点赞！！！ 抽象现代智能交通系统 （ITS） 的一个关键要求是能够以安全、可靠和匿名的方式从互联车辆和移动设备收集地理参考数据。Nexagon 协议建立在 IETF 定位器/ID 分离协议 （…...

编程新知 2026/2/8 5:22:04

Redis相关知识总结（缓存雪崩，缓存穿透，缓存击穿，Redis实现分布式锁，如何保持数据库和缓存一致）

文章目录 1.什么是Redis？2.为什么要使用redis作为mysql的缓存？3.什么是缓存雪崩、缓存穿透、缓存击穿？3.1缓存雪崩3.1.1 大量缓存同时过期3.1.2 Redis宕机 3.2 缓存击穿3.3 缓存穿透3.4 总结 4. 数据库和缓存如何保持一致性5. Redis实现分布式…...

编程新知 2026/2/8 12:24:34

【Go语言基础【12】】指针：声明、取地址、解引用

文章目录零、概述：指针 vs. 引用（类比其他语言）一、指针基础概念二、指针声明与初始化三、指针操作符1. &：取地址（拿到内存地址）2. *：解引用（拿到值） 四、空指针&am…...

编程新知 2025/6/21 2:18:57

Java求职者面试指南：计算机基础与源码原理深度解析

Java求职者面试指南：计算机基础与源码原理深度解析第一轮提问：基础概念问题 1. 请解释什么是进程和线程的区别？ 面试官：进程是程序的一次执行过程，是系统进行资源分配和调度的基本单位；而线程是进程中的…...

编程新知 2025/12/9 14:22:07

Python Einops库：深度学习中的张量操作革命

Einops（爱因斯坦操作库）就像给张量操作戴上了一副"语义眼镜"——让你用人类能理解的方式告诉计算机如何操作多维数组。这个基于爱因斯坦求和约定的库，用类似自然语言的表达式替代了晦涩的API调用，彻底改变了深度学习工程…...

编程新知 2025/10/16 12:04:52

通过MicroSip配置自己的freeswitch服务器进行调试记录

之前用docker安装的freeswitch的，启动是正常的， 但用下面的Microsip连接不上主要原因有可能一下几个 1、通过下面命令可以看 [rootlocalhost default]# docker exec -it freeswitch fs_cli -x "sofia status profile internal"Name …...

编程新知 2026/2/6 14:23:05

Python实现简单音频数据压缩与解压算法

Python实现简单音频数据压缩与解压算法引言在音频数据处理中，压缩算法是降低存储成本和传输效率的关键技术。Python作为一门灵活且功能强大的编程语言，提供了丰富的库和工具来实现音频数据的压缩与解压。本文将通过一个简单的音频数据压缩与解压算法…...

编程新知 2025/9/18 22:43:13

一些实用的chrome扩展0x01

简介浏览器扩展程序有助于自动化任务、查找隐藏的漏洞、隐藏自身痕迹。以下列出了一些必备扩展程序，无论是测试应用程序、搜寻漏洞还是收集情报，它们都能提升工作流程。 FoxyProxy 代理管理工具，此扩展简化了使用代理（如 Burp…...

编程新知 2026/2/4 17:28:54

6.9-QT模拟计算器

源码: 头文件: widget.h #ifndef WIDGET_H #define WIDGET_H#include <QWidget> #include <QMouseEvent>QT_BEGIN_NAMESPACE namespace Ui { class Widget; } QT_END_NAMESPACEclass Widget : public QWidget {Q_OBJECTpublic:Widget(QWidget *parent nullptr);…...

编程新知 2026/2/6 5:43:28

【论文阅读】Reliable, Adaptable, and Attributable Language Models with Retrieval

文章目录

Overview

Current Retrieval-Augmented LMs

Architecture

Training

Limitations & Future Work

相关文章：

【论文阅读】Reliable, Adaptable, and Attributable Language Models with Retrieval

A-Frame负责人Diego Marcos分享WebXR与开源AI的未来

【STM32-HAL库】火焰传感器（STM32F407ZGT6）(附带工程下载链接)

git merge没有生成合并提交

算法题总结（十九）——图论

android studio编译错误提示无法下载仓库

基于SpringBoot的时装购物系统【源码】+【论文】

自动化结账测试：使用 Playwright确保电商支付流程的无缝体验【nodejs]

计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-25

【读书笔记-《网络是怎样连接的》- 5】Chapter2_4-网卡的工作过程

qt QOperatingSystemVersion详解

openpnp - 解决“底部相机高级校正成功后, 开机归零时，吸嘴自动校验失败的问题“

Python字幕滚动：为视频添加专业级动态效果！

Linux 系统中，将网络配置从 DHCP 改为静态 IP的几种方法

【jellyfin】解决Edge 浏览器播放 jellyfin 的 hevc/h265 视频“该客户端与媒体不兼容，服务器未发送兼容的媒体格式”错误

企业管理系统设计思路——毕业论文设计

Android 默认去掉URL网络校验，设置不进行网络校验

Python | Leetcode Python题解之第515题在每个树行中找最大值

Java泛型：类型安全的艺术

Redis 淘汰策略问题

网络六边形受到攻击

Redis相关知识总结（缓存雪崩，缓存穿透，缓存击穿，Redis实现分布式锁，如何保持数据库和缓存一致）

【Go语言基础【12】】指针：声明、取地址、解引用

Java求职者面试指南：计算机基础与源码原理深度解析

Python Einops库：深度学习中的张量操作革命

通过MicroSip配置自己的freeswitch服务器进行调试记录

Python实现简单音频数据压缩与解压算法

热门Chrome扩展程序存在明文传输风险，用户隐私安全受威胁

一些实用的chrome扩展0x01

6.9-QT模拟计算器