当前位置: 首页 > news >正文

论文解读 | NeurIPS'24 IRCAN:通过识别和重新加权上下文感知神经元来减轻大语言模型生成中的知识冲突...

点击蓝字

82401254ef12330ec2cd14d203cb3d74.jpeg

关注我们

AI TIME欢迎每一位AI爱好者的加入!

1a962832f0394ed2dc475e0ecde2616e.png

点击 阅读原文 观看作者讲解回放!

作者简介

史丹,天津大学博士生

内容简介

大语言模型(LLM)经过海量数据训练后编码了丰富的世界知识。最近的研究表明,当LLM面临其编码的参数知识和上下文中提供的知识之间存在矛盾(被称为知识冲突)时,可能会过度依赖其内在的参数知识,而不能充分重视上下文中引入的新知识。为了减轻该问题,本文提出了一个新颖的框架IRCAN,通过识别和重新加权上下文感知神经元,引导LLM根据上下文中提供的新知识生成对上下文更敏感的输出。具体而言,IRCAN首先利用基于积分梯度的上下文感知归因评分,识别出显著贡献于处理上下文的神经元。随后,通过重新加权来增强所识别的上下文感知神经元。在来自多个系列的模型和多种任务上进行的广泛实验表明,IRCAN不仅显著提升了LLM在知识冲突问题上的性能,还可以与现有方法无缝集成,取得了最先进的结果。

论文地址:https://arxiv.org/abs/2312.12853

代码链接:https://github.com/danshi777/IRCAN

Motivation

众所周知,大语言模型经过大量数据的训练,蕴含了丰富的知识。然而,由于信息/知识的快速发展以及训练数据中存在的噪音,LLM可能拥有不正确或过时的知识。在现实应用中,通常使用检索增强生成(RAG)等方法,将最新的知识或来自外部数据库的知识集成到输入的提示上下文中来缓解这个问题。这导致LLM在生成过程中依赖两种知识来源:一种是参数知识,即模型在预训练阶段获得并编码在其参数中的知识;另一种是上下文知识,即我们提供给模型的输入上下文中的信息。当这两种知识存在不一致或矛盾时,就会出现所谓的知识冲突问题。

4be5ab80654dd9a872a7a8927545b476.png

以往的研究表明,当LLM面临参数知识与上下文知识之间的冲突时,它们可能会过度坚持现有的参数知识,而不能充分关注在上下文中引入的新知识。

例如,即便将“截至2023年,印度成为世界上人口最多的国家”这一信息作为上下文输入给Llama-2-7B,当被问及“世界上人口最多的国家是哪个”时,它仍然回答为“中国”。

fe6fc3f8453bef46d6ef5b92990b8416.png

作者猜想,是否类似于之前的知识神经元,在LLM中也存在专注于处理上下文的神经元呢?基于此假设,作者提出一个识别和重新加权上下文感知神经元的框架IRCAN,首先通过计算每个神经元的归因分数来衡量来识别负责处理上下文的神经元,称之为知识感知神经元,然后通过增加这些知识感知神经元的权重,使模型在生成过程中更加关注上下文,从而生成更忠诚于上下文的响应。

8e610c4c71c72512c4904a78279391a7.png

Methodology

具体而言,本方法首先通过一种基于梯度积分的上下文感知归因方法,计算每个神经元在感知上下文以预测答案方面的贡献分数。这些分数可用于评估哪些神经元在处理上下文中发挥着关键作用。与许多先前的研究相同,本文也关注第2个FFN层中的神经元。

作者将每个神经元要计算的归因分数记作66c01490876ddd766a0d80675f5ad679.png,其中表示在模型的第层的位于第i个位置的神经元。首先,仅将问题作为输入,记录下此时模型中每个神经元的激活值,记作a83bd7a77c75bf8dd96dacd9b55e9d38.png。接着,将上下文和问题一起输入给语言模型并记录此时新的神经元激活值,记作1f53d3943d074d754cebfd0133e6b3ea.png。然后,当输入为上下文和问题时,逐渐将神经元的激活值从d57ba882107d2aa7abcebf4cc1540e68.png改变为d7510c980f210b3cc8d9f1e1c347a074.png,观察输出正确答案的概率梯度的变化,计算归因分数为式(1)。直观上,通过对 α 从 0 变化到 1 时的梯度进行积分,7d24aa5e20e55c2cf95621435197dc94.png累积了由上下文不存在到存在的激活值变化引起的输出概率变化。如果神经元对上下文有很强的感知和处理能力,那么梯度就会很大,从而产生很大的积分值。因此,归因分数可以衡量神经元在处理上下文方面的贡献程度。

在实际的实验中,作者采用黎曼逼近法来近似计算归因分数,如式(2)所示。具体做法是将ece761e192eeea568176b325f075feff.png减这个值分成m份,每次改变其中的m分之一,然后将这些变化累加起来。在实验中,m默认为20。

3009b5cbb5eab48071dbcced0586ab42.png

第二步,根据计算出的神经元归因分数,首先保留分数高于阈值t的神经元。然后,对于每个数据实例,选择具有最高归因分数的前z个神经元作为候选集。在实验中,t和z分别默认设置为 10% 和 20。最终,计算所有候选集中神经元的共现次数,并选择共现次数最多的前h个神经元作为上下文感知神经元。这些识别出的上下文感知神经元在所有数据实例之间共享。

15542722c243cf7d57dce31abb34fac5.png

最后,本文采用了一种简单而有效的办法来放大识别到的知识感知神经元的作用,即直接将这些神经元的权重扩大到原始权重的β倍。在实验中,选取的知识神经元的数量h以及增强的倍数β都是超参数。

bdcc05c7318c437512f891b6b4bebd47.png

Experiments

作者在两种不同类型的知识冲突任务上进行了实验:一是补全任务,涉及“MemoTrap”数据集,该任务要求模型在英文谚语的上下文中使用不同于其传统结尾词的其他词语来补全谚语;另一种则是多项选择任务,在 COSE_KRE 和 ECARE_KRE 数据集上进行了实验,在该任务中,预先指定一个错误答案为正确答案,然后让ChatGPT生成一个支持这个错误答案的解释,并将这个解释作为上下文,期望模型在被提问后,能根据这个解释回答指定的答案,而非它原本的答案。

作者采用accuracy作为主要指标来评估模型的性能。此外,还设计了一个作为参考的指标——称为“固执率”。该指标旨在评估模型是否倾向于固守其内在参数知识。较低的固执率意味着模型利用内部参数知识回答问题的比例越低,从而在一定程度上反映了模型对上下文知识的专注。

fc160ada17c9ae2b149d303e310e3248.png

首先,在补全任务中,对比的baselines包括不做任何操作的原始模型,基于Probe的方法,以及一个强大的baseline CAD,它直接调整了输出概率,放大了使用上下文和不使用上下文时的概率差异,以此来使模型更加关注于上下文知识。实验结果表明,本文方法的性能达到了SOTA,尤其对于LLaMa-2-7B和LLaMa-3-8B,分别实现了129%和136%的显著ACC提升,SSR指标也明显下降。这证明了通过增加上下文感知神经元的权重,模型可以从依赖预先存储的参数知识转向利用上下文知识。此外,IRCAN和CAD技术能够产生叠加效应,结合CAD后性能进一步提升。

22e483160d1863d6e091dfc35c902ead.png

在多项选择任务中,除了前面提到的baseline,实验还增加了基于Prompt Engeering的baselines,包括三种明确指示模型在回答问题时更加关注上下文的方法和一种使用基于opinion的prompt的方法。结果显示,基于Prompt Engeering的方法并未带来一致的性能提升,甚至在某些模型上还导致了性能下降,但IRCAN在所有模型上都实现了稳定的性能提升,并且在结合CAD后,性能也进一步得到提高。

43909d75195c7447e6d1a6b6b4cc963f.png

为了进一步验证IRCAN识别的神经元是否在处理上下文中发挥关键作用,作者进一步进行了消融实验,包括:擦除(将权重置为0)检测到的上下文感知神经元;随机增强或删除与 IRCAN 中实现的相同数量的神经元。结果显示,与 IRCAN 的结果相比,当上下文感知神经元被擦除时,准确率大幅下降。然而,无论是擦除还是增强随机神经元,性能都与原始模型相似。这表明本文检测到的上下文感知神经元在解决知识冲突方面发挥着关键作用,从而验证了它们在模型功能中的重要性。

7b0d63d9ad79f43468c08e0ce2d0b24f.png

本文还探究了增强倍数和增强神经元的数量这两个超参数对模型性能的影响。左图显示了在固定神经元数量的情况下,随着上下文感知神经元增强倍数的增加,模型性能在初期逐渐提升,凸显了IRCAN识别的神经元的关键作用。然后,与我们的直觉一致,超过一定的增强强度后性能开始下降。这种下降可能是由于神经元的过度增强导致模型直接崩溃,其输出完全不可用。右图也展示出了类似的结果,随着增强神经元数量的增加,模型性能也呈现出先上升后下降的趋势。

7c55f26b64d67ad5aad19f257f0b3a1c.png

本文还对计算得到的归因分数较高的神经元进行了可视化,观察它们在模型层内部的分布情况。结果显示,大部分神经元集中在高层,也有部分位于中间层。这与以往的研究发现相吻合,即语言模型主要在高层编码高级语义知识。

33ec1272922ee5c3b7ba5484cf1b4c39.png

由于IRCAN增强了某些神经元的权重,这可能会引发一个担忧,即这是否会损害模型的一般能力?为了探究这一点,作者在六个常用的基准上进行了测试,结果显示,与原始模型的性能相比,IRCAN只会导致轻微的性能振荡。这表明IRCAN 可以可靠地提高大语言模型解决知识冲突任务的能力,同时保持其出色的综合能力。

本期文章由陈研整理

往期精彩文章推荐

b0f853ce9705586a035bf086d4af5fb9.jpeg

AAAI 2025预讲会28位讲者相聚|28篇论文工作+2个团队专场,一起期待2025年的首场预讲会

 关于AI TIME 

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。

迄今为止,AI TIME已经邀请了2000多位海内外讲者,举办了逾700场活动,超800万人次观看。

 7c3b076ae54cf020c5ce153b505f6593.png

我知道你 

在看

提出观点,表达想法,欢迎 

留言

b38b467c24ce7ccbc0c62edc38d31422.gif

点击 阅读原文 观看作者讲解回放!

相关文章:

论文解读 | NeurIPS'24 IRCAN:通过识别和重新加权上下文感知神经元来减轻大语言模型生成中的知识冲突...

点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 点击 阅读原文 观看作者讲解回放! 作者简介 史丹,天津大学博士生 内容简介 大语言模型(LLM)经过海量数据训练后编码了丰富的世界知识。最近的研究表明&#xff0c…...

edeg插件/扩展推荐:助力生活工作

WeTab 此插件在我看来有2个作用 1.改变edeg的主页布局和样式,使其更加精简,无广告 2.提供付费webtab Ai(底层是chatGpt) 沉浸式翻译 此插件可翻译网页的内容 假设我们浏览github 翻译前 翻译后 Better Ruler 可以对网页的距离进行测量 适合写前端的小伙伴 用法示例:...

基于Python读取ZIP和TAR格式压缩包教程

在数据处理和文件管理中,压缩包(如ZIP、TAR等格式)的使用非常普遍。Python提供了多种库来读取和处理这些压缩包。本文将介绍如何使用Python的内置库和第三方库来读取ZIP和TAR格式的压缩包。 1、读取ZIP文件 Python的zipfile模块提供了处理Z…...

懒人不下床型遥控方案--手机对电脑的简单遥控(无收费方案)

兄弟们,天气越发寒冷,不得不说,对像我这种喜欢看直播睡觉的懒狗越发的不友好了,每次昏昏欲睡但还要下床关直播的操作就像泡完温泉直接冲凉水澡,透心凉,心飞扬。 最进也是有时间找找合适的懒人方案解决这个…...

人工智能知识分享第八天-机器学习_泰坦尼克生存预估线性回归和决策树回归对比案例

泰坦尼克生存预估案例 import pandas as pd from sklearn.model_selection import train_test_split from sklearn.tree import DecisionTreeClassifier from sklearn.metrics import classification_report import matplotlib.pyplot as plt from sklearn.tree import plot_t…...

html中下拉选框的基本实现方式及JavaScript动态修改选项内容情况总结

最近项目中使用到了下拉选项以及通过js判断动态改变选项值的相关操作,查询了一些相关内容,在此记录一下,以免后续再碰到布置如何书写。 一、html中下拉选框的基本方式 在 HTML 中,创建下拉选择框(也叫选择菜单&#…...

sql server期末复习

表操作 创建create 删除drop 修改alter 数据操作 查询 select from <tableName> 插入 insert into <tableName> values 修改 update <tableName> set 删除 delete from <tableName> 授权与收回对数据的操作权限 授予 grant <权…...

LabVIEW语言学习过程是什么?

学习LabVIEW语言的过程可以分为几个阶段&#xff0c;每个阶段的重点内容逐步加深&#xff0c;帮助你从入门到精通。以下是一个简洁的学习过程&#xff1a; ​ 1. 基础入门阶段 理解图形化编程&#xff1a;LabVIEW是一种图形化编程语言&#xff0c;与传统的文本编程语言不同&am…...

小程序租赁系统开发的优势与应用前景分析

内容概要 小程序租赁系统是一种新兴的数字化解决方案&#xff0c;旨在为用户提供更加便捷与高效的租赁服务。它通常包括一系列功能&#xff0c;如在线浏览、即时预定、支付功能以及用户反馈机制。这些系统在使用上极为友好&#xff0c;让用户能够轻松选择所需的商品或服务&…...

『SQLite』安装与基本命令语法

SQLite安装 Windows&#xff1a; 访问 SQLite 的安装网页&#xff1a;https://www.sqlite.org/download.html.向下滚动页面到“Precompiled Binaries for Windows”部分。下载适用于你的系统架构&#xff08;32-bit 或 64-bit&#xff09;的预编译二进制文件。将下载的 ZIP 文…...

Unity-Mirror网络框架-从入门到精通之Benchmark示例

文章目录 前言什么是Benchmark&#xff1f;Benchmark 简要说明Benchmark示例BenchmarkNetworkManagerMonsterMovementPlayerMovementInterestManagement性能指标 BenchmarkIdle示例BenchmarkPrediction示例BenchmarkStinkySteak示例 前言 在现代游戏开发中&#xff0c;网络功能…...

毕业项目推荐:基于yolov8/yolov5的行人检测识别系统(python+卷积神经网络)

文章目录 概要一、整体资源介绍技术要点功能展示&#xff1a;功能1 支持单张图片识别功能2 支持遍历文件夹识别功能3 支持识别视频文件功能4 支持摄像头识别功能5 支持结果文件导出&#xff08;xls格式&#xff09;功能6 支持切换检测到的目标查看 二、数据集三、算法介绍1. YO…...

今日头条ip属地根据什么显示?不准确怎么办

在今日头条这样的社交媒体平台上&#xff0c;用户的IP属地信息对于维护网络环境的健康与秩序至关重要。然而&#xff0c;不少用户发现自己的IP属地显示与实际位置不符&#xff0c;这引发了广泛的关注和讨论。本文将深入探讨今日头条IP属地的显示依据&#xff0c;并提供解决IP属…...

FPGA设计-如何使用后端工具

目录 简介 布线布局 设计前期 布局布线策略 兼谈如何做第一次布局布线 正确看待map之后的资源占用报告 简介 本章节主要说明Xilinx的一些后端工具能为我们做什么在什么情况下我们考虑使用这些工具至于这些工具具体如何使用可以看Xilinx提供的相关文件 可从www.xilinx.com…...

苍穹外卖04——Redis初入门 在店铺打烊or营业状态管理功能中的使用

Redis入门 redis简介 它以键值对的形式存储数据在内存中,并且以极高的性能和灵活性而著称,通常用于缓存、消息代理以及持久化数据。 - 基于内存存储,读写性能高- 适合存储热点数据(热点商品、资讯、新闻)- 企业应用广泛Windows版下载地址:https://github.com/microsoft…...

【MySQL关于数据库和表结构的增删查改】

数据库和表结构的基本语法 数据库命令关于字符集语法 表操作语法创建表查看表结构修改表修改表名增加字段同时修改字段名和字段数据类型仅修改字段数据类型删除字段 删除表 备份和恢复备份恢复 mysql -h 127.0.0.1 -P 3306 -u root -p mysql -u root -h 和 -p 默认 进入MySQL程…...

JVM实战—11.OOM的原因和模拟以及案例

大纲 1.线上系统突然由于OOM内存溢出挂掉 2.什么是内存溢出及哪些区域会发生内存溢出 3.Metaspace如何因类太多而发生内存溢出 4.无限制调用方法如何让线程的栈内存溢出 5.对象太多导致堆内存实在放不下而内存溢出 6.模拟JVM Metaspace内存溢出的场景(动态生成268个类占1…...

LLM - 使用 LLaMA-Factory 部署大模型 HTTP 多模态服务 教程 (4)

欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/144881432 大模型的 HTTP 服务,通过网络接口,提供 AI 模型功能的服务,允许通过发送 HTTP 请求,交互大模型,通常基于云计算架构,无需在本地部署复杂的模型和硬件,…...

Clickhouse集群部署(3分片1副本)

Clickhouse集群部署 3台Linux服务器&#xff0c;搭建Clickhouse集群3分片1副本模式 1、安装Java、Clickhouse、Zookeeper dpkg -i clickhouse-client_23.2.6.34_amd64.deb dpkg -i clickhouse-common-static_23.2.6.34_amd64.deb dpkg -i clickhouse-server_23.2.6.34_amd64…...

刷服务器固件

猫眼淘票票 大麦 一 H3C通用IP 注:算力服务器不需要存储 二 刷服务器固件 1 登录固定IP地址 2 升级BMC版本 注 虽然IP不一致但是步骤是一致的 3 此时服务器会出现断网现象&#xff0c;若不断网等上三分钟ping一下 4 重新登录 5 断电拔电源线重新登录查看是否登录成功...

零门槛NAS搭建:WinNAS如何让普通电脑秒变私有云?

一、核心优势&#xff1a;专为Windows用户设计的极简NAS WinNAS由深圳耘想存储科技开发&#xff0c;是一款收费低廉但功能全面的Windows NAS工具&#xff0c;主打“无学习成本部署” 。与其他NAS软件相比&#xff0c;其优势在于&#xff1a; 无需硬件改造&#xff1a;将任意W…...

论文解读:交大港大上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化学习框架(二)

HoST框架核心实现方法详解 - 论文深度解读(第二部分) 《Learning Humanoid Standing-up Control across Diverse Postures》 系列文章: 论文深度解读 + 算法与代码分析(二) 作者机构: 上海AI Lab, 上海交通大学, 香港大学, 浙江大学, 香港中文大学 论文主题: 人形机器人…...

逻辑回归:给不确定性划界的分类大师

想象你是一名医生。面对患者的检查报告&#xff08;肿瘤大小、血液指标&#xff09;&#xff0c;你需要做出一个**决定性判断**&#xff1a;恶性还是良性&#xff1f;这种“非黑即白”的抉择&#xff0c;正是**逻辑回归&#xff08;Logistic Regression&#xff09;** 的战场&a…...

2024年赣州旅游投资集团社会招聘笔试真

2024年赣州旅游投资集团社会招聘笔试真 题 ( 满 分 1 0 0 分 时 间 1 2 0 分 钟 ) 一、单选题(每题只有一个正确答案,答错、不答或多答均不得分) 1.纪要的特点不包括()。 A.概括重点 B.指导传达 C. 客观纪实 D.有言必录 【答案】: D 2.1864年,()预言了电磁波的存在,并指出…...

转转集团旗下首家二手多品类循环仓店“超级转转”开业

6月9日&#xff0c;国内领先的循环经济企业转转集团旗下首家二手多品类循环仓店“超级转转”正式开业。 转转集团创始人兼CEO黄炜、转转循环时尚发起人朱珠、转转集团COO兼红布林CEO胡伟琨、王府井集团副总裁祝捷等出席了开业剪彩仪式。 据「TMT星球」了解&#xff0c;“超级…...

LLM基础1_语言模型如何处理文本

基于GitHub项目&#xff1a;https://github.com/datawhalechina/llms-from-scratch-cn 工具介绍 tiktoken&#xff1a;OpenAI开发的专业"分词器" torch&#xff1a;Facebook开发的强力计算引擎&#xff0c;相当于超级计算器 理解词嵌入&#xff1a;给词语画"…...

什么?连接服务器也能可视化显示界面?:基于X11 Forwarding + CentOS + MobaXterm实战指南

文章目录 什么是X11?环境准备实战步骤1️⃣ 服务器端配置(CentOS)2️⃣ 客户端配置(MobaXterm)3️⃣ 验证X11 Forwarding4️⃣ 运行自定义GUI程序(Python示例)5️⃣ 成功效果![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/55aefaea8a9f477e86d065227851fe3d.pn…...

大数据学习(132)-HIve数据分析

​​​​&#x1f34b;&#x1f34b;大数据学习&#x1f34b;&#x1f34b; &#x1f525;系列专栏&#xff1a; &#x1f451;哲学语录: 用力所能及&#xff0c;改变世界。 &#x1f496;如果觉得博主的文章还不错的话&#xff0c;请点赞&#x1f44d;收藏⭐️留言&#x1f4…...

【Redis】笔记|第8节|大厂高并发缓存架构实战与优化

缓存架构 代码结构 代码详情 功能点&#xff1a; 多级缓存&#xff0c;先查本地缓存&#xff0c;再查Redis&#xff0c;最后才查数据库热点数据重建逻辑使用分布式锁&#xff0c;二次查询更新缓存采用读写锁提升性能采用Redis的发布订阅机制通知所有实例更新本地缓存适用读多…...

Modbus RTU与Modbus TCP详解指南

目录 1. Modbus协议基础 1.1 什么是Modbus? 1.2 Modbus协议历史 1.3 Modbus协议族 1.4 Modbus通信模型 🎭 主从架构 🔄 请求响应模式 2. Modbus RTU详解 2.1 RTU是什么? 2.2 RTU物理层 🔌 连接方式 ⚡ 通信参数 2.3 RTU数据帧格式 📦 帧结构详解 🔍…...