当前位置: 首页 > article >正文

论文浅尝 | HOLMES:面向大语言模型多跳问答的超关系知识图谱方法(ACL2024)

笔记整理:李晓彤,浙江大学硕士,研究方向为大语言模型

论文链接:https://arxiv.org/pdf/2406.06027

发表会议:ACL 2024

1. 动机

多跳问答(Multi-Hop Question Answering, MHQA)技术近年来在自然语言处理领域引起了广泛关注,尤其是在大规模语言模型(LLMs)用于问答任务的背景下。然而,面对复杂的多跳问题时,现有的LLMs表现不尽如人意,其主要原因在于:理解复杂问题所需的信息筛选和上下文聚合存在很大的挑战。为了缓解这一问题,研究人员尝试结合结构化知识图谱(KG)来简化信息,但这仍不足以应对复杂、多跳问题的挑战,因为这些方法通常缺乏上下文依赖性和对查询的具体化。因此,本文提出了一种超关系(Hyper-Relational)知识图谱,以更有效地辅助LLMs进行多跳问答任务。

2. 贡献

本文的主要贡献有:

(1) 引入了一种新的多跳问答方法,通过将非结构化文本转换为基于查询产生的超关系知识图谱来简化信息处理。

(2) 实验表明,该方法在多个数据集上显著提升了多跳问答的性能。具体而言,在HotpotQA数据集上提升了18.7%和20%的EM分数,而在MuSiQue数据集上提升了26%和14.3%。

(3) 相较于现有技术(SoTA)方法,利用本文的查询聚焦的超关系知识图能够减少67%的标记使用,从而提高信息效率。

3. 方法

该方法的关键思想是识别包含多跳问题答案的文档子集,随后从它们中提取上下文感知的结构化信息,进一步使用基于查询的schema来完善信息,以保留与查询相关的信息。

3.1 与查询相关的结构化知识发现

从支持文档中提取指定的实体。然后,在文档和实体节点之间建立边缘,形成了一个两分图,该图捕获了实体与它们出现的文档之间的连接,通过层次遍历来探索相关的潜在语义图,并利用LLMs生成知识图谱三元组,再将其转换为超关系四元组。

3.2 信息精炼的知识架构构建

为了消除超关系图中与检索无关的信息,作者构建了一个与查询对准的知识模式,图模式使用两个来源填充:通过识别推理查询中的关系得出模式元素,然后使用LLMs估算每个关系中的主题和对象实体类型;使用其他领域特定的关系丰富了知识模式,以帮助多跳的推理。然后执行改进步骤中的完善步骤。根据问题和领域内的知识构建查询对齐的知识架构,用其对超关系知识图进行裁剪,保留与查询相关的信息。

3.3 LLM的提示构建

将裁剪后的超关系图谱进行语言化处理,并根据与查询的相关性排序,形成输入提示。由于结构化信息提取是一个未解决的问题,因此在输入图中可能会遗漏一些相关的细节。为了减轻这种情况,作者还在提示构建中包含了一个验步骤。如果LLM识别输入图中缺少有关特定命名实体集的事实,则指示它列出缺失的命名实体。重新从Entity-Document图中获取相应的文档,并将它们与初始相关事实集成在一起。此过程不仅丰富了LLM的输入,而且还确保检索任何缺失的查询信息,从而提高了系统响应的准确性。

4. 实验

通过两个基准数据集HotpotQA和MuSiQue的验证,使用GPT-3.5、GPT-4等最先进的语言模型,证明了本文方法在多跳问答任务中的显著优越性能。在主要的评价指标(EM、F1、Precision、Recall等)上,该方法在这些数据集上均取得了优于基线方法的结果。

同时,为了衡量LLM提供答案时的信心,还引入了“自知精确匹配”(Self-Aware EM)这一新的评价指标。实验结果显示,相较于其他基线方法,HOLMES方法在自知EM分数上具有更高的表现,在多个数据集和各种LLM模型中均实现了一致的改进。

5. 总结

本文提出了一种基于超关系知识图谱的方法来提升多跳问答的效果,通过减小信息噪声、对相关事实进行精炼及利用LLMs的强大推理能力来解决复杂的自然语言问题。通过一系列实验验证,该方法成功地在具有代表性的问答数据集中实现了先进的性能。此外,几乎所有处理步骤都是零训练的,使得该系统在没有大量标注数据的情况下也能表现优异。总之,HOLMES方法为多跳问答任务提供了更为精确和高效的解决方案,标志着在该领域的一次显著进步。未来的研究方向可能会围绕增强模型的上下文理解能力及进一步减少信息处理的冗余展开。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

点击阅读原文,进入 OpenKG 网站。

相关文章:

论文浅尝 | HOLMES:面向大语言模型多跳问答的超关系知识图谱方法(ACL2024)

笔记整理:李晓彤,浙江大学硕士,研究方向为大语言模型 论文链接:https://arxiv.org/pdf/2406.06027 发表会议:ACL 2024 1. 动机 多跳问答(Multi-Hop Question Answering, MHQA)技术近年来在自然语…...

npm、pnpm、yarn 各自优劣深度剖析

在前端开发领域,包管理工具是开发者的得力助手,它们负责处理项目中的依赖安装、更新与管理。npm、pnpm、yarn 是目前最主流的三款包管理工具,它们在功能上有诸多相似之处,但在实际使用中又各有优劣。本文将结合包管理工具常见问题…...

jenkins使用Send build artifacts over SSH发布jar包目录配置

本测试用ruoyi-plus的代码。 1 [GitLab 自动触发 Jenkins 构建_jenkins构建触发器没有build when a change is pushed to git-CSDN博客](https://blog.csdn.net/wangyiyungw/article/details/81776972) 2 [jenkins使用Send build artifacts over SSH遇到的坑-CSDN博客](https…...

uni-app小程序登录后…

前情 最近新接了一个全新项目,是类似商城的小程序项目,我负责从0开始搭建小程序,我选用的技术栈是uni-app技术栈,其中就有一个用户登录功能,小程序部分页面是需要登录才可以查看的,对于未登录的用户需要引…...

【深度学习基础】从感知机到多层神经网络:模型原理、结构与计算过程全解析

【深度学习基础】从感知机到多层神经网络:模型原理、结构与计算过程全解析 1. 引言 神经网络的重要性: 作为人工智能的核心技术之一,神经网络通过模拟人脑神经元的工作机制,成为解决复杂模式识别、预测和决策任务的利器。从图像分…...

【Leetcode】取余/2的幂次方

给定一个非负整数 num,反复将各个位上的数字相加,直到结果为一位数。返回这个结果。 示例 1: 输入: num 38 输出: 2 解释: 各位相加的过程为: 38 --> 3 8 --> 11 11 --> 1 1 --> 2 由于 2 是一位数,所以返回 2。 …...

解决Power BI Desktop导入Excel数据第一行不是列标题问题

选中第一行不是列标题的表→鼠标右键→选择编辑查询→进入Power Query界面→点击“将第一行用作标题”→点击左边的“关闭并应用” 第一行就提升为标题了...

springboot3.x只需两步快速整合nacos作配置中心

一、下载依赖 我在网上找了各种资料&#xff0c;都是要先确定springcloud版本&#xff0c;实际操作却可能由于版本或者镜像或者maven等问题报红&#xff0c;出现各种情况。 实际只需要指定特定版本号就行&#xff0c;添加下面两个依赖 <dependency><groupId>com.…...

python如何遍历postgresql所有的用户表

要遍历PostgreSQL数据库中的所有用户表&#xff0c;可以按照以下步骤操作&#xff1a; 安装必要依赖库 pip install psycopg2-binary使用标准SQL查询方案&#xff08;推荐&#xff09; import psycopg2def list_user_tables():try:conn psycopg2.connect(host"your_ho…...

c/c++的opencv高斯模糊

深入探索图像高斯模糊&#xff1a;原理、C/C实现与OpenCV应用 在图像处理的众多技术中&#xff0c;模糊&#xff08;或平滑&#xff09;是最为基础且不可或缺的一环。它广泛应用于降噪、图像预处理、特征提取前的平滑以及计算机图形学中的各种视觉效果。在高斯模糊&#xff08…...

<uniapp><vuex><状态管理>在uniapp中,如何使用vuex实现数据共享与传递?

前言 本专栏是基于uniapp实现手机端各种小功能的程序&#xff0c;并且基于各种通讯协议如http、websocekt等&#xff0c;实现手机端作为客户端&#xff08;或者是手持机、PDA等&#xff09;&#xff0c;与服务端进行数据通讯的实例开发。 发文平台 CSDN 环境配置 系统&…...

Java Stream流:高效数据处理的现代解决方案

精心整理了最新的面试资料和简历模板&#xff0c;有需要的可以自行获取 点击前往百度网盘获取 点击前往夸克网盘获取 一、Stream流概述 Java 8引入的Stream API为集合操作带来了革命性改进&#xff0c;它结合Lambda表达式实现了声明式编程风格&#xff0c;支持并行处理&#…...

数据湖和数据仓库的区别

在当今数据驱动的时代&#xff0c;企业需要处理和存储海量数据。数据湖与数据仓库作为两种主要的数据存储解决方案&#xff0c;各自有其独特的优势与适用场景。本文将客观详细地介绍数据湖与数据仓库的基本概念、核心区别、应用场景以及未来发展趋势&#xff0c;帮助读者更好地…...

【论文阅读 | AAAI 2025 | FD2-Net:用于红外 - 可见光目标检测的频率驱动特征分解网络】

论文阅读 | AAAI 2025 | FD2-Net&#xff1a;用于红外 - 可见光目标检测的频率驱动特征分解网络 1.摘要&&引言2. 方法2.1总体架构2.2特征分解编码器2.3多模态重建机制2.4训练损失 3.实验3.1实验设置3.2主要结果3.3消融研究 4.结论 题目&#xff1a;FD2-Net: Frequency-…...

前端取经路——量子UI:响应式交互新范式

嘿&#xff0c;老铁们好啊&#xff01;我是老十三&#xff0c;一枚普通的前端切图仔&#xff08;不&#xff0c;开玩笑的&#xff0c;我是正经开发&#xff09;。最近前端技术简直跟坐火箭一样&#xff0c;飞速发展&#xff01;今天我就跟大家唠唠从状态管理到实时渲染&#xf…...

计算机视觉与深度学习 | matlab实现EMD-VMD-LSTM时间序列预测(完整源码和数据)

EMD-VMD-LSTM 一、完整代码实现二、代码结构说明三、关键参数说明四、注意事项五、典型输出示例以下是使用MATLAB实现EMD-VMD-LSTM时间序列预测的完整代码,包含数据生成、经验模态分解(EMD)、变分模态分解(VMD)、LSTM模型构建与预测分析。代码通过对比实验验证分解策略的有…...

济南国网数字化培训班学习笔记-第三组-1-电力通信传输网认知

电力通信传输网认知 电力通信基本情况 传输介质 传输介质类型&#xff08;导引与非导引&#xff09; 导引传输介质&#xff0c;如电缆、光纤&#xff1b; 非导引传输介质&#xff0c;如无线电波&#xff1b; 传输介质的选择影响信号传输质量 信号传输模式&#xff08;单工…...

OAT 初始化时出错?问题可能出在 PAM 配置上|OceanBase 故障排查实践

本文作者&#xff1a;爱可生数据库工程师&#xff0c;任仲禹&#xff0c;擅长故障分析和性能优化。 背景 某客户在使用 OAT 初始化OceanBase 服务器的过程中&#xff0c;进行到 precheck 步骤时&#xff0c;遇到了如下报错信息&#xff1a; ERROR - check current session ha…...

1-机器学习的基本概念

文章目录 一、机器学习的步骤Step1 - Function with unknownStep2 - Define Loss from Training DataStep3 - Optimization 二、机器学习的改进Q1 - 线性模型有一些缺点Q2 - 重新诠释机器学习的三步Q3 - 机器学习的扩展Q4 - 过拟合问题&#xff08;Overfitting&#xff09; 一、…...

Hass-Panel - 开源智能家居控制面板

文章目录 ▎项目介绍&#xff1a;预览图▎主要特性安装部署Docker方式 正式版Home Assistant Addon方式详细安装方式1. Home Assistant 插件安装&#xff08;推荐&#xff09;2. Docker 安装命令功能说明 &#xff1a;3. Docker Compose 安装升级说明Docker Compose 版本升级 功…...

Ubuntu搭建NFS服务器的方法

0 工具 Ubuntu 18.041 Ubuntu搭建NFS服务器的方法 在Ubuntu下搭建NFS&#xff08;网络文件系统&#xff09;服务器可以让我们像访问本地文件一样访问Ubuntu上的文件&#xff0c;例如可以把开发板的根文件系统放到NFS服务器目录下方便调试。 1.1 安装nfs-kernel-server&#…...

网感驱动下开源AI大模型AI智能名片S2B2C商城小程序源码的实践路径研究

摘要&#xff1a;在数字化浪潮中&#xff0c;网感已成为内容创作者与商业运营者必备的核心能力。本文以开源AI大模型、AI智能名片及S2B2C商城小程序源码为技术载体&#xff0c;通过解析网感培养与用户需求洞察的内在关联&#xff0c;提出"数据驱动-场景适配-价值重构"…...

COMPUTEX 2025 | 广和通5G AI MiFi解决方案助力移动宽带终端迈向AI新未来

随着5G与AI不断融合&#xff0c;稳定高速、智能的移动网络已成为商务、旅行、户外作业等场景的刚需。广和通5G AI MiFi方案凭借领先技术与创新设计&#xff0c;重新定义5G移动网络体验。 广和通5G AI MiFi 方案搭载高通 4nm制程QCM4490平台&#xff0c;融合手机级超低功耗技术…...

防范Java应用中的恶意文件上传:确保服务器的安全性

防范Java应用中的恶意文件上传&#xff1a;确保服务器的安全性 在当今数字化时代&#xff0c;Java 应用无处不在&#xff0c;而文件上传功能作为许多应用的核心组件&#xff0c;却潜藏着巨大的安全隐患。恶意文件上传可能导致服务器被入侵、数据泄露甚至服务瘫痪&#xff0c;因…...

STM32H7时钟树

时钟树分析 STM32H7共有6个外部时钟源,分别是&#xff1a; HSI&#xff08;高速内部振荡器&#xff09;时钟&#xff1a;~ 8 MHz、16 MHz、32 MHz 或 64 MHzHSE&#xff08;高速外部振荡器&#xff09;时钟&#xff1a;4 MHz 到 48 MHzLSE&#xff08;低速外部振荡器&#xff…...

git 的 .gitignore 规则文件

# .gitignore 使用注意事项&#xff1a; # 1. 所有的注释只能是独占单行注释&#xff0c;不能在有效代码后注释&#xff01;否者不生效&#xff01;比如错误示范&#xff1a; # 实例&#xff1a; MDK/ #忽略MDK目录下所有内容 (跟在有效代码后注释&#xff0c;非法&#xff…...

【通用智能体】Serper API 详解:搜索引擎数据获取的核心工具

Serper API 详解&#xff1a;搜索引擎数据获取的核心工具 一、Serper API 的定义与核心功能二、技术架构与核心优势2.1 技术实现原理2.2 对比传统方案的突破性优势 三、典型应用场景与代码示例3.1 SEO 监控系统3.2 竞品广告分析 四、使用成本与配额策略五、开发者注意事项六、替…...

asp.net web form nlog的安装

一、安装NuGet包 ‌核心包安装‌ NLog提供日志记录核心功能 NLog.Config自动生成默认配置文件模板 配置NLog文件 ‌配置文件创建‌ 项目根目录自动生成NLog.config文件&#xff08;通过NuGet安装NLog.Config时创建&#xff09; <?xml version"1.0" encoding&…...

【图像生成大模型】CogVideoX-5b:开启文本到视频生成的新纪元

CogVideoX-5b&#xff1a;开启文本到视频生成的新纪元 项目背景与目标模型架构与技术亮点项目运行方式与执行步骤环境准备模型加载与推理量化推理 执行报错与问题解决内存不足模型加载失败生成质量不佳 相关论文信息总结 在人工智能领域&#xff0c;文本到视频生成技术一直是研…...

剧本杀小程序:指尖上的沉浸式推理宇宙

在推理热潮席卷社交圈的当下&#xff0c;你是否渴望随时随地开启一场烧脑又刺激的冒险&#xff1f;我们的剧本杀小程序&#xff0c;就是你掌心的“推理魔法盒”&#xff0c;一键解锁无限精彩&#xff01; 海量剧本库&#xff0c;满足多元口味&#xff1a;小程序汇聚了从古风权…...