【文献阅读】GraphAny: A Foundation Model for Node Classification on Any Graph
Abstract
可以执行任何新任务而无需特定训练的基础模型已经在视觉和语言应用中引发了机器学习的革命。然而,涉及图结构数据的应用仍然是基础模型面临的一个难题,因为每个图都有独特的特征和标签空间。传统的图机器学习模型,如图神经网络(GNNs),在训练时只能处理特定的图,不能对特征和标签空间不同的新图进行推断。此外,现有模型学习的是针对训练图的特定函数,无法泛化到新图中。
在这项工作中,我们通过一种新的基础架构——GraphAny,解决了这两个挑战。
GraphAny 将对新图的推断建模为线性图神经网络(LinearGNN)的分析解决方案,从而解决了第一个挑战。
为了应对第二个挑战,我们为每个节点学习注意力分数,以融合多个 LinearGNN 的预测结果。具体而言,注意力模块被精心参数化为多个 LinearGNN 预测之间的熵归一化距离特征的函数,以确保对新图的泛化。
实证研究表明,GraphAny 在仅使用 120 个标记节点的威斯康星数据集上训练,能够以 67.26% 的平均准确率有效地对 30 个新图进行归纳泛化,超越了在监督模式下训练的 GCN 和 GAT 以及其他归纳基线。
Introduction
基础模型 [1, 39, 40] 在海量数据上预训练,凭借仅需少量示例即可解决任何新任务的能力,已经彻底改变了人工智能的格局 [8, 3]。到目前为止,这种能力主要限于文本或图像等模态。这些模态的一个固有特性是存在一个跨所有任务的共享输入空间(例如,令牌的词汇表或像素块),为学习一个基础模型覆盖广泛任务类别并泛化到新任务提供了自然基础。然而,图数据不具备这种特性。以节点分类任务为例,每个图可能具有其特征和标签空间的独特维度和语义(例如,连续或离散),这阻碍了我们以与上述模态相同的方式开发图基础模型 [26]。
挑战:(1)现有模型学习特定于训练中使用的特征和标签的维度、类型和结构的变换,不能对与训练不同的特征和标签空间进行推断。这需要我们为任意特征和标签空间开发一种新的模型架构。(2)现有模型学习的是针对训练图的特定函数,无法泛化到新图中;这要求一个能够在训练后对任何图进行泛化的归纳函数。
GraphAny,一种新颖的预训练基础模型架构,能够在任何新图上解决节点分类问题。GraphAny 由两个组件组成:一个 LinearGNN 在没有训练步骤的情况下对新特征和标签空间进行推断,以及一个基于熵归一化距离特征的每个节点的注意力向量,确保对新图的泛化。
具体而言, LinearGNN 将节点特征和标签之间的映射建模为非参数化的图卷积,随后是线性层,其参数在封闭形式中确定,无需明确的训练步骤。虽然单个 LinearGNN 模型可能远未达到许多图的最佳效果,但使用多个具有不同图卷积算子的 LinearGNN 模型,并学习一个注意力向量来融合它们的预测结果。
注意力向量被参数化为 LinearGNN 预测之间距离特征的函数,这保证了模型对特征和标签维度的排列不变。为了进一步提高模型的泛化能力,我们提出了熵归一化,将距离特征分布调整为固定熵,从而减少不同标签维度对距离特征的影响。
直观地说,注意力向量学习根据其预测分布选择每个节点的最有效的 LinearGNN 组合,反映其局部结构的统计特性(例如,同质性度量 [25]),并对新图进行泛化。
Contribution:
- 提出了 LinearGNN,这是一种高效的架构,适用于在任何具有任意特征和标签空间的图上进行归纳节点分类。
- 设计了一个归纳注意力模块,用于使用距离特征和熵归一化融合 LinearGNN,这对特征和标签排列不变,对维度变化具有鲁棒性。
- 结合LinearGNN 和归纳注意力模块,GraphAny 在单一数据集上训练后可以对任何图进行泛化,实现了第一个图基础模型用于节点分类。
GraphAny: A Foundation Model for Node Classification
GraphAny包括一个LinearGNN和一个注意力模块。LinearGNN提供了在具有任意特征和标签空间的新图上进行归纳推理的基本解决方案,而注意力模块则学习基于归纳特征组合多个LinearGNN,以实现对新图的泛化。
LinearGNNs for Inductive Inference on Any Graph
Learning Inductive Attention over LinearGNNs
相关文章:

【文献阅读】GraphAny: A Foundation Model for Node Classification on Any Graph
Abstract 可以执行任何新任务而无需特定训练的基础模型已经在视觉和语言应用中引发了机器学习的革命。然而,涉及图结构数据的应用仍然是基础模型面临的一个难题,因为每个图都有独特的特征和标签空间。传统的图机器学习模型,如图神经网络&…...

动态规划.
目录 (一)递归到动规的一般转化方法 (二)动规解题的一般思路 1. 将原问题分解为子问题 2. 确定状态 3. 确定一些初始状态(边界状态)的值 4. 确定状态转移方程 (三)能用动规解…...

PHP常用函数
字符串 strlen()获取字符串长度strpos()在字符串内查找一个字符或一段指定的文本,返回第一次出现的位置或falsestripos()同上,但不区分大小写strrpos()同上上,返回最后一…...

完全用python 实现消息中间件4
为了进一步完善这个消息中间件,我们可以添加以下功能: 消息确认:客户端可以发送一个确认消息,表明消息已经被正确接收。消息队列:使用一个队列来存储消息,而不是直接存储在字典中。多消费者支持࿱…...

公司新来的两个Java后端,因题背太熟轻松过面试?
以前面试是背八股文,而2024年的后端面试都是流行问场景题!建议大家把面试想简单一点,顺的场景题直接给有需要的人,希望能对大家有所帮助! 由于平台篇幅原因,很多java面试资料内容展示不了,需要…...

Pinia状态管理库
为了跨组件传递JWT令牌,我们就会利用Pinia状态管理库,它允许跨组件或页面共享状态。 使用Pinia步骤: 安装pinia:cnpm install pinia 在vue应用实例中使用pinia 在src/stores/token.js中定义store 在组件中使用store 1.在main.js文…...

利用ffmpeg转码视频为gif图片,调整gif图片的大小
【1】压缩gif图片大小 一般发布技术文章的时候经常要插入GIF图演示软件效果,但是一些编辑器总是限制大小,但是录制的时候可能一不小心就搞大了。 要将 GIF 图片大小限制在 10MB 内,可以使用 FFmpeg 进行压缩。 以下是一个ffmpeg的命令&…...

【Java 第四篇章】流程控制、容器
一、流程控制 1、概念 //1.if//2.if...else//3.if...else if...else...//4.switch//5.跳出循环体:break和continue2、语法 //1. ifif(条件表达式){//执行代码块}//2.if...elseif(条件表达式){//条件表达式为真执行的代码块} else {//条件表达式为假执行的代码块}//…...

华为云全域Serverless技术创新:全球首创通用Serverless平台被ACM SIGCOMM录用
华为开发者大会2024(HDC 2024)在东莞松山湖圆满结束,期间华为云主办的“全域Serverless时代:技术创新引领,赋能行业实践”专题论坛,向广大开发者传递了Serverless领域的前沿思考和实践,现场座无…...

除自身以外数组的相乘 C++
给你一个整数数组 nums,返回 数组 answer ,其中 answer[i] 等于 nums 中除 nums[i] 之外其余各元素的乘积 。 题目数据 保证 数组 nums之中任意元素的全部前缀元素和后缀的乘积都在 32 位 整数范围内。 请 不要使用除法,且在 O(n) 时间复杂…...

Element UI 如何配置文件来设置全局的语言选项。
Element UI 允许你通过配置文件来设置全局的语言选项,这样你可以方便地切换组件的语言。以下是如何配置 Element UI 以设置全局语言选项的步骤: 1. 安装 Element UI 确保你已经安装了 Element UI。 npm install element-ui --save2. 引入语言包 Elem…...

Windows 常用命令集锦
目录 一、文件和目录管理 1.1 文件操作 1.2 目录操作 二、系统信息 2.1 基本系统信息 2.2 硬件信息 三、网络管理 3.1 基本网络命令 3.2 网络诊断 四、进程管理 4.1 查看进程 4.2 管理进程 五、磁盘管理 5.1 磁盘操作 5.2 磁盘分区 六、IIS操作 通过上述命令&am…...

第一阶段面试问题(后半部分)
1. c语言中const *p的用法 (1)const int *p; 或 int const *p; 指向常量整数的指针,通过这个指针不能修改它所指向的整数值,但可以修改指针本身来指向其他地址 const int a 10; const int *p &a; // *p 20; // 错误&…...

【AIGC】ComfyUI入门-使用ComfyUI_MagicClothing插件在生成图片时候出现的问题
最近想自己实现自动换装的工作流,在使用ComfyUI_MagicClothing插件的时候,出现了一个奇怪的问题。这个问题不是插件的问题,是环境配置问题。 问题内容如下: Exception during processing!!! D:\a_work\1\s\onnxruntime\python\onnxruntime_pybind_state.cc:891 onnxrunti…...

巴黎奥运会8K转播科技为国产品牌自主研发设计
这个夏天,顶流是属于巴黎奥运会中国队的。 20枚金牌、15枚银牌、12枚铜牌......这个数字正随着赛事推进而不停在增加。赛场之上,中国健儿奋力拼搏、捷报频传,令人热血沸腾;赛场之外,另一支来自中国企业的“奥运选手”…...

【Material-UI】Button 组件中的图标和标签按钮(Buttons with Icons and Label)详解
文章目录 一、基础用法1. 左侧图标(startIcon)2. 右侧图标(endIcon) 二、图标与标签的搭配三、高级用法和最佳实践1. 自定义图标2. 视觉一致性3. 动态图标 四、总结 在现代用户界面设计中,图标在提高用户体验ÿ…...
K个一组翻转链表(LeetCode)
题目 给你链表的头节点 ,每 个节点一组进行翻转,请你返回修改后的链表。 是一个正整数,它的值小于或等于链表的长度。如果节点总数不是 的整数倍,那么请将最后剩余的节点保持原有顺序。 你不能只是单纯的改变节点内部的值&…...

2-56 基于matlab的图像融合增强技术
基于matlab的图像融合增强技术。通过原始图像——傅里叶变换——频率域滤波处理——傅里叶变换——增强后的图像。傅立叶变换以及傅立叶反变换.过程就是将空间的信息分解为在频率上的表示,通过傅立叶正反变换的处理,才使得频率域上的处理可以用于图像的增强。程序已调通&#x…...

序列化定义以及使用和注意事项
什么是序列化和反序列化 序列化:是将对象转换为可传输或存储的过程, 反序列化:通常是将字节流或是其他数据格式或源数据转为对象的过程。 序列化的作用 对象的持久化:将对象的状态保存到磁盘或数据库中,以便在程序…...

吴恩达机器学习COURSE1 WEEK3
COURSE1 WEEK3 逻辑回归 逻辑回归主要用于分类任务 只有两种输出结果的分类任务叫做二元分类,例如预测垃圾邮件,只能回答是或否 实际上,在逻辑回归中,我们要做的任务就类似于在数据集中画出一个这样的曲线,用来作为…...

白骑士的PyCharm教学高级篇 3.1 性能分析与优化
系列目录 上一篇:白骑士的PyCharm教学进阶篇 2.5 数据库连接与管理 在软件开发中,性能分析与优化是提高程序运行效率和用户体验的重要环节。PyCharm提供了强大的性能分析工具,帮助你识别和优化代码中的性能瓶颈。本文将详细介绍PyCharm中的代…...

swiper横向轮播(阶梯式滚动轮播)未生效
问题描述 版本问题 使用swiper4以上的版本可以解决该问题,4以上的swiper采用了this指向。...

基于arcpro3.0.2的北斗网格生成简介
基于arcpro3.0.2的北斗网格生成简介 采用2000坐标系、可基于行政区范围 软件可生成第一级到第十级北斗网格经纬跨度 等分 约赤道处距离 第一级 6X4度 60 和A~V 660 km 第二级 30X30分 12X8 …...

网络流算法:最大流问题
引言 最大流问题是网络流中的一个经典问题,其目标是在给定的流网络中找到从源点到汇点的最大流量。最大流问题在交通运输、计算机网络、供应链管理等领域有广泛的应用。本文将详细介绍最大流问题的定义、解决方法以及具体算法实现。 目录 最大流问题的定义Ford-F…...

C++从入门到入土(四)--日期类的实现
目录 前言 日期类的实现 日期的获取 日期的比较 const成员函数 日期的加减 日期的加等 日期的减等 日期的加减 日期的加加减减 日期的相减 流插入和提取的重载 友元 友元的特点 日期类代码 总结 前言 前面我们介绍了C中类和对象的相关知识和六个默认成员函数&…...

【香橙派系列教程】(七)香橙派下的Python3安装
【七】香橙派下的Python3安装 为接下来的Linux图像识别智能垃圾桶做准备。 图像处理使用京东SDK只支持pyhton和Java接口,目的是引入C语言的Python调用,感受大厂做的算法bug 此接口是人工智能接口,京东识别模型是通过训练后的模型,…...

贝叶斯优化算法(Bo)与门控循环单元(GRU)结合的预测模型(Bo-GRU)及其Python和MATLAB实现
### 背景 随着时间序列数据在各个领域(如金融、气象、医疗等)应用的日益广泛,如何准确地预测未来的数据点成为了一个重要的研究方向。长短期记忆网络(LSTM)和门控循环单元(GRU)作为深度学习模型…...

人工智能时代,程序员当如何保持核心竞争力?
目录 前言 一.AI辅助编程对程序员工作的影响 二.程序员应重点发展的核心能力 三.人机协作模式下的职业发展规划 结束语 前言 随着AIGC(如chatgpt、midjourney、claude等)大语言模型接二连三的涌现,AI辅助编程工具日益普及,程序…...

LMDrive 端到端闭环自动驾驶框架
LMDrive,一种新颖的语言引导的端到端闭环自动驾驶框架。LMDrive独特地处理和整合多模态传感器数据与自然语言指令,使车辆能够在现实的指令设置中与人类和导航软件进行交互。 LMDrive由两个主要部分组成: 1)一个视觉编码器&#x…...

P2045 方格取数加强版
Description 给定一个 n n n \times n nn 的矩阵,从左上角出发,可以往右或者往下走,每到达一个方格,就取走上面的数(取过后格子上的数会清零),一共要走 k k k 次,求取到的数之和…...