【文献阅读】GraphAny: A Foundation Model for Node Classification on Any Graph
Abstract
可以执行任何新任务而无需特定训练的基础模型已经在视觉和语言应用中引发了机器学习的革命。然而,涉及图结构数据的应用仍然是基础模型面临的一个难题,因为每个图都有独特的特征和标签空间。传统的图机器学习模型,如图神经网络(GNNs),在训练时只能处理特定的图,不能对特征和标签空间不同的新图进行推断。此外,现有模型学习的是针对训练图的特定函数,无法泛化到新图中。
在这项工作中,我们通过一种新的基础架构——GraphAny,解决了这两个挑战。
GraphAny 将对新图的推断建模为线性图神经网络(LinearGNN)的分析解决方案,从而解决了第一个挑战。
为了应对第二个挑战,我们为每个节点学习注意力分数,以融合多个 LinearGNN 的预测结果。具体而言,注意力模块被精心参数化为多个 LinearGNN 预测之间的熵归一化距离特征的函数,以确保对新图的泛化。
实证研究表明,GraphAny 在仅使用 120 个标记节点的威斯康星数据集上训练,能够以 67.26% 的平均准确率有效地对 30 个新图进行归纳泛化,超越了在监督模式下训练的 GCN 和 GAT 以及其他归纳基线。
Introduction
基础模型 [1, 39, 40] 在海量数据上预训练,凭借仅需少量示例即可解决任何新任务的能力,已经彻底改变了人工智能的格局 [8, 3]。到目前为止,这种能力主要限于文本或图像等模态。这些模态的一个固有特性是存在一个跨所有任务的共享输入空间(例如,令牌的词汇表或像素块),为学习一个基础模型覆盖广泛任务类别并泛化到新任务提供了自然基础。然而,图数据不具备这种特性。以节点分类任务为例,每个图可能具有其特征和标签空间的独特维度和语义(例如,连续或离散),这阻碍了我们以与上述模态相同的方式开发图基础模型 [26]。
挑战:(1)现有模型学习特定于训练中使用的特征和标签的维度、类型和结构的变换,不能对与训练不同的特征和标签空间进行推断。这需要我们为任意特征和标签空间开发一种新的模型架构。(2)现有模型学习的是针对训练图的特定函数,无法泛化到新图中;这要求一个能够在训练后对任何图进行泛化的归纳函数。
GraphAny,一种新颖的预训练基础模型架构,能够在任何新图上解决节点分类问题。GraphAny 由两个组件组成:一个 LinearGNN 在没有训练步骤的情况下对新特征和标签空间进行推断,以及一个基于熵归一化距离特征的每个节点的注意力向量,确保对新图的泛化。
具体而言, LinearGNN 将节点特征和标签之间的映射建模为非参数化的图卷积,随后是线性层,其参数在封闭形式中确定,无需明确的训练步骤。虽然单个 LinearGNN 模型可能远未达到许多图的最佳效果,但使用多个具有不同图卷积算子的 LinearGNN 模型,并学习一个注意力向量来融合它们的预测结果。
注意力向量被参数化为 LinearGNN 预测之间距离特征的函数,这保证了模型对特征和标签维度的排列不变。为了进一步提高模型的泛化能力,我们提出了熵归一化,将距离特征分布调整为固定熵,从而减少不同标签维度对距离特征的影响。
直观地说,注意力向量学习根据其预测分布选择每个节点的最有效的 LinearGNN 组合,反映其局部结构的统计特性(例如,同质性度量 [25]),并对新图进行泛化。
Contribution:
- 提出了 LinearGNN,这是一种高效的架构,适用于在任何具有任意特征和标签空间的图上进行归纳节点分类。
- 设计了一个归纳注意力模块,用于使用距离特征和熵归一化融合 LinearGNN,这对特征和标签排列不变,对维度变化具有鲁棒性。
- 结合LinearGNN 和归纳注意力模块,GraphAny 在单一数据集上训练后可以对任何图进行泛化,实现了第一个图基础模型用于节点分类。
GraphAny: A Foundation Model for Node Classification
GraphAny包括一个LinearGNN和一个注意力模块。LinearGNN提供了在具有任意特征和标签空间的新图上进行归纳推理的基本解决方案,而注意力模块则学习基于归纳特征组合多个LinearGNN,以实现对新图的泛化。
LinearGNNs for Inductive Inference on Any Graph

Learning Inductive Attention over LinearGNNs


相关文章:
【文献阅读】GraphAny: A Foundation Model for Node Classification on Any Graph
Abstract 可以执行任何新任务而无需特定训练的基础模型已经在视觉和语言应用中引发了机器学习的革命。然而,涉及图结构数据的应用仍然是基础模型面临的一个难题,因为每个图都有独特的特征和标签空间。传统的图机器学习模型,如图神经网络&…...
动态规划.
目录 (一)递归到动规的一般转化方法 (二)动规解题的一般思路 1. 将原问题分解为子问题 2. 确定状态 3. 确定一些初始状态(边界状态)的值 4. 确定状态转移方程 (三)能用动规解…...
PHP常用函数
字符串 strlen()获取字符串长度strpos()在字符串内查找一个字符或一段指定的文本,返回第一次出现的位置或falsestripos()同上,但不区分大小写strrpos()同上上,返回最后一…...
完全用python 实现消息中间件4
为了进一步完善这个消息中间件,我们可以添加以下功能: 消息确认:客户端可以发送一个确认消息,表明消息已经被正确接收。消息队列:使用一个队列来存储消息,而不是直接存储在字典中。多消费者支持࿱…...
公司新来的两个Java后端,因题背太熟轻松过面试?
以前面试是背八股文,而2024年的后端面试都是流行问场景题!建议大家把面试想简单一点,顺的场景题直接给有需要的人,希望能对大家有所帮助! 由于平台篇幅原因,很多java面试资料内容展示不了,需要…...
Pinia状态管理库
为了跨组件传递JWT令牌,我们就会利用Pinia状态管理库,它允许跨组件或页面共享状态。 使用Pinia步骤: 安装pinia:cnpm install pinia 在vue应用实例中使用pinia 在src/stores/token.js中定义store 在组件中使用store 1.在main.js文…...
利用ffmpeg转码视频为gif图片,调整gif图片的大小
【1】压缩gif图片大小 一般发布技术文章的时候经常要插入GIF图演示软件效果,但是一些编辑器总是限制大小,但是录制的时候可能一不小心就搞大了。 要将 GIF 图片大小限制在 10MB 内,可以使用 FFmpeg 进行压缩。 以下是一个ffmpeg的命令&…...
【Java 第四篇章】流程控制、容器
一、流程控制 1、概念 //1.if//2.if...else//3.if...else if...else...//4.switch//5.跳出循环体:break和continue2、语法 //1. ifif(条件表达式){//执行代码块}//2.if...elseif(条件表达式){//条件表达式为真执行的代码块} else {//条件表达式为假执行的代码块}//…...
华为云全域Serverless技术创新:全球首创通用Serverless平台被ACM SIGCOMM录用
华为开发者大会2024(HDC 2024)在东莞松山湖圆满结束,期间华为云主办的“全域Serverless时代:技术创新引领,赋能行业实践”专题论坛,向广大开发者传递了Serverless领域的前沿思考和实践,现场座无…...
除自身以外数组的相乘 C++
给你一个整数数组 nums,返回 数组 answer ,其中 answer[i] 等于 nums 中除 nums[i] 之外其余各元素的乘积 。 题目数据 保证 数组 nums之中任意元素的全部前缀元素和后缀的乘积都在 32 位 整数范围内。 请 不要使用除法,且在 O(n) 时间复杂…...
Element UI 如何配置文件来设置全局的语言选项。
Element UI 允许你通过配置文件来设置全局的语言选项,这样你可以方便地切换组件的语言。以下是如何配置 Element UI 以设置全局语言选项的步骤: 1. 安装 Element UI 确保你已经安装了 Element UI。 npm install element-ui --save2. 引入语言包 Elem…...
Windows 常用命令集锦
目录 一、文件和目录管理 1.1 文件操作 1.2 目录操作 二、系统信息 2.1 基本系统信息 2.2 硬件信息 三、网络管理 3.1 基本网络命令 3.2 网络诊断 四、进程管理 4.1 查看进程 4.2 管理进程 五、磁盘管理 5.1 磁盘操作 5.2 磁盘分区 六、IIS操作 通过上述命令&am…...
第一阶段面试问题(后半部分)
1. c语言中const *p的用法 (1)const int *p; 或 int const *p; 指向常量整数的指针,通过这个指针不能修改它所指向的整数值,但可以修改指针本身来指向其他地址 const int a 10; const int *p &a; // *p 20; // 错误&…...
【AIGC】ComfyUI入门-使用ComfyUI_MagicClothing插件在生成图片时候出现的问题
最近想自己实现自动换装的工作流,在使用ComfyUI_MagicClothing插件的时候,出现了一个奇怪的问题。这个问题不是插件的问题,是环境配置问题。 问题内容如下: Exception during processing!!! D:\a_work\1\s\onnxruntime\python\onnxruntime_pybind_state.cc:891 onnxrunti…...
巴黎奥运会8K转播科技为国产品牌自主研发设计
这个夏天,顶流是属于巴黎奥运会中国队的。 20枚金牌、15枚银牌、12枚铜牌......这个数字正随着赛事推进而不停在增加。赛场之上,中国健儿奋力拼搏、捷报频传,令人热血沸腾;赛场之外,另一支来自中国企业的“奥运选手”…...
【Material-UI】Button 组件中的图标和标签按钮(Buttons with Icons and Label)详解
文章目录 一、基础用法1. 左侧图标(startIcon)2. 右侧图标(endIcon) 二、图标与标签的搭配三、高级用法和最佳实践1. 自定义图标2. 视觉一致性3. 动态图标 四、总结 在现代用户界面设计中,图标在提高用户体验ÿ…...
K个一组翻转链表(LeetCode)
题目 给你链表的头节点 ,每 个节点一组进行翻转,请你返回修改后的链表。 是一个正整数,它的值小于或等于链表的长度。如果节点总数不是 的整数倍,那么请将最后剩余的节点保持原有顺序。 你不能只是单纯的改变节点内部的值&…...
2-56 基于matlab的图像融合增强技术
基于matlab的图像融合增强技术。通过原始图像——傅里叶变换——频率域滤波处理——傅里叶变换——增强后的图像。傅立叶变换以及傅立叶反变换.过程就是将空间的信息分解为在频率上的表示,通过傅立叶正反变换的处理,才使得频率域上的处理可以用于图像的增强。程序已调通&#x…...
序列化定义以及使用和注意事项
什么是序列化和反序列化 序列化:是将对象转换为可传输或存储的过程, 反序列化:通常是将字节流或是其他数据格式或源数据转为对象的过程。 序列化的作用 对象的持久化:将对象的状态保存到磁盘或数据库中,以便在程序…...
吴恩达机器学习COURSE1 WEEK3
COURSE1 WEEK3 逻辑回归 逻辑回归主要用于分类任务 只有两种输出结果的分类任务叫做二元分类,例如预测垃圾邮件,只能回答是或否 实际上,在逻辑回归中,我们要做的任务就类似于在数据集中画出一个这样的曲线,用来作为…...
深入浅出Asp.Net Core MVC应用开发系列-AspNetCore中的日志记录
ASP.NET Core 是一个跨平台的开源框架,用于在 Windows、macOS 或 Linux 上生成基于云的新式 Web 应用。 ASP.NET Core 中的日志记录 .NET 通过 ILogger API 支持高性能结构化日志记录,以帮助监视应用程序行为和诊断问题。 可以通过配置不同的记录提供程…...
2025年能源电力系统与流体力学国际会议 (EPSFD 2025)
2025年能源电力系统与流体力学国际会议(EPSFD 2025)将于本年度在美丽的杭州盛大召开。作为全球能源、电力系统以及流体力学领域的顶级盛会,EPSFD 2025旨在为来自世界各地的科学家、工程师和研究人员提供一个展示最新研究成果、分享实践经验及…...
渗透实战PortSwigger靶场-XSS Lab 14:大多数标签和属性被阻止
<script>标签被拦截 我们需要把全部可用的 tag 和 event 进行暴力破解 XSS cheat sheet: https://portswigger.net/web-security/cross-site-scripting/cheat-sheet 通过爆破发现body可以用 再把全部 events 放进去爆破 这些 event 全部可用 <body onres…...
大语言模型如何处理长文本?常用文本分割技术详解
为什么需要文本分割? 引言:为什么需要文本分割?一、基础文本分割方法1. 按段落分割(Paragraph Splitting)2. 按句子分割(Sentence Splitting)二、高级文本分割策略3. 重叠分割(Sliding Window)4. 递归分割(Recursive Splitting)三、生产级工具推荐5. 使用LangChain的…...
高等数学(下)题型笔记(八)空间解析几何与向量代数
目录 0 前言 1 向量的点乘 1.1 基本公式 1.2 例题 2 向量的叉乘 2.1 基础知识 2.2 例题 3 空间平面方程 3.1 基础知识 3.2 例题 4 空间直线方程 4.1 基础知识 4.2 例题 5 旋转曲面及其方程 5.1 基础知识 5.2 例题 6 空间曲面的法线与切平面 6.1 基础知识 6.2…...
3403. 从盒子中找出字典序最大的字符串 I
3403. 从盒子中找出字典序最大的字符串 I 题目链接:3403. 从盒子中找出字典序最大的字符串 I 代码如下: class Solution { public:string answerString(string word, int numFriends) {if (numFriends 1) {return word;}string res;for (int i 0;i &…...
优选算法第十二讲:队列 + 宽搜 优先级队列
优选算法第十二讲:队列 宽搜 && 优先级队列 1.N叉树的层序遍历2.二叉树的锯齿型层序遍历3.二叉树最大宽度4.在每个树行中找最大值5.优先级队列 -- 最后一块石头的重量6.数据流中的第K大元素7.前K个高频单词8.数据流的中位数 1.N叉树的层序遍历 2.二叉树的锯…...
基于Java+MySQL实现(GUI)客户管理系统
客户资料管理系统的设计与实现 第一章 需求分析 1.1 需求总体介绍 本项目为了方便维护客户信息为了方便维护客户信息,对客户进行统一管理,可以把所有客户信息录入系统,进行维护和统计功能。可通过文件的方式保存相关录入数据,对…...
push [特殊字符] present
push 🆚 present 前言present和dismiss特点代码演示 push和pop特点代码演示 前言 在 iOS 开发中,push 和 present 是两种不同的视图控制器切换方式,它们有着显著的区别。 present和dismiss 特点 在当前控制器上方新建视图层级需要手动调用…...
从“安全密码”到测试体系:Gitee Test 赋能关键领域软件质量保障
关键领域软件测试的"安全密码":Gitee Test如何破解行业痛点 在数字化浪潮席卷全球的今天,软件系统已成为国家关键领域的"神经中枢"。从国防军工到能源电力,从金融交易到交通管控,这些关乎国计民生的关键领域…...
