当前位置：首页 > news >正文

LD2 Scalable Heterophilous Graph Neural Network with Decoupled Embeddings

news 2026/5/17 10:28:28

Neurips 24
推荐指数： #paper/⭐⭐⭐
领域：可扩展图，大图加速
整个文章的理论部分比较多，尽量尽我所能避开一些额外公式。详细文章，见链接

模型架构

文章配图
如图，整个模型分为与计算和训练两部分。本文的精华在于预训练

LD2–一个解耦的异配图gnn

为了更好的加速，我们使用了多通道结果去增加灵活性。输入的数据是一系列的嵌入矩阵 $[P_{1},P_{2},\dots ,P_{C}]$
预计算
$\boldsymbol{P}_A,\boldsymbol{P}_X=\mathrm{A}^2\mathrm{Prop}(\boldsymbol{A},\boldsymbol{X})$
转换得嵌入
$\boldsymbol{H}^{(L)}=\mathrm{MLP}(\boldsymbol{P}_A\boldsymbol{W}_A\|\boldsymbol{P}_X\boldsymbol{W}_X).$

低纬邻接矩阵嵌入

由于二阶邻居信息很少受到同配异配信息的影响，因此我们对二跳邻接矩阵进行建模
$\boldsymbol{P}_A=\arg\min_{\boldsymbol{P}\in\mathbb{R}^{n\times F}}\|\boldsymbol{A}^2-\boldsymbol{P}\boldsymbol{P}^T\|_F^2.$
通过优化F范数，我们可以得到 $P_{A} \in \mathbb{R}^{n \times F}$ .
(谱分析视角见论文原文)

长距离特征嵌入

用 $P_X=\sum_{l=1}^{L_P}\theta_l\boldsymbol{T}^l\boldsymbol{X}$ 来计算特征，可能不太好(因为数据有高通低通中通)。按照低通高通中通，我们分别定义为 $P_{X,L2},P_{H},P_{X,0}$ 。
那么，
$\boldsymbol{P}_{X,H}=\frac1{L_{P,H}}\sum_{l=1}^{L_{P,H}}(\boldsymbol{I}+\tilde{\boldsymbol{L}})^l\boldsymbol{X}, (\theta_l=1, \boldsymbol{T}=\boldsymbol{I}+\tilde{\boldsymbol{L}})$
$\boldsymbol{P}_{X,L2}=\frac1{L_{\boldsymbol{P},\boldsymbol{L}2}}\sum_{l=1}^{L_{P,L2}}\bar{\boldsymbol{A}}^{2l}\boldsymbol{X}, (\theta_{l}=1,\boldsymbol{T}=\bar{\boldsymbol{A}}^{2})$
$\boldsymbol{P}_{X,0}=\boldsymbol{X}$
其中， $\tilde{L}=I-\tilde{A},\overline{A}$ 是没有自环的邻接矩阵。
(谱分析视角见原文)
拉普拉斯矩阵显然是高通过滤器，A是低通过滤器。这样，我们就可以构造高阶或者低阶如上长距离特征嵌入

近似邻接矩阵传播预计算

文章配图

近似特征嵌入计算

$\boldsymbol{P}_X=\sum_{l=0}^{L_P}\theta_l\boldsymbol{T}^l\boldsymbol{X}$
首先，初始值是： $\boldsymbol{R}^{(0)}=\boldsymbol{X}.$ 传播矩阵是T。拉普拉斯传播T=I+L.嵌入可以表示为迭代形式：
$\boldsymbol{R}^{(l+1)}(u)=2\boldsymbol{R}^{(l)}(u)-\sum_{v\in\mathcal{N}(u)}\boldsymbol{R}^{(l)}(v)/d^a(u)d^b(v)=\sum_{v\in\mathcal{N}(u)\cup\{u\}}\frac{\alpha_L(u,v)}{d^a(u)d^b(v)}\cdot\boldsymbol{R}^{(l)}(v)$
$\alpha_T(u,v)$ 对于T， $\begin{aligned}\alpha_L(u,u)=2d^{\boldsymbol{a+b}}(u),\alpha_L(u,v)=-1,v\in\mathcal{N}(u)\end{aligned}$ 。对于 $\tilde{A},\bar{A}$ ,分别是 $\alpha_{A}(u,v)=1\text{ and }\alpha_{A}(u,u)=1,0$

近似邻接矩阵嵌入的计算

$\boldsymbol{R}^{(0)}=N(0,1)$
$\boldsymbol{A}^2\mathrm{~as~}\boldsymbol{R}^{(l+1)}=\boldsymbol{A}^2\boldsymbol{R}^{(l)}$
之后，执行column-wise normalization
$\texttt{orthonormalize}(\boldsymbol{R}^{(l+1)})$
这样，矩阵就满足：
$\boldsymbol{A}^2\boldsymbol{R}^{(L_P)}=\boldsymbol{R}^{(L_P)}\boldsymbol{\Lambda}$
最后，结果是：
$\hat{\boldsymbol{U}}=\boldsymbol{R}^{(L_P)},\hat{\boldsymbol{P}}_A=\hat{\boldsymbol{U}}|\hat{\boldsymbol{\Lambda}}|^{1/2}$

实验结果：

文章配图
时间开销：

LD2 Scalable Heterophilous Graph Neural Network with Decoupled Embeddings

模型架构

LD2–一个解耦的异配图gnn

低纬邻接矩阵嵌入

长距离特征嵌入

近似邻接矩阵传播预计算

近似特征嵌入计算

近似邻接矩阵嵌入的计算

实验结果：

相关文章：

LD2 Scalable Heterophilous Graph Neural Network with Decoupled Embeddings

【Mysql】Mysql数据库基本操作-------DDL（上）

MySQL知识点复习 - 常用的日志类型

基于PHP+MySQL组合开发地方门户分类信息网站源码系统带完整的安装代码包以及搭建部署教程

【1米C-SAR卫星】

【小小的脑袋，大大的疑问？】如何在Zookeeper中配置集群?

Metasploit渗透测试之服务端漏洞利用

什么是原生IP？

【C++】unordered_map（set）

HTML 盒模型

node.js npm 安装和安装create-next-app -windowsserver12

Android13 展锐平台拨号中视频彩铃界面方向未与设备方向一致

为什么IP首部的源IP地址和目的IP地址不变而MAC层的源MAC地址和目的MAC地址变

Django 数据库配置以及字段设置详解

C++ 左值右值引用梳理

向量化技术在机器学习领域的深度实践与探索

RuoYi若依框架学习：多环境配置

Linux-RedHat7.4-服务器搭建FTP

遍历递归数结构,修改里的disabled值

怎么通过AI大模型开发一个网站？

智能路由器项目解析：基于策略路由实现多线路流量智能调度

Netgear路由器终极救援指南：用nmrpflash免费快速修复变砖设备

低温预警！固化慢、易开裂……密封胶冬季施工手册

并行LLM推理技术：Hogwild! Inference原理与应用

MySQL 视图使用场景与限制

Arm Morello平台模型与CHERI安全扩展开发指南

三维重建下半场，拼的全是底层基建实力！

会话管理封装实践：构建安全可扩展的分布式会话系统

LoRA模型合并实战指南：多技能融合与vLLM部署

GoLang简便模板缓存实现