当前位置：首页 > news >正文

《图机器学习》-GNN Augmentation and Training

news 2026/2/10 7:59:51

GNN Augmentation and Training

一、Graph Augmentation for GNNs
- 1、Feature Augmentation
- 2、Structure augmentation
- 3、Node Neighborhood Sampling

一、Graph Augmentation for GNNs

之前的假设：
Raw input graph = computational graph，即原始图等于计算图。

现在要打破这个假设，原因如下：

如果图过于稀疏：消息传递效率低下
如果图过于密集了：消息传递的开销太大
- 如要点击查看某个名人的embedding，要汇聚其成千上万个追随者的信息，这个花销是很大的
如果图很大：难以将计算图拟合到CPU内存中

所以，原始输入图不太可能恰好是嵌入的最佳计算图。因此需要Graph Augmentation，改变解构使之适于嵌入。

1、Feature Augmentation

为什么我们需要特征增强?
(1)、输入图没有节点特征；如只有邻接矩阵的时候。

解决方案：

为节点分配常量值
如为每个节点都分配一个常数1，在一轮汇聚后，各节点就能学习到其邻居节点的个数。
为节点分配唯一的IDs
如为每个节点都分配one-hot编码

该方法每个node的向量不一样，增加了模型的表达能力，但是花费的代价非常大，如one-hot编码的维度和节点数量一致

两种方式的对比：

	Constant node feature	One-hot node feature
表达能力	中等。所有的节点都是相同的，但GNN仍然可以从图结构中学习	高。每个节点都有唯一的ID，因此可以存储特定于节点的信息
归纳学习(推广到新的节点)	高。推广到新节点很简单:我们为它们分配恒定的特征，然后应用我们的GNN	低。不能泛化到新节点:新节点引入新ID, GNN不知道如何嵌入看不见的ID
计算成本	低。只有一维特征	高。O(\|V\|)维度特征，不能应用于大型图
使用范围	任何图	小图

为什么我们需要特征增强?
(2)、GNN很难学习某些结构

如：计算节点所处环的节点数
在这里插入图片描述

基于前面的GNN是不能够解答这个问题的，原因是这两个节点的计算图是一样的，学习出来的embedding大致类似

在这里插入图片描述
解决方案：
可以添加cycle count作为节点的特征，如下图；即开辟一个特征空间用于描述所需要的属性。

其他常用于数据增强的特征：

Node degree
Clustering coefficient
PageRank
Centrality

2、Structure augmentation

出发点： Augment sparse graphs(增强稀疏图)

Add virtual edges
- 常见的方法：通过虚边连接2跳邻居
- 如：将邻接矩阵 $A$ 使用 $A+A^2$ 代替
- 实例：Bipartite graphs。
  使用2-hop的虚边将作者节点连接起来
Add virtual nodes
增加一个虚拟节点，虚拟节点将于图中的所有节点相连接
- 好处：
  1. 缩短节点之间的距离(均可两跳可达)
  2. 传递信息更多、更有效、更快

3、Node Neighborhood Sampling

回顾之前的GNN计算图，所有节点都用于消息传递，如下图：

在这里插入图片描述

新的想法：
随机的选取邻居节点的子集用于计算图的构建(用于信息传递)

例如，可以在给定的层中随机选择2个邻居来传递消息，如下图：

在这里插入图片描述

在大图中，随机采样邻居节点的子集用于信息传递能够减少计算图；但会丢失信息，即获得了效率但失去了一些表现力。

为了弥补，可以在下一层中，当我们计算嵌入时，对不同的邻居进行采样(即每一层都采样不同的邻居用于计算图的构建)，提升模型的鲁棒性。

在这里插入图片描述

该方法在实践中效果不错。

《图机器学习》-GNN Augmentation and Training

GNN Augmentation and Training一、Graph Augmentation for GNNs1、Feature Augmentation2、Structure augmentation3、Node Neighborhood Sampling一、Graph Augmentation for GNNs 之前的假设： Raw input graph computational graph，即原始图等于计算…...

编程日记 2023/3/1 16:02:03

【Node.js算法题】数组去重、数组删除元素、数组排序、字符串排序、字符串反向、字符串改大写、数组改大写、字符替换

文章目录前言数组去重数组删除元素数组排序字符串排序字符串反向字符串改大写数组改大写字符替换字符替换运行结果： ![在这里插入图片描述](https://img-blog.csdnimg.cn/8ac1c15e6f0944cdb8ca50bcb844182a.png)总结前言本期文章是js的一些算法题，包括…...

编程日记 2023/3/1 16:00:58

Win10系统开始菜单无法点击解决方法分享

Win10系统开始菜单无法点击解决方法分享。有用户电脑一开机之后，就出现了开始菜单无法正常点击的情况。我们很多设置项都是通过开始菜单来进行开启的。那么这个功能无法点击了怎么办呢？接下来我们一起来看看以下的解决方法分享吧。方法一： 1…...

编程日记 2023/3/1 15:59:51

libmodbus从linux访问window上的服务超时问题

window：使用EasyModbusTCP Server Simulator 作为服务。linux:程序：#include <stdio.h> #include <modbus/modbus.h>int main() {modbus_t *ctx;uint16_t holding_registers[1];// Create a new Modbus TCP contextctx modbus_new_tcp(&quo…...

编程日记 2023/3/1 15:58:45

挑战图像处理100问（26）——双线性插值

双线性插值是一种常用的图像插值方法，用于将低分辨率的图像放大到高分辨率。它基于一个假设：在两个相邻像素之间的值是线性的。双线性插值考察444邻域的像素点，并根据距离设置权值。虽然计算量增大使得处理时间变长，但是可以有效…...

编程日记 2023/3/1 15:57:36

NXP iMX8系列处理器Pin Multiplexing定义说明

By Toradex秦海1). 简介为了提高处理器的设计灵活性和可用性，NXP的所有i.MX系列处理器都配备了基于 IOMUX Controller (IOMUXC)和IOMUX来使能Pin Mux功能，使得一个特定的IO管脚可以选择不同的可能多达8种的功能定义模块(ALT0, ALT1, ALT2, ALT3...)&…...

编程日记 2023/3/1 15:56:28

用Python的Supervisor進行進程監控以及自動啓動

python 限制同一时间只执行一个作服務器端開發的同窗應該都對進程監控不會陌生，最近剛好要更換 uwsgi 爲 gunicorn，而gunicorn又剛好有這麼一章講進程監控，因此多研究了下。python 結合以前在騰訊工做的經驗，也會講講騰訊的服務…...

编程日记 2023/3/1 15:55:22

Centos和Window系统下Frp内网穿透

frp 是一个高性能的内网穿透的反向代理软件，支持 TCP、UDP、HTTP、HTTPS 等常见协议(TCP最常用)，可以将处于局域网或者家用电脑主机、办公电脑主机通过中转服务器的方式暴露在公网里，使用户可以通过访问公网的IP（域名）…...

编程日记 2023/3/1 15:54:12

春招冲刺（四）：flex布局面试题总结

flex布局面试题总结 Q1：什么是弹性盒布局？ 特点：让元素对不同屏幕尺寸和不同显示设备做好适应。在响应式网站表现较好。一、容器属性 Q2：display:flex和display:inline-flex的作用使容器变成弹性布局，为其子元素…...

编程日记 2023/3/1 15:53:04

我的 System Verilog 学习记录（7）

引言本文简单介绍 SystemVerilog 语言的 testbench 组件间通信和数据交互。前文链接： 我的 System Verilog 学习记录（1） 我的 System Verilog 学习记录（2） 我的 System Verilog 学习记录（3&#xff…...

编程日记 2023/3/1 15:51:57

canvas复习笔记（绘制直线、矩形、圆形、圆弧）

canvas 画一条直线 <body><canvasid"c"width"300"height"200"style"border: 1px solid #ccc;"></canvas> </body><script>// 2、获取 canvas 对象const cnv document.getElementById("c");…...

编程日记 2023/3/1 15:50:47

LeetCode 653. 两数之和 IV - 输入二叉搜索树

653. 两数之和 IV - 输入二叉搜索树难度：easy\color{Green}{easy}easy 题目描述给定一个二叉搜索树 rootrootroot 和一个目标结果 kkk，如果二叉搜索树中存在两个元素且它们的和等于给定的目标结果，则返回 truetruetrue。示例 1&#xf…...

编程日记 2023/3/1 15:49:38

【Datawhale图机器学习】图神经网络

图神经网络 GNN是一种连接模型，通过网络中节点之间的信息传递的方式来获取图中的依存关系，GNN通过从节点任意深度的邻居来更新该节点状态，这个状态能够表示状态信息。第一次在论文 The graph neural network model 中提出与传统NN的区别&a…...

编程日记 2023/3/1 15:48:32

【项目精选】 javaEE采购管理系统（论文+视频+源码）

点击下载源码本系统是一个独立的系统，用来解决企业采购信息的管理问题。采用JSP技术构建了一个有效而且实用的企业采购信息管理平台，目的是为高效地完成对企业采购信息的管理。经过对课题的深入分析，采购系统需实现以下功能模块&#xff1…...

编程日记 2023/3/1 15:47:26

【Servlet篇2】创建一个web项目

在上一篇文章当中，已经提到了什么是Maven，以及如何使用maven从中央仓库下载jar包。【Tomcat与Servlet篇1】认识Tomcat与Maven_革凡成圣211的博客-CSDN博客Tomcat，mavenhttps://blog.csdn.net/weixin_56738054/article/details/129228140?spm…...

编程日记 2023/3/1 15:46:16

Allegro如何手动让静态铜皮避让过孔操作指导

Allegro如何手动让静态铜皮避让过孔操作指导在用Allegro做PCB设计的时候，如果铺的是静态铜皮，铜皮铺在过孔上会造成短路，需要手动避让下，如下图下面介绍如何手动避让，具体操作如下点击Shape点击Manual Void/Cavity...

编程日记 2023/3/1 15:45:11

Java使用SpringBoot的Filter来扩展管道请求

Java Spring Boot 是一个流行的 Java Web 开发框架，它提供了一些基本的 Web 管道功能。在 Spring Boot 中，Web 管道是通过一组过滤器、拦截器、控制器和视图解析器等组件组成的。如果你需要扩展 Spring Boot Web 管道，可以考虑以下几种方式…...

编程日记 2023/3/1 15:44:05

「JVM 高效并发」锁优化

为了线程间更高效的共享数据及解决竞争问题，提高程序执行效率，JDK 6 做了大量锁优化，如适应性自旋（Adaptive Spinning）、锁消除（Lock Elimination）、锁膨胀（Lock Coarsening&#xf…...

编程日记 2023/3/1 15:42:59

当园区物流遇上云计算，会发生什么事情？

顺丰供应链与亚马逊云科技的强强联手，可以给物流供应链企业带来怎样的启示？物流行业的数智化趋势在国内物流行业说起顺丰，相信是无人不知无人不晓。作为数字化供应链服务解决方案提供商，顺丰供应链可以提供端到端供应链的规划、管…...

编程日记 2023/3/1 15:40:50

作为测试开发岗的面试官，我都是怎么选人的？

最近一段时间面试了不少人，主要是一些测试开发岗，中高级的初级的也都有；也有一些偏业务测试岗的候选人。总结出了一些方法论，或者说更多的是个人作为面试官所遵守的一套面试准则。 1.什么是面试？ 面试不仅仅是你问我…...

编程日记 2023/3/1 15:39:41

MPNet：旋转机械轻量化故障诊断模型详解python代码复现

目录一、问题背景与挑战二、MPNet核心架构 2.1 多分支特征融合模块（MBFM） 2.2 残差注意力金字塔模块（RAPM） 2.2.1 空间金字塔注意力（SPA） 2.2.2 金字塔残差块（PRBlock） 2.3 分类器设计三、关键技术突破 3.1 多尺度特征融合 3.2 轻量化设计策略 3.3 抗噪声…...

编程新知 2026/2/7 5:16:28

spring：实例工厂方法获取bean

spring处理使用静态工厂方法获取bean实例，也可以通过实例工厂方法获取bean实例。实例工厂方法步骤如下： 定义实例工厂类（Java代码），定义实例工厂（xml），定义调用实例工厂&#xff…...

编程新知 2025/11/25 22:46:30

C++中string流知识详解和示例

一、概览与类体系 C 提供三种基于内存字符串的流，定义在 <sstream> 中： std::istringstream：输入流，从已有字符串中读取并解析。std::ostringstream：输出流，向内部缓冲区写入内容，最终取…...

编程新知 2025/11/30 11:30:47

c#开发AI模型对话

AI模型前面已经介绍了一般AI模型本地部署，直接调用现成的模型数据。这里主要讲述讲接口集成到我们自己的程序中使用方式。微软提供了ML.NET来开发和使用AI模型，但是目前国内可能使用不多，至少实践例子很少看见。开发训练模型就不介绍了&am…...

编程新知 2026/2/1 8:59:45

css3笔记（1）自用

outline: none 用于移除元素获得焦点时默认的轮廓线 broder:0 用于移除边框 font-size：0 用于设置字体不显示 list-style: none 消除<li> 标签默认样式 margin: xx auto 版心居中 width:100% 通栏 vertical-align 作用于行内元素 / 表格单元格&#xff…...

编程新知 2025/10/11 5:18:43

.Net Framework 4/C# 关键字（非常用，持续更新...）

一、is 关键字 is 关键字用于检查对象是否于给定类型兼容，如果兼容将返回 true，如果不兼容则返回 false，在进行类型转换前，可以先使用 is 关键字判断对象是否与指定类型兼容，如果兼容才进行转换，这样的转换是安全的。例如有：首先创建一个字符串对象，然后将字符串对象隐…...

编程新知 2025/9/25 18:41:38

Device Mapper 机制

Device Mapper 机制详解 Device Mapper（简称 DM）是 Linux 内核中的一套通用块设备映射框架，为 LVM、加密磁盘、RAID 等提供底层支持。本文将详细介绍 Device Mapper 的原理、实现、内核配置、常用工具、操作测试流程，并配以详细的…...

编程新知 2025/12/14 13:11:33

Linux --进程控制

本文从以下五个方面来初步认识进程控制： 目录进程创建进程终止进程等待进程替换模拟实现一个微型shell 进程创建在Linux系统中我们可以在一个进程使用系统调用fork()来创建子进程，创建出来的进程就是子进程，原来的进程为父进程。…...

编程新知 2026/1/30 15:27:25

Java编程之桥接模式

定义桥接模式（Bridge Pattern）属于结构型设计模式，它的核心意图是将抽象部分与实现部分分离，使它们可以独立地变化。这种模式通过组合关系来替代继承关系，从而降低了抽象和实现这两个可变维度之间的耦合度。用例子…...

编程新知 2026/1/23 10:28:48

mac：大模型系列测试

0 MAC 前几天经过学生优惠以及国补17K入手了mac studio,然后这两天亲自测试其模型行运用能力如何，是否支持微调、推理速度等能力。下面进入正文。 1 mac 与 unsloth 按照下面的进行安装以及测试，是可以跑通文章里面的代码。训练速度也是很快的。注意…...

编程新知 2026/2/4 0:46:21

GNN Augmentation and Training

一、Graph Augmentation for GNNs

1、Feature Augmentation

2、Structure augmentation

3、Node Neighborhood Sampling

相关文章：