GRN前沿:DGCGRN:基于有向图卷积网络的基因调控网络推理
1.论文原名:Inference of gene regulatory networks based on directed graph convolutional networks
2.发表日期:2024
DGCGRN框架
中心节点和节点的构建
局部增强策略
1. 问题背景
在基因调控网络中,许多节点的连接度较低(即低度节点),这些节点在图结构中包含的信息较少。传统的图神经网络(GNN)在处理这类低度节点时,可能会因为缺乏足够的邻域信息而导致特征表达能力不足,进而影响整体的预测性能。因此,需要一种方法来增强这些低度节点的特征表示。
2. 局部增强策略的核心思想
局部增强策略的核心是通过生成模型(CVAE)为低度节点生成额外的邻域特征,从而增强其特征表达能力。具体来说,该策略利用节点的局部结构信息和特征分布,生成与中心节点特征相关的邻域节点特征。这种方法可以在不改变整体图结构的前提下,为低度节点提供更丰富的特征信息。
3. 条件变分自编码器(CVAE)
CVAE是一种生成模型,结合了变分自编码器(VAE)和条件生成对抗网络(GAN)的思想。它通过编码器将输入数据编码为潜在空间的分布,然后通过解码器生成新的数据。在DGCGRN中,CVAE被用于生成邻域节点的特征,具体步骤如下:
局部增强策略的优势
-
针对性增强低度节点:通过生成邻域特征,为低度节点提供额外的特征信息,增强其在图神经网络中的表达能力。
-
保留局部结构信息:CVAE在生成邻域特征时,考虑了中心节点的特征分布,因此生成的特征与局部结构相关,能够更好地保留图的局部信息。
-
提升模型性能:通过增强低度节点的特征,模型能够更准确地捕捉节点间的调控关系,从而提升GRN推断的整体性能。
序列特征提取
1. 序列特征提取模块的背景和动机
在基因调控网络(GRN)推断中,基因表达数据通常是主要的输入特征。然而,基因表达数据的维度可能较低,尤其是在处理真实生物数据时。此外,基因表达数据只能反映基因在特定条件下的表达水平,而无法提供基因序列本身的结构信息。这些结构信息对于理解基因的调控机制至关重要,因为基因序列中的某些模式(如转录因子结合位点)直接影响基因的调控。
因此,DGCGRN引入了序列特征提取模块,通过从基因序列中提取额外的特征来补充基因表达数据。这些序列特征不仅能够提供基因序列的结构信息,还能增强模型对基因调控关系的推断能力。
2. 序列特征提取模块的实现细节
序列特征提取模块主要通过两种方法提取序列特征:
-
隐藏特征提取(Hidden Features Extraction):使用双向门控循环单元(Bi-GRU)模型提取基因序列的隐藏特征。
-
理化特征计算(Physicochemical Features Calculation):计算基因序列的物理化学性质,如Z-curve、GC含量、AT/GC比等。
2.1 隐藏特征提取(Hidden Features Extraction)
2.1.1 Bi-GRU模型
Bi-GRU(双向门控循环单元)是一种基于循环神经网络(RNN)的模型,能够处理序列数据的时间依赖性和上下文信息。Bi-GRU通过双向处理输入序列,能够捕捉序列的前向和后向依赖关系,从而提取更全面的特征。
-
输入:基因序列被分割成多个k-mer片段(长度为k的子序列),每个k-mer片段通过one-hot编码表示。
-
处理:Bi-GRU模型对这些k-mer片段进行处理,提取隐藏特征。
-
输出:Bi-GRU模型输出每个基因序列的隐藏特征向量。
具体步骤:
-
k-mer分割:将基因序列分割成多个长度为k的子序列(k-mer片段)。例如,对于一个基因序列“ATGCGT”,如果k=3,则分割为“ATG”、“TGC”、“GCG”、“CGT”。
-
One-hot编码:将每个k-mer片段通过one-hot编码表示。例如,对于4个核苷酸(A、C、G、T),每个核苷酸可以用一个4维的向量表示。
-
Bi-GRU处理:将编码后的k-mer片段输入到Bi-GRU模型中,提取隐藏特征。
示例: 假设基因序列“ATGCGT”被分割成3-mer片段“ATG”、“TGC”、“GCG”、“CGT”,每个片段通过one-hot编码表示后输入到Bi-GRU模型中,最终输出一个隐藏特征向量。
基于有向图卷积网络的GRN预测
1. 有向图卷积网络(DGCN)的背景和动机
1.1 传统GCN的局限性
传统的图卷积网络(GCN)主要用于处理无向图数据。在无向图中,边没有方向,因此GCN通过聚合邻域节点的信息来更新节点的特征表示。然而,在基因调控网络(GRN)中,调控关系是有方向的(例如,转录因子A调控基因B,但基因B不一定调控转录因子A)。如果直接将无向图的处理方法应用于有向图,会丢失调控关系的方向性信息,从而影响推断的准确性。
1.2 DGCN的优势
DGCN通过引入有向图的处理机制,能够直接处理有向图数据,保留调控关系的方向性。具体来说,DGCN通过定义一阶和二阶邻近矩阵,能够更好地捕捉节点之间的直接和间接调控关系,从而提高GRN推断的准确性。
4. GRN预测模块的流程
基于DGCN的GRN预测模块的完整流程如下:
-
输入特征:将增强后的节点特征(包括基因表达特征、序列特征和局部增强特征)作为输入。
-
图卷积操作:通过DGCN的谱卷积操作,结合一阶和二阶邻近矩阵,更新节点的特征表示。
-
动态更新策略:在每次迭代中,根据预测的调控关系更新边的权重,生成新的加权图。
-
输出预测结果:最终,模型输出节点之间的调控关系预测结果,包括调控关系的存在概率和方向。
5. DGCN的优势和作用
5.1 保留调控关系的方向性
DGCN通过处理有向图数据,保留了基因调控关系的方向性,从而提高了GRN推断的准确性。
5.2 捕捉直接和间接调控关系
通过定义一阶和二阶邻近矩阵,DGCN能够捕捉节点之间的直接和间接调控关系,从而更好地理解基因调控网络的全局结构。
5.3 动态更新策略
动态更新策略使模型能够根据每次迭代的结果调整图结构,从而更好地捕捉节点之间的调控关系,进一步提高模型的预测性能。
细节补充:动态更新策略
1. 动态更新策略的背景和动机
在传统的图神经网络(GNN)中,图结构通常是静态的,即边的权重在训练过程中不会改变。然而,在基因调控网络(GRN)推断中,调控关系的强度可能因节点之间的相互作用而有所不同。静态图结构无法有效捕捉这种动态变化,从而限制了模型的预测能力。
为了解决这一问题,DGCGRN引入了动态更新策略。该策略通过在每次迭代中更新边的权重,使模型能够根据当前预测结果动态调整图结构,从而更好地反映节点之间的调控关系强度。
3. 动态更新策略的作用和优势
3.1 提高预测准确性
通过动态更新边权重,模型能够根据当前预测结果调整图结构,从而更好地反映节点之间的调控关系强度。这有助于提高模型对调控关系的预测准确性。
3.2 捕捉动态变化
基因调控网络中的调控关系可能因环境变化或节点状态而有所不同。动态更新策略能够捕捉这种动态变化,使模型在训练过程中不断优化图结构。
3.3 增强模型的适应性
动态更新策略使模型能够自适应地调整图结构,从而更好地适应不同的数据集和调控关系模式。实验结果表明,加入动态更新策略后,模型的预测性能显著提升。
相关文章:

GRN前沿:DGCGRN:基于有向图卷积网络的基因调控网络推理
1.论文原名:Inference of gene regulatory networks based on directed graph convolutional networks 2.发表日期:2024 DGCGRN框架 中心节点和节点的构建 局部增强策略 1. 问题背景 在基因调控网络中,许多节点的连接度较低(即…...
MongoDB 入门操作指南
文章目录 MongoDB 入门操作指南1. 连接到 MongoDB 数据库2. 查看当前数据库3. 显示所有数据库4. 切换或创建数据库5. 查看当前数据库中的所有集合6. 创建集合7. 插入文档插入单个文档插入多个文档 8. 查询文档查询所有文档查询匹配条件的文档格式化查询输出 9. 更新文档更新单个…...
共享设备管理难?MDM助力Kiosk模式一键部署
目录 1. 简化设备部署与配置:实现一键式部署 2. 自动化应用更新与内容推送:确保设备始终保持最新状态 3. 权限控制与设备安全:防止滥用与数据泄露 4. 远程管理与故障诊断:保障设备长期稳定运行 5. 数据分析与报告:…...
HttpClient-Java程序中发送Http请求
配置 <dependency><groupId>org.apache.httpcomponents</groupId><artifactId>httpclient</artifactId><version>4.5.13</version> </dependency> ps:aliyun-sdk-oss中已引入上述配置 HttpClient的核心API: Htt…...

硬件-电源-隔离与非隔离的区别
文章目录 一:隔离电源与非隔离电源1.1 充电器触电新闻1.2 电路拓扑1.3 隔离电源与非隔离电源的优缺点1.3 隔离电源与非隔离电源的选择1.3.1 隔离电源1.3.2 非隔离电源 二:注意事项2.1 隔离电源结构图2.1 隔离耐压测试方法 三:感悟道友&#x…...
Kubernetes 最佳实践:Top 10 常见 DevOps/SRE 面试问题及答案
1. 如何在 Kubernetes 中设置资源请求和限制? 资源请求确保容器有最小资源量(CPU/内存),而限制则强制容器消耗的最大资源量。这有助于高效资源分配并防止资源争用。 示例: resources:requests:memory: "256Mi&…...

Training for Computer Use
Training for Computer Use 核心事件:多家科技公司推出能操控计算机的智能体,字节跳动和清华大学团队引入UI - TARS模型,展示了训练模型实现计算机操控能力的新成果。 UI - TARS模型 基本信息:是视觉 - 语言模型Qwen2 - VL的微调版…...

PH热榜 | 2025-02-14
1. Beatoven.ai 标语:能创作完美背景音乐的AI作曲家 介绍:Beatoven.ai 能根据简单的提示生成惊艳的背景音乐,用于你的内容创作。它是由世界各地的真实音乐家倾力打造(并使用了大量数据)。无需任何音乐专业知识&#…...

工业物联网远程监控系统优化方案,基于巨控GRM553Y-CHE
工业物联网远程监控系统优化方案 ——基于巨控GRM553Y-CHE的西门子S7-1500 PLC多站点无线集成方案 1. 项目背景与概述 巨控科技作为工业物联网解决方案提供商,专注于PLC无线通信与远程监控技术研发,其YunPLC安全平台已服务超30,000工业终端,…...

报名丨Computer useVoice Agent :使用 TEN 搭建你的 Mac Assistant
与 TEN 相聚在「LET’S VISION 2025」大会,欢迎来展位上跟我们交流。这次我们还准备了一场聚焦「computer use」的工作坊,功能新鲜上线,线下首波体验! 📅 TEN 展位:2025年3月1日-2日 TEN workshop&#x…...
Flutter 中的生命周期
在 Flutter 中,StatefulWidget 和 StatelessWidget 这两种 Widget 的生命周期不同,主要关注的是 StatefulWidget,因为它涉及到状态的管理和更新。 StatefulWidget 的生命周期: 1. 创建阶段 (Create) createState():…...

深度整理总结MySQL——redoLog日志工作原理
redo log的工作原理 前言概念为什么需要redo log修改undo页面,会记录对应的redo log吗redo log 和undo log 区别在哪什么是WAL技术redo log要写入磁盘,数据也要写入磁盘,为什么多此一举产生的redo log直接写入磁盘吗redo log 什么时候刷盘innodb_flush_log_at_trx_commit 参数参…...
备战蓝桥杯 Day1 回顾语言基础
开启蓝桥杯刷题之路 Day1 回顾语言基础 1.配置dev 工具->编译选项->勾选编译时加入以下命令->设定编译器配置(release和debug)都要-> -stdc11 ->代码生成/优化->代码生成/优化->语言标准(-std)->ISO C11 ->代码警告->显示最多警告信息(-Wall)…...

小记大模型本地部署:vllm, lmdeploy, ollama
记录一下最近折腾的大模型本地部署。由于学校有部署deepseek的竞赛(觉得扯不?)所以首选ollama这种超级简单的来过关,但我最希望的还是用专门的推理工具部署,因为做应用开发推理速度一定最重要。所以先尝试自己想搞的vl…...

MySQL查看存储过程和存储函数
【图书推荐】《MySQL 9从入门到性能优化(视频教学版)》-CSDN博客 《MySQL 9从入门到性能优化(视频教学版)(数据库技术丛书)》(王英英)【摘要 书评 试读】- 京东图书 (jd.com) MySQL9数据库技术_夏天又到了…...
从零到一:开发并上线一款极简记账本小程序的完整流程
从零到一:开发并上线一款极简记账本小程序的完整流程 目录 前言需求分析与功能设计 2.1 目标用户分析2.2 核心功能设计2.3 技术栈选择 开发环境搭建 3.1 微信开发者工具安装与配置3.2 项目初始化3.3 版本控制与协作工具 前端开发 4.1 页面结构与布局4.2 组件化开发…...

卷积神经网络实战人脸检测与识别
文章目录 前言一、人脸识别一般过程二、人脸检测主流算法1. MTCNN2. RetinaFace3. CenterFace4. BlazeFace5. YOLO6. SSD7. CascadeCNN 三、人脸识别主流算法1.deepface2.FaceNet3.ArcFace4.VGGFace5.DeepID 四、人脸识别系统实现0.安装教程与资源说明1. 界面采用PyQt5框架2.人…...

【面试题系列】Java 多线程面试题深度解析
本文涉及Java 多线程面试题,从基础到高级,希望对你有所帮助! 一、基础概念类 1. 请简述 Java 中线程的几种状态及其转换条件 题目分析:这是多线程基础中的基础,考查对线程生命周期的理解,在多线程编程中&…...

【C语言】左旋字符串(三种实现方式)
题目: 实现一个函数,可以左旋字符串中的k个字符。 例如: ABCD左旋一个字符得到BCDA ABCD左旋两个字符得到CDAB 方法一: 我们画个图分析一下: 基本逻辑: 就是我们每一次旋转之前,我们就取出…...

数论补充 之 前后缀分解问题
文章目录 [0,i-1] 和 [i1,n-1] 共同作用3334,数组的最大因子得分 对于前缀分解问题,我愿把它分为几个大问题:[0,i] 或 [i,n-1] 或 [l,r],或 [0,i-1] 和 [i1,n-1] 共同作用的问题 [0,i-1] 和 [i1,n-1] 共同作用 3334,数组的最大因子得分 3334,数组的最大…...
java_网络服务相关_gateway_nacos_feign区别联系
1. spring-cloud-starter-gateway 作用:作为微服务架构的网关,统一入口,处理所有外部请求。 核心能力: 路由转发(基于路径、服务名等)过滤器(鉴权、限流、日志、Header 处理)支持负…...

Appium+python自动化(十六)- ADB命令
简介 Android 调试桥(adb)是多种用途的工具,该工具可以帮助你你管理设备或模拟器 的状态。 adb ( Android Debug Bridge)是一个通用命令行工具,其允许您与模拟器实例或连接的 Android 设备进行通信。它可为各种设备操作提供便利,如安装和调试…...
从零实现富文本编辑器#5-编辑器选区模型的状态结构表达
先前我们总结了浏览器选区模型的交互策略,并且实现了基本的选区操作,还调研了自绘选区的实现。那么相对的,我们还需要设计编辑器的选区表达,也可以称为模型选区。编辑器中应用变更时的操作范围,就是以模型选区为基准来…...

vscode(仍待补充)
写于2025 6.9 主包将加入vscode这个更权威的圈子 vscode的基本使用 侧边栏 vscode还能连接ssh? debug时使用的launch文件 1.task.json {"tasks": [{"type": "cppbuild","label": "C/C: gcc.exe 生成活动文件"…...

ESP32 I2S音频总线学习笔记(四): INMP441采集音频并实时播放
简介 前面两期文章我们介绍了I2S的读取和写入,一个是通过INMP441麦克风模块采集音频,一个是通过PCM5102A模块播放音频,那如果我们将两者结合起来,将麦克风采集到的音频通过PCM5102A播放,是不是就可以做一个扩音器了呢…...

DBAPI如何优雅的获取单条数据
API如何优雅的获取单条数据 案例一 对于查询类API,查询的是单条数据,比如根据主键ID查询用户信息,sql如下: select id, name, age from user where id #{id}API默认返回的数据格式是多条的,如下: {&qu…...
土地利用/土地覆盖遥感解译与基于CLUE模型未来变化情景预测;从基础到高级,涵盖ArcGIS数据处理、ENVI遥感解译与CLUE模型情景模拟等
🔍 土地利用/土地覆盖数据是生态、环境和气象等诸多领域模型的关键输入参数。通过遥感影像解译技术,可以精准获取历史或当前任何一个区域的土地利用/土地覆盖情况。这些数据不仅能够用于评估区域生态环境的变化趋势,还能有效评价重大生态工程…...

【论文阅读28】-CNN-BiLSTM-Attention-(2024)
本文把滑坡位移序列拆开、筛优质因子,再用 CNN-BiLSTM-Attention 来动态预测每个子序列,最后重构出总位移,预测效果超越传统模型。 文章目录 1 引言2 方法2.1 位移时间序列加性模型2.2 变分模态分解 (VMD) 具体步骤2.3.1 样本熵(S…...

图表类系列各种样式PPT模版分享
图标图表系列PPT模版,柱状图PPT模版,线状图PPT模版,折线图PPT模版,饼状图PPT模版,雷达图PPT模版,树状图PPT模版 图表类系列各种样式PPT模版分享:图表系列PPT模板https://pan.quark.cn/s/20d40aa…...

AI书签管理工具开发全记录(十九):嵌入资源处理
1.前言 📝 在上一篇文章中,我们完成了书签的导入导出功能。本篇文章我们研究如何处理嵌入资源,方便后续将资源打包到一个可执行文件中。 2.embed介绍 🎯 Go 1.16 引入了革命性的 embed 包,彻底改变了静态资源管理的…...