当前位置: 首页 > news >正文

GRN前沿:DGCGRN:基于有向图卷积网络的基因调控网络推理

1.论文原名:Inference of gene regulatory networks based on directed graph convolutional networks

2.发表日期:2024

DGCGRN框架

中心节点和节点的构建

局部增强策略

1. 问题背景

在基因调控网络中,许多节点的连接度较低(即低度节点),这些节点在图结构中包含的信息较少。传统的图神经网络(GNN)在处理这类低度节点时,可能会因为缺乏足够的邻域信息而导致特征表达能力不足,进而影响整体的预测性能。因此,需要一种方法来增强这些低度节点的特征表示。

2. 局部增强策略的核心思想

局部增强策略的核心是通过生成模型(CVAE)为低度节点生成额外的邻域特征,从而增强其特征表达能力。具体来说,该策略利用节点的局部结构信息和特征分布,生成与中心节点特征相关的邻域节点特征。这种方法可以在不改变整体图结构的前提下,为低度节点提供更丰富的特征信息。


3. 条件变分自编码器(CVAE)

CVAE是一种生成模型,结合了变分自编码器(VAE)和条件生成对抗网络(GAN)的思想。它通过编码器将输入数据编码为潜在空间的分布,然后通过解码器生成新的数据。在DGCGRN中,CVAE被用于生成邻域节点的特征,具体步骤如下:

局部增强策略的优势

  1. 针对性增强低度节点:通过生成邻域特征,为低度节点提供额外的特征信息,增强其在图神经网络中的表达能力。

  2. 保留局部结构信息:CVAE在生成邻域特征时,考虑了中心节点的特征分布,因此生成的特征与局部结构相关,能够更好地保留图的局部信息。

  3. 提升模型性能:通过增强低度节点的特征,模型能够更准确地捕捉节点间的调控关系,从而提升GRN推断的整体性能。

序列特征提取

1. 序列特征提取模块的背景和动机

在基因调控网络(GRN)推断中,基因表达数据通常是主要的输入特征。然而,基因表达数据的维度可能较低,尤其是在处理真实生物数据时。此外,基因表达数据只能反映基因在特定条件下的表达水平,而无法提供基因序列本身的结构信息。这些结构信息对于理解基因的调控机制至关重要,因为基因序列中的某些模式(如转录因子结合位点)直接影响基因的调控。

因此,DGCGRN引入了序列特征提取模块,通过从基因序列中提取额外的特征来补充基因表达数据。这些序列特征不仅能够提供基因序列的结构信息,还能增强模型对基因调控关系的推断能力。

2. 序列特征提取模块的实现细节

序列特征提取模块主要通过两种方法提取序列特征:

  1. 隐藏特征提取(Hidden Features Extraction):使用双向门控循环单元(Bi-GRU)模型提取基因序列的隐藏特征。

  2. 理化特征计算(Physicochemical Features Calculation):计算基因序列的物理化学性质,如Z-curve、GC含量、AT/GC比等。

2.1 隐藏特征提取(Hidden Features Extraction)

2.1.1 Bi-GRU模型

Bi-GRU(双向门控循环单元)是一种基于循环神经网络(RNN)的模型,能够处理序列数据的时间依赖性和上下文信息。Bi-GRU通过双向处理输入序列,能够捕捉序列的前向和后向依赖关系,从而提取更全面的特征。

  • 输入:基因序列被分割成多个k-mer片段(长度为k的子序列),每个k-mer片段通过one-hot编码表示。

  • 处理:Bi-GRU模型对这些k-mer片段进行处理,提取隐藏特征。

  • 输出:Bi-GRU模型输出每个基因序列的隐藏特征向量。

具体步骤

  1. k-mer分割:将基因序列分割成多个长度为k的子序列(k-mer片段)。例如,对于一个基因序列“ATGCGT”,如果k=3,则分割为“ATG”、“TGC”、“GCG”、“CGT”。

  2. One-hot编码:将每个k-mer片段通过one-hot编码表示。例如,对于4个核苷酸(A、C、G、T),每个核苷酸可以用一个4维的向量表示。

  3. Bi-GRU处理:将编码后的k-mer片段输入到Bi-GRU模型中,提取隐藏特征。

示例: 假设基因序列“ATGCGT”被分割成3-mer片段“ATG”、“TGC”、“GCG”、“CGT”,每个片段通过one-hot编码表示后输入到Bi-GRU模型中,最终输出一个隐藏特征向量。

基于有向图卷积网络的GRN预测

1. 有向图卷积网络(DGCN)的背景和动机

1.1 传统GCN的局限性

传统的图卷积网络(GCN)主要用于处理无向图数据。在无向图中,边没有方向,因此GCN通过聚合邻域节点的信息来更新节点的特征表示。然而,在基因调控网络(GRN)中,调控关系是有方向的(例如,转录因子A调控基因B,但基因B不一定调控转录因子A)。如果直接将无向图的处理方法应用于有向图,会丢失调控关系的方向性信息,从而影响推断的准确性。

1.2 DGCN的优势

DGCN通过引入有向图的处理机制,能够直接处理有向图数据,保留调控关系的方向性。具体来说,DGCN通过定义一阶和二阶邻近矩阵,能够更好地捕捉节点之间的直接和间接调控关系,从而提高GRN推断的准确性。

4. GRN预测模块的流程

基于DGCN的GRN预测模块的完整流程如下:

  1. 输入特征:将增强后的节点特征(包括基因表达特征、序列特征和局部增强特征)作为输入。

  2. 图卷积操作:通过DGCN的谱卷积操作,结合一阶和二阶邻近矩阵,更新节点的特征表示。

  3. 动态更新策略:在每次迭代中,根据预测的调控关系更新边的权重,生成新的加权图。

  4. 输出预测结果:最终,模型输出节点之间的调控关系预测结果,包括调控关系的存在概率和方向。


5. DGCN的优势和作用

5.1 保留调控关系的方向性

DGCN通过处理有向图数据,保留了基因调控关系的方向性,从而提高了GRN推断的准确性。

5.2 捕捉直接和间接调控关系

通过定义一阶和二阶邻近矩阵,DGCN能够捕捉节点之间的直接和间接调控关系,从而更好地理解基因调控网络的全局结构。

5.3 动态更新策略

动态更新策略使模型能够根据每次迭代的结果调整图结构,从而更好地捕捉节点之间的调控关系,进一步提高模型的预测性能。

细节补充:动态更新策略

1. 动态更新策略的背景和动机

在传统的图神经网络(GNN)中,图结构通常是静态的,即边的权重在训练过程中不会改变。然而,在基因调控网络(GRN)推断中,调控关系的强度可能因节点之间的相互作用而有所不同。静态图结构无法有效捕捉这种动态变化,从而限制了模型的预测能力。

为了解决这一问题,DGCGRN引入了动态更新策略。该策略通过在每次迭代中更新边的权重,使模型能够根据当前预测结果动态调整图结构,从而更好地反映节点之间的调控关系强度。

3. 动态更新策略的作用和优势

3.1 提高预测准确性

通过动态更新边权重,模型能够根据当前预测结果调整图结构,从而更好地反映节点之间的调控关系强度。这有助于提高模型对调控关系的预测准确性。

3.2 捕捉动态变化

基因调控网络中的调控关系可能因环境变化或节点状态而有所不同。动态更新策略能够捕捉这种动态变化,使模型在训练过程中不断优化图结构。

3.3 增强模型的适应性

动态更新策略使模型能够自适应地调整图结构,从而更好地适应不同的数据集和调控关系模式。实验结果表明,加入动态更新策略后,模型的预测性能显著提升。

相关文章:

GRN前沿:DGCGRN:基于有向图卷积网络的基因调控网络推理

1.论文原名:Inference of gene regulatory networks based on directed graph convolutional networks 2.发表日期:2024 DGCGRN框架 中心节点和节点的构建 局部增强策略 1. 问题背景 在基因调控网络中,许多节点的连接度较低(即…...

MongoDB 入门操作指南

文章目录 MongoDB 入门操作指南1. 连接到 MongoDB 数据库2. 查看当前数据库3. 显示所有数据库4. 切换或创建数据库5. 查看当前数据库中的所有集合6. 创建集合7. 插入文档插入单个文档插入多个文档 8. 查询文档查询所有文档查询匹配条件的文档格式化查询输出 9. 更新文档更新单个…...

共享设备管理难?MDM助力Kiosk模式一键部署

目录 1. 简化设备部署与配置:实现一键式部署 2. 自动化应用更新与内容推送:确保设备始终保持最新状态 3. 权限控制与设备安全:防止滥用与数据泄露 4. 远程管理与故障诊断:保障设备长期稳定运行 5. 数据分析与报告&#xff1a…...

HttpClient-Java程序中发送Http请求

配置 <dependency><groupId>org.apache.httpcomponents</groupId><artifactId>httpclient</artifactId><version>4.5.13</version> </dependency> ps:aliyun-sdk-oss中已引入上述配置 HttpClient的核心API&#xff1a; Htt…...

硬件-电源-隔离与非隔离的区别

文章目录 一&#xff1a;隔离电源与非隔离电源1.1 充电器触电新闻1.2 电路拓扑1.3 隔离电源与非隔离电源的优缺点1.3 隔离电源与非隔离电源的选择1.3.1 隔离电源1.3.2 非隔离电源 二&#xff1a;注意事项2.1 隔离电源结构图2.1 隔离耐压测试方法 三&#xff1a;感悟道友&#x…...

Kubernetes 最佳实践:Top 10 常见 DevOps/SRE 面试问题及答案

1. 如何在 Kubernetes 中设置资源请求和限制&#xff1f; 资源请求确保容器有最小资源量&#xff08;CPU/内存&#xff09;&#xff0c;而限制则强制容器消耗的最大资源量。这有助于高效资源分配并防止资源争用。 示例&#xff1a; resources:requests:memory: "256Mi&…...

Training for Computer Use

Training for Computer Use 核心事件&#xff1a;多家科技公司推出能操控计算机的智能体&#xff0c;字节跳动和清华大学团队引入UI - TARS模型&#xff0c;展示了训练模型实现计算机操控能力的新成果。 UI - TARS模型 基本信息&#xff1a;是视觉 - 语言模型Qwen2 - VL的微调版…...

PH热榜 | 2025-02-14

1. Beatoven.ai 标语&#xff1a;能创作完美背景音乐的AI作曲家 介绍&#xff1a;Beatoven.ai 能根据简单的提示生成惊艳的背景音乐&#xff0c;用于你的内容创作。它是由世界各地的真实音乐家倾力打造&#xff08;并使用了大量数据&#xff09;。无需任何音乐专业知识&#…...

工业物联网远程监控系统优化方案,基于巨控GRM553Y-CHE

工业物联网远程监控系统优化方案 ——基于巨控GRM553Y-CHE的西门子S7-1500 PLC多站点无线集成方案 1. 项目背景与概述 巨控科技作为工业物联网解决方案提供商&#xff0c;专注于PLC无线通信与远程监控技术研发&#xff0c;其YunPLC安全平台已服务超30,000工业终端&#xff0c…...

报名丨Computer useVoice Agent :使用 TEN 搭建你的 Mac Assistant

与 TEN 相聚在「LET’S VISION 2025」大会&#xff0c;欢迎来展位上跟我们交流。这次我们还准备了一场聚焦「computer use」的工作坊&#xff0c;功能新鲜上线&#xff0c;线下首波体验&#xff01; &#x1f4c5; TEN 展位&#xff1a;2025年3月1日-2日 TEN workshop&#x…...

Flutter 中的生命周期

在 Flutter 中&#xff0c;StatefulWidget 和 StatelessWidget 这两种 Widget 的生命周期不同&#xff0c;主要关注的是 StatefulWidget&#xff0c;因为它涉及到状态的管理和更新。 StatefulWidget 的生命周期&#xff1a; 1. 创建阶段 (Create) createState()&#xff1a;…...

深度整理总结MySQL——redoLog日志工作原理

redo log的工作原理 前言概念为什么需要redo log修改undo页面,会记录对应的redo log吗redo log 和undo log 区别在哪什么是WAL技术redo log要写入磁盘,数据也要写入磁盘,为什么多此一举产生的redo log直接写入磁盘吗redo log 什么时候刷盘innodb_flush_log_at_trx_commit 参数参…...

备战蓝桥杯 Day1 回顾语言基础

开启蓝桥杯刷题之路 Day1 回顾语言基础 1.配置dev 工具->编译选项->勾选编译时加入以下命令->设定编译器配置(release和debug)都要-> -stdc11 ->代码生成/优化->代码生成/优化->语言标准(-std)->ISO C11 ->代码警告->显示最多警告信息(-Wall)…...

小记大模型本地部署:vllm, lmdeploy, ollama

记录一下最近折腾的大模型本地部署。由于学校有部署deepseek的竞赛&#xff08;觉得扯不&#xff1f;&#xff09;所以首选ollama这种超级简单的来过关&#xff0c;但我最希望的还是用专门的推理工具部署&#xff0c;因为做应用开发推理速度一定最重要。所以先尝试自己想搞的vl…...

MySQL查看存储过程和存储函数

【图书推荐】《MySQL 9从入门到性能优化&#xff08;视频教学版&#xff09;》-CSDN博客 《MySQL 9从入门到性能优化&#xff08;视频教学版&#xff09;&#xff08;数据库技术丛书&#xff09;》(王英英)【摘要 书评 试读】- 京东图书 (jd.com) MySQL9数据库技术_夏天又到了…...

从零到一:开发并上线一款极简记账本小程序的完整流程

从零到一&#xff1a;开发并上线一款极简记账本小程序的完整流程 目录 前言需求分析与功能设计 2.1 目标用户分析2.2 核心功能设计2.3 技术栈选择 开发环境搭建 3.1 微信开发者工具安装与配置3.2 项目初始化3.3 版本控制与协作工具 前端开发 4.1 页面结构与布局4.2 组件化开发…...

卷积神经网络实战人脸检测与识别

文章目录 前言一、人脸识别一般过程二、人脸检测主流算法1. MTCNN2. RetinaFace3. CenterFace4. BlazeFace5. YOLO6. SSD7. CascadeCNN 三、人脸识别主流算法1.deepface2.FaceNet3.ArcFace4.VGGFace5.DeepID 四、人脸识别系统实现0.安装教程与资源说明1. 界面采用PyQt5框架2.人…...

【面试题系列】Java 多线程面试题深度解析

本文涉及Java 多线程面试题&#xff0c;从基础到高级&#xff0c;希望对你有所帮助&#xff01; 一、基础概念类 1. 请简述 Java 中线程的几种状态及其转换条件 题目分析&#xff1a;这是多线程基础中的基础&#xff0c;考查对线程生命周期的理解&#xff0c;在多线程编程中&…...

【C语言】左旋字符串(三种实现方式)

题目&#xff1a; 实现一个函数&#xff0c;可以左旋字符串中的k个字符。 例如&#xff1a; ABCD左旋一个字符得到BCDA ABCD左旋两个字符得到CDAB 方法一&#xff1a; 我们画个图分析一下&#xff1a; 基本逻辑&#xff1a; 就是我们每一次旋转之前&#xff0c;我们就取出…...

数论补充 之 前后缀分解问题

文章目录 [0,i-1] 和 [i1,n-1] 共同作用3334,数组的最大因子得分 对于前缀分解问题&#xff0c;我愿把它分为几个大问题&#xff1a;[0,i] 或 [i,n-1] 或 [l,r],或 [0,i-1] 和 [i1,n-1] 共同作用的问题 [0,i-1] 和 [i1,n-1] 共同作用 3334,数组的最大因子得分 3334,数组的最大…...

java_网络服务相关_gateway_nacos_feign区别联系

1. spring-cloud-starter-gateway 作用&#xff1a;作为微服务架构的网关&#xff0c;统一入口&#xff0c;处理所有外部请求。 核心能力&#xff1a; 路由转发&#xff08;基于路径、服务名等&#xff09;过滤器&#xff08;鉴权、限流、日志、Header 处理&#xff09;支持负…...

Appium+python自动化(十六)- ADB命令

简介 Android 调试桥(adb)是多种用途的工具&#xff0c;该工具可以帮助你你管理设备或模拟器 的状态。 adb ( Android Debug Bridge)是一个通用命令行工具&#xff0c;其允许您与模拟器实例或连接的 Android 设备进行通信。它可为各种设备操作提供便利&#xff0c;如安装和调试…...

从零实现富文本编辑器#5-编辑器选区模型的状态结构表达

先前我们总结了浏览器选区模型的交互策略&#xff0c;并且实现了基本的选区操作&#xff0c;还调研了自绘选区的实现。那么相对的&#xff0c;我们还需要设计编辑器的选区表达&#xff0c;也可以称为模型选区。编辑器中应用变更时的操作范围&#xff0c;就是以模型选区为基准来…...

vscode(仍待补充)

写于2025 6.9 主包将加入vscode这个更权威的圈子 vscode的基本使用 侧边栏 vscode还能连接ssh&#xff1f; debug时使用的launch文件 1.task.json {"tasks": [{"type": "cppbuild","label": "C/C: gcc.exe 生成活动文件"…...

ESP32 I2S音频总线学习笔记(四): INMP441采集音频并实时播放

简介 前面两期文章我们介绍了I2S的读取和写入&#xff0c;一个是通过INMP441麦克风模块采集音频&#xff0c;一个是通过PCM5102A模块播放音频&#xff0c;那如果我们将两者结合起来&#xff0c;将麦克风采集到的音频通过PCM5102A播放&#xff0c;是不是就可以做一个扩音器了呢…...

DBAPI如何优雅的获取单条数据

API如何优雅的获取单条数据 案例一 对于查询类API&#xff0c;查询的是单条数据&#xff0c;比如根据主键ID查询用户信息&#xff0c;sql如下&#xff1a; select id, name, age from user where id #{id}API默认返回的数据格式是多条的&#xff0c;如下&#xff1a; {&qu…...

土地利用/土地覆盖遥感解译与基于CLUE模型未来变化情景预测;从基础到高级,涵盖ArcGIS数据处理、ENVI遥感解译与CLUE模型情景模拟等

&#x1f50d; 土地利用/土地覆盖数据是生态、环境和气象等诸多领域模型的关键输入参数。通过遥感影像解译技术&#xff0c;可以精准获取历史或当前任何一个区域的土地利用/土地覆盖情况。这些数据不仅能够用于评估区域生态环境的变化趋势&#xff0c;还能有效评价重大生态工程…...

【论文阅读28】-CNN-BiLSTM-Attention-(2024)

本文把滑坡位移序列拆开、筛优质因子&#xff0c;再用 CNN-BiLSTM-Attention 来动态预测每个子序列&#xff0c;最后重构出总位移&#xff0c;预测效果超越传统模型。 文章目录 1 引言2 方法2.1 位移时间序列加性模型2.2 变分模态分解 (VMD) 具体步骤2.3.1 样本熵&#xff08;S…...

图表类系列各种样式PPT模版分享

图标图表系列PPT模版&#xff0c;柱状图PPT模版&#xff0c;线状图PPT模版&#xff0c;折线图PPT模版&#xff0c;饼状图PPT模版&#xff0c;雷达图PPT模版&#xff0c;树状图PPT模版 图表类系列各种样式PPT模版分享&#xff1a;图表系列PPT模板https://pan.quark.cn/s/20d40aa…...

AI书签管理工具开发全记录(十九):嵌入资源处理

1.前言 &#x1f4dd; 在上一篇文章中&#xff0c;我们完成了书签的导入导出功能。本篇文章我们研究如何处理嵌入资源&#xff0c;方便后续将资源打包到一个可执行文件中。 2.embed介绍 &#x1f3af; Go 1.16 引入了革命性的 embed 包&#xff0c;彻底改变了静态资源管理的…...