当前位置: 首页 > news >正文

网络药理学:16、速通流程版

一、筛选疾病靶点

GeneCards

  1. 下载数据得到GeneCards-SearchResult.csv
  2. 通过Relevance score≥1.0得到GeneCards.csv
  3. 步骤2只保留Gene Symbol,即基因名这一列得到GeneCards_gene_names.csv

OMIM

  1. 下载数据得到OMIM-Gene-Map-Retrieval.xlsx
  2. 只保留Gene/Locus,即基因名这一列得到OMIM.xlsx
  3. 处理OMIM.xlsx,得到单个基因名只占一行、去重、去除空格的OMIM_gene_names.xlsx

TDD

  1. 手动粘贴Target Name小括号里面的基因名称,加上列名GeneName,得到TDD_gene_names.csv

汇总

  1. 取三个数据库的交集或并集(一般取交集),去重,得到disease.xlsx,数据量为几千个为合适的。

二、筛选药物成分

TCMSP

  1. OB≥30%, DL≥0.18标准筛选后手动粘贴数据得到TCMSP.xlsx(数据量太少就用OB≥20%, DL≥0.18

SwissADME二次筛选

  1. 高GI和两条yes于Druglikeness标准进行二次筛选,得到SwissADME.xlsx,最终数据量为几条到十几条。

三、查询成分相关信息

TCMSP根据成分名称(Molecule Name)获取其mol2格式文件

PubChem根据成分名称获取其2D结构的SDF格式文件

四、预测成分靶点

PharmMapper

  1. SDF(2D3D都可)/MOL2格式文件上传任务(一般2DSDF最常用)
  2. 下载任务数据集,命名为成分名称_pharmMapper.csv
  3. 对步骤2得到的文件进行处理,列只要Norm FitUniplot,得到成分名称_pharmMapper_uniplot.csv
  4. 对步骤3得到的文件进行处理,只要Norm Fit≥0.9的数据行,得到成分名称_pharmMapper_filtered.csv
  5. 对步骤4得到得文件进行处理,列只要Uniplot,去重,得到pharmMapper_filtered.csv,数据量在几十到几百正常。

SwissTargetPrediction

  1. 下载数据集,分别命名为成分名称_SwissTargetPrediction.csv
  2. 选取ProbabilityTop15,分别命名为成分名称_SwissTargettPrediction_top15.csv

如果Probability为0,那么即使在top15也不要选,数据量小时可以选择Top 20/Top 25,或者干脆≥0.7≥0.1>0的都可。数据量过多时, probability大于10也可以。大于中位数也行。

  1. 对步骤2得到的文件进行处理,列只要Common(靶点名)、Uniprot IDProbability,分别命名为成分名称_SwissTargetPrediction_filtered.csv
  2. 对步骤3得到的文件进行处理,把所有成分汇总,只保留列Common nameUniprot ID,并去重,得到SwissTargetPrediction_top15_filtered.csv,数据量在几十到几百正常。

汇总

  1. 取两个数据库的交集或并集(一般取交集,数据量过小就取并集),只保留Uniplot列,去重,得到drug.xlsx,数据量为几百个为合适的。

五、Uniprot转化为基因名

  • 对成分靶点的数据文件转换为基因名,将From列改为Uniplot,将To列改为GeneName,命名为drug_genes.xlsx

六、成分靶点和疾病靶点做韦恩图

  • 命名为venn.png

七、

相关文章:

网络药理学:16、速通流程版

一、筛选疾病靶点 GeneCards 下载数据得到GeneCards-SearchResult.csv通过Relevance score≥1.0得到GeneCards.csv步骤2只保留Gene Symbol,即基因名这一列得到GeneCards_gene_names.csv OMIM 下载数据得到OMIM-Gene-Map-Retrieval.xlsx只保留Gene/Locus&#xf…...

P2515 [HAOI2010] 软件安装

~~~~~ P2515 [HAOI2010] 软件安装 ~~~~~ 总题单链接 思路 ~~~~~ 发现构成的图是一个森林和一些环。 ~~~~~ 对于森林,建一个虚点然后树形 D P DP DP 即可。 ~~~~~ 对于环,发现要么把这个环上的每一个点都选了,要么每一个都不选。所以可以先缩…...

51单片机快速入门之定时器和计数器

51单片机快速入门之定时器 断开外部输入 晶振振荡 假设为 12MHz 12分频之后,为1MHz 当其从0-65536 时,需要65536μs 微秒 也就是65.536ms 毫秒 溢出(值>65536 时)>中断>执行中断操作 假设需要1ms后产生溢出,则需要设置初始值为64536 此时定时器会从 64536 开始计…...

【计算机网络 - 基础问题】每日 3 题(一)

✍个人博客:Pandaconda-CSDN博客 📣专栏地址:http://t.csdnimg.cn/fYaBd 📚专栏简介:在这个专栏中,我将会分享 C 面试中常见的面试题给大家~ ❤️如果有收获的话,欢迎点赞👍收藏&…...

Unity全面取消Runtime费用 安装游戏不再收版费

Unity宣布他们已经废除了争议性的Runtime费用,该费用于2023年9月引入,定于1月1日开始收取。Runtime费用起初是打算根据使用Unity引擎安装游戏的次数收取版权费。2023年9月晚些时候,该公司部分收回了计划,称Runtime费用只适用于订阅…...

IDEA测试类启动报 “java: 常量字符串过长” 解决办法

目录标题 问题描述问题分析解决办法其他办法 问题描述 问题分析 字符串长度过长,导致 idea 默认使用的 javac 编译器编译不了。 查询资料发现,原因是javac在编译期间,常量字符串最大长度为65534。 解决办法 Javac 编译器改为 Eclipse 编译…...

计算机科学基础 -- 访存单元

访存单元(Memory Access Unit)的概念 访存单元(Memory Access Unit) 是处理器中的一个关键模块,负责处理指令中的内存访问操作,包括从内存中读取数据和将数据写入内存。由于内存访问速度通常比处理器执行速…...

Linux压缩、解压缩、查看压缩内容详解使用(tar、gzip、bzip2、xz、jar、war、aar)

在Linux环境中,你可以使用各种命令来压缩、解压缩和查看不同类型的压缩包。以下是常用的命令和操作说明,包括tar、gzip、bzip2、xz、jar、war、aar等类型的包文件。 1. tar命令:压缩、解压、查看tar包 压缩: tar -cvf archive.…...

StreamReader 和 StreamWriter提供自动处理字符编码的功能

FileStream、StreamReader 和 StreamWriter 都用于文件操作,但它们的设计目标和使用方式有所不同。下面是它们之间的主要差异以及如何结合使用的说明: 1. FileStream 用途:提供对文件的字节流访问,用于读写二进制数据。特点&…...

Gitlab备份、迁移、恢复和升级(Gitlab Backup, migration, recovery, and upgrade)

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:Linux运维老纪的首页…...

MySQL:INSERT command denied to user

异常: INSERT command denied to user 解决办法: 请检查一下 MySQL 帐号是否有相应的权限...

【Android安全】Ubuntu 16.04安装GDB和GEF

1. 安装GDB sudo apt install gdb-multiarch 2. 安装GEF(GDB Enhanced Features) 官网地址:https://github.com/hugsy/gef 2.1 安装2021.10版本 但是在Ubuntu 16.04上,bash -c "$(curl -fsSL https://gef.blah.cat/sh)"等命令不好使&…...

ISO 21434与网络安全管理系统(CSMS)的协同作用

ISO/SAE 21434与CSMS(网络安全管理系统)之间的关系主要体现在以下几个方面: 提供指导框架:ISO/SAE 21434《道路车辆—网络安全工程》是一项国际标准,它为汽车行业提供了实施网络安全管理系统的国际认可的方法和最佳实…...

Vue 67 vuex 四个map方法的使用

mapState方法:用于帮助我们映射state中的数据为计算属性 computed: {//借助mapState生成计算属性:sum、school、subject(对象写法)...mapState({sum:sum,school:school,subject:subject}),//借助mapState生成计算属性:…...

Unity自带脚本之GameObject脚本

目录 GameObject基本成员变量 静态方法 创建自带几何体 1.查找对象 通过tag来查找对象 2查找多个对象 实例化对象(克隆对象)的方法 删除对象的方法 过场景不移除 Unity中的Object和C#中的万物之父的区别 成员方法 创建空物体 为对象 动态添加…...

软件测试面试题-自测

一、测试流程 1.项目测试流程你是怎么开展的? ①首先,需求分析阶段,分析需求点,需求确定以后进入测试计划阶段,参考需求规格说明书进行测试计划编写 ②接着,进入测试设计阶段,依据需求文档及原…...

深度学习-神经网络

文章目录 一、基本组成单元:神经元二、神经网络层三、偏置与权重四、激活函数1.激活函数的作用2.常见的激活函数1).Sigmoid2).Tanh函数3).ReLU函数 五、优点与缺点六、总结 神经网络(Neural Network, NN)是一种模拟人类大脑工作方式的计算模型…...

Redis - 集群篇 - 集群模式

面试的时候被人问到集群的问题,搬砖仔哪懂这么多,继续整理一下知识点 Redis 集群模式 Redis集群就是将多个Redis节点连接在一起, 让Redis在不同的节点上同时提供服务。 Redis集群主要有三种模式: 主从复制模式(mast…...

Robot Operating System——线速度和角速度

大纲 应用场景1. 移动机器人控制场景描述具体应用 2. 无人机控制场景描述具体应用 3. 机械臂运动控制场景描述具体应用 4. 自动驾驶车辆控制场景描述具体应用 5. 机器人仿真场景描述具体应用 6. 机器人传感器数据处理场景描述具体应用 定义字段解释 案例 geometry_msgs::msg::T…...

量化投资策略_因子打分选股的案例实现

一:因子打分选股的介绍 因子打分选股是一种量化投资策略,它通过选取多个与股票收益率相关的因子,对股票进行综合评分,然后根据评分来选择股票构建投资组合。以下是构建多因子打分选股模型的一般步骤: 数据预处理&…...

Qwerty Learner 数据持久化架构深度解析:IndexedDB 异步存储方案技术实现

Qwerty Learner 数据持久化架构深度解析:IndexedDB 异步存储方案技术实现 【免费下载链接】qwerty-learner 项目地址: https://gitcode.com/GitHub_Trending/qw/qwerty-learner 在英语单词记忆与打字训练应用中,数据持久化架构直接影响学习体验的…...

STM32开发中的C语言高效编程技巧

STM32开发中的C语言高效编程技巧1. 位操作在寄存器控制中的应用1.1 位操作基础在STM32嵌入式开发中&#xff0c;C语言提供了六种基本位操作运算符&#xff1a;&按位与|按位或^按位异或~按位取反<<左移>>右移1.2 寄存器位操作技巧1.2.1 特定位置位/清零// 设置G…...

MySQL技巧(八) :死锁解决与实战案例

在数据库高并发场景下&#xff0c;死锁是一个绕不开的经典难题。两个或多个事务相互持有对方需要的锁&#xff0c;导致都无法继续执行&#xff0c;就像两辆车在狭窄路口互不相让。本文将带你从原理到实战&#xff0c;掌握死锁的排查、解决和预防全流程。一、死锁快速定位当应用…...

接近开关和光电开关接头:A编码M12一体式防水连接器规格解析

在工业自动化现场&#xff0c;接近开关与光电开关是应用最广泛的传感器。其标准接口——A编码M12一体式防水连接器&#xff08;预铸线缆型&#xff09;&#xff0c;通过统一的机械尺寸与电气定义&#xff0c;实现了传感器的即插即用与高可靠连接。一、规格标准与接口定义A编码M…...

OpenClaw智能截图:nanobot自动识别图片中的文字信息

OpenClaw智能截图&#xff1a;nanobot自动识别图片中的文字信息 1. 为什么需要智能截图工具 在日常工作和学习中&#xff0c;我们经常遇到需要从图片中提取文字的场景。比如截取网页上的技术文档片段、保存会议白板上的讨论要点、或者整理纸质书籍中的关键段落。传统做法是手…...

LCDWIKI SPI图形库:嵌入式TFT-LCD驱动核心架构与实战

1. LCDWIKI SPI 图形库深度解析&#xff1a;面向嵌入式显示驱动的底层架构与工程实践LCDWIKI SPI Library 是一款专为基于 SPI 接口的 TFT-LCD 显示模块设计的轻量级、高兼容性图形驱动核心库。它并非孤立的显示驱动&#xff0c;而是整个 LCDWIKI 显示生态系统的“基石类”&…...

ViGEmBus虚拟手柄驱动全栈技术指南:从内核原理到游戏控制革新

ViGEmBus虚拟手柄驱动全栈技术指南&#xff1a;从内核原理到游戏控制革新 【免费下载链接】ViGEmBus Windows kernel-mode driver emulating well-known USB game controllers. 项目地址: https://gitcode.com/gh_mirrors/vi/ViGEmBus 一、认知虚拟手柄技术&#xff1a;…...

swoole方案 实时监控大盘推送中心

业务服务 --写--> Kafka ---> Swoole消费 --WebSocket推--> 浏览器ECharts实时刷新Kafka 当缓冲层&#xff0c;业务打点不管推送快不快&#xff0c;Swoole 从 Kafka 拉数据&#xff0c;有新数据就推给所有看板页面。---代码<?php// composer require longlang/php…...

PCB Layout实战:信号走线绕过ESD/TVS管,为何防护会失效?

1. 信号走线绕过ESD/TVS管的隐患 很多工程师在PCB设计时都听过一个原则&#xff1a;信号走线要先经过ESD/TVS保护器件&#xff0c;再连接到被保护芯片。但在实际项目中&#xff0c;由于空间限制或布线困难&#xff0c;经常会出现信号线先连接到芯片&#xff0c;再绕回保护器件的…...

5大突破!漫画阅读工具Venera重构跨平台阅读体验

5大突破&#xff01;漫画阅读工具Venera重构跨平台阅读体验 【免费下载链接】venera A comic app 项目地址: https://gitcode.com/gh_mirrors/ve/venera 副标题&#xff1a;如何在Windows、macOS和移动设备间无缝切换你的漫画库&#xff1f; 开篇痛点引入 不同设备间漫…...