【流行病学】Melodi-Presto因果关联工具
title: “[流行病学] Melodi Presto因果关联工具”
date: 2022-12-08
lastmod: 2022-12-08
draft: false
tags: [“流行病学”,“因果关联工具”]
toc: true
autoCollapseToc: true
阅读介绍
Melodi-Presto: A fast and agile tool to explore semantic triples derived from biomedical literature1
triples: subject–predicate–object triple
SemMedDB 大型开放式知识库
使用入口
-
🚩在线工具 Web Application
-
API
-
Jupyter Notebooks
git 下载到json在提取
curl -X POST 'https://melodi-presto.mrcieu.ac.uk/api/overlap/' -H 'accept: application/json' -H 'Content-Type: application/json' -d '{ "x": [ "diabetes " ], "y": [ "coronary heart disease" ]}' > 1.json
使用示例
X: KRAS
Y: lung cancer
输入的专业术语应该在Mesh先确定???
文章复现
doi: 10.1093/ije/dyab2032
{{< note >}} 1. 部分内容已经改变 2. Object的挑选精确到chronic 3. Predicate的挑选先无限制 4. Subject的挑选去掉了CRP,但是论文有纳入 5. OR的计算已经去掉? 6. gtf基因和[Uniprot蛋白名库](https://www.uniprot.org/uniprotkb?facets=model_organism%3A9606&query=reviewed%3Atrue)删掉 7. +药物库? {{< /note >}}library(openxlsx)
# read
df <- read.xlsx("chronic kidney disease.xlsx",sheet = 1, colNames=TRUE,check.names=FALSE )str(df$Pval)
df$Pval <- as.numeric(df$Pval)
# P value < 0.005
df <- subset(df,df$Pval < 0.005 )# removed triples where the subject was a gene or protein
df$Subject <- tolower(df$Subject)
a=stringr::str_which(df$Subject,pattern = "gene|protein|receptor")
# [waring:delete the CRP in the paper]
df$Subject[a]
df <- df[-a,]# where the term “CAUSES” implies causality,
# the term “ASSOCIATED_WITH” implies association,
# and the term “COEXISTS_WITH” implies co-existence.
table(df$Predicate)
df <- subset(df,df$Predicate=="CAUSES"|df$Predicate=="ASSOCIATED_WITH"|df$Predicate=="COEXISTS_WITH")# restricted to triples
# where the object contained either “kidney” or “renal”
table(df$Object)
dplyr::count(df,forcats::fct_lump_n(Object,n=10))
#
df$Object <- tolower(df$Object)
b=stringr::str_which(df$Object,pattern = "kidney|renal")
df$Object[b]
df <- df[b,]# removed2
df$Subject
c=stringr::str_which(df$Subject,pattern = "\\|")
df$Subject[c]
df <- df[-c,]
#
df$Subject
c=stringr::str_which(df$Subject,pattern = "factor")
df$Subject[c]
df <- df[-c,]
#
df$Subject
c=stringr::str_which(df$Subject,pattern = "peptide")
df$Subject[c]
df <- df[-c,]# retained only unique risk factors (subjects)
# to avoid duplicates
df <- dplyr::arrange(df,desc(Count),Pval)
df <- df[!duplicated(df$Subject),]table(df$Count)
# df <- subset(df,df$Count>2)write.xlsx(df, file = "筛选4.xlsx", colNames = TRUE)# enrichment odds ratio
# (a) count the number of these triples
# (b) the number of total triples matched to the query
# (c) the total number of these triples in the data base ,
# (d) and the total number of triples in the database .# stats.fisher_exact([[a, b-a], [c, d-c]])library(openxlsx)
# read
df <- read.xlsx("chronic kidney disease.xlsx",sheet = 1, colNames=TRUE,check.names=FALSE )str(df$Pval)
df$Pval <- as.numeric(df$Pval)
# P value < 0.005
df <- subset(df,df$Pval < 0.005 )# removed triples where the subject was a gene or protein
df$Subject <- tolower(df$Subject)
a=stringr::str_which(df$Subject,pattern = "gene|protein|receptor")
# [waring:delete the CRP in the paper]
df$Subject[a]
df <- df[-a,]# where the term “CAUSES” implies causality,
# the term “ASSOCIATED_WITH” implies association,
# and the term “COEXISTS_WITH” implies co-existence.
table(df$Predicate)
df <- subset(df,df$Predicate=="CAUSES"|df$Predicate=="ASSOCIATED_WITH"|df$Predicate=="COEXISTS_WITH")# restricted to triples
# where the object contained either “kidney” or “renal”
table(df$Object)
dplyr::count(df,forcats::fct_lump_n(Object,n=10))
#
df$Object <- tolower(df$Object)
b=stringr::str_which(df$Object,pattern = "kidney|renal")
df$Object[b]
df <- df[b,]# removed2
df$Subject
c=stringr::str_which(df$Subject,pattern = "\\|")
df$Subject[c]
df <- df[-c,]
#
df$Subject
c=stringr::str_which(df$Subject,pattern = "factor")
df$Subject[c]
df <- df[-c,]
#
df$Subject
c=stringr::str_which(df$Subject,pattern = "peptide")
df$Subject[c]
df <- df[-c,]# retained only unique risk factors (subjects)
# to avoid duplicates
df <- dplyr::arrange(df,desc(Count),Pval)
df <- df[!duplicated(df$Subject),]table(df$Count)
# df <- subset(df,df$Count>2)write.xlsx(df, file = "筛选4.xlsx", colNames = TRUE)# enrichment odds ratio
# (a) count the number of these triples
# (b) the number of total triples matched to the query
# (c) the total number of these triples in the data base ,
# (d) and the total number of triples in the database .# stats.fisher_exact([[a, b-a], [c, d-c]])
NHANES
注意事项, 参考文章复现
doi: 10.1093/bioinformatics/btaa726 ↩︎
Trans-ethnic Mendelian-randomization
study reveals causal relationships between
cardiometabolic factors and chronic kidney
disease ↩︎
相关文章:
【流行病学】Melodi-Presto因果关联工具
title: “[流行病学] Melodi Presto因果关联工具” date: 2022-12-08 lastmod: 2022-12-08 draft: false tags: [“流行病学”,“因果关联工具”] toc: true autoCollapseToc: true 阅读介绍 Melodi-Presto: A fast and agile tool to explore semantic triples derived from …...
Stream在Swift 和 Flutter上的对比
Swift 和 Flutter 都是跨平台开发框架,它们各自提供了强大的工具来处理数据流,尤其是在移动应用开发中。虽然 Swift 主要用于 iOS 开发,而 Flutter 主要用于移动应用的开发(包括 iOS 和 Android),但它们各自…...
Vue3 TransitionGroup组件深入解析:结合Element Plus实践指南
引言 在动态列表交互场景中,元素的增删排序需要优雅的过渡效果。Vue3的TransitionGroup组件为这类需求提供了专业解决方案。本文将通过Element Plus等流行UI库的实战案例,深入剖析TransitionGroup的应用技巧。 一、TransitionGroup核心特性 1.1 与Tran…...
关于opencv中solvepnp中UPNP与DLS与EPNP的参数
The methods SOLVEPNP_DLS and SOLVEPNP_UPNP cannot be used as the current implementations are unstable and sometimes give completely wrong results. If you pass one of these two flags, SOLVEPNP_EPNP method will be used instead.、 由于当前的实现不稳定&#x…...
Versal - XRT(CPP) 2024.1
目录 1.简介 2. XRT 2.1 XRT vs OpenCL 2.2 Takeways 2.3 XRT C APIs 2.4 Device and XCLBIN 2.5 Buffers 2.5.1 Buffer 创建 2.5.1.1 普通 Buffer 2.5.1.2 特殊 Buffer 2.5.1.3 用户指针 Buffer 2.5.2 Data Transfer 2.5.2.1 read/write API 2.5.2.2 map API 2…...
【零基础到精通Java合集】第十八集:多线程与并发编程-线程池与Callable/Future应用
课程标题:线程池与Callable/Future应用(15分钟) 目标:掌握线程池的创建与管理,理解Callable任务与Future异步结果处理机制 0-1分钟:课程引入与线程池意义 以“银行窗口服务”类比线程池:复用固定资源(柜员)处理多任务(客户)。说明线程池的核心价值——避免频繁创建…...
windows下安装Open Web UI
windows下安装openwebui有三种方式,docker,pythonnode.js,整合包. 这里我选择的是第二种,非docker. 非Docker方式安装 1. 安装Python: 下载并安装Python 3.11,建议安装路径中不要包含中文字符,并勾选“Add python 3.11 to Path”选项。 安…...
【自用】NLP算法面经(4)
一、deepseek 1、MLA (1)LLM推理过程 prefill阶段:模型对全部的prompt tokens一次性并行计算,最终生成第一个输出token。decode阶段:每次生成一个token,直到生成EOS(end-of-sequence…...
LeetCode热题100JS(20/100)第四天|41. 缺失的第一个正数|73. 矩阵置零|54. 螺旋矩阵|48. 旋转图像
41. 缺失的第一个正数 题目链接:41. 缺失的第一个正数 难度:困难 刷题状态:1刷 新知识: 解题过程 思考 示例 1: 输入:nums [1,2,0] 输出:3 解释:范围 [1,2] 中的数字都在数组中…...
【银河麒麟高级服务器操作系统实际案例分享】数据库资源重启现象分析及处理全过程
更多银河麒麟操作系统产品及技术讨论,欢迎加入银河麒麟操作系统官方论坛 https://forum.kylinos.cn 了解更多银河麒麟操作系统全新产品,请点击访问 麒麟软件产品专区:https://product.kylinos.cn 开发者专区:https://developer…...
开源架构与人工智能的融合:开启技术新纪元
最近五篇文章推荐: 开源架构的自动化测试策略优化版(New) 开源架构的容器化部署优化版(New) 开源架构的微服务架构实践优化版(New) 开源架构中的数据库选择优化版(New) 开…...
缓存那些事儿
为什么要使用缓存 性能 我们在碰到需要执行耗时特别久,且结果不频繁变动的SQL,就特别适合将运行结果放入缓存。这样,后面的请求就去缓存中读取,使得请求能够迅速响应。 并发 在大并发的情况下,所有的请求直接访问数…...
【弹性计算】弹性裸金属服务器和神龙虚拟化(二):适用场景
《弹性裸金属服务器》系列,共包含以下文章: 弹性裸金属服务器和神龙虚拟化(一):功能特点弹性裸金属服务器和神龙虚拟化(二):适用场景弹性裸金属服务器和神龙虚拟化(三&a…...
通往 AI 之路:Python 机器学习入门-语法基础
第一章 Python 语法基础 Python 是一种简单易学的编程语言,广泛用于数据分析、机器学习和人工智能领域。在学习机器学习之前,我们需要先掌握 Python 的基本语法。本章将介绍 Python 的变量与数据类型、条件语句、循环、函数以及文件操作,帮助…...
FastGPT 引申:信息抽取到知识图谱的衔接流程
文章目录 信息抽取到知识图谱的衔接流程步骤1:原始信息抽取结果步骤2:数据标准化处理(Python示例)步骤3:Cypher代码动态生成(Python驱动) 关键衔接逻辑说明1. 唯一标识符生成规则2. 数据映射策略…...
计算机毕业设计SpringBoot+Vue.js保险合同管理系统(源码+文档+PPT+讲解)
温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…...
58、深度学习-自学之路-自己搭建深度学习框架-19、RNN神经网络梯度消失和爆炸的原因(从公式推导方向来说明),通过RNN的前向传播和反向传播公式来理解。
一、RNN神经网络的前向传播图如下: 时间步 t1: x₁ → (W_x) → [RNN Cell] → h₁ → (W_y) → y₁ ↑ (W_h) h₀ (初始隐藏状态) 时间步 t2: x₂ → (W_x) → [RNN Cell] → h₂ → (W_y) → y₂ ↑ (W_h) h₁ 时间…...
什么是 Cholesky 分解?兼谈正定矩阵和二次型
Cholesky 分解在深度学习中的应用与理解 Cholesky 分解是一种用于对称正定矩阵的特殊分解方法,在线性代数和概率模型中有广泛应用。对于深度学习研究者来说,理解 Cholesky 分解不仅有助于掌握矩阵运算的理论基础,还能在高斯过程、变分方法&a…...
在单位,领导不说,但自己得懂的7个道理
如果你感到很难继续适应旧模式、旧关系、旧想法,开始厌倦生活,你很可能到了该蜕皮的时候。把“不是自己”的那部分舍弃掉,你就能看见“自己是谁”了。 ——奥赞瓦罗尔,《读者》2024年第11期 前几天听部门里一个新来的小姑娘抱怨&a…...
bge-large-zh-v1.5 与Pro/BAAI/bge-m3 区别
ge-large-zh-v1.5 和 Pro/BAAI/bge-m3 是两种不同的模型,主要区别在于架构、性能和应用场景。以下是它们的对比: 1. 模型架构 bge-large-zh-v1.5: 基于Transformer架构,专注于中文文本的嵌入表示。 参数量较大,适合处…...
lamp平台介绍
一、lamp介绍 网站: 静态 动态 php语言 .php 作用:运行php语言编写动态网站应用 lamp Linux Apache MySQL PHP PHP是作为httpd的一个功能模块存在的 二、部署lamp平台 1、测试httpd是否可正常返回PHP的响应 2、测试PHP代码是否可正常连接数据…...
Windows10系统构建本地安全私有化的个人知识库——采用DeepSeek+RAGFlow
一、为什么要构建本地私有化个人知识库 1.1、自身需求 1、需要相关隐私资料内容的安全保护可控; 2、需要根据自身的隐私资料内容构建出个性化的知识库; 一些常见的业务场景如:①希望我们的智能助手可以根据公司的管理制度回答问题,让员工可以随时了解公司相关制度内容信息;…...
Linux: Centos7 Cannot find a valid baseurl for repo: base/7/x86_64 解决方案
Linux: Centos7 Cannot find a valid baseurl for repo: base/7/x86_64 解决方案 问题背景: 执行yum update出现如下报错 排查虚拟机是否联网: ping -c 4 www.baidu.com 可以看到网络链接没有问题 解决方案: 原因是国外的镜像源有问题&am…...
Java 大视界 -- Java 大数据在智能金融反欺诈中的技术实现与案例分析(114)
💖亲爱的朋友们,热烈欢迎来到 青云交的博客!能与诸位在此相逢,我倍感荣幸。在这飞速更迭的时代,我们都渴望一方心灵净土,而 我的博客 正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识,也…...
每日OJ_牛客_游游的字母串_枚举_C++_Java
目录 牛客_游游的字母串_枚举 题目解析 C代码 Java代码 牛客_游游的字母串_枚举 游游的字母串 描述: 对于一个小写字母而言,游游可以通过一次操作把这个字母变成相邻的字母。a和b相邻,b和c相邻,以此类推。特殊的࿰…...
AI会带给我们一个什么样的未来
AI到来的时代,很多人还没有意识到这一点,就是AI在新的时代不仅改变了游戏规则,还创造了一个全新的游戏规则。我们谁也不清楚接下来会发生什么? AI是否能够像人类一样看、听和说话,或者AI将永远改变企业的运作方式&…...
示例:在WPF中如何使用Segoe MDL2 Assets图标和使用该图标的好处
一、目的:分享在WPF中如何使用Segoe MDL2 Assets图标和使用该图标的好处 在WPF中使用Segoe MDL2 Assets字体,可以通过设置控件的FontFamily属性来实现。Segoe MDL2 Assets是一个包含许多图标的字体,通常用于Windows应用程序的图标显示。 二、…...
h5 IOS端渐变的兼容问题 渐变实现弧形效果
IOS端使用渐变的时候有兼容问题 以下是问题效果,图中黑色部分期望的效果应该是白色的。但是ios端是下面的样子…… 安卓pc 支持: background-image: radial-gradient(circle 40rpx at 100% 0, #f3630c 40rpx, rgb(255, 255, 255) 50%);安卓pc ios支持…...
Linux搜索---find
find搜索 find 命令的核心功能是在指定的目录路径下,递归地搜索文件和目录,并且可以根据多种条件对搜索结果进行筛选,还能对符合条件的文件和目录执行特定操作。 一、基础语法结构 find [起始目录] [匹配条件] [执行操作] # 基本示例 find…...
Libgdx游戏开发系列教程(4)——显示中文文字
目录 2种方法优缺点 BitmapFont FreeTypeFont 方法1 使用BitmapFont 1.下载hiero工具 2.生成fnt文件 3.代码使用 测试效果 方法2 使用FreeType 1.依赖引入 2.代码使用 测试效果 使用疑问点 这里主要介绍关于在Libgdx显示文字的2种方法 本文代码示例采用kotl…...
