当前位置：首页 > article >正文

【流行病学】Melodi-Presto因果关联工具

article 2026/3/24 23:43:28

title: “[流行病学] Melodi Presto因果关联工具”
date: 2022-12-08
lastmod: 2022-12-08
draft: false
tags: [“流行病学”,“因果关联工具”]
toc: true
autoCollapseToc: true

阅读介绍

Melodi-Presto: A fast and agile tool to explore semantic triples derived from biomedical literature¹

triples: subject–predicate–object triple

SemMedDB 大型开放式知识库

使用入口

🚩在线工具 Web Application
API
Jupyter Notebooks

git 下载到json在提取

curl -X POST 'https://melodi-presto.mrcieu.ac.uk/api/overlap/' -H 'accept: application/json' -H 'Content-Type: application/json' -d '{ "x": [ "diabetes " ], "y": [ "coronary heart disease" ]}' > 1.json

使用示例

X: KRAS 
Y: lung cancer

输入的专业术语应该在Mesh先确定？？？

文章复现

doi: 10.1093/ije/dyab203²

{{< note >}} 1. 部分内容已经改变 2. Object的挑选精确到chronic 3. Predicate的挑选先无限制 4. Subject的挑选去掉了CRP,但是论文有纳入 5. OR的计算已经去掉？ 6. gtf基因和[Uniprot蛋白名库](https://www.uniprot.org/uniprotkb?facets=model_organism%3A9606&query=reviewed%3Atrue)删掉 7. +药物库？ {{< /note >}}

library(openxlsx)
# read
df <- read.xlsx("chronic kidney disease.xlsx",sheet = 1,  colNames=TRUE,check.names=FALSE )str(df$Pval)
df$Pval <- as.numeric(df$Pval)
# P value < 0.005
df <- subset(df,df$Pval < 0.005 )# removed triples where the subject was a gene or protein
df$Subject <- tolower(df$Subject)
a=stringr::str_which(df$Subject,pattern = "gene|protein|receptor")
# [waring:delete the CRP in the paper]
df$Subject[a]
df <- df[-a,]# where the term “CAUSES” implies causality, 
#   the term “ASSOCIATED_WITH” implies association, 
#   and the term “COEXISTS_WITH” implies co-existence. 
table(df$Predicate)
df <- subset(df,df$Predicate=="CAUSES"|df$Predicate=="ASSOCIATED_WITH"|df$Predicate=="COEXISTS_WITH")# restricted to triples 
# where the object contained either “kidney” or “renal”
table(df$Object)
dplyr::count(df,forcats::fct_lump_n(Object,n=10))
# 
df$Object <- tolower(df$Object)
b=stringr::str_which(df$Object,pattern = "kidney|renal")
df$Object[b]
df <- df[b,]# removed2 
df$Subject
c=stringr::str_which(df$Subject,pattern = "\\|")
df$Subject[c]
df <- df[-c,]
# 
df$Subject
c=stringr::str_which(df$Subject,pattern = "factor")
df$Subject[c]
df <- df[-c,]
# 
df$Subject
c=stringr::str_which(df$Subject,pattern = "peptide")
df$Subject[c]
df <- df[-c,]# retained only unique risk factors (subjects) 
#    to avoid duplicates
df <- dplyr::arrange(df,desc(Count),Pval)
df <- df[!duplicated(df$Subject),]table(df$Count)
# df <- subset(df,df$Count>2)write.xlsx(df, file = "筛选4.xlsx", colNames = TRUE)# enrichment odds ratio
#  (a) count the number of these triples 
#  (b) the number of total triples matched to the query 
#  (c) the total number of these triples in the data base , 
#  (d) and the total number of triples in the database .# stats.fisher_exact([[a, b-a], [c, d-c]])library(openxlsx)
# read
df <- read.xlsx("chronic kidney disease.xlsx",sheet = 1,  colNames=TRUE,check.names=FALSE )str(df$Pval)
df$Pval <- as.numeric(df$Pval)
# P value < 0.005
df <- subset(df,df$Pval < 0.005 )# removed triples where the subject was a gene or protein
df$Subject <- tolower(df$Subject)
a=stringr::str_which(df$Subject,pattern = "gene|protein|receptor")
# [waring:delete the CRP in the paper]
df$Subject[a]
df <- df[-a,]# where the term “CAUSES” implies causality, 
#   the term “ASSOCIATED_WITH” implies association, 
#   and the term “COEXISTS_WITH” implies co-existence. 
table(df$Predicate)
df <- subset(df,df$Predicate=="CAUSES"|df$Predicate=="ASSOCIATED_WITH"|df$Predicate=="COEXISTS_WITH")# restricted to triples 
# where the object contained either “kidney” or “renal”
table(df$Object)
dplyr::count(df,forcats::fct_lump_n(Object,n=10))
# 
df$Object <- tolower(df$Object)
b=stringr::str_which(df$Object,pattern = "kidney|renal")
df$Object[b]
df <- df[b,]# removed2 
df$Subject
c=stringr::str_which(df$Subject,pattern = "\\|")
df$Subject[c]
df <- df[-c,]
# 
df$Subject
c=stringr::str_which(df$Subject,pattern = "factor")
df$Subject[c]
df <- df[-c,]
# 
df$Subject
c=stringr::str_which(df$Subject,pattern = "peptide")
df$Subject[c]
df <- df[-c,]# retained only unique risk factors (subjects) 
#    to avoid duplicates
df <- dplyr::arrange(df,desc(Count),Pval)
df <- df[!duplicated(df$Subject),]table(df$Count)
# df <- subset(df,df$Count>2)write.xlsx(df, file = "筛选4.xlsx", colNames = TRUE)# enrichment odds ratio
#  (a) count the number of these triples 
#  (b) the number of total triples matched to the query 
#  (c) the total number of these triples in the data base , 
#  (d) and the total number of triples in the database .# stats.fisher_exact([[a, b-a], [c, d-c]])

NHANES

注意事项, 参考文章复现

doi: 10.1093/bioinformatics/btaa726 ↩︎
Trans-ethnic Mendelian-randomization
study reveals causal relationships between
cardiometabolic factors and chronic kidney
disease ↩︎

【流行病学】Melodi-Presto因果关联工具

title: “[流行病学] Melodi Presto因果关联工具” date: 2022-12-08 lastmod: 2022-12-08 draft: false tags: [“流行病学”,“因果关联工具”] toc: true autoCollapseToc: true 阅读介绍 Melodi-Presto: A fast and agile tool to explore semantic triples derived from …...

编程日记 2025/11/20 9:39:12

Stream在Swift 和 Flutter上的对比

Swift 和 Flutter 都是跨平台开发框架，它们各自提供了强大的工具来处理数据流，尤其是在移动应用开发中。虽然 Swift 主要用于 iOS 开发，而 Flutter 主要用于移动应用的开发（包括 iOS 和 Android），但它们各自…...

编程日记 2025/11/19 23:38:34

Vue3 TransitionGroup组件深入解析：结合Element Plus实践指南

引言在动态列表交互场景中，元素的增删排序需要优雅的过渡效果。Vue3的TransitionGroup组件为这类需求提供了专业解决方案。本文将通过Element Plus等流行UI库的实战案例，深入剖析TransitionGroup的应用技巧。一、TransitionGroup核心特性 1.1 与Tran…...

编程日记 2025/7/6 1:36:45

关于opencv中solvepnp中UPNP与DLS与EPNP的参数

The methods SOLVEPNP_DLS and SOLVEPNP_UPNP cannot be used as the current implementations are unstable and sometimes give completely wrong results. If you pass one of these two flags, SOLVEPNP_EPNP method will be used instead.、由于当前的实现不稳定&#x…...

编程日记 2025/7/6 21:59:35

Versal - XRT（CPP） 2024.1

目录 1.简介 2. XRT 2.1 XRT vs OpenCL 2.2 Takeways 2.3 XRT C APIs 2.4 Device and XCLBIN 2.5 Buffers 2.5.1 Buffer 创建 2.5.1.1 普通 Buffer 2.5.1.2 特殊 Buffer 2.5.1.3 用户指针 Buffer 2.5.2 Data Transfer 2.5.2.1 read/write API 2.5.2.2 map API 2…...

编程日记 2026/3/23 7:37:48

【零基础到精通Java合集】第十八集：多线程与并发编程-线程池与Callable/Future应用

课程标题：线程池与Callable/Future应用（15分钟）目标：掌握线程池的创建与管理，理解Callable任务与Future异步结果处理机制 0-1分钟：课程引入与线程池意义以“银行窗口服务”类比线程池：复用固定资源（柜员）处理多任务（客户）。说明线程池的核心价值——避免频繁创建…...

编程日记 2026/3/20 7:50:37

windows下安装Open Web UI

windows下安装openwebui有三种方式,docker,pythonnode.js,整合包. 这里我选择的是第二种,非docker. 非Docker方式安装 1. 安装Python： 下载并安装Python 3.11，建议安装路径中不要包含中文字符，并勾选“Add python 3.11 to Path”选项。安…...

编程日记 2026/3/23 12:09:45

【自用】NLP算法面经（4）

一、deepseek 1、MLA （1）LLM推理过程 prefill阶段：模型对全部的prompt tokens一次性并行计算，最终生成第一个输出token。decode阶段：每次生成一个token，直到生成EOS（end-of-sequence&#xf…...

编程日记 2026/3/13 7:16:20

LeetCode热题100JS（20/100）第四天|41. 缺失的第一个正数|73. 矩阵置零|54. 螺旋矩阵|48. 旋转图像

41. 缺失的第一个正数题目链接：41. 缺失的第一个正数难度：困难刷题状态：1刷新知识： 解题过程思考示例 1： 输入：nums [1,2,0] 输出：3 解释：范围 [1,2] 中的数字都在数组中…...

编程日记 2026/3/21 6:17:50

【银河麒麟高级服务器操作系统实际案例分享】数据库资源重启现象分析及处理全过程

更多银河麒麟操作系统产品及技术讨论，欢迎加入银河麒麟操作系统官方论坛 https://forum.kylinos.cn 了解更多银河麒麟操作系统全新产品，请点击访问麒麟软件产品专区：https://product.kylinos.cn 开发者专区：https://developer…...

编程日记 2026/3/16 22:40:57

开源架构与人工智能的融合：开启技术新纪元

最近五篇文章推荐： 开源架构的自动化测试策略优化版（New） 开源架构的容器化部署优化版（New） 开源架构的微服务架构实践优化版（New） 开源架构中的数据库选择优化版（New） 开…...

编程日记 2026/3/16 20:32:29

缓存那些事儿

为什么要使用缓存性能我们在碰到需要执行耗时特别久，且结果不频繁变动的SQL，就特别适合将运行结果放入缓存。这样，后面的请求就去缓存中读取，使得请求能够迅速响应。并发在大并发的情况下，所有的请求直接访问数…...

编程日记 2025/7/5 18:51:46

【弹性计算】弹性裸金属服务器和神龙虚拟化（二）：适用场景

《弹性裸金属服务器》系列，共包含以下文章： 弹性裸金属服务器和神龙虚拟化（一）：功能特点弹性裸金属服务器和神龙虚拟化（二）：适用场景弹性裸金属服务器和神龙虚拟化（三&a…...

编程日记 2026/3/24 22:14:13

通往 AI 之路：Python 机器学习入门-语法基础

第一章 Python 语法基础 Python 是一种简单易学的编程语言，广泛用于数据分析、机器学习和人工智能领域。在学习机器学习之前，我们需要先掌握 Python 的基本语法。本章将介绍 Python 的变量与数据类型、条件语句、循环、函数以及文件操作，帮助…...

编程日记 2025/7/6 4:28:58

FastGPT 引申：信息抽取到知识图谱的衔接流程

文章目录信息抽取到知识图谱的衔接流程步骤1：原始信息抽取结果步骤2：数据标准化处理（Python示例）步骤3：Cypher代码动态生成（Python驱动） 关键衔接逻辑说明1. 唯一标识符生成规则2. 数据映射策略…...

编程日记 2026/1/7 11:59:01

计算机毕业设计SpringBoot+Vue.js保险合同管理系统(源码+文档+PPT+讲解)

温馨提示：文末有 CSDN 平台官方提供的学长联系方式的名片！ 温馨提示：文末有 CSDN 平台官方提供的学长联系方式的名片！ 温馨提示：文末有 CSDN 平台官方提供的学长联系方式的名片！ 作者简介：Java领…...

编程日记 2026/3/16 21:21:22

58、深度学习-自学之路-自己搭建深度学习框架-19、RNN神经网络梯度消失和爆炸的原因（从公式推导方向来说明），通过RNN的前向传播和反向传播公式来理解。

一、RNN神经网络的前向传播图如下： 时间步 t1: x₁ → (W_x) → [RNN Cell] → h₁ → (W_y) → y₁ ↑ (W_h) h₀ (初始隐藏状态) 时间步 t2: x₂ → (W_x) → [RNN Cell] → h₂ → (W_y) → y₂ ↑ (W_h) h₁ 时间…...

编程日记 2026/3/19 2:04:46

什么是 Cholesky 分解？兼谈正定矩阵和二次型

Cholesky 分解在深度学习中的应用与理解 Cholesky 分解是一种用于对称正定矩阵的特殊分解方法，在线性代数和概率模型中有广泛应用。对于深度学习研究者来说，理解 Cholesky 分解不仅有助于掌握矩阵运算的理论基础，还能在高斯过程、变分方法&a…...

编程日记 2026/1/29 15:07:05

在单位，领导不说，但自己得懂的7个道理

如果你感到很难继续适应旧模式、旧关系、旧想法，开始厌倦生活，你很可能到了该蜕皮的时候。把“不是自己”的那部分舍弃掉，你就能看见“自己是谁”了。 ——奥赞瓦罗尔，《读者》2024年第11期前几天听部门里一个新来的小姑娘抱怨&a…...

编程日记 2026/2/3 10:42:57

bge-large-zh-v1.5 与Pro/BAAI/bge-m3 区别

ge-large-zh-v1.5 和 Pro/BAAI/bge-m3 是两种不同的模型，主要区别在于架构、性能和应用场景。以下是它们的对比： 1. 模型架构 bge-large-zh-v1.5： 基于Transformer架构，专注于中文文本的嵌入表示。参数量较大，适合处…...

编程日记 2026/3/16 20:32:59

lamp平台介绍

一、lamp介绍网站： 静态动态 php语言 .php 作用：运行php语言编写动态网站应用 lamp Linux Apache MySQL PHP PHP是作为httpd的一个功能模块存在的二、部署lamp平台 1、测试httpd是否可正常返回PHP的响应 2、测试PHP代码是否可正常连接数据…...

编程日记 2026/3/16 20:33:26

Windows10系统构建本地安全私有化的个人知识库——采用DeepSeek+RAGFlow

一、为什么要构建本地私有化个人知识库 1.1、自身需求 1、需要相关隐私资料内容的安全保护可控； 2、需要根据自身的隐私资料内容构建出个性化的知识库；一些常见的业务场景如：①希望我们的智能助手可以根据公司的管理制度回答问题，让员工可以随时了解公司相关制度内容信息；…...

编程日记 2026/3/18 6:38:06

Linux: Centos7 Cannot find a valid baseurl for repo: base/7/x86_64 解决方案

Linux: Centos7 Cannot find a valid baseurl for repo: base/7/x86_64 解决方案问题背景： 执行yum update出现如下报错排查虚拟机是否联网： ping -c 4 www.baidu.com 可以看到网络链接没有问题解决方案： 原因是国外的镜像源有问题&am…...

编程日记 2026/3/16 20:32:56

Java 大视界 -- Java 大数据在智能金融反欺诈中的技术实现与案例分析（114）

💖亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也…...

编程日记 2026/3/16 20:32:37

每日OJ_牛客_游游的字母串_枚举_C++_Java

目录牛客_游游的字母串_枚举题目解析 C代码 Java代码牛客_游游的字母串_枚举游游的字母串描述： 对于一个小写字母而言，游游可以通过一次操作把这个字母变成相邻的字母。a和b相邻，b和c相邻，以此类推。特殊的&#xff0…...

编程日记 2026/3/16 3:11:16

AI会带给我们一个什么样的未来

AI到来的时代，很多人还没有意识到这一点，就是AI在新的时代不仅改变了游戏规则，还创造了一个全新的游戏规则。我们谁也不清楚接下来会发生什么？ AI是否能够像人类一样看、听和说话，或者AI将永远改变企业的运作方式&…...

编程日记 2026/2/19 6:09:02

示例：在WPF中如何使用Segoe MDL2 Assets图标和使用该图标的好处

一、目的：分享在WPF中如何使用Segoe MDL2 Assets图标和使用该图标的好处在WPF中使用Segoe MDL2 Assets字体，可以通过设置控件的FontFamily属性来实现。Segoe MDL2 Assets是一个包含许多图标的字体，通常用于Windows应用程序的图标显示。二、…...

编程日记 2026/3/24 16:49:32

h5 IOS端渐变的兼容问题渐变实现弧形效果

IOS端使用渐变的时候有兼容问题以下是问题效果，图中黑色部分期望的效果应该是白色的。但是ios端是下面的样子…… 安卓pc 支持： background-image: radial-gradient(circle 40rpx at 100% 0, #f3630c 40rpx, rgb(255, 255, 255) 50%);安卓pc ios支持…...

编程日记 2026/3/24 22:14:09

Linux搜索---find

find搜索 find 命令的核心功能是在指定的目录路径下，递归地搜索文件和目录，并且可以根据多种条件对搜索结果进行筛选，还能对符合条件的文件和目录执行特定操作。一、基础语法结构 find [起始目录] [匹配条件] [执行操作] # 基本示例 find…...

编程日记 2026/2/5 14:44:41

Libgdx游戏开发系列教程(4)——显示中文文字

目录 2种方法优缺点 BitmapFont FreeTypeFont 方法1 使用BitmapFont 1.下载hiero工具 2.生成fnt文件 3.代码使用测试效果方法2 使用FreeType 1.依赖引入 2.代码使用测试效果使用疑问点这里主要介绍关于在Libgdx显示文字的2种方法本文代码示例采用kotl…...

编程日记 2026/3/24 22:14:10

title: “[流行病学] Melodi Presto因果关联工具” date: 2022-12-08 lastmod: 2022-12-08 draft: false tags: [“流行病学”,“因果关联工具”] toc: true autoCollapseToc: true