当前位置：首页 > news >正文

决策曲线分析（DCA）中平均净阈值用于评价模型算法（R自定义函数）

news 2026/2/11 0:17:14

决策曲线分析（DCA）中平均净阈值用于评价模型算法

DCA分析虽然不强调用来评价模型算法或者变量组合的优劣，但是实际应用过程中感觉DCA曲线的走势和模型的效能具有良好的一致性，其实这种一致性也可以找到内在的联系，比如通过净阈值的计算公式可以知道净阈值的大小与真阳性率有密切的关系，而真阳性率和模型的效能也有一致性。

如果想用DCA曲线来挑选算法或者变量组合，有一个定量的指标就更加方便一些，这就有了为DCA曲线找一个定量指标的想法。

1. 微积分法

曲线下面积可能是比较直观的一种方法，首先想到的是用微积分的方法计算DCA曲线下面积，代码如下。因为对微积分并不熟悉，加上计算出的结果还会有负值的情况，所以不是太确定代码的正确性，大家谨慎采用。

WA_NBC <- function(df, pred, real, integration_limits = c(0, 1), prevalence) {# 内部函数计算净获益calculate_nbc <- function(pt) {# NBC函数的代码tp <- sum(df[[pred]] >= pt & df[[real]] == 1)fp <- sum(df[[pred]] >= pt & df[[real]] == 0)net_benefit <- tp/nrow(df) - fp/nrow(df) * pt/(1-pt)if (!is.null(prevalence)) {net_benefit <- net_benefit / prevalence}return(net_benefit)}# 计算加权平均净获益integrand <- function(x) {calculate_nbc(x)}integral_result <- stats::integrate(integrand, lower = integration_limits[1], upper = integration_limits[2])wa_nbc <- integral_result$value / diff(integration_limits)return(wa_nbc)
}

2. 净收益平均法

这种方法是计算指定阈值范围内的净阈值然后求平均。感觉更好理解一些，但是似乎技术含量低些。

library(purrr)mean_benefit <- function(df, pred, real, integration_limits = c(0, 1), prevalence) {calculate_nbc <- function(pt) {# NBC函数的代码tp <- sum(df[[pred]] >= pt & df[[real]] == 1)fp <- sum(df[[pred]] >= pt & df[[real]] == 0)net_benefit <- tp/nrow(df) - fp/nrow(df) * pt/(1-pt)if (!is.null(prevalence)) {net_benefit <- net_benefit / prevalence}return(net_benefit)}# 使用map_dbl对每个阈值计算净获益net_benefits <- map_dbl(seq(integration_limits[1], integration_limits[2], by = 0.01), ~ calculate_nbc(.x))# 计算加权平均净获益mean(net_benefits)
}

初步测试感觉在一定程度上能达到设计的目的，能反映变量组合之间的优劣（如下图），但是也有不好解释的地方，比如计算出的绝对值有没有意义，欢迎大家测试反馈。在和鲸社区上有一个项目可以进行体验和测试，包含了数据和代码。
在这里插入图片描述

决策曲线分析（DCA）中平均净阈值用于评价模型算法（R自定义函数）

决策曲线分析（DCA）中平均净阈值用于评价模型算法

1. 微积分法

2. 净收益平均法

相关文章：

决策曲线分析（DCA）中平均净阈值用于评价模型算法（R自定义函数）

《经验分享 · 软考系统分析师》

记录一下 js encodeURI和encodeURIComponent URL转码问题

【C语言】二维前缀和/求子矩阵之和

SRS 服务器入门：实时流媒体传输的理想选择

【ETCD】【源码阅读】configurePeerListeners() 函数解析

1_ssrf总结

深入解析 Redis

Visual Studio 2022发布UWP应用证书绑定失败

K8S对接ceph的RBD块存储

ragflow连不上ollama的解决方案

ACL与Prefix List（前缀列表）

OpenSSH和OpenSSL升级

数据库继续学习

车载以太网-UDPNM

网页核心页面设计（第8章）

在PowerShell下运行curl命令出现错误：Invoke-WebRequest : 无法处理参数，因为参数名称“u”具有二义性

医疗花费预测——协方差矩阵和热力图

react antd tabs router 基础管理后台模版

【数据结构——栈与队列】环形队列的基本运算（头歌实践教学平台习题）【合集】

通过Wrangler CLI在worker中创建数据库和表

【大模型RAG】Docker 一键部署 Milvus 完整攻略

selenium学习实战【Python爬虫】

Java毕业设计：WML信息查询与后端信息发布系统开发

免费PDF转图片工具

【从零学习JVM|第三篇】类的生命周期(高频面试题)

（一）单例模式

SQL Server 触发器调用存储过程实现发送 HTTP 请求

LangChain 中的文档加载器（Loader）与文本切分器（Splitter）详解《二》

在RK3588上搭建ROS1环境：创建节点与数据可视化实战指南