当前位置: 首页 > article >正文

机器学习第十八讲:混淆矩阵 → 诊断模型在医疗检查中的误诊情况

机器学习第十八讲:混淆矩阵 → 诊断模型在医疗检查中的误诊情况

资料取自《零基础学机器学习》。
查看总目录:学习大纲

关于DeepSeek本地部署指南可以看下我之前写的文章:DeepSeek R1本地与线上满血版部署:超详细手把手指南


混淆矩阵是模型诊断的体检报告,能清晰展示分类模型的各种"误诊"类型[^8-1]。通过医疗检查案例详细说明:

一、核心概念(类似疫情筛查报告)

假设医院用AI模型检测1000份血样,实际有50人感染病毒:

实际阳性
实际阴性
实际阳性
实际阴性
预测阳性
真阳性TP
假阳性FP
预测阴性
假阴性FN
真阴性TN

示例数据
| | 实际感染 | 实际健康 |
|----------------|---------|---------|
| 预测感染 | TP=45 | FP=10 |
| 预测健康 | FN=5 | TN=940 | [2][4]

二、关键指标解读(医生最关注的4个数据)

  1. 假阳性(误诊):健康人被误判为感染者 → 造成过度治疗 [参考材料1]
  2. 假阴性(漏诊):感染者被误判为健康 → 导致疫情扩散 [参考材料6]
  3. 精确率 = TP/(TP+FP) = 45/55 ≈ 81.8% → 预测感染者的可信度 [参考材料2]
  4. 召回率 = TP/(TP+FN) = 45/50 = 90% → 真实感染者的检出率 [参考材料6]
模型捕捉到
模型漏掉
被误判
正确排除
总样本1000
实际感染50
实际健康950
TP=45
FN=5
FP=10
TN=940

三、医疗场景应用(新冠肺炎检测案例)

案例背景:CT影像AI诊断系统 [参考材料4]

  • 数据集:500张肺部CT(300新冠阳性,200阴性)
  • 模型预测结果:
    # 混淆矩阵数值
    [[275,  25],  # 真阳性275 | 假阳性25[ 15, 185]]  # 假阴性15 | 真阴性185
    

问题诊断

  1. 假阳性问题:25例健康人需复检 → 增加医疗资源消耗
  2. 假阴性危机:15例漏诊患者成为传染源 → 需提升模型灵敏度[^6]
  3. 平衡建议:调整阈值使FN<5,即使FP増至40 [参考材料6]

类比说明:就像机场安检,过分严格(低FP)会延误旅客,过于宽松(低FN)会放过危险品,需权衡两者[^8-1]

四、可视化呈现(热力图诊断)

原始预测
标准化评估
颜色映射
异常值定位

实操步骤

  1. 用seaborn绘制热力矩阵 [参考材料3]
    sns.heatmap([[275,25],[15,185]], annot=True, cmap="Blues") 
    
  2. 深色块表示问题区域:
    • 左下角(15):急需减少的漏诊病例
    • 右上角(25):可容忍的误诊误差[^4]

优化效果
调参后矩阵变为:

[[285, 35],[ 3, 177]]
  • 漏诊从15→3人,误诊从25→35人 → 更适合疫情管控 [参考材料6]

目录:总目录
上篇文章:机器学习第十七讲:PCA → 把100维数据压缩成3D视图仍保持主要特征
下篇文章:机器学习第十九讲:交叉验证 → 用五次模拟考试验证真实水平


[^8-1]《零基础学机器学习》第八章第一/二节评估指标
[2][3][4][6]参见医疗检测案例实践(《零基础学机器学习》心脏病预测章节)

相关文章:

机器学习第十八讲:混淆矩阵 → 诊断模型在医疗检查中的误诊情况

机器学习第十八讲&#xff1a;混淆矩阵 → 诊断模型在医疗检查中的误诊情况 资料取自《零基础学机器学习》。 查看总目录&#xff1a;学习大纲 关于DeepSeek本地部署指南可以看下我之前写的文章&#xff1a;DeepSeek R1本地与线上满血版部署&#xff1a;超详细手把手指南 混淆…...

Proxmox 主机与虚拟机全部断网问题排查与解决记录

Proxmox 主机与虚拟机全部断网问题排查与解决记录 关键词&#xff1a;Proxmox、e1000e、板载网卡、断网、网络桥接、Hardware Unit Hang、网卡挂死 背景 近期在使用 Proxmox VE 管理服务器时&#xff0c;遇到一个奇怪的问题&#xff1a;每当在某个虚拟机中执行某些操作&#x…...

力扣560.和为K的子数组

文章目录 题目介绍题解 题目介绍 题解 前缀和哈希表&#xff08;两数之和&#xff09;&#xff1a; 代码如下&#xff1a; class Solution {public int subarraySum(int[] nums, int k) {int n nums.length;int[] s new int[n 1];for (int i 0; i < n; i) {s[i 1] …...

MySQL——4、表的约束

表的约束 1、空属性2、默认值3、列描述4、zerofill5、主键6、自增长7、唯一键8、外键9、综合案例 真正约束字段的是数据类型&#xff0c;但是数据类型约束很单一&#xff0c;需要有一些额外的约束&#xff0c;更好的保证数据的合法性&#xff0c;从业务逻辑角度保证数据的正确性…...

新浪、京东golang一面整理

Mysql怎么去查询的&#xff0c;什么时候走索引&#xff0c;什么时候不走 微服务治理 我们要做到服务上下线对调用方无感知&#xff0c;熔断限流需要考虑&#xff0c;还要考虑监控和告警&#xff0c;链路追踪&#xff0c;安全&#xff0c;支持灰度发布、蓝绿部署、快速缩容扩容…...

Kotlin 协程 (二)

Kotlin 协程提供了丰富的功能&#xff0c;能够高效地处理并发和异步任务。以下是对 Kotlin 协程中常见概念和功能的详细讲解&#xff0c;包括它们的定义、作用、使用场景以及最佳实践。 1. 协程核心概念 1.1 CoroutineScope 定义&#xff1a;CoroutineScope 是协程作用域的抽…...

[250516] OpenAI 升级 ChatGPT:GPT-4.1 及 Mini 版上线!

目录 ChatGPT 迎来重要更新&#xff1a;GPT-4.1 和 GPT-4.1 mini 正式上线用户如何访问新模型&#xff1f;技术亮点与用户体验优化 ChatGPT 迎来重要更新&#xff1a;GPT-4.1 和 GPT-4.1 mini 正式上线 OpenAI 宣布在 ChatGPT 平台正式推出其最新的 AI 模型 GPT-4.1 和 GPT-4.…...

【完整版】基于laravel开发的开源交易所源码|BTC交易所/ETH交易所/交易所/交易平台/撮合交易引擎

功能说明 源码简介与安装环境说明&#xff1a; 开源交易所&#xff0c;基于laravel开发的交易所 | BTC交易所 | ETH交易所 | 交易所 | 交易平台 | 撮合交易引擎。本项目有完整的撮合交易引擎源码、后台管理&#xff08;后端前端&#xff09;、前台&#xff08;交易页面、活动页…...

Android Framework学习七:Handler、Looper、Message

文章目录 简介LooperMessageMessageQueueHandlerFramework学习系列文章 简介 Looper当做一台传送装置&#xff0c;MessageQueue是传送带&#xff0c;传送带上放的是Message&#xff0c;Handler用于发送Message分发与接收处理。 Looper frameworks/base/core/java/android/app…...

MyBatis:简化数据库操作的持久层框架

1、什么是Mybatis? MyBatis 本是apache的一个开源项目iBatis, 2010年这个项目由 apachesoftwarefoundation 迁移到了google code,由谷歌托管,并且改名为MyBatis 。 2013年11月迁移到Github。 iBATIS一词来源于“internet”和“abatis”的组合,是一个基于Java的持久层框…...

【001】RenPy打包安卓apk 流程源码级别分析

1. 入口在下图 2. SDK版本及代码入口 &#xff08;renpy-8.3.7-sdk&#xff09; 由于SDK一直在升级&#xff0c;本文采用 标题中的版本进行分析&#xff0c;整体逻辑变化不太大。 实际执行逻辑是调用的rapt 2.1 点击按钮实际执行逻辑 def AndroidIfState(state, needed, acti…...

物理信息神经网络(PINNs)在悬臂梁分析中的应用研究

一、引言 物理信息神经网络(Physics-Informed Neural Networks, PINNs)是近年来兴起的一种结合深度学习与传统物理建模的创新方法。本文将探讨PINNs在悬臂梁力学分析中的应用&#xff0c;展示如何利用这一技术解决工程力学中的经典问题。 二、PINNs基本原理 PINNs的核心思想是…...

论文浅尝 | HOLMES:面向大语言模型多跳问答的超关系知识图谱方法(ACL2024)

笔记整理&#xff1a;李晓彤&#xff0c;浙江大学硕士&#xff0c;研究方向为大语言模型 论文链接&#xff1a;https://arxiv.org/pdf/2406.06027 发表会议&#xff1a;ACL 2024 1. 动机 多跳问答&#xff08;Multi-Hop Question Answering, MHQA&#xff09;技术近年来在自然语…...

npm、pnpm、yarn 各自优劣深度剖析

在前端开发领域&#xff0c;包管理工具是开发者的得力助手&#xff0c;它们负责处理项目中的依赖安装、更新与管理。npm、pnpm、yarn 是目前最主流的三款包管理工具&#xff0c;它们在功能上有诸多相似之处&#xff0c;但在实际使用中又各有优劣。本文将结合包管理工具常见问题…...

jenkins使用Send build artifacts over SSH发布jar包目录配置

本测试用ruoyi-plus的代码。 1 [GitLab 自动触发 Jenkins 构建_jenkins构建触发器没有build when a change is pushed to git-CSDN博客](https://blog.csdn.net/wangyiyungw/article/details/81776972) 2 [jenkins使用Send build artifacts over SSH遇到的坑-CSDN博客](https…...

uni-app小程序登录后…

前情 最近新接了一个全新项目&#xff0c;是类似商城的小程序项目&#xff0c;我负责从0开始搭建小程序&#xff0c;我选用的技术栈是uni-app技术栈&#xff0c;其中就有一个用户登录功能&#xff0c;小程序部分页面是需要登录才可以查看的&#xff0c;对于未登录的用户需要引…...

【深度学习基础】从感知机到多层神经网络:模型原理、结构与计算过程全解析

【深度学习基础】从感知机到多层神经网络&#xff1a;模型原理、结构与计算过程全解析 1. 引言 神经网络的重要性&#xff1a; 作为人工智能的核心技术之一&#xff0c;神经网络通过模拟人脑神经元的工作机制&#xff0c;成为解决复杂模式识别、预测和决策任务的利器。从图像分…...

【Leetcode】取余/2的幂次方

给定一个非负整数 num&#xff0c;反复将各个位上的数字相加&#xff0c;直到结果为一位数。返回这个结果。 示例 1: 输入: num 38 输出: 2 解释: 各位相加的过程为&#xff1a; 38 --> 3 8 --> 11 11 --> 1 1 --> 2 由于 2 是一位数&#xff0c;所以返回 2。 …...

解决Power BI Desktop导入Excel数据第一行不是列标题问题

选中第一行不是列标题的表→鼠标右键→选择编辑查询→进入Power Query界面→点击“将第一行用作标题”→点击左边的“关闭并应用” 第一行就提升为标题了...

springboot3.x只需两步快速整合nacos作配置中心

一、下载依赖 我在网上找了各种资料&#xff0c;都是要先确定springcloud版本&#xff0c;实际操作却可能由于版本或者镜像或者maven等问题报红&#xff0c;出现各种情况。 实际只需要指定特定版本号就行&#xff0c;添加下面两个依赖 <dependency><groupId>com.…...

python如何遍历postgresql所有的用户表

要遍历PostgreSQL数据库中的所有用户表&#xff0c;可以按照以下步骤操作&#xff1a; 安装必要依赖库 pip install psycopg2-binary使用标准SQL查询方案&#xff08;推荐&#xff09; import psycopg2def list_user_tables():try:conn psycopg2.connect(host"your_ho…...

c/c++的opencv高斯模糊

深入探索图像高斯模糊&#xff1a;原理、C/C实现与OpenCV应用 在图像处理的众多技术中&#xff0c;模糊&#xff08;或平滑&#xff09;是最为基础且不可或缺的一环。它广泛应用于降噪、图像预处理、特征提取前的平滑以及计算机图形学中的各种视觉效果。在高斯模糊&#xff08…...

<uniapp><vuex><状态管理>在uniapp中,如何使用vuex实现数据共享与传递?

前言 本专栏是基于uniapp实现手机端各种小功能的程序&#xff0c;并且基于各种通讯协议如http、websocekt等&#xff0c;实现手机端作为客户端&#xff08;或者是手持机、PDA等&#xff09;&#xff0c;与服务端进行数据通讯的实例开发。 发文平台 CSDN 环境配置 系统&…...

Java Stream流:高效数据处理的现代解决方案

精心整理了最新的面试资料和简历模板&#xff0c;有需要的可以自行获取 点击前往百度网盘获取 点击前往夸克网盘获取 一、Stream流概述 Java 8引入的Stream API为集合操作带来了革命性改进&#xff0c;它结合Lambda表达式实现了声明式编程风格&#xff0c;支持并行处理&#…...

数据湖和数据仓库的区别

在当今数据驱动的时代&#xff0c;企业需要处理和存储海量数据。数据湖与数据仓库作为两种主要的数据存储解决方案&#xff0c;各自有其独特的优势与适用场景。本文将客观详细地介绍数据湖与数据仓库的基本概念、核心区别、应用场景以及未来发展趋势&#xff0c;帮助读者更好地…...

【论文阅读 | AAAI 2025 | FD2-Net:用于红外 - 可见光目标检测的频率驱动特征分解网络】

论文阅读 | AAAI 2025 | FD2-Net&#xff1a;用于红外 - 可见光目标检测的频率驱动特征分解网络 1.摘要&&引言2. 方法2.1总体架构2.2特征分解编码器2.3多模态重建机制2.4训练损失 3.实验3.1实验设置3.2主要结果3.3消融研究 4.结论 题目&#xff1a;FD2-Net: Frequency-…...

前端取经路——量子UI:响应式交互新范式

嘿&#xff0c;老铁们好啊&#xff01;我是老十三&#xff0c;一枚普通的前端切图仔&#xff08;不&#xff0c;开玩笑的&#xff0c;我是正经开发&#xff09;。最近前端技术简直跟坐火箭一样&#xff0c;飞速发展&#xff01;今天我就跟大家唠唠从状态管理到实时渲染&#xf…...

计算机视觉与深度学习 | matlab实现EMD-VMD-LSTM时间序列预测(完整源码和数据)

EMD-VMD-LSTM 一、完整代码实现二、代码结构说明三、关键参数说明四、注意事项五、典型输出示例以下是使用MATLAB实现EMD-VMD-LSTM时间序列预测的完整代码,包含数据生成、经验模态分解(EMD)、变分模态分解(VMD)、LSTM模型构建与预测分析。代码通过对比实验验证分解策略的有…...

济南国网数字化培训班学习笔记-第三组-1-电力通信传输网认知

电力通信传输网认知 电力通信基本情况 传输介质 传输介质类型&#xff08;导引与非导引&#xff09; 导引传输介质&#xff0c;如电缆、光纤&#xff1b; 非导引传输介质&#xff0c;如无线电波&#xff1b; 传输介质的选择影响信号传输质量 信号传输模式&#xff08;单工…...

OAT 初始化时出错?问题可能出在 PAM 配置上|OceanBase 故障排查实践

本文作者&#xff1a;爱可生数据库工程师&#xff0c;任仲禹&#xff0c;擅长故障分析和性能优化。 背景 某客户在使用 OAT 初始化OceanBase 服务器的过程中&#xff0c;进行到 precheck 步骤时&#xff0c;遇到了如下报错信息&#xff1a; ERROR - check current session ha…...