当前位置: 首页 > news >正文

5.12.1 Detecting and classifying lesions in mammograms with Deep Learning

计算机辅助检测 (CAD) 系统的开发是为了帮助放射科医生分析筛查性乳房 X 光检查,深度 CNN 有可能彻底改变医学图像分析。我们提出了一种基于最成功的对象检测框架之一 Faster R-CNN 的 CAD 系统。该系统无需任何人为干预即可检测乳房 X 光照片上的恶性或良性病变并对其进行分类。

Region-based Convolutional Neural Networks,是一种基于卷积神经网络(CNN)的目标检测算法。

R-CNN的基本思想是使用选择性搜索算法或其他方法在输入图像中选取候选区域(Region of Interest,RoI),然后对每个RoI分别进行CNN的特征提取和分类。

 筛查乳房X光检查

在标准乳房 X 光筛查检查期间,从每个乳房的 2 个角度捕获 X 射线图像。这些图像由一到两名经验丰富的放射科医生检查是否存在恶性病变。可疑病例被召回以进行进一步的诊断评估。

双重读数可以提高乳房X线照相评估的性能,最多可超过 10 个读数器,这证明乳房 X 光检查评估除了双重读数之外还有改进的空间。

双重读数(或称双重阅片)在乳房X线照相(乳腺X线摄影)评估中,指的是同一份X线图像由两位或更多的专业医生或技师进行独立解读和分析,以确保诊断的准确性和一致性。

数字乳房X线(数据科学竞赛)

要求参与者编写算法,可以预测筛查性乳房 X 线摄影检查中的乳房是否会被诊断为癌症。该数据集由 86000 次检查组成,没有像素级注释,只有一个二进制标签,指示检查后的未来 12 个月内是否诊断出乳腺癌。乳房的每一侧都被视为单独的案例。

材料和方法数据

需要具有像素级注释的乳房 X 光照片来训练病变检测器并测试分类和定位性能。在公共乳腺筛查数字数据库 (DDSM) 和布达佩斯 Semmelweis 大学的数据集上训练了模型,并在公共 INbreast 数据集上对其进行了测试。

用于训练的图像包含组织学证明的癌症或良性病变,这些图像被召回进行进一步检查,但后来证明是非恶性的。

DDSM 数据集包含 2620 个数字化胶片屏幕筛查乳房 X 线摄影检查,以及病变的像素级实况注释。癌性病变有组织学证据。我们仅使用 DDSM 数据库来训练我们的模型,而不是对其进行评估。数字化胶片屏幕乳房 X 光检查的质量不如全视野数字乳房 X 光检查,因此对这些病例的评估不相关。我们将无损 jpeg 图像转换为 png 格式,使用 DDSM 网站的校准函数将像素值映射到光密度,并将像素值重新调整到 0-255 范围。

匈牙利布达佩斯 Semmelweis 大学放射科的数据集包含 174 名患者 214 次检查的 847 张 FFDM 图像。

INbreast 数据集包含 115 个 FFDM 病例,带有像素级地面实况注释以及癌症的组织学证据。我们调整了 INbreast 像素级注释以适应我们的测试场景。我们忽略所有良性注释,并将恶性病变注释转换为边界框。

FFDM病例是指利用全视野数字乳房X光片(Full-Field Digital Mammography)进行乳腺摄影的病例

方法

模型的核心是最先进的目标检测框架 Faster R-CNN。Faster R-CNN 基于卷积神经网络,具有用于检测、定位和分类图像中的对象的附加组件。

Faster R-CNN 在原始网络的最后一个卷积层之上有一个称为区域提议网络 (RPN) 的卷积层        分支,该分支经过训练以检测和定位图像上的对象,无论对象的类别如何。它使用不同大小和纵横比的默认检测框来查找不同大小和形状的对象。得分最高的默认框称为网络其他分支的区域提议

区域提议是一个重要的概念。它通常指的是从图像中生成一系列候选区域,这些区域可能包含目标对象。这些候选区域随后会被进一步处理,以确定它们是否确实包含目标,并对目标进行定位和分类。

神经网络的另一个分支用来评估来自最后一个卷积层的每个建议区域的信号,该信号被重新采样到固定大小。两个分支都尝试解决分类任务以检测对象的存在,以及边界框回归任务以细化区域中存在的对象的边界。从检测到的重叠对象中,使用非极大值抑制选择最佳预测。

非极大值抑制(Non-Maximum Suppression,NMS)是一种在图像处理和目标检测中广泛应用的技术。其基本思想是抑制不是极大值的元素,可以理解为局部最大搜索。

在目标检测任务中,NMS的主要作用是去除检测出来的冗余框,只保留最有可能包含目标物体的框,从而保留最优的检测结果。

Faster R-CNN 模型

模型中使用的基础 CNN 是 VGG16 网络,它是 16 层深的 CNN。最后一层可以检测图像中的两种对象:良性或恶性病变。该模型的输出是每个检测到的病变的边界框和一个分数,该分数反映了病变类别的置信度。

病变类别的置信度中的“置信度”指的是对模型预测或分类结果的可靠程度或可信度的度量。它通常表示为0到1之间的数字,其中1表示完全置信,0则表示完全不置信。

为了用一个分数来描述一张图像,我们计算图像中检测到的所有恶性病变的分数的最大值。对于同一乳房的多个图像,我们取各个图像分数的平均值。

在训练过程中,我们同时优化模型的目标检测和分类器部分,称为联合优化。我们使用反向传播和带有权重衰减的随机梯度下降。用于训练的初始模型是在 ImageNet 数据集的 120 万张图像上进行预训练的。

乳房 X 光照片被等比例缩放(isotropically downscaled),使得它们的长边小于2100像素,而短边小于1700像素。该分辨率接近所用显卡内存的最大尺寸。选择长宽比以适应 Hologic 图像的常规长宽比。更高的分辨率会产生更好的结果。

Hologic乳腺钼靶X线摄影系统也是一种常用的乳腺检查设备。它能够生成高分辨率的乳腺图像,有助于医生发现乳腺疾病,特别是乳腺癌的早期病变。

应用垂直和水平翻转来增强训练数据集。乳房 X 光照片包含的对象比普通图像少,并且在训练行为的初始检查过程中,我们在小批量中观察到病理性的阳性区域很少。为了解决类平衡问题,我们将 区域提议网络 中前景对象的交并集 (IoU) 阈值从 0.7 降低到 0.5。这种选择允许在小批量中提供更多正面示例,并有效地稳定训练。

IoU,即交并比,用于量化预测边界框或分段区域与真实边界框或注释区域之间的重叠程度。如果预测的边界框与真实边界框的IoU高于或等于这个阈值,通常认为该预测是正确的;否则,它会被视为误检。

与普通图像相比,乳房 X 光照片代表压缩且相对较薄的 3D 空间,因此预计重叠检测的发生频率低于通常的目标检测。

乳房X光照片是通过将乳房组织压缩在一个相对较薄的层面内进行成像的。这种压缩使得乳房组织的不同部分在二维平面上得以展现,从而减少了组织之间的重叠。

相关文章:

5.12.1 Detecting and classifying lesions in mammograms with Deep Learning

计算机辅助检测 (CAD) 系统的开发是为了帮助放射科医生分析筛查性乳房 X 光检查,深度 CNN 有可能彻底改变医学图像分析。我们提出了一种基于最成功的对象检测框架之一 Faster R-CNN 的 CAD 系统。该系统无需任何人为干预即可检测乳房 X 光照片上的恶性或良性病变并对…...

Python爬虫——如何使用urllib的HTTP基本库

怎样通过 urllib库 发送 HTTP 请求? urllib库主要由四个模块组成: urllib.request 打开和读取 URLurllib.error 包含 urllib.request 抛出的异常urllib.parse 用于解析 URLurllib.robotparser 用于解析 robots.txt 文件 1. 使用urllib.parse解析URL 使用urlparse(…...

OceanBase v4.3特性解析:新功能“租户克隆”的场景与应用指南

熟悉或曾用过OceanBase的朋友,对于“多租户”这一理念定不陌生。OceanBase的租户概念,与我们熟知的传统数据库实例颇为相似。举例来说,OceanBase的租户支持MySQL兼容模式,对于用户而言,选用一个MySQL兼容模式的租户&am…...

RS3236-3.3YUTDN4功能和参数介绍及PDF资料

RS3236-3.3YUTDN4功能和参数介绍及PDF资料-公司新闻-配芯易-深圳市亚泰盈科电子有限公司 品牌: RUNIC(润石) 封装: XDFN-4-EP(1x1) 描述: 带过温保护 输出类型: 固定 最大输入电压: 7.5V 输出电压: 3.3V 最大输出电流: 500mA RS3236-3.3YUTDN4 是一款低压差线性稳压器&#x…...

Vue如何引入公用方法

文章目录 1. 在全局范围内引入2. 在单文件组件中引入3. 使用Vuex或Vue Composition API4. 使用mixins5. 使用插件 1. 在全局范围内引入 在你的main.js或main.ts文件中引入并注册你的公用方法,使得它们可以在整个Vue应用中使用。 // 引入你的公用方法文件 import {…...

Java面试题:ConcurrentHashMap

ConcurrentHashMap 一种线程安全的高效Map集合 jdk1.7之前 底层采用分段的数组链表实现 一个不可扩容的数组:segment[] 数组中的每个元素都对应一个HashEntry数组用以存放数据 当放入数据时,根据key的哈希值找到对应的segment数组下标 找到下标后就会添加一个reentrantlo…...

现在闪侠惠递寄快递有福利了,千万不要因没把握住而后悔呀!

闪侠惠递平台寄快递现在真的是太便宜了,优惠价格把握不住,后悔都来不及!大家可以在闪侠惠递上面寄快递,价格真的非常优惠呢,比咱们平常寄快递的价格都优惠呢,真的,小编都亲自替大家尝试过了呢。…...

vue+ant-design+formBuiler表单构建器——技能提升——form design——亲测有效

最近看到后端同事在弄一个后台管理系统,额,前端真的是夹缝中生存啊,AI抢饭碗,后端也想干前端的活儿。。。 他用到了表单构建器,具体效果如下: 网上有很多适用于ElementUi和ant-design的form design插件,下…...

Git 如何管理标签命令(tag)

1.查看本地仓库tag --1.查看本地仓库tag UserDESKTOP-2NRT2ST MINGW64 /e/GITROOT/STARiBOSS/STARiBOSS-5GCA (gw_frontend_master) $ git tag 1stBossUpgrade V10.0.1_20220224_test V10.0.1_20220301_test tag-gwfrontend-V1.0.12-230625 tag-gw_frontend-23.08.29 tag-gw_f…...

零样本身份保持:ID-Animator引领个性化视频生成技术新前沿

在最新的研究进展中,由Xuanhua He及其团队提出的ID-Animator技术,为个性化视频生成领域带来了突破性的创新。这项技术的核心在于其零样本(zero-shot)人物视频生成方法,它允许研究者和开发者根据单一的参考面部图像生成…...

在Go语言中,可以这样使用Json

在Go语言中,处理JSON数据通常涉及编码(将Go结构体转换为JSON字符串)和解码(将JSON字符串转换为Go结构体)。Go标准库中的encoding/json包提供了这些功能。第三方插件可以使用"github.com/goccy/go-json"也有同…...

React useEffect Hook: 理解和解决组件双重渲染问题

在React中,useEffect可能会在组件的每次渲染后运行,这取决于它的依赖项。如果你发现useEffect运行了两次,并且你正在使用React 18或更高版本的严格模式(Strict Mode),这可能是因为在开发模式下,…...

【C语言】—— 动态内存管理

【C语言】——动态内存管理 一、动态内存管理概述1.1、动态内存的概念1.2、动态内存的必要性 二、 m a l l o c malloc malloc 函数2.1、函数介绍2.2、应用举例 三、 c a l l o c calloc calloc 函数四、 f r e e free free 函数4.1、函数介绍4.2、应用举例 五、 r e a l l o …...

Oracle到PostgreSQL的不停机数据库迁移

1970 年,数据库之父 Edgar Frank Codd 发表了“数据的关系模型”论文,该论文为往后的关系型数据库的发展奠定了基础。1979 年,基于关系模型理论的数据库产品 Oracle 2 首次亮相,并在过去的三四十年时间里,横扫全球数据…...

OpenAI 发布新款大型语言模型 GPT-4o,带大家了解最新ChatGPT动态。

OpenAI 发布新款大型语言模型 GPT-4o 昨日OpenAI 举办了一场线上活动,正式发布了其最新研发的 AI 模型 GPT-4o,并详细介绍了该模型的强大功能和未来发展规划。此次发布标志着 AI 技术的重大突破,为用户提供了更加便捷、高效的 AI 工具&#…...

网络编程套接字(一) 【简单的Udp网络程序】

网络编程套接字<一> 理解源端口号和目的端口号PORT VS PID认识TCP协议和UDP协议网络字节序socket编程接口sockaddr结构简单的UDP网络程序服务端创建套接字服务端绑定运行服务器客户端创建套接字关于客户端的绑定问题启动客户端启动客户端本地测试INADDR_ANY 理解源端口号…...

【CANoe】CAPL中生成报告常用的测试函数

文章目录 一、常用函数1、测试标题、描述、Comment2、测试步骤3、延时4、报告中插入图片5、报告中插入窗口截图二、实例源码三、报告效果一、常用函数 1、测试标题、描述、Comment testCaseTitle("TC 3.1", "Test Case 3.1"); testCaseDescription...

WEB后端复习——MVC、SSM【含登录页面代码】

MVC&#xff08;Model-View-Controller&#xff09;是一种软件设计模式&#xff0c;用于将应用程序分解为三个相互关联的组件&#xff1a;模型&#xff08;Model&#xff09;、视图&#xff08;View&#xff09;和控制器&#xff08;Controller&#xff09;。这种模式在构建用户…...

灵卡科技HDMI音视频采集及H.264编码一体化采集卡—LCC260

推荐一款由灵卡科技倾力打造的高品质HDMI音视频采集卡——LCC260。以创新的技术&#xff0c;精湛的工艺和卓越的性能&#xff0c;为您提供全方位的音视频解决方案。 LCC260是一款集HDMI音视频采集与H.264编码于一身的全功能采集卡。它的输入端配备了最先进的HDMI 1.4a标准接口&…...

智能自助终端主板RK3288/RK3568在酒店前台自助机方案的应用,支持鸿蒙,支持免费定制

酒店前台自助机解决方案是一款基于自助服务终端&#xff0c;能够让客人通过简单的操作完成入住登记/退房的解决方案&#xff0c;大幅提高酒店的工作效率&#xff0c;提升客人体验&#xff0c;降低人力成本。 该方案解决了以下传统前台登记入住方式的痛点&#xff1a; 1、人流量…...

网络编程(Modbus进阶)

思维导图 Modbus RTU&#xff08;先学一点理论&#xff09; 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议&#xff0c;由 Modicon 公司&#xff08;现施耐德电气&#xff09;于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…...

Android Wi-Fi 连接失败日志分析

1. Android wifi 关键日志总结 (1) Wi-Fi 断开 (CTRL-EVENT-DISCONNECTED reason3) 日志相关部分&#xff1a; 06-05 10:48:40.987 943 943 I wpa_supplicant: wlan0: CTRL-EVENT-DISCONNECTED bssid44:9b:c1:57:a8:90 reason3 locally_generated1解析&#xff1a; CTR…...

<6>-MySQL表的增删查改

目录 一&#xff0c;create&#xff08;创建表&#xff09; 二&#xff0c;retrieve&#xff08;查询表&#xff09; 1&#xff0c;select列 2&#xff0c;where条件 三&#xff0c;update&#xff08;更新表&#xff09; 四&#xff0c;delete&#xff08;删除表&#xf…...

C++:std::is_convertible

C++标志库中提供is_convertible,可以测试一种类型是否可以转换为另一只类型: template <class From, class To> struct is_convertible; 使用举例: #include <iostream> #include <string>using namespace std;struct A { }; struct B : A { };int main…...

三维GIS开发cesium智慧地铁教程(5)Cesium相机控制

一、环境搭建 <script src"../cesium1.99/Build/Cesium/Cesium.js"></script> <link rel"stylesheet" href"../cesium1.99/Build/Cesium/Widgets/widgets.css"> 关键配置点&#xff1a; 路径验证&#xff1a;确保相对路径.…...

基于Uniapp开发HarmonyOS 5.0旅游应用技术实践

一、技术选型背景 1.跨平台优势 Uniapp采用Vue.js框架&#xff0c;支持"一次开发&#xff0c;多端部署"&#xff0c;可同步生成HarmonyOS、iOS、Android等多平台应用。 2.鸿蒙特性融合 HarmonyOS 5.0的分布式能力与原子化服务&#xff0c;为旅游应用带来&#xf…...

跨链模式:多链互操作架构与性能扩展方案

跨链模式&#xff1a;多链互操作架构与性能扩展方案 ——构建下一代区块链互联网的技术基石 一、跨链架构的核心范式演进 1. 分层协议栈&#xff1a;模块化解耦设计 现代跨链系统采用分层协议栈实现灵活扩展&#xff08;H2Cross架构&#xff09;&#xff1a; 适配层&#xf…...

Robots.txt 文件

什么是robots.txt&#xff1f; robots.txt 是一个位于网站根目录下的文本文件&#xff08;如&#xff1a;https://example.com/robots.txt&#xff09;&#xff0c;它用于指导网络爬虫&#xff08;如搜索引擎的蜘蛛程序&#xff09;如何抓取该网站的内容。这个文件遵循 Robots…...

视频行为标注工具BehaviLabel(源码+使用介绍+Windows.Exe版本)

前言&#xff1a; 最近在做行为检测相关的模型&#xff0c;用的是时空图卷积网络&#xff08;STGCN&#xff09;&#xff0c;但原有kinetic-400数据集数据质量较低&#xff0c;需要进行细粒度的标注&#xff0c;同时粗略搜了下已有开源工具基本都集中于图像分割这块&#xff0c…...

Go 并发编程基础:通道(Channel)的使用

在 Go 中&#xff0c;Channel 是 Goroutine 之间通信的核心机制。它提供了一个线程安全的通信方式&#xff0c;用于在多个 Goroutine 之间传递数据&#xff0c;从而实现高效的并发编程。 本章将介绍 Channel 的基本概念、用法、缓冲、关闭机制以及 select 的使用。 一、Channel…...