当前位置：首页 > news >正文

卷积神经网络（CNN）：乳腺癌识别.ipynb

news 2026/5/12 19:53:45

文章目录

一、前言
一、设置GPU
二、导入数据
- 1. 导入数据
- 2. 检查数据
- 3. 配置数据集
- 4. 数据可视化
三、构建模型
四、编译
五、训练模型
六、评估模型
- 1. Accuracy与Loss图
- 2. 混淆矩阵
- 3. 各项指标评估

一、前言

我的环境：

语言环境：Python3.6.5
编译器：jupyter notebook
深度学习环境：TensorFlow2.4.1

往期精彩内容：

卷积神经网络（CNN）实现mnist手写数字识别
卷积神经网络（CNN）多种图片分类的实现
卷积神经网络（CNN）衣服图像分类的实现
卷积神经网络（CNN）鲜花识别
卷积神经网络（CNN）天气识别
卷积神经网络（VGG-16）识别海贼王草帽一伙
卷积神经网络（ResNet-50）鸟类识别
卷积神经网络（AlexNet）鸟类识别
卷积神经网络(CNN)识别验证码

来自专栏：机器学习与深度学习算法推荐

一、设置GPU

import tensorflow as tf
gpus = tf.config.list_physical_devices("GPU")if gpus:gpu0 = gpus[0] #如果有多个GPU，仅使用第0个GPUtf.config.experimental.set_memory_growth(gpu0, True) #设置GPU显存用量按需使用tf.config.set_visible_devices([gpu0],"GPU")import matplotlib.pyplot as plt
import os,PIL,pathlib
import numpy as np
import pandas as pd
import warnings
from tensorflow import keraswarnings.filterwarnings("ignore")             #忽略警告信息
plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False    # 用来正常显示负号

二、导入数据

1. 导入数据

import pathlibdata_dir = "./32-data"
data_dir = pathlib.Path(data_dir)
image_count = len(list(data_dir.glob('*/*')))
print("图片总数为：",image_count)

图片总数为： 13403

batch_size = 16
img_height = 50
img_width  = 50

train_ds = tf.keras.preprocessing.image_dataset_from_directory(data_dir,validation_split=0.2,subset="training",seed=12,image_size=(img_height, img_width),batch_size=batch_size)

Found 13403 files belonging to 2 classes.
Using 10723 files for training.

val_ds = tf.keras.preprocessing.image_dataset_from_directory(data_dir,validation_split=0.2,subset="validation",seed=12,image_size=(img_height, img_width),batch_size=batch_size)

Found 13403 files belonging to 2 classes.
Using 2680 files for validation.

class_names = train_ds.class_names
print(class_names)

['0', '1']

2. 检查数据

for image_batch, labels_batch in train_ds:print(image_batch.shape)print(labels_batch.shape)break

(16, 50, 50, 3)
(16,)

3. 配置数据集

AUTOTUNE = tf.data.AUTOTUNEdef train_preprocessing(image,label):return (image/255.0,label)train_ds = (train_ds.cache().shuffle(1000).map(train_preprocessing)    # 这里可以设置预处理函数
#     .batch(batch_size)           # 在image_dataset_from_directory处已经设置了batch_size.prefetch(buffer_size=AUTOTUNE)
)val_ds = (val_ds.cache().shuffle(1000).map(train_preprocessing)    # 这里可以设置预处理函数
#     .batch(batch_size)         # 在image_dataset_from_directory处已经设置了batch_size.prefetch(buffer_size=AUTOTUNE)
)

4. 数据可视化

plt.figure(figsize=(10, 8))  # 图形的宽为10高为5
plt.suptitle("数据展示")class_names = ["乳腺癌细胞","正常细胞"]for images, labels in train_ds.take(1):for i in range(15):plt.subplot(4, 5, i + 1)plt.xticks([])plt.yticks([])plt.grid(False)# 显示图片plt.imshow(images[i])# 显示标签plt.xlabel(class_names[labels[i]-1])plt.show()

在这里插入图片描述

三、构建模型

import tensorflow as tfmodel = tf.keras.Sequential([tf.keras.layers.Conv2D(filters=16,kernel_size=(3,3),padding="same",activation="relu",input_shape=[img_width, img_height, 3]),tf.keras.layers.Conv2D(filters=16,kernel_size=(3,3),padding="same",activation="relu"),tf.keras.layers.MaxPooling2D((2,2)),tf.keras.layers.Dropout(0.5),tf.keras.layers.Conv2D(filters=16,kernel_size=(3,3),padding="same",activation="relu"),tf.keras.layers.MaxPooling2D((2,2)),tf.keras.layers.Conv2D(filters=16,kernel_size=(3,3),padding="same",activation="relu"),tf.keras.layers.MaxPooling2D((2,2)),tf.keras.layers.Flatten(),tf.keras.layers.Dense(2, activation="softmax")
])
model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
conv2d (Conv2D)              (None, 50, 50, 16)        448       
_________________________________________________________________
conv2d_1 (Conv2D)            (None, 50, 50, 16)        2320      
_________________________________________________________________
max_pooling2d (MaxPooling2D) (None, 25, 25, 16)        0         
_________________________________________________________________
dropout (Dropout)            (None, 25, 25, 16)        0         
_________________________________________________________________
conv2d_2 (Conv2D)            (None, 25, 25, 16)        2320      
_________________________________________________________________
max_pooling2d_1 (MaxPooling2 (None, 12, 12, 16)        0         
_________________________________________________________________
conv2d_3 (Conv2D)            (None, 12, 12, 16)        2320      
_________________________________________________________________
max_pooling2d_2 (MaxPooling2 (None, 6, 6, 16)          0         
_________________________________________________________________
flatten (Flatten)            (None, 576)               0         
_________________________________________________________________
dense (Dense)                (None, 2)                 1154      
=================================================================
Total params: 8,562
Trainable params: 8,562
Non-trainable params: 0
_________________________________________________________________

四、编译

model.compile(optimizer="adam",loss='sparse_categorical_crossentropy',metrics=['accuracy'])

五、训练模型

from tensorflow.keras.callbacks import ModelCheckpoint, Callback, EarlyStopping, ReduceLROnPlateau, LearningRateSchedulerNO_EPOCHS = 100
PATIENCE  = 5
VERBOSE   = 1# 设置动态学习率
annealer = LearningRateScheduler(lambda x: 1e-3 * 0.99 ** (x+NO_EPOCHS))# 设置早停
earlystopper = EarlyStopping(monitor='loss', patience=PATIENCE, verbose=VERBOSE)# 
checkpointer = ModelCheckpoint('best_model.h5',monitor='val_accuracy',verbose=VERBOSE,save_best_only=True,save_weights_only=True)

train_model  = model.fit(train_ds,epochs=NO_EPOCHS,verbose=1,validation_data=val_ds,callbacks=[earlystopper, checkpointer, annealer])

六、评估模型

1. Accuracy与Loss图

acc = train_model.history['accuracy']
val_acc = train_model.history['val_accuracy']loss = train_model.history['loss']
val_loss = train_model.history['val_loss']epochs_range = range(len(acc))plt.figure(figsize=(12, 4))
plt.subplot(1, 2, 1)plt.plot(epochs_range, acc, label='Training Accuracy')
plt.plot(epochs_range, val_acc, label='Validation Accuracy')
plt.legend(loc='lower right')
plt.title('Training and Validation Accuracy')plt.subplot(1, 2, 2)
plt.plot(epochs_range, loss, label='Training Loss')
plt.plot(epochs_range, val_loss, label='Validation Loss')
plt.legend(loc='upper right')
plt.title('Training and Validation Loss')
plt.show()

2. 混淆矩阵

from sklearn.metrics import confusion_matrix
import seaborn as sns
import pandas as pd# 定义一个绘制混淆矩阵图的函数
def plot_cm(labels, predictions):# 生成混淆矩阵conf_numpy = confusion_matrix(labels, predictions)# 将矩阵转化为 DataFrameconf_df = pd.DataFrame(conf_numpy, index=class_names ,columns=class_names)  plt.figure(figsize=(8,7))sns.heatmap(conf_df, annot=True, fmt="d", cmap="BuPu")plt.title('混淆矩阵',fontsize=15)plt.ylabel('真实值',fontsize=14)plt.xlabel('预测值',fontsize=14)

val_pre   = []
val_label = []for images, labels in val_ds:#这里可以取部分验证数据（.take(1)）生成混淆矩阵for image, label in zip(images, labels):# 需要给图片增加一个维度img_array = tf.expand_dims(image, 0) # 使用模型预测图片中的人物prediction = model.predict(img_array)val_pre.append(class_names[np.argmax(prediction)])val_label.append(class_names[label])

plot_cm(val_label, val_pre)

3. 各项指标评估

from sklearn import metricsdef test_accuracy_report(model):print(metrics.classification_report(val_label, val_pre, target_names=class_names)) score = model.evaluate(val_ds, verbose=0)print('Loss function: %s, accuracy:' % score[0], score[1])test_accuracy_report(model)

             precision    recall  f1-score   support乳腺癌细胞       0.92      0.90      0.91      1339正常细胞       0.91      0.92      0.91      1341accuracy                           0.91      2680macro avg       0.91      0.91      0.91      2680
weighted avg       0.91      0.91      0.91      2680Loss function: 0.22688131034374237, accuracy: 0.9138059616088867

pport

   乳腺癌细胞       0.92      0.90      0.91      1339正常细胞       0.91      0.92      0.91      1341accuracy                           0.91      2680

macro avg 0.91 0.91 0.91 2680
weighted avg 0.91 0.91 0.91 2680

Loss function: 0.22688131034374237, accuracy: 0.9138059616088867

卷积神经网络（CNN）：乳腺癌识别.ipynb

文章目录一、前言一、设置GPU二、导入数据1. 导入数据2. 检查数据3. 配置数据集4. 数据可视化三、构建模型四、编译五、训练模型六、评估模型1. Accuracy与Loss图2. 混淆矩阵3. 各项指标评估一、前言我的环境： 语言环境：Python3.6.5编译器&#xf…...

编程日记 2023/12/5 3:16:29

有文件实体的后门无文件实体的后门rootkit后门

有文件实体后门和无文件实体后门&RootKit后门什么是有文件的实体后门： 在传统的webshell当中，后门代码都是可以精确定位到某一个文件上去的，你可以rm删除它，可以鼠标右键操作它，它是有一个文件实体对象存在的。…...

编程日记 2023/12/5 3:15:28

GPT实战系列-大模型训练和预测，如何加速、降低显存

GPT实战系列-大模型训练和预测，如何加速、降低显存不做特别处理，深度学习默认参数精度为浮点32位精度（FP32）。大模型参数庞大，10-1000B级别，如果不注意优化，既耗费大量的显卡资源，…...

编程日记 2023/12/5 3:13:26

SQL Sever 基础知识 - 数据排序

SQL Sever 基础知识 - 二、数据排序二、对数据进行排序第1节 ORDER BY 子句简介第2节 ORDER BY 子句示例2.1 按一列升序对结果集进行排序2.2 按一列降序对结果集进行排序2.3 按多列对结果集排序2.4 按多列对结果集不同排序2.5 按不在选择列表中的列对结果集进行排序2.6 按表…...

编程日记 2023/12/5 3:12:25

标题安装clang-format和cpplint sudo apt-get install clang-format sudo pip3 install cpplint标题以下settings.json文件放置xxx/Code/User目录 settings.json {"sync.forceDownload": false,"workbench.sideBar.location": "right","…...

编程日记 2023/12/5 3:11:23

C++ 系列第四篇 C++ 数据类型上篇—基本类型

系列文章 C 系列前篇为什么学习C 及学习计划-CSDN博客 C 系列第一篇开发环境搭建（WSL 方向）-CSDN博客 C 系列第二篇你真的了解C吗？本篇带你走进C的世界-CSDN博客 C 系列第三篇 C程序的基本结构-CSDN博客前言面向对象编程(OOP)的…...

编程日记 2023/12/5 3:09:22

C++ 指针详解

目录一、指针概述指针的定义指针的大小指针的解引用野指针指针未初始化指针越界访问指针运算二级指针指针与数组二、字符指针三、指针数组四、数组指针函数指针函数指针数组指向函数指针数组的指针回调函数指针与数组一维数组字符数组…...

编程日记 2023/12/5 3:08:21

.locked、locked1勒索病毒的最新威胁：如何恢复您的数据？

导言： 网络安全问题变得愈加严峻。.locked、locked1勒索病毒是近期备受关注的一种恶意软件，给用户的数据带来了巨大威胁。本文将深入探讨.locked、locked1勒索病毒的特征，探讨如何有效恢复被其加密的数据，并提供一些建议&#xf…...

编程日记 2023/12/5 3:07:19

Apache Sqoop使用

1. Sqoop介绍 Apache Sqoop 是在 Hadoop 生态体系和 RDBMS 体系之间传送数据的一种工具。 Sqoop 工作机制是将导入或导出命令翻译成 mapreduce 程序来实现。在翻译出的 mapreduce 中主要是对 inputformat 和 outputformat 进行定制。 Hadoop 生态系统包括：HDFS、Hi…...

编程日记 2023/12/5 3:05:18

【UGUI】实现UGUI背包系统的六个主要交互功能

在这篇教程中，我们将详细介绍如何在Unity中实现一个背包系统的六个主要功能：添加物品、删除物品、查看物品信息、排序物品、搜索物品和使用物品。让我们开始吧！ 一、添加物品首先，我们需要创建一个方法来添加新的物品到背包中。…...

编程日记 2023/12/5 3:04:17

电压驻波比

电压驻波比关于IF端口的电压驻波比一个信号变频后，从中频端口输出，它的输出跟输入是互异的。这个电压柱波比反映了它输出的能量有多少可以真正的输送到后端连接的器件或者设备。...

编程日记 2023/12/5 3:03:16

Open3D 最小二乘拟合二维直线（直接求解法）

目录一、算法原理二、代码实现三、结果展示本文由CSDN点云侠原创，原文链接。爬虫网站自重。一、算法原理平面直线的表达式为： y = k x + b...

编程日记 2023/12/5 3:02:15

面试题目总结（二）

1. IoC 和 AOP 的区别控制反转(Ioc) 和面向切面编程(AOP) 是两个不同的概念，它们在软件设计中有着不同的应用和目的。 IoC 是一种基于对象组合的编程模式，通过将对象的创建、依赖关系和生命周期等管理权交给外部容器或框架来实现程序间的解耦。IoC 的…...

编程日记 2023/12/5 3:01:14

TrustZone概述

目录一、概述 1.1 在开始之前二、什么是TrustZone？ 2.1 Armv8-M的TrustZone 2.2 Armv9-A Realm Management Ext...

编程日记 2023/12/5 3:00:14

[go 面试] Go Kit中读取原始HTTP请求体的方法

关注公众号【爱发白日梦的后端】分享技术干货、读书笔记、开源项目、实战经验、高效开发工具等，您的关注将是我的更新动力！在Go Kit中，如果你想读取未序列化的HTTP请求体，可以使用标准的net/http包来实现。以下是一个示例，演示了如何完成这个任务： package mainimport …...

编程日记 2023/12/5 2:58:12

小程序如何刷新当前页面？

在小程序中，刷新当前页面通常有两种方法： 使用 wx.navigateBack 方法： wx.navigateBack({delta: 1 }) 这将返回上一页，并刷新页面。你可以通过调整 delta 参数来控制返回的页面数。例如，如果你想要返回到两页之前的页…...

编程日记 2023/12/5 2:57:11

ChatGPT使用路径：从新手到专家的指南

原文&精华文章&转载注明：ChatGPT与日本首相交流核废水事件-精准Prompt... hello，我是小索奇，有任何问题或者需要帮助的都可以在这里找到我或者留言哈一、初识ChatGPT 什么是ChatGPT？ ChatGPT是一种大型语言模型&…...

编程日记 2023/12/5 2:56:10

VsCode 调试 MySQL 源码

1. 启动 MySQL 2. 查看 MySQL 进程号 [root ~]# ps -ef | grep mysqld root 21479 1 0 Nov01 ? 00:00:00 /bin/sh /usr/local/mysql/bin/mysqld_safe --datadir/usr/local/mysql/data --pid-file/usr/local/mysql/data/mysqld.pid root 26622 21479 0 …...

编程日记 2023/12/5 2:54:08

Mysql中的正经行锁、间隙锁和临键锁

行锁、间隙锁和临键锁是数据库中的三种不同类型的锁，三者都属于行锁，第一个一般叫他正经的行锁（《Mysql是怎样运行的》一书中的说法）。行锁（Row Lock）：行锁是指对数据表中的某一行进行的锁定操…...

编程日记 2023/12/5 2:53:07

最强AI之风袭来，你爱了吗？

2017年，柯洁同阿尔法狗人机大战，AlphaGo以3比0大获全胜，一代英才泪洒当场...... 2019年，换脸哥视频“杨幂换朱茵”轰动全网，时至今日AI换脸仍热度只增不减； 2022年，ChatGPT一经发布便轰动全球&a…...

编程日记 2023/12/5 2:52:06

斐讯K3从梅林‘变砖’到官复原职：一个手残党的硬核救砖全记录（附TTL/编程器操作避坑点）

斐讯K3救砖实战：从梅林固件崩溃到完美恢复的完整指南 1. 当路由器变成"砖头"：一个普通用户的崩溃瞬间那是一个普通的周末下午，我正兴冲冲地准备给我的斐讯K3刷上梅林固件，幻想着能获得更强大的功能和更稳定的性能。按照…...

编程新知 2026/5/12 19:11:46

如何快速掌握Blender精确建模：CAD_Sketcher完整实战指南

如何快速掌握Blender精确建模：CAD_Sketcher完整实战指南【免费下载链接】CAD_Sketcher Constraint-based geometry sketcher for blender 项目地址: https://gitcode.com/gh_mirrors/ca/CAD_Sketcher 你是否曾经希望在Blender中创建精确的工程图纸&#xff…...

编程新知 2026/5/12 18:48:17

从灰度图到粉彩叙事，全程可复现：5个精准Prompt模板+3类LUT预设，零基础速产美术馆级Pastel印相

更多请点击： https://intelliparadigm.com 第一章：从灰度图到粉彩叙事：Pastel印相的美学本质与技术边界 Pastel印相并非简单的色彩叠加，而是一种基于人眼感知非线性响应与胶片化学特性的数字模拟范式。其核心在于将灰度图像的亮度…...

编程新知 2026/5/12 17:37:10

Loop Habit Tracker习惯追踪应用技术深度解析与架构实践指南

Loop Habit Tracker习惯追踪应用技术深度解析与架构实践指南【免费下载链接】uhabits Loop Habit Tracker, a mobile app for creating and maintaining long-term positive habits 项目地址: https://gitcode.com/gh_mirrors/uh/uhabits Loop Habit Tracker是一款基于…...

编程新知 2026/5/12 16:24:05

基于VitePress构建开源AI智能体框架深度中文文档站实战指南

1. 项目概述：一个为AI智能体框架量身打造的中文文档站如果你正在寻找一个能帮你把Claude、GPT这些大模型快速接入到微信、Telegram、飞书等聊天软件的开源框架，那你大概率会接触到OpenClaw（原名ClawdBot）。但当你兴冲冲地打开官方…...

编程新知 2026/5/12 16:13:19

如何在Chrome浏览器中快速生成与扫描二维码：终极免费插件指南

如何在Chrome浏览器中快速生成与扫描二维码：终极免费插件指南【免费下载链接】chrome-qrcode :zap: A Chrome plugin to Genrate QRCode of URL / Text, or Decode the QRcode in website. 一个Chrome浏览器插件，用于生成当前URL或者选中内容的二维码&a…...

编程新知 2026/5/12 15:43:51

终极指南：在Windows上无需模拟器安装安卓应用的完整教程

终极指南：在Windows上无需模拟器安装安卓应用的完整教程【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 还在为安卓模拟器的臃肿和卡顿烦恼吗？今…...

编程新知 2026/5/12 15:43:51

PixelAnnotationTool终极指南：如何用智能分水岭算法实现高效像素级图像标注

PixelAnnotationTool终极指南：如何用智能分水岭算法实现高效像素级图像标注【免费下载链接】PixelAnnotationTool Annotate quickly images. 项目地址: https://gitcode.com/gh_mirrors/pi/PixelAnnotationTool 你是否曾经为图像标注工作感到头疼&#xff…...

编程新知 2026/5/12 15:22:52

InferenceX：大模型高效推理引擎核心原理与生产部署实战

1. 项目概述：从模型训练到高效推理的最后一公里如果你在AI领域，特别是大模型应用开发上投入过精力，那么对“InferenceX”这个名字可能不会感到陌生。它不是一个全新的训练框架，也不是一个模型仓库，而是精准地瞄准了当前…...

编程新知 2026/5/12 13:26:45

一台电脑变四台主机：Nucleus Co-Op如何让单人游戏秒变多人派对？

一台电脑变四台主机：Nucleus Co-Op如何让单人游戏秒变多人派对？ 【免费下载链接】nucleuscoop Starts multiple instances of a game for split-screen multiplayer gaming! 项目地址: https://gitcode.com/gh_mirrors/nu/nucleuscoop 想象一下&a…...

编程新知 2026/5/12 10:06:49