基于神经网络的肾脏疾病预测模型

构建一个基于神经网络的肾脏疾病预测模型
1. 数据预处理
- 加载数据:读取
kidney_disease.csv文件,加载患者医疗数据。 - 删除冗余特征:移除与预测目标无关的列(如
al,su等),保留关键特征(如年龄、血压、血糖等)。 - 处理缺失值:用
np.nan_to_num将缺失值(NaN)替换为0,但此方法可能不适用于分类特征(例如“是否有糖尿病”列中0可能代表“否”)。
2. 特征工程
- 标签定义:假设数据最后一列(第8列)是分类标签(如
classification),标记患者是否患病(二分类问题)。 - 分类变量编码:对分类特征(如
dm(糖尿病)、cad(冠心病)、appet(食欲))进行独热编码(One-Hot Encoding),将其转换为数值形式供模型处理。
3. 数据标准化与分割
- 标准化:使用
StandardScaler对数值型特征进行标准化(均值0,方差1),消除量纲差异。 - 数据分割:按8:2比例划分训练集和测试集,确保模型评估的客观性。
4. 神经网络建模
- 模型结构:
- 输入层:11个输入节点(对应特征数量)。
- 隐藏层:2层全连接层,每层6个神经元,激活函数为ReLU。
- 输出层:1个神经元,激活函数为Sigmoid,输出患病概率(0~1)。
- 训练配置:
- 损失函数:二元交叉熵(
binary_crossentropy),适用于二分类问题。 - 优化器:Adam,自适应调整学习率。
- 批次训练:每批次7个样本,共训练20轮(epochs)。
- 损失函数:二元交叉熵(
5. 模型评估
- 预测与阈值处理:对测试集预测概率大于0.5的样本判定为患病。
- 性能指标:
- 混淆矩阵:计算真阳性、假阳性等分类结果。
- 准确率:统计模型正确预测的比例。
# 导入必要库
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import confusion_matrix, accuracy_score
from keras.models import Sequential
from keras.layers import Dense# 数据预处理
df = pd.read_csv('kidney_disease.csv')
to_drop = ['al','su','rbc','pc','pcc','ba','bgr','pcv','sod','pot','bu','wc','rc','htn','pe','ane']
df.drop(to_drop, axis=1, inplace=True)
df = df.dropna() # 删除缺失值# 分割特征与标签
X = df.drop(['id', 'classification'], axis=1) # 假设标签列名是'classification'
y = df['classification'].apply(lambda x: 1 if x.lower().strip() == 'ckd' else 0) # 处理标签格式# 分类列处理
categorical_cols = ['dm', 'cad', 'appet']
for col in categorical_cols:# 清洗字符串数据(统一小写并去除空格)X[col] = X[col].astype(str).str.strip().str.lower()# 生成哑变量dummies = pd.get_dummies(X[col], prefix=col, drop_first=True)X = pd.concat([X, dummies], axis=1)
X = X.drop(categorical_cols, axis=1)# 数据标准化
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=1, stratify=y) # 添加分层抽样
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)# 模型构建
classifier = Sequential()
classifier.add(Dense(units=6, activation='relu', input_dim=X_train.shape[1], kernel_initializer='he_uniform')) # 更合适的初始化方法
classifier.add(Dense(units=6, activation='relu', kernel_initializer='he_uniform'))
classifier.add(Dense(units=1, activation='sigmoid', kernel_initializer='he_uniform'))
classifier.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])# 训练
classifier.fit(X_train, y_train, batch_size=7, epochs=20)# 评估
y_pred = classifier.predict(X_test) > 0.5
print("Confusion Matrix:\n", confusion_matrix(y_test, y_pred))
print("Accuracy:", accuracy_score(y_test, y_pred))
相关文章:
基于神经网络的肾脏疾病预测模型
构建一个基于神经网络的肾脏疾病预测模型 1. 数据预处理 加载数据:读取 kidney_disease.csv 文件,加载患者医疗数据。删除冗余特征:移除与预测目标无关的列(如 al, su 等),保留关键特征(如…...
Oracle常用高可用方案(10)——RAC
10.2. RAC 10.2.1. 概念 RAC,Real Application Cluster的缩写,业界就称为RAC。RAC最早出现于2001年发布的Oracle 9i版本,之前的版本中,也有类似的产品或技术,叫做OPS,即Oracle Parallel Server的缩写。基于多方面的因素,Oracle 9i之前的类似产品或技术并没有得到广泛应…...
JavaScript基础-移动端常用开发插件
在移动Web开发中,为了提升开发效率和用户体验,开发者通常会依赖于一些成熟的JavaScript插件。这些插件封装了复杂的功能,使得实现常见的交互效果变得更加简单快捷。本文将介绍几款广泛使用的移动端开发插件,并通过具体的示例展示它…...
I/O多路复用 + Reactor和Proactor + 一致性哈希
网络系统 1. I/O多路复用1)原始Socket模型通信方式2)多进程模型3)多线程模型4)I/O多路复用select/pollepoll边缘触发和水平触发 2. Reactor和Proactor1)Reactor模式2)Reactor模式四种方案3)单Re…...
解决小程序video控件在真机和上线后黑屏不播放问题
小程序上线后,mp4格式的视频无法点击是黑屏,但是测试得时候在微信开发者工具中能够打开正常播放 原因:编码格式不能是vp9 微信开发者工具本地设置中把这个打开勾选。 排查:可以换一个视频尝试能不能真机播放,如果能&a…...
js中判断对象是否包含某个属性(元素)
在JavaScript中,判断对象是否包含某个属性(元素)主要有以下几种方法,根据具体需求选择合适的方式: 1. 使用 in 运算符 作用:检查对象自身及原型链上是否存在指定属性。 示例: javascript cons…...
数据库6(数据库指令)
之前所学的指令均为查找指令,即select相关语句 接下来的语句是增删改查的其他三部分,即增删改 1.删除 删除操作是三个操作中较为简单的,因为它只需要考虑数据的完整性 在实验时可以用表的复件来操作,防止操作不当导致数据库被…...
[C++面试] 智能指针面试点(重点)续4
[C面试] RAII资源获取即初始化(重点)-CSDN博客 [C面试] 智能指针面试点(重点)-CSDN博客 [C面试] 智能指针面试点(重点)续1-CSDN博客 [C面试] 智能指针面试点(重点)续2-CSDN博客 …...
java项目分享-分布式电商项目附软件链接
今天来分享一下github上最热门的开源电商项目安装部署,star 12.2k,自行安装部署历时两天,看了这篇文章快的话半天搞定!该踩的坑都踩完了,软件也打包好了就差喂嘴里。 项目简介 mall-swarm是一套微服务商城系统…...
16变量命名风格
给变量/函数/文件/类 起名字, 非常有讲究的~~ 1.起的名字要有描述性.不要使用 abc,xyz 这种比较无规律的名字来描述 2.如果名字比较长,由多个单词构成的,就需要使用适当的方式来进行区分不同单词 C中,偏好使用_来进行单词的分割. 形如: student_count(变量) unordered_map(stl容…...
【LVS】负载均衡群集部署(DR模式)
部署前IP分配 DR服务器:192.168.166.101 vip:192.168.166.100 Web服务器1:192.168.166.104 vip:192.168.166.100 Web服务器2:192.168.166.107 vip:192.168.166.100 NFS服务器:192.168.166.108 …...
链表的操作-反转链表
链表 160相交链表 代码 class Solution { public:ListNode *getIntersectionNode(ListNode *headA, ListNode *headB) {ListNode* h1headA;ListNode* h2headB;while(h1&&h2){if(h1!h2){h1h1->next;h2h2->next;}else{return h1;}}if(h1nullptr){h1headB;}else{h…...
Linux安装Cmake (Centos 7.9)
cmake安装 这个虽然已经更新到了4.0.0版本了,但是我们要用3.5版本的,因为这个比较稳定 官方地址:https://github.com/Kitware/CMake/releases/tag/v3.5.0,选择那个cmake-3.5.0-Linux-x86_64.tar.gz下载, 首先解压文…...
Node.js v22.14.0 多平台安装指南:Windows、Linux 和 macOS 详细教程
Node.js作为现代Web开发的基石,持续为开发者带来性能提升和新特性支持。本文将详细介绍在Windows、macOS和Linux系统上安装最新Node.js的多种方法,助您快速搭建高效的JavaScript开发环境。 📦 当前最新版本 截至2025年4月,Node.…...
Netty源码—10.Netty工具之时间轮一
大纲 1.什么是时间轮 2.HashedWheelTimer是什么 3.HashedWheelTimer的使用 4.HashedWheelTimer的运行流程 5.HashedWheelTimer的核心字段 6.HashedWheelTimer的构造方法 7.HashedWheelTimer添加任务和执行任务 8.HashedWheelTimer的完整源码 9.HashedWheelTimer的总结…...
C++虚函数与抽象类
一、虚函数  **;类中定义不同类中的同名函数的多态的行为**,主要是通过虚函数来实现。 在类的成员函数前加virtual关键字。虚函数是实现包含多态的基础。这里需要说明的是当基类里有虚函数且派生类中重新声明了和基类虚函数相同的函数,那…...
鸿蒙项目笔记(1)
一、核心内容-商城 1、装饰器的拓展使用,基础组件的熟悉。 2、引入基础动画实战,页面属性动画、页面跳转动画、自定义页面翻页等。 3、一次开发,多端部署。 4、本地数据库实战,涉及多种本地数据存储方式。 5、路由导航&#…...
*快排延伸-自省排序
此节是学有余力的人去看,如果没时间,不看也没关系,只要知道代码就可以了! 自省排序的思路是自我侦测和反省,快速排序如果递归深度太深,其算法的效率可能被大幅度削弱,这就需要借助其他的算法进…...
三.微服务架构中的精妙设计:服务注册/服务发现-Eureka
一.使用注册中心背景 1.1服务远程调用问题 服务之间远程调⽤时, 我们的URL是写死的 String url "http://127.0.0.1:9090/product/" orderInfo.getProductId(); 缺点: 当更换机器, 或者新增机器时, 这个URL就需要跟着变更, 就需要去通知所有的相关服…...
python-leetcode 63.搜索二维矩阵
题目: 给一个满足两条属性的m*n的整数矩阵: 每行中的整数从左到右按非严格递增顺序排列 每行的第一个整数大于前一行的最后一个整数 给一个整数target,如果target在矩阵中,返回true,否则返回false 方法一:两次二分查找 由于每…...
后端框架入门:Django
Django 基础:模型、视图、模板Django REST Framework 的使用一、Django 概述 Django 是一个 高效、灵活、可扩展 的 Python Web 框架,主要用于快速开发 Web 应用 和 REST API。 📌 Django 的优势: ✅ MTV 架构:模型(Model)、视图(View)、模板(Template)分离,便于…...
从零构建大语言模型全栈开发指南:第四部分:工程实践与部署-4.3.2知识库增强与外部API集成(代码示例:HTTP节点与检索增强生成)
👉 点击关注不迷路 👉 点击关注不迷路 👉 点击关注不迷路 文章大纲 知识库增强与外部API集成:HTTP节点与检索增强生成实战4.3.2 知识库增强与外部API集成(代码示例:HTTP节点与检索增强生成)1. 核心挑战与优化目标1.1 技术瓶颈分析1.2 设计目标2. 关键技术方案2.1 知识…...
音视频入门基础:MPEG2-TS专题(26)——通过FFmpeg命令使用RTP发送TS流
音视频入门基础:MPEG2-TS专题系列文章: 音视频入门基础:MPEG2-TS专题(1)——MPEG2-TS官方文档下载 音视频入门基础:MPEG2-TS专题(2)——使用FFmpeg命令生成ts文件 音视频入门基础…...
blender二次元上色
前: 后:(脸自己会发光) 参考:05-模型导入与材质整理_哔哩哔哩_bilibili...
2025年2月一区SCI-壮丽细尾鹩莺算法Superb Fairy-wren Optimization-附Matlab免费代码
引言 本期介绍一种新的元启发式算法——壮丽细尾鹩莺优化算法Superb Fairy-wren Optimization algorithm,SFOA。该算法结合了壮丽细尾鹩莺群体中幼鸟的发育,繁殖后喂养幼鸟的行为,以及它们躲避捕食者的策略,于2025年2月最新发表在…...
Linux系统禁用swap
Linux系统禁用swap sed -ri s/.*swap.*/#&/ /etc/fstab大家之前禁用swap用上面的命令,也就是把"/etc/fstab"文件里包含swap的那行注释了,然后重启系统swap就被禁用了。 可是到了Ubuntu 20.04之后、CentOS Stream 10、openEuler 24.04、O…...
Hadoop•踩过的SHIT
听说这里是目录哦 ssh登录Permission denied, please try again💩要发癫🥲 centos7 yum报错:cannot find a valid baseurl for repo:base/7/x86_64💩FinalShell重连失效💩ssh免密登录显示 No route to hostὊ…...
闭环SOTA!北航DiffAD:基于扩散模型实现端到端自动驾驶「多任务闭环统一」
端到端自动驾驶目前是有望实现完全自动驾驶的一条有前景的途径。然而,现有的端到端自动驾驶系统通常采用主干网络与多任务头结合的方式,但是它们存在任务协调和系统复杂度高的问题。为此,本文提出了DiffAD,它统一了各种驾驶目标并…...
Docker Registry 清理镜像最佳实践
文章目录 registry-clean1. 简介2. 功能3. 安装 docker4. 配置 docker5. 配置域名解析6. 部署 registry7. Registry API 管理8. 批量清理镜像9. 其他10. 参考registry-clean 1. 简介 registry-clean 是一个强大而高效的解决方案,旨在简化您的 Docker 镜像仓库管理。通过 reg…...
JavaScript重难点突破:期约与异步函数
同步和异步 同步(Synchronous) 定义:任务按顺序依次执行,前一个任务完成前,后续任务必须等待。 特点:阻塞性执行,程序逻辑直观,但效率较低 异步(Asynchron…...
