当前位置：首页 > news >正文

多层感知机(MLP)实现考勤预测二分类任务(sklearn)

news 2026/5/20 15:18:52

'''
1、基础应用：
https://blog.csdn.net/qq_36158230/article/details/118670801
多层感知机(MLP)实现考勤预测二分类任务(sklearn)
2、分类器参数：https://scikit-learn.org/dev/modules/generated/sklearn.neural_network.MLPClassifier.html
3、损失函数：https://scikit-learn.org/stable/modules/generated/sklearn.metrics.log_loss.html
看着示例数据、参数训练出的模型效果不好呀hhh
'''import csv
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import accuracy_score# 加载训练数据集
def load_dataset(path):dataset_file = csv.reader(open(path))vector_x = []   # 样本y = []          # 样本所对应的标签# 从文件读取训练数据集for content in dataset_file:# 如果读取的不是表头if dataset_file.line_num != 1:# 读取一行并转化为列表content = list(map(float, content))if len(content) != 0:vector_x.append(content[1:12])  # 第0-11列是样本的特征，其中第0列是idy.append(content[-1])           # 最后一列是样本的标签#print(content,len(content)) # [2.0, 1.0, 1.0, 2.0, 3.0, 1.0, 4.0, 1.0, 3.0, 2.0, 1.0, 3.0, 1.0] 13#breakreturn vector_x, y  # 返回训练数据集# 训练模型
def mlp_cls(vector_x_train, y_train):# 输入层->第一层->第二层->输出层#    12      30     20      1  # 节点个数# MLPClassifier参数说明详情见https://www.cnblogs.com/-X-peng/p/14225973.htmlmlp = MLPClassifier(solver='adam', alpha=0, hidden_layer_sizes=(30, 20), random_state=1)mlp.fit(vector_x_train, y_train)        # 训练return mlp# 模型预测
def mlp_cls_predict(mlp, vector_x_test, y_test):# 预测y_predict = mlp.predict(vector_x_test)n = 3print("模型预测值：", y_predict[:n], ", 模型true值：", y_test[:n])print(y_predict[0]==y_test[0])print("测试集大小：", len(y_test), len(y_predict))label_1 = []label_fu1 = []for p in y_test:if p==1:label_1.append(p)#print("label: 1")if p==-1:label_fu1.append(-1)print('测试集：和',len(label_1)+len(label_fu1),'，len(label_1)', len(label_1), ',len(label_fu1)',len(label_fu1))error_n = 0for i in range(len(y_predict)):if y_predict[i] != y_test[i]:print('错误预测结果：', y_predict[i], ', 真实值：', y_test[i])error_n +=1print('预测错误的数量：', error_n)# 输出模型预测的准确度print(accuracy_score(y_predict, y_test))# 实验
if __name__ == '__main__':# 1. 加载数据集vector_x, y = load_dataset("dataset.csv") # 如果报错，原因：ipynb创建的时候在其他目录，而不是csv文件的路径下print('数据集大小（预期161）：', len(vector_x), len(y))count_fu1 = []for p in y:if p==-1:count_fu1.append(p)print('总的负样本数：', len(count_fu1))print(vector_x[:3], y[:3])scalar = StandardScaler()               # 标准化转换scalar.fit(vector_x)                    # 训练标准化对象vector_x = scalar.transform(vector_x)   # 转换数据集print(vector_x[:3], y[:3])print("每个特征的Mean:", scalar.mean_, "特征数量：", len(scalar.mean_))print("每个特征的Standard Deviation:", scalar.scale_, "特征数量：", len(scalar.scale_))'''在数据处理中，标准化是一种常见的预处理步骤，用于将数据转换为均值为 0，标准差为 1 的分布。这有助于确保不同特征的值处于相似的尺度，避免某些特征对模型的影响过大。1)对每个特征计算其均值和标准差。2)将每个特征的值减去均值，然后除以标准差，以完成标准化处理。preprocessing.scale(data) 是 Scikit-learn 中 preprocessing 模块提供的一种快速标准化数据的方法。这个方法会对输入的数据进行标准化处理，即将数据按特征进行标准化，使得每个特征的均值为 0，标准差为 1。这个方法适用于需要快速对数据进行标准化的情况，但是它并不像使用 StandardScaler 那样可以保存均值和标准差供后续使用。'''# 2. 划分训练集和测试集# https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.htmlvector_x_train, vector_x_test, y_train, y_test = train_test_split(vector_x, y, test_size=0.2, random_state=0)# vector_x_train, vector_x_test, y_train, y_test = train_test_split(vector_x, y, test_size=0.2, random_state=10)label_1 = []label_fu1 = []for p in y_train:if p==1:label_1.append(p)#print("label: 1")if p==-1:label_fu1.append(-1)print('训练集：和',len(label_1)+len(label_fu1),'，len(label_1)', len(label_1), ',len(label_fu1)',len(label_fu1))# 3. 训练mlp = mlp_cls(vector_x_train, y_train)# 4. 预测mlp_cls_predict(mlp, vector_x_test, y_test)print('【感觉模型预测时，将结果都预测为正样本1了，看看训练的精度怎么样】')mlp_cls_predict(mlp, vector_x_train, y_train)

对应的输出

数据集大小（预期161）： 161 161
总的负样本数： 18
[[1.0, 1.0, 2.0, 3.0, 1.0, 4.0, 1.0, 3.0, 2.0, 1.0, 3.0], [1.0, 2.0, 2.0, 3.0, 1.0, 4.0, 1.0, 4.0, 2.0, 2.0, 3.0], [2.0, 2.0, 2.0, 3.0, 1.0, 3.0, 1.0, 3.0, 1.0, 2.0, 3.0]] [1.0, 1.0, 1.0]
[[-0.41854806 -1.31484355  0.36579067  0.3130227  -0.80178373  0.49383162-0.48832524  0.23600208  0.06141296 -2.9104275  -0.39633848][-0.41854806  0.76054676  0.36579067  0.3130227  -0.80178373  0.49383162-0.48832524  1.23590565  0.06141296  0.34359214 -0.39633848][ 2.38921186  0.76054676  0.36579067  0.3130227  -0.80178373 -0.71081824-0.48832524  0.23600208 -1.35108513  0.34359214 -0.39633848]] [1.0, 1.0, 1.0]
每个特征的Mean: [1.14906832 1.63354037 1.88198758 2.74534161 1.39130435 3.590062111.19254658 2.76397516 1.95652174 1.89440994 3.31677019] 特征数量： 11
每个特征的Standard Deviation: [0.35615581 0.48183708 0.32262283 0.81354605 0.48804227 0.830116730.39429988 1.00009644 0.70796556 0.30731222 0.79924157] 特征数量： 11
训练集：和 128 ，len(label_1) 111 ,len(label_fu1) 17
模型预测值： [1. 1. 1.] , 模型true值： [1.0, 1.0, 1.0]
True
测试集大小： 33 33
测试集：和 33 ，len(label_1) 32 ,len(label_fu1) 1
错误预测结果： 1.0 , 真实值： -1.0
预测错误的数量： 1
0.9696969696969697
【感觉模型预测时，将结果都预测为正样本1了，看看训练的精度怎么样】
模型预测值： [1. 1. 1.] , 模型true值： [1.0, -1.0, 1.0]
True
测试集大小： 128 128
测试集：和 128 ，len(label_1) 111 ,len(label_fu1) 17
错误预测结果： 1.0 , 真实值： -1.0
错误预测结果： 1.0 , 真实值： -1.0
错误预测结果： 1.0 , 真实值： -1.0
错误预测结果： 1.0 , 真实值： -1.0
错误预测结果： 1.0 , 真实值： -1.0
错误预测结果： 1.0 , 真实值： -1.0
错误预测结果： 1.0 , 真实值： -1.0
错误预测结果： 1.0 , 真实值： -1.0
错误预测结果： 1.0 , 真实值： -1.0
错误预测结果： 1.0 , 真实值： -1.0
错误预测结果： 1.0 , 真实值： -1.0
错误预测结果： 1.0 , 真实值： -1.0
错误预测结果： 1.0 , 真实值： -1.0
预测错误的数量： 13
0.8984375
/base/envs/py36/lib/python3.6/site-packages/sklearn/neural_network/_multilayer_perceptron.py:617: ConvergenceWarning: Stochastic Optimizer: Maximum iterations (200) reached and the optimization hasn't converged yet.% self.max_iter, ConvergenceWarning)

多层感知机(MLP)实现考勤预测二分类任务(sklearn)

1、基础应用： https://blog.csdn.net/qq_36158230/article/details/118670801 多层感知机(MLP)实现考勤预测二分类任务(sklearn) 2、分类器参数：https://scikit-learn.org/dev/modules/generated/sklearn.neural_network.MLPClassifier.html 3、损失函数…...

编程日记 2024/10/11 19:37:57

文件与目录的基本操作

前提：使用su root 切换到权限最大的root用户 1.显示当前工作目录的绝对路径（pwd） 用途：用于显示当前工作目录的绝对路径的命令。无论用户在文件系统的哪个位置，pwd 命令都能提供当前所在位置的完整路径信息。用法&a…...

编程日记 2024/10/11 19:36:56

Python入门笔记(三)

文章目录第八章字典dict8.1 创建字典：{}、dict()、字典生成式、zip()8.2 获取键对应的值：get()8.3 in， not in判断键是否在字典中8.4 增加键值对：fromkeys()、setdefault()、update()8.5 删除键值对：del语句、clear(…...

编程日记 2024/10/11 19:35:55

PostgreSQL 任意命令执行漏洞(CVE-2019-9193)

记一次授权攻击通过PostgreSql弱口令拿到服务器权限的事件。使用靶机复现攻击过程。过程在信息收集过程中，获取到在公网服务器上开启了5432端口，尝试进行暴破，获取到数据库名为默认postgres，密码为1 随后连接进PostgreSql …...

编程日记 2024/10/11 19:34:53

使用tgz包下载安装clickhouse低版本

1.下载安装包官方下载地址：https://packages.clickhouse.com/tgz/stable 阿里云下载地址：clickhouse-tgz-stable安装包下载_开源镜像站-阿里云共需要下载四个文件 clickhouse-common-static-20.3.10.75.tgz clickhouse-common-static-dbg-20.3.10.7…...

编程日记 2024/10/11 19:33:50

外包功能测试干了6个月，技术退步太明显了。。。。。

先说一下自己的情况，本科生，23年通过校招进入武汉某软件公司，干了差不多6个月的功能测试，今年中秋，感觉自己不能够在这样下去了，长时间呆在一个舒适的环境会让一个人堕落!而我就在一个外包企业干了6个月的功…...

编程日记 2024/10/11 19:32:40

动态规划和贪心算法

目录动态规划和贪心算法动态规划贪心算法两者之间的区别动态规划和贪心算法是两种经典的算法设计策略，它们各自具有独特的特点和适用场景。动态规划动态规划是一种将复杂问题分解为更简单子问题的求解方法。它特别适用于那些具有重叠子问题和最优子结构特性的问…...

编程日记 2024/10/11 19:30:38

python爬虫--tx动漫完整信息抓取

python爬虫--tx动漫完整信息抓取一、采集主页信息二、采集详情页信息三、完整代码一、采集主页信息先看一下采集到的信息，结果保存为csv文件：打开开发者工具，找到数据接口。使用xpath提取详情页url。二、采集详情页信息如上图所示，使用xpath提取详情页的标题、作…...

编程日记 2024/10/11 19:27:34

《使用Java做爬虫和使用python做爬虫哪个好》

使用Java做爬虫和使用python做爬虫哪个好 Java 和 Python 都是非常出色的编程语言，在爬虫领域各有其优势，具体使用哪种语言更好取决于多种因素： 一、开发效率 1. Python Python 以其简洁、易读的语法而闻名。在爬虫开发中，有许…...

编程日记 2024/10/11 19:26:33

如果我想开发一个APP,需要准备哪些材料呢

开发一个APP需要准备的材料相对复杂，涵盖了公司资质、技术资源、支付接口以及第三方服务等多个方面。以下是一份详细的材料清单： 一、公司资质证明营业执照：需要提供公司的营业执照副本，用于申请企业支付、域名备案、APP上架及…...

编程日记 2024/10/11 19:24:29

告别论文初稿焦虑！ChatGPT让你轻松完成写作！

AIPaperGPT，论文写作神器~ https://www.aipapergpt.com/ 在面对繁琐的论文写作时，很多人都会遇到无从下手的困惑，尤其是论文初稿阶段，往往需要大量的时间来组织思路和编写内容。然而，随着AI技术的发展，像…...

编程日记 2024/10/11 19:23:28

mongodb 数据迁移，亲测成功！

mysql进行数据迁移，最简单的不过是导出sql，然后在运行sql，数据也自然迁移过去了。可是mongodb里，我们存储的是文件，是怎么做到的呢，当我在翻阅网上博客的时候，并没有发现有这方面的顾虑。当…...

编程日记 2024/10/11 19:22:26

如何使用ssm实现疫情居家办公OA系统

TOC 10902ssm疫情居家办公OA系统系统概述进过系统的分析后，就开始记性系统的设计，系统设计包含总体设计和详细设计。总体设计只是一个大体的设计，经过了总体设计，我们能够划分出系统的一些东西，例如文件、文档、数…...

编程日记 2024/10/11 19:19:22

深入了解 MySQL 中的 JSON_CONTAINS

深入了解 MySQL 中的 JSON_CONTAINS MySQL 5.7 及更高版本引入了对 JSON 数据类型的支持，使得在数据库中存储和查询 JSON 数据成为可能。在这些新功能中，JSON_CONTAINS 函数是一个非常有用的工具，允许我们检查一个 JSON 文档是否包含特定的值…...

编程日记 2024/10/11 19:18:18

宝藏推荐：精选十款知识库搭建软件

当今这个信息爆炸的时代，高效地管理和利用知识成为了各行各业追求的目标。无论是企业内部的协作，还是对外提供的信息服务，一个强大的知识库都是不可或缺的。为了帮助大家更好地守护和利用知识宝藏，以下是精选的十款知识库搭建软件…...

编程日记 2024/10/11 19:17:17

go语言接口设计三国人物

题目请设计一个接口Person，然后设计两个结构体实现Person接口，这两个结构体都代表三国时代的名人。Person接口中有一个方法，该方法输出一句最能代表该人物特点的话。程序 package main import ("fmt") type Person interface …...

编程日记 2024/10/11 19:16:16

day-63 优质数对的总数 II

思路 nums1[i] 可以被 nums2[j] * k 整除,所以nums[i]/k的所有因子都符合条件，问题转换为遍历nums1,统计nums[i]/k的因子出现次数，然后遍历nums2，如果nums2[i]是某一个因子，将其出现次数加入答案中即可解题过程利用哈希表统计出…...

编程日记 2024/10/11 19:14:12

基于 Prometheus+Grafana+Alertmanager 搭建 K8S 云监控告警平台（附配置告警至QQ、钉钉）

文章目录一、机器规划二、部署安装 node-exporter、prometheus、Grafana、kube-state-metrics1、创建 monitor-sa 命名空间2、安装node-exporter组件2.1、说明2.2、应用资源清单2.3、通过node-exporter采集数据 3、k8s 集群中部署 prometheus3.1、创建一个 sa 账号3.2、将 sa …...

编程日记 2024/10/11 19:12:08

C++ | Leetcode C++题解之第461题汉明距离

题目： 题解： class Solution { public:int hammingDistance(int x, int y) {int s x ^ y, ret 0;while (s) {s & s - 1;ret;}return ret;} };...

编程日记 2024/10/11 19:11:06

ElasticSearch备考 -- Update by query Reindex

一、题目有个索引task，里面的文档长这样现在需要添加一个字段all，这个字段的值是以下 a、b、c、d字段的值连在一起二、思考需要把四个字段拼接到一起，组成一个新的字段，这个就需要脚本， 这里有两种方案&#xff…...

编程日记 2024/10/11 19:08:59

告别时序警告！手把手教你为Vivado自定义分频器添加正确时钟约束

深度解析Vivado分频器时钟约束：从原理到实战的全链路指南在FPGA开发中，时钟管理是确保设计稳定性的核心环节。当我们面对低频应用场景时，常常需要将高频系统时钟分频至工作频率，而Vivado工具链对这类自定义分频器的时序约束有着特…...

编程新知 2026/5/20 13:47:55

3步极速配置：LXMusic音源完全指南

3步极速配置：LXMusic音源完全指南【免费下载链接】LXMusic音源 lxmusic（洛雪音乐）全网最新最全音源项目地址: https://gitcode.com/guoyue2010/lxmusic- 作为全网音乐资源的整合引擎，LXMusic音源为你提供一站式音乐解决方…...

编程新知 2026/5/20 13:35:21

C Shell（csh）脚本实战：用`foreach`和`switch`处理日志文件的完整例子

C Shell（csh）脚本实战：用foreach和switch处理日志文件的完整例子在服务器运维和数据分析的日常工作中，处理大量日志文件是一项常见但繁琐的任务。想象一下，每天需要手动解压、筛选、统计数十个按日期命名的压缩日志文…...

编程新知 2026/5/20 13:14:47

Nodejs后端服务集成Taotoken实现AI对话功能的具体配置指南

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度 Nodejs后端服务集成Taotoken实现AI对话功能的具体配置指南 1. 准备工作：获取API密钥与模型ID 在开始编写代码之前&…...

编程新知 2026/5/20 11:59:18

技术突破：Code_Copyright_Gen - 重新定义软件著作权文档生成工作流

技术突破：Code_Copyright_Gen - 重新定义软件著作权文档生成工作流【免费下载链接】code_copyright_gen flutter 实现的软著生成项目地址: https://gitcode.com/gh_mirrors/co/code_copyright_gen 在软件著作权申请过程中，开发者面临的最大痛点…...

编程新知 2026/5/20 10:09:50

[STM32U3] 【STM32U385RG 测评】PWM调节屏幕亮度

在评测计划中有使用pwm来实现调节屏幕亮度，因此本篇为如何使用HMI实现对屏的亮度调节。实现原理为，使用TouchGFX Designer添加一个滑动控件，通过滑动来修改pwm的占空比，实现ST7789的BLK的电压实现。本次工程在上一篇试用的基础上…...

编程新知 2026/5/20 9:34:25

如何用3步将B站视频变成文字稿？这个智能转录工具让你告别手动记录

如何用3步将B站视频变成文字稿？这个智能转录工具让你告别手动记录【免费下载链接】bili2text Bilibili视频转文字，一步到位，输入链接即可使用项目地址: https://gitcode.com/gh_mirrors/bi/bili2text 你是否曾经为了记录一个B站视频…...

编程新知 2026/5/20 8:12:38

RT-Thread Smart用户态开发：基于xmake的嵌入式高性能应用构建实践

1. 项目概述与核心价值最近在嵌入式圈子里，和几位做工业网关和智能设备的朋友聊天，大家普遍有个痛点：项目从单片机往更高性能的处理器（比如Cortex-A系列）迁移时，开发体验有点“开倒车”。在资源受限的单片机…...

编程新知 2026/5/20 5:57:12

缠论分析工具终极指南：如何在通达信中实现可视化技术分析

缠论分析工具终极指南：如何在通达信中实现可视化技术分析【免费下载链接】Indicator 通达信缠论可视化分析插件项目地址: https://gitcode.com/gh_mirrors/ind/Indicator 还在为复杂的缠论分析而头疼吗？想要在通达信软件中轻松识别分型、笔、线…...

编程新知 2026/5/20 5:22:07

告别GDB依赖：在NEMU里打造专属调试器，我是如何搞定单步执行与内存扫描的

从零构建教学级调试器：NEMU Monitor模块深度解析与实践指南在计算机系统与体系结构的学习过程中，调试器如同探索程序执行奥秘的显微镜。传统调试工具如GDB虽然功能强大，但其内部工作机制对初学者而言却如同黑箱。本文将带您深入NEMU模拟器的…...

编程新知 2026/5/20 3:43:49

相关文章：