当前位置：首页 > news >正文

python：用 sklearn.metrics 评价 K-Means 聚类模型

news 2025/7/8 8:11:41

sklearn 的 metrics 模块提供的聚类模型评价指标如下：

ARI 评价法（兰德系数）: adjusted_rand_score
AMI 评价法（相互信息）: adjusted_mutual_info_score
V-measure 评分 : completeness_score
FMI 评价法 : fowlkes_mallows_score
轮廓系数评价法 : silhouette_score
Calinski-Harabasz 指数评价法 : calinski_harabasz_score

编写 test_sklearn_4.py 如下

# -*- coding: utf-8 -*-
""" 使用 sklearn 评价 K-Means 聚类模型 """
#import numpy as np
#import pandas as pd
import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn import preprocessing
from sklearn import cluster# 1.加载 鸢尾花 数据集
iris = datasets.load_iris()
# 数据集的数据
iris_data = iris['data']
# 数据集的标签
iris_target = iris['target']# 使用 FMI 评价法评价 K-Means 聚类模型
from sklearn.metrics import fowlkes_mallows_score
for i in range(2,7):# 构建并训练模型kmeans = cluster.KMeans(n_clusters=i, n_init=10,random_state=123).fit(iris_data)score = fowlkes_mallows_score(iris_target, kmeans.labels_)print(f"iris_{i} 类 FMI 评价分数: {score}")
print('--------')# 使用轮廓系数评价法评价 K-Means 聚类模型
from sklearn.metrics import silhouette_score
silhScore = []
for i in range(2,10):
# 构建并训练模型kmeans = cluster.KMeans(n_clusters=i, n_init=10,random_state=123).fit(iris_data)score = silhouette_score(iris_data, kmeans.labels_)silhScore.append(score)
plt.figure(figsize=(10,6))
plt.plot(range(2,10), silhScore, linewidth=1.5, linestyle='-')
plt.show()# 使用 Calinski-Harabasz 指数评价 K-Means 聚类模型
from sklearn.metrics import calinski_harabasz_score
for i in range(2,7):# 构建并训练模型kmeans = cluster.KMeans(n_clusters=i, n_init=10,random_state=123).fit(iris_data)score = calinski_harabasz_score(iris_data, kmeans.labels_)print(f"iris_{i} 类 calinski_harabasz 指数为: {score}")

cmd
set OMP_NUM_THREADS=1
python test_sklearn_4.py

(base) D:\python> python test_sklearn_4.py
iris_2 类 FMI 评价分数: 0.7504732564880243
iris_3 类 FMI 评价分数: 0.8208080729114153
iris_4 类 FMI 评价分数: 0.7539699941396392
iris_5 类 FMI 评价分数: 0.7254830776265845
iris_6 类 FMI 评价分数: 0.614344977586966
--------
iris_2 类 calinski_harabasz 指数为: 513.9245459802768
iris_3 类 calinski_harabasz 指数为: 561.62775662962
iris_4 类 calinski_harabasz 指数为: 530.4871420421675
iris_5 类 calinski_harabasz 指数为: 495.54148767768777
iris_6 类 calinski_harabasz 指数为: 469.8366331329009

参考书：【Python 数据分析与应用】第6章使用 scikit-learn 构建模型

python：用 sklearn.metrics 评价 K-Means 聚类模型

sklearn 的 metrics 模块提供的聚类模型评价指标如下： ARI 评价法（兰德系数）: adjusted_rand_score AMI 评价法（相互信息）: adjusted_mutual_info_score V-measure 评分 : completeness_score FMI 评价法 : fowlkes_m…...

编程日记 2024/12/20 10:30:10

Spring依赖注入不同类型的数据

目录前言回顾注入集合 List与set集合 Map集合前言前面学习依赖注入时注入的都是对象，这里记录注入的值为集合的情况回顾在注入的时候，如果要注入的属性的值为字符串或基本数据类型，用value即可；如果要注入一个对象的…...

编程日记 2024/12/20 10:23:01

Linux大杂烩！！！

Linux 命令大全 https://www.runoob.com/linux/linux-command-manual.html Linux下打印ASCII字符 ASCII码对照表及转换器 [rootuntifa_80 ~]# printf "\x30\n" 0 [rootuntifa_80 ~]# echo -e "\u0030" 0tar、gzip 打包解压命令参考文章：ta…...

编程日记 2024/12/20 10:22:00

12.19问答解析

概述某中小型企业有四个部门，分别是市场部、行政部、研发部和工程部，请合理规划IP地址和VLAN，实现企业内部能够互联互通，同时要求市场部、行政部和工程部能够访问外网环境(要求使用OSPF协议)，研发部不能访问外网环境…...

编程日记 2024/12/20 10:08:46

C语言——实现杨氏矩阵

什么是杨氏矩阵？ 概念： 有一个数字矩阵，矩阵的每行从左到右是递增的，矩阵从上到下是递增的 eg： 1 2 3 4 5 6 7 8 9 题目： 请编写程序在这样的矩阵中查找某个数字是否存在。要求：时间复…...

编程日记 2024/12/20 10:03:40

授权模型PAM

PAM（Privileged Access Management）是一种授权模型，用于管理和控制特权用户的访问权限。PAM的目标是确保特权用户只能在需要时获得所需的特权，并且他们的活动得到适当的监控和审计。 PAM的核心思想是将特权访问权限视为一种受限的…...

编程日记 2024/12/20 10:02:39

【Leecode】子集⭐⭐

子集 [78]子集I 题目描述给你一个整数数组 nums ，数组中的元素互不相同。返回该数组所有可能的子集（幂集）。解集不能包含重复的子集。你可以按任意顺序返回解集。示例输入示例 1： 输入：nums [1, 2, 3…...

编程日记 2024/12/20 10:00:36

Linux高性能服务器编程 | 读书笔记 | 12. 多线程编程

12. 多线程编程注：博客中有书中没有的内容，均是来自黑马06-线程概念_哔哩哔哩_bilibili 早期Linux不支持线程，直到1996年，Xavier Leroy等人开发出第一个基本符合POSIX标准的线程库LinuxThreads，但LinuxThreads效率…...

编程日记 2024/12/20 9:57:32

[HNCTF 2022 Week1]baby_rsa

源代码： from Crypto.Util.number import bytes_to_long, getPrime from gmpy2 import * from secret import flag m bytes_to_long(flag) p getPrime(128) q getPrime(128) n p * q e 65537 c pow(m,e,n) print(n,c) # 62193160459999883112594854240161159…...

编程日记 2024/12/20 9:55:30

解析Java中的Stream API：函数式编程与性能优化

自Java 8以来，Java语言引入了Stream API，为开发者提供了一种全新的数据处理方式。Stream API支持函数式编程风格，使得对集合、数组、IO流等数据源的操作更加简洁、直观且具有高效的性能优势。通过Stream API，我们可以在不修改原有…...

编程日记 2024/12/20 9:54:28

java简单题目练习

大家好，今天我们不学习新的内容，今天给大家分享一些简单的java算法题供大家练练手，那么我们下面就来看看。那么大家下去练习一下，我们明天继续讲解类和对象的相关知识，谢谢大家！！！...

编程日记 2024/12/20 9:52:26

Kaggler日志--Day9

进度24/12/18 昨日复盘： 补充并解决Day7Kaggler日志–Day7统计的部分问题今日进度： 继续完成Day8Kaggler日志–Day8统计问题的解答明日规划： 今天报名了Regression with an Insurance Dataset算是新手村练习比赛，截止时间是2…...

编程日记 2024/12/20 9:51:25

OpenCVE：一款自动收集NVD、MITRE等多源知名漏洞库的开源工具，累计收录CVE 27万+

漏洞库在企业中扮演着至关重要的角色，不仅提升了企业的安全防护能力，还支持了安全决策、合规性要求的满足以及智能化管理的发展。前期博文《业界十大知名权威安全漏洞库介绍》介绍了主流漏洞库，今天给大家介绍一款集成了多款漏洞库的开源漏洞…...

编程日记 2024/12/20 9:48:22

麒麟信安参编的《能源企业数字化转型能力评价技术可控》团体标准发布

近日，中国能源研究会发布公告，《能源企业数字化转型能力评价技术可控》团体标准发布。该标准由麒麟信安与国网湖北省电力有限公司武汉供电公司、国网智能电网研究院有限公司、中能国研（北京）电力科学研究院等单位联合编制。《能…...

编程日记 2024/12/20 9:45:18

戴尔物理机更换完Raid控制器（阵列卡），启动服务器失败

背景我们使用的物理机是戴尔的POWEREDGE R730机器，由于硬件损坏导致该问题的延申，再更换完Raid的控制器（阵列卡）之后导致启动服务器报错。报错： There are offline or missing virtual drives with preserved cac…...

编程日记 2024/12/20 9:43:16

计算机基础知识——数据结构与算法（二）（山东省大数据职称考试）

大数据分析应用-初级第一部分基础知识一、大数据法律法规、政策文件、相关标准二、计算机基础知识三、信息化基础知识四、密码学五、大数据安全六、数据库系统七、数据仓库. 第二部分专业知识一、大数据技术与应用二、大数据分析模型三、数据科学大数据相关标准…...

编程日记 2024/12/20 9:38:10

docsify

macos ➜ ~ node -v v16.20.2➜ ~ npm --version 8.19.4全局安装 docsify-cli 工具 npm i docsify-cli -g➜ ~ docsify -vdocsify-cli version:4.4.4初始化项目 docsify init ./docsls -ah docs . .. .nojekyll README.md index.htmlindex.html 入口文件README.md 会…...

编程日记 2024/12/20 9:35:07

GEE教程——使用 CHIRPS 和 GSMaP 数据集计算并可视化了特定区域的降水量

目录简介函数 ee.Image.pixelLonLat() No arguments. Returns: Image visualize(bands, gain, bias, min, max, gamma, opacity, palette, forceRgbOutput) Arguments: Returns: Image 代码解释代码结果简介 GEE教程——使用 CHIRPS 和 GSMaP 数据集计算并可视…...

编程日记 2024/12/20 9:34:06

前端实现页面自动播放音频方法

前端实现页面视频在谷歌浏览器中自动播放音频方法了解Chrome自动播放策略在Chrome和其他现代浏览器中，为了改善用户体验，自动播放功能受到了限制。Chrome的自动播放策略主要针对有声音的视频，目的是防止页面在用户不知情的情况下自动播放声…...

编程日记 2024/12/20 9:33:05

【Nginx-5】Nginx 限流配置指南：保护你的服务器免受流量洪峰冲击

在现代互联网应用中，流量波动是常态。无论是突发的用户访问高峰，还是恶意攻击，都可能导致服务器资源耗尽，进而影响服务的可用性。为了应对这种情况，限流（Rate Limiting）成为了一种常见的保护措施…...

编程日记 2024/12/20 9:32:03

【大模型RAG】拍照搜题技术架构速览：三层管道、两级检索、兜底大模型

摘要拍照搜题系统采用“三层管道（多模态 OCR → 语义检索 → 答案渲染）、两级检索（倒排 BM25 向量 HNSW）并以大语言模型兜底”的整体框架： 多模态 OCR 层将题目图片经过超分、去噪、倾斜校正后，分别用…...

编程新知 2025/7/7 17:33:09

接口测试中缓存处理策略

在接口测试中，缓存处理策略是一个关键环节，直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性，避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明： 一、缓存处理的核…...

编程新知 2025/7/7 17:37:24

React hook之useRef

React useRef 详解 useRef 是 React 提供的一个 Hook，用于在函数组件中创建可变的引用对象。它在 React 开发中有多种重要用途，下面我将全面详细地介绍它的特性和用法。基本概念 1. 创建 ref const refContainer useRef(initialValue);initialValu…...

编程新知 2025/6/11 15:21:26

c++ 面试题(1)-----深度优先搜索（DFS）实现

操作系统：ubuntu22.04 IDE:Visual Studio Code 编程语言：C11 题目描述地上有一个 m 行 n 列的方格，从坐标 [0,0] 起始。一个机器人可以从某一格移动到上下左右四个格子，但不能进入行坐标和列坐标的数位之和大于 k 的格子。例…...

编程新知 2025/7/6 20:47:25

学习STC51单片机31（芯片为STC89C52RCRC）OLED显示屏1

每日一言生活的美好，总是藏在那些你咬牙坚持的日子里。硬件：OLED 以后要用到OLED的时候找到这个文件 OLED的设备地址 SSD1306"SSD" 是品牌缩写，"1306" 是产品编号。驱动 OLED 屏幕的 IIC 总线数据传输格式示意图 …...

编程新知 2025/7/6 12:08:18

Swagger和OpenApi的前世今生

Swagger与OpenAPI的关系演进是API标准化进程中的重要篇章，二者共同塑造了现代RESTful API的开发范式。本期就扒一扒其技术演进的关键节点与核心逻辑： 🔄 一、起源与初创期：Swagger的诞生（2010-2014） 核心…...

编程新知 2025/6/20 15:14:31

算法岗面试经验分享-大模型篇

文章目录 A 基础语言模型A.1 TransformerA.2 Bert B 大语言模型结构B.1 GPTB.2 LLamaB.3 ChatGLMB.4 Qwen C 大语言模型微调C.1 Fine-tuningC.2 Adapter-tuningC.3 Prefix-tuningC.4 P-tuningC.5 LoRA A 基础语言模型 A.1 Transformer （1）资源论文&a…...

编程新知 2025/7/4 18:44:06

短视频矩阵系统文案创作功能开发实践，定制化开发

在短视频行业迅猛发展的当下，企业和个人创作者为了扩大影响力、提升传播效果，纷纷采用短视频矩阵运营策略，同时管理多个平台、多个账号的内容发布。然而，频繁的文案创作需求让运营者疲于应对，如何高效产出高质量文案成…...

编程新知 2025/7/4 14:33:59

LOOI机器人的技术实现解析：从手势识别到边缘检测

LOOI机器人作为一款创新的AI硬件产品，通过将智能手机转变为具有情感交互能力的桌面机器人，展示了前沿AI技术与传统硬件设计的完美结合。作为AI与玩具领域的专家，我将全面解析LOOI的技术实现架构，特别是其手势识别、物体识别和环境…...

编程新知 2025/6/10 21:22:04

【阅读笔记】MemOS: 大语言模型内存增强生成操作系统

核心速览研究背景研究问题：这篇文章要解决的问题是当前大型语言模型（LLMs）在处理内存方面的局限性。LLMs虽然在语言感知和生成方面表现出色，但缺乏统一的、结构化的内存架构。现有的方法如检索增强生成（RA…...

编程新知 2025/7/6 18:45:39

相关文章：