机器学习和数据挖掘03-模型性能评估指标
Accuracy(准确率)
概念:模型正确预测的样本数量与总样本数量的比例。
公式:Accuracy = (TP + TN) / (TP + TN + FP + FN)
TP (True Positives):正确预测为正例的样本数。即模型正确地将正例判定为正例。
TN (True Negatives):正确预测为负例的样本数。即模型正确地将负例判定为负例。
FP (False Positives):错误预测为正例的样本数。即模型错误地将负例判定为正例。
FN (False Negatives):错误预测为负例的样本数。即模型错误地将正例判定为负例。
代码实现
from sklearn.metrics import accuracy_scorey_true = [0, 1, 1, 0, 1, 0]
y_pred = [0, 1, 0, 0, 1, 1]accuracy = accuracy_score(y_true, y_pred)
print("Accuracy:", accuracy)
Precision(精确度)
概念:被模型正确分类为正例的样本数量与所有被模型分类为正例的样本数量的比例。
公式:Precision = TP / (TP + FP)
代码实现
from sklearn.metrics import precision_scoreprecision = precision_score(y_true, y_pred)
print("Precision:", precision)
Recall(召回率)
概念:在所有实际正例中,模型正确识别的比例。
公式:Recall = TP / (TP + FN)
代码实现
from sklearn.metrics import recall_scorerecall = recall_score(y_true, y_pred)
print("Recall:", recall)
F1-Score
概念:综合了模型的精确度和召回率,是一个更全面的指标。
公式:F1 Score = 2 * (Precision * Recall) / (Precision + Recall)
代码实现
from sklearn.metrics import f1_scoref1 = f1_score(y_true, y_pred)
print("F1-Score:", f1)
Time Taken(花费时间)
这个指标通常不是用公式来计算的,而是通过代码中记录开始时间和结束时间,然后计算时间差来得出。
Root Mean-Squared Error (RMSE)(均方根误差)
概念:衡量模型预测值与真实值之间的平均差异。是均方误差的平方根。
公式:RMSE = sqrt(MSE)
from sklearn.metrics import mean_squared_error
import numpy as npy_true = np.array([3.0, 2.5, 4.8])
y_pred = np.array([2.8, 2.7, 4.5])mse = mean_squared_error(y_true, y_pred)
rmse = np.sqrt(mse)
print("RMSE:", rmse)
Mean Absolute Error (MAE)(平均绝对误差)
概念:衡量模型预测值与真实值之间的平均绝对差异。
公式:MAE = (|y_true - y_pred|) / n
from sklearn.metrics import mean_absolute_errormae = mean_absolute_error(y_true, y_pred)
print("MAE:", mae)
Log-loss/Cross-entropy loss(对数损失/交叉熵损失)
概念:衡量模型在预测概率时的准确性。适用于二分类问题的交叉熵损失为对数损失。
公式:Log-loss = - (y_true * log(y_pred) + (1 - y_true) * log(1 - y_pred))
代码实现
from sklearn.metrics import log_lossy_true = [0, 1, 1, 0]
y_pred = [0.2, 0.8, 0.7, 0.3]logloss = log_loss(y_true, y_pred)
print("Log-loss:", logloss)相关文章:
机器学习和数据挖掘03-模型性能评估指标
Accuracy(准确率) 概念:模型正确预测的样本数量与总样本数量的比例。 公式:Accuracy (TP TN) / (TP TN FP FN) TP (True Positives):正确预测为正例的样本数。即模型正确地将正例判定为正例。 TN (True Negati…...
PageNumberPagination、LimitOffsetPagination、CursorPagination
数据 from django.db import modelsclass User(models.Model):username models.CharField(max_length64, verbose_name用户名)password models.CharField(max_length64, verbose_name密码)# 用户类型user_type models.IntegerField(choices((1, 菜鸟用户), (2, 普通用户), …...
怎么把视频转换成mp4格式
怎么把视频转换成mp4格式?如今,随着科技的不断发展,我们在工作中接触到的多媒体视频格式也越来越多。其中,MP4作为一种广泛兼容的视频格式,在许多软件中都能轻松播放,并且成为了剪辑与裁剪视频时大家常用的…...
正则判断字符是否包含手机号
字符前后不能是数字,满足手机号标准 String msg "19009098989";String mobliePattern "((?<!\\d))(mobile|手机号|)(|\\[|\\\":\\\"|:|:||:|)(1)([3-9]{1}\\d{1})(\\d{4})(\\d{4})(\\]|\\\"||)((?!\\d))";String mobileR…...
OSCP系列靶场-Esay-Sumo
OSCP系列靶场-Esay-Sumo 总结 getwebshell : nikto扫描 → 发现shellshock漏洞 → 漏洞利用 → getwebshell 提 权 思 路 : 内网信息收集 → 内核版本较老 →脏牛提权 准备工作 启动VPN 获取攻击机IP → 192.168.45.194 启动靶机 获取目标机器IP → 192.168.190.87 信息收…...
本地电脑搭建web服务器、个人博客网站并发布公网访问 【无公网IP】(1)
文章目录 前言1. 安装套件软件2. 创建网页运行环境 指定网页输出的端口号3. 让WordPress在所需环境中安装并运行 生成网页4. “装修”个人网站5. 将位于本地电脑上的网页发布到公共互联网上 前言 在现代社会,网络已经成为我们生活离不开的必需品,而纷繁…...
Python基础List列表定义与函数
如何定义一个非空的列表? name_list ["liming","xiaohong",15,{"hobby":"basketball"}] 列表的特点: 1.列表是有序的 2.可以存放多个元素 3.每个元素可以是任何数据类型 定义一个空列表 name_list [] 访…...
typeScript--[数据定义]
一.安装ts 1.命令行运行如下命令,全局安装 TypeScript: npm install -g typescript2.安装完成后,在控制台运行如下命令,检查安装是否成功 tsc -V 二.创建ts文件 1.创建一个day01.ts文件,随便在里面码一点代码&…...
【常见相机模型】
常见相机模型 enum class Type {kPinhole 0,kUnifiedProjection 1,kOmni 2, //optimize_on_spherekEqFisheye 3};其余类型optimize_on_plane这4种类型的相机模型具有以下差异: kPinhole (针孔相机模型):这是最基本和常见的相机模型。它假设光线通过…...
大数据-玩转数据-Flink状态编程(上)
一、Flink状态编程 有状态的计算是流处理框架要实现的重要功能,因为稍复杂的流处理场景都需要记录状态,然后在新流入数据的基础上不断更新状态。 SparkStreaming在状态管理这块做的不好, 很多时候需要借助于外部存储(例如Redis)来手动管理状态, 增加了编…...
主动获取用户的ColaKey接口
主动获取用户的ColaKey接口 一、主动获取用户的ColaKey接口二、使用步骤1、接口***重要提示:建议使用https协议,当https协议无法使用时再尝试使用http协议***2、请求参数 三、 请求案例和demo1、请求参数例子(POST请求,参数json格式)2、响应返…...
C#写一个UDP程序判断延迟并运行在Centos上
服务端 using System.Net.Sockets; using System.Net;int serverPort 50001; Socket server; EndPoint client new IPEndPoint(IPAddress.Any, 0);//用来保存发送方的ip和端口号CreateSocket();void CreateSocket() {server new Socket(AddressFamily.InterNetwork, SocketT…...
Kafka核心原理第二弹——更新中
架构原理 一、高吞吐机制:Batch打包、缓冲区、acks 1. Kafka Producer怎么把消息发送给Broker集群的? 需要指定把消息发送到哪个topic去 首先需要选择一个topic的分区,默认是轮询来负载均衡,但是如果指定了一个分区key&#x…...
巨人互动|游戏出海H5游戏出海规模如何?
H5游戏出海是指将H5游戏推广和运营扩展到国外市场的行为,它的规模受到多个因素的影响。本文小编讲一些关于H5游戏出海规模的详细介绍。 1、市场规模 H5游戏出海的规模首先取决于目标市场的规模。不同国家和地区的游戏市场规模差异很大,有些市场庞大而成…...
【爬虫】实验项目三:验证码处理与识别
目录 一、实验目的 二、实验预习提示 三、实验内容 实验要求 基本要求: 改进要求A: 改进要求B: 四、实验过程 基本要求 五、源码如下 六、资料 一、实验目的 部分网站可能会使用验证机制来阻止用户无效登录或者是验证用户不是用程…...
广东成人高考报名将于9月14日开始!
截图来自广东省教育考试院官网* 今年的广东成人高考正式报名时间终于确定了! 报名时间:2023年 9 月14—20日 准考证打印时间:考前一周左右 考试时间:2023年10月21—22日 录取时间:2023年12 月中上旬 报名条件: …...
pytorch中文文档学习笔记
先贴上链接 torch - PyTorch中文文档 首先我们需要安装拥有pytorch的环境 conda指令 虚拟环境的一些指令 查看所有虚拟环境 conda info -e 创建新的虚拟环境 conda create -n env_name python3.6 删除已有环境 conda env remove -n env_name 激活某个虚拟环境 activate env…...
element-ui全局导入与按需引入
全局引入 npm i element-ui -S 安装好depencencies里面可以看到安装的element-ui版本 然后 在 main.js 中写入以下内容: import Vue from vue; import ElementUI from element-ui; import element-ui/lib/theme-chalk/index.css; import App from ./App.vue;Vue.…...
go 地址 生成唯一索引v2 --chatGPT
问:golang 函数 getIndex(n,addr,Hlen,Tlen) 返回index。参数n为index的上限,addr为包含大小写字母数字的字符串,Hlen为截取addr头部的长度,Tlen为截取addr尾部的长度 gpt: 你可以编写一个函数来计算根据给定的参数 n、addr、Hlen 和 Tlen …...
JSON XML
JSON(JavaScript Object Notation)和XML(eXtensible Markup Language)是两种常用的数据交换格式,用于在不同系统之间传输和存储数据。 JSON是一种轻量级的数据交换格式,它使用易于理解的键值对的形式表示数…...
保姆级教程:手把手教你用LIN诊断协议传输超过5字节的数据(附多帧传输实战代码)
突破LIN诊断协议5字节限制:多帧传输实战指南 在汽车电子开发中,LIN总线因其低成本、高可靠性的特点,被广泛应用于车身控制、传感器网络等场景。但LIN协议的单帧5字节数据限制,常常成为开发者面临的技术瓶颈——无论是ECU固件升级还…...
太阳能电池阵列监测实战:用AMC1301搞定200V共模电压下的单体电压采集
太阳能电池阵列单体电压监测:基于AMC1301的高压隔离采集方案设计指南 光伏电站的电池阵列通常由数十至数百块单体电池串联组成,系统电压可达600-1500V。在这种高压堆叠场景下,如何准确监测每块单体电池的电压(通常仅0.5-0.7V&…...
Paimon数据湖实战:Merge Engines深度解析与应用场景
1. Paimon数据湖中的Merge Engines核心机制 第一次接触Paimon的Merge Engines时,我完全被它强大的数据合并能力震撼到了。这就像是一个智能的数据管家,能够根据不同的业务需求,自动帮你处理各种复杂的数据合并场景。在实际项目中,…...
Nomic-Embed-Text-V2-MoE生成技术博客:以CSDN风格撰写模型评测文章
Nomic-Embed-Text-V2-MoE生成技术博客:用向量分析读懂CSDN热门文章的秘密 最近在尝试用AI辅助写技术博客,发现一个挺有意思的思路:与其让模型凭空创作,不如先让它“学习”一下社区里那些受欢迎的文章到底长什么样。这就好比你要写…...
IEC102协议报文解析:从格式到传输的实战指南
1. IEC102协议基础入门:电力系统的"语言密码" 第一次接触IEC102协议时,我完全被那些十六进制代码和术语搞晕了。直到有一次在变电站调试电表,看到主站和终端设备用这种"暗号"流畅对话,才真正理解它的价值。简…...
如何通过内置实时地图彻底解决黑神话悟空中的迷路问题:终极导航指南
如何通过内置实时地图彻底解决黑神话悟空中的迷路问题:终极导航指南 【免费下载链接】wukong-minimap 黑神话内置实时地图 / Black Myth: Wukong Built-in real-time map 项目地址: https://gitcode.com/gh_mirrors/wu/wukong-minimap 在《黑神话:…...
从‘饱和度’到‘肤色正常’:深入理解CCM色彩校正矩阵的调试逻辑与参数关系
从‘饱和度’到‘肤色正常’:深入理解CCM色彩校正矩阵的调试逻辑与参数关系 在数字图像处理领域,色彩校正矩阵(Color Correction Matrix,CCM)的调试一直是工程师们面临的技术难点之一。不同于简单的参数调整࿰…...
几何完备扩散模型GCDM:从理论突破到SBDD实战评测与部署指南
1. 几何完备扩散模型GCDM的核心突破 第一次看到GCDM论文时,我被它解决3D分子生成痛点的思路惊艳到了。传统方法就像用2D积木搭3D建筑——EDM等模型依赖的EGNN网络只能处理距离信息,而GCDM引入的GCPNET架构彻底改变了游戏规则。这个改进相当于给模型装上了…...
Ubuntu 20.04 LTS下Miniconda3安装与配置全攻略(含常见错误解决)
Ubuntu 20.04 LTS下Miniconda3安装与配置全攻略(含常见错误解决) 如果你正在Ubuntu 20.04 LTS上搭建Python开发或数据科学环境,Miniconda3绝对是一个值得考虑的选择。作为Anaconda的精简版,它保留了核心的conda包管理功能&#x…...
Java开发者必看:Lingbot深度模型服务端集成与高并发处理
Java开发者必看:Lingbot深度模型服务端集成与高并发处理 最近和几个做Java后端的朋友聊天,发现大家对接AI模型服务时,都遇到了类似的头疼事。模型本身效果不错,但一集成到自己的Spring Boot项目里,特别是流量稍微大点…...
