当前位置: 首页 > article >正文

别再只盯着准确率了!用sklearn实战搞懂分类模型的Precision、Recall和F1

别再只盯着准确率了用sklearn实战搞懂分类模型的Precision、Recall和F1当你第一次用sklearn训练完分类模型看到测试集上90%的准确率时是不是觉得稳了但实际部署后才发现这个高准确率模型根本抓不住关键事件——比如把癌症误诊为健康或者让垃圾邮件塞满收件箱。这时候你需要的不是accuracy而是三个更犀利的武器精确率、召回率和F1分数。1. 为什么准确率会骗人上周帮朋友分析一个信用卡欺诈检测模型测试集准确率高达99.5%但银行风控团队却抱怨完全抓不到骗子。打开混淆矩阵一看就明白了——在10000笔交易中欺诈交易只有50笔模型只要把所有交易都预测为正常就能轻松获得9950/1000099.5%的准确率。这种情况在类别不平衡的场景中尤为常见医疗诊断健康样本远多于患病样本异常检测正常事件占绝大多数推荐系统用户未点击商品远多于点击from sklearn.datasets import make_classification from sklearn.dummy import DummyClassifier # 生成极度不平衡数据集正负样本比例1:99 X, y make_classification(n_samples10000, weights[0.99], flip_y0, random_state42) # 使用总是预测多数类的策略 dummy DummyClassifier(strategymost_frequent).fit(X, y) print(f准确率: {dummy.score(X, y):.2%}) # 输出: 准确率: 99.00%提示当正样本比例低于5%时准确率指标基本失效此时需要关注precision和recall2. 三大核心指标实战解析2.1 精确率Precision宁缺毋滥精确率回答的问题是模型预测为正的样本中有多少是真的正样本这在误判成本高的场景至关重要。比如法律量刑预测错判比漏判更严重电商推荐用户对误推商品更敏感from sklearn.metrics import precision_score # 真实标签1代表重要邮件0代表普通邮件 y_true [1, 0, 0, 1, 1, 0, 1, 1] # 模型预测第2、5个预测错误 y_pred [1, 1, 0, 1, 0, 0, 1, 1] precision precision_score(y_true, y_pred) print(f精确率: {precision:.2f}) # 输出: 精确率: 0.80计算过程解析TP真正例 4第1、4、7、8个样本FP假正例 1第2个样本Precision TP / (TP FP) 4/(41) 0.82.2 召回率Recall宁可错杀召回率关注实际为正的样本中模型抓住了多少适用于漏网之鱼代价大的场景癌症筛查宁可误诊也不能漏诊安全监控不能放过任何潜在威胁from sklearn.metrics import recall_score recall recall_score(y_true, y_pred) print(f召回率: {recall:.2f}) # 输出: 召回率: 0.80计算逻辑FN假负例 1第5个样本Recall TP / (TP FN) 4/(41) 0.82.3 F1分数精准与召回的艺术平衡F1是precision和recall的调和平均数在两者需要兼顾时使用。比如搜索引擎结果排序既要相关度高又要覆盖广客服机器人既要准确回答又要覆盖多问题类型from sklearn.metrics import f1_score f1 f1_score(y_true, y_pred) print(fF1分数: {f1:.2f}) # 输出: F1分数: 0.80计算公式F1 2 × (precision × recall) / (precision recall)3. 多分类场景下的指标计算当类别超过两类时sklearn提供了多种平均策略策略类型计算方式适用场景macro各类别指标的算术平均重视所有类别平等micro全局统计TP/FP/TN/FN关注样本量大的类weighted按类别样本量加权平均考虑类别不平衡from sklearn.metrics import precision_score y_true [0, 1, 2, 0, 1, 2] y_pred [0, 2, 1, 0, 0, 1] print(macro精度:, precision_score(y_true, y_pred, averagemacro)) # 0.22 print(micro精度:, precision_score(y_true, y_pred, averagemicro)) # 0.33 print(加权精度:, precision_score(y_true, y_pred, averageweighted)) # 0.22 print(各类别精度:, precision_score(y_true, y_pred, averageNone)) # [0.67, 0. , 0. ]4. 实际项目中的指标选择策略在金融风控项目中我们这样制定评估策略确定业务优先级反欺诈高Recall宁可误拦也不能漏掉欺诈信用评分高Precision拒绝好客户比放过坏客户更糟调整分类阈值from sklearn.linear_model import LogisticRegression from sklearn.metrics import precision_recall_curve model LogisticRegression().fit(X_train, y_train) y_scores model.predict_proba(X_test)[:, 1] precisions, recalls, thresholds precision_recall_curve(y_test, y_scores) # 找到满足recall90%的最低阈值 threshold_90recall thresholds[np.argmax(recalls 0.90)]绘制P-R曲线import matplotlib.pyplot as plt plt.plot(recalls, precisions, linewidth2) plt.xlabel(Recall) plt.ylabel(Precision) plt.title(Precision-Recall Tradeoff)选择最佳平衡点医疗诊断选择recall突然下降的拐点内容审核选择precision陡降前的阈值最后在客户流失预测项目中我们发现单纯追求recall会导致给太多客户发放优惠成本激增只看precision又会漏掉高价值客户收入损失最终选择F1最高的阈值使保留客户数提升37%

相关文章:

别再只盯着准确率了!用sklearn实战搞懂分类模型的Precision、Recall和F1

别再只盯着准确率了!用sklearn实战搞懂分类模型的Precision、Recall和F1 当你第一次用sklearn训练完分类模型,看到测试集上90%的准确率时,是不是觉得稳了?但实际部署后才发现,这个"高准确率"模型根本抓不住关…...

企业级应用如何通过 Taotoken 实现 AI 服务的访问控制与审计

企业级应用如何通过 Taotoken 实现 AI 服务的访问控制与审计 1. 企业级 AI 集成的安全挑战 将大模型能力集成到企业内部系统时,开发团队常面临三个核心问题:如何控制不同部门对 AI 资源的访问权限,如何防止单个应用过度消耗配额&#xff0c…...

Python量化策略实盘延迟骤降87%(Cython+NUMBA双引擎实战手记)

更多请点击: https://intelliparadigm.com 第一章:Python量化策略实盘延迟骤降87%(CythonNUMBA双引擎实战手记) 在高频实盘交易场景中,Python原生循环常成为性能瓶颈。某CTA策略在实盘中平均下单延迟达142ms&#xff…...

VMware Horizon桌面USB重定向全指南:从基础配置到摄像头、大容量U盘等疑难场景处理

VMware Horizon桌面USB重定向实战手册:从策略配置到性能调优 虚拟桌面环境中USB设备的无缝使用一直是企业IT运维的痛点。想象一下这样的场景:财务部门需要通过U盘传输敏感报表,设计团队依赖数位板完成创意工作,而销售部门每天都要…...

任务栏变身全能监控中心:TrafficMonitor插件让你的Windows桌面焕然一新 ✨

任务栏变身全能监控中心:TrafficMonitor插件让你的Windows桌面焕然一新 ✨ 【免费下载链接】TrafficMonitorPlugins 用于TrafficMonitor的插件 项目地址: https://gitcode.com/gh_mirrors/tr/TrafficMonitorPlugins 你是否厌倦了在电脑桌面上打开一个又一个监…...

实测 Taotoken 多模型聚合服务的响应延迟与稳定性表现

实测 Taotoken 多模型聚合服务的响应延迟与稳定性表现 1. 测试环境与调用方法 本次测试使用 Python 脚本通过 Taotoken 的 OpenAI 兼容 API 连续调用不同模型。测试环境为华东地区的云服务器,网络延迟稳定在 50ms 以内。测试脚本基于官方推荐的最小示例稍作扩展&a…...

想进民航局搞适航审定?一文说清CAAC适航司、审定中心、地区管理局的职责与招聘门槛

民航适航审定体系职业指南:从入门到精通的择业策略 当C919国产大飞机划破天际线的那一刻,无数航空人的目光不仅追随着银翼的轨迹,更聚焦在这架国之重器背后那群"航空器守门人"——适航审定团队。这个由适航审定司、六大地区管理局和…...

别再傻傻分不清了!一文搞懂4G/5G打电话背后的三种技术:CSFB、VoLTE和VoNR到底啥区别?

移动通信语音技术演进:从CSFB到VoNR的深度解析 第一次用5G手机打电话时,很多人会注意到状态栏的"HD"标志突然出现,而有些时候又会看到网络从5G自动切换到了4G。这些现象背后,是移动通信领域三种截然不同的语音技术方案在…...

别再只用MD5了!用Python的pycryptodome库实现文件完整性校验(附AES-GCM实战)

别再只用MD5了!用Python的pycryptodome库实现文件完整性校验(附AES-GCM实战) 当我们需要验证下载的文件是否被篡改,或者确保备份数据的完整性时,文件校验是必不可少的环节。许多开发者习惯使用MD5或SHA1这类传统哈希算…...

重塑你的数字工作空间:Farouk‘s Homepage主题深度体验指南

重塑你的数字工作空间:Farouks Homepage主题深度体验指南 【免费下载链接】obsidian-homepage Obsidian homepage - Minimal and aesthetic template (with my unique features) 项目地址: https://gitcode.com/gh_mirrors/obs/obsidian-homepage 还在为Obsi…...

别再重训模型了!:用Python实现风控决策在线热更新——零停机、无状态、支持AB灰度的轻量级DSL方案

更多请点击: https://intelliparadigm.com 第一章:别再重训模型了!:用Python实现风控决策在线热更新——零停机、无状态、支持AB灰度的轻量级DSL方案 在实时风控系统中,频繁迭代策略常导致服务重启、状态丢失或灰度能…...

nodejs后端服务如何无缝集成taotoken的多模型能力

Node.js 后端服务如何无缝集成 Taotoken 的多模型能力 1. 统一接入的价值 在构建需要 AI 功能的 Web 服务或 API 时,开发者常面临多模型供应商接入的复杂性。Taotoken 提供的 OpenAI 兼容接口允许 Node.js 后端通过单一配置接入多种大模型,避免了为每个…...

Go语言构建飞书ChatGPT机器人:多模态AI助手企业级部署指南

1. 项目概述:将ChatGPT深度集成到飞书工作流 如果你和我一样,每天大部分工作时间都泡在飞书上,处理消息、文档和会议,那你肯定想过:要是能把ChatGPT直接“装”进飞书,让它成为团队里的一个“超级员工”&am…...

使用Taotoken后大模型API调用延迟与用量可视化的实际体验

使用Taotoken后大模型API调用延迟与用量可视化的实际体验 1. 接入后的核心观测指标 接入Taotoken平台后,开发者最关心的两个核心指标是API调用延迟和token用量。通过控制台的实时监控面板,可以清晰看到每次请求的响应时间分布。在持续一周的测试中&…...

QMCDecode终极指南:3步解锁QQ音乐加密文件,实现音乐播放自由

QMCDecode终极指南:3步解锁QQ音乐加密文件,实现音乐播放自由 【免费下载链接】QMCDecode QQ音乐QMC格式转换为普通格式(qmcflac转flac,qmc0,qmc3转mp3, mflac,mflac0等转flac),仅支持macOS,可自动识别到QQ音乐下载目录…...

Orion-MSP:高效处理表格数据的多尺度稀疏注意力模型

1. 项目背景与核心价值 表格数据作为企业最广泛使用的数据存储形式之一,在金融风控、医疗诊断、供应链管理等关键领域扮演着重要角色。传统表格建模方法(如随机森林、XGBoost)虽然成熟,但在处理跨表格关联、长序列依赖等复杂场景时…...

如何在Mac上实现300%性能提升:GPT-SoVITS语音合成终极优化指南

如何在Mac上实现300%性能提升:GPT-SoVITS语音合成终极优化指南 【免费下载链接】GPT-SoVITS 1 min voice data can also be used to train a good TTS model! (few shot voice cloning) 项目地址: https://gitcode.com/GitHub_Trending/gp/GPT-SoVITS 你是否…...

Tiny11Builder:基于DISM的Windows 11镜像精简架构与优化方案

Tiny11Builder:基于DISM的Windows 11镜像精简架构与优化方案 【免费下载链接】tiny11builder Scripts to build a trimmed-down Windows 11 image. 项目地址: https://gitcode.com/GitHub_Trending/ti/tiny11builder Tiny11Builder是一个基于PowerShell和Mic…...

终极PL2303驱动解决方案:让老旧串口设备在Windows 10/11重获新生

终极PL2303驱动解决方案:让老旧串口设备在Windows 10/11重获新生 【免费下载链接】pl2303-win10 Windows 10 driver for end-of-life PL-2303 chipsets. 项目地址: https://gitcode.com/gh_mirrors/pl/pl2303-win10 还在为Windows 10/11系统无法识别PL2303串…...

揭秘Windows热键冲突:精准定位与智能检测实战解析

揭秘Windows热键冲突:精准定位与智能检测实战解析 【免费下载链接】hotkey-detective A small program for investigating stolen key combinations under Windows 7 and later. 项目地址: https://gitcode.com/gh_mirrors/ho/hotkey-detective Windows系统热…...

如何10分钟完成视频字幕制作:开源神器VideoSrt让语音转字幕变得如此简单

如何10分钟完成视频字幕制作:开源神器VideoSrt让语音转字幕变得如此简单 【免费下载链接】video-srt-windows 这是一个可以识别视频语音自动生成字幕SRT文件的开源 Windows-GUI 软件工具。 项目地址: https://gitcode.com/gh_mirrors/vi/video-srt-windows 你…...

Figma中文界面插件:5分钟解决英文界面困扰,提升设计效率70%

Figma中文界面插件:5分钟解决英文界面困扰,提升设计效率70% 【免费下载链接】figmaCN 中文 Figma 插件,设计师人工翻译校验 项目地址: https://gitcode.com/gh_mirrors/fi/figmaCN 你是否曾因为Figma的英文界面而头疼?菜单…...

别再用Delay了!STM32按键控制LED的3种高级写法(中断、状态机、滤波)

别再用Delay了!STM32按键控制LED的3种高级写法(中断、状态机、滤波) 在嵌入式开发中,按键控制LED是最基础的功能之一,但很多开发者止步于简单的延时消抖实现。这种传统方法虽然容易理解,却存在实时性差、资…...

告别Docker臃肿:PhpWebStudy轻量级本地开发环境终极指南

告别Docker臃肿:PhpWebStudy轻量级本地开发环境终极指南 【免费下载链接】PhpWebStudy Lightweight Native Local Dev Toolbox for Windows, macOS & Linux. Run Hermes Agent/OpenClaw/n8n/Apache/Nginx/Caddy/Tomcat/PHP/Node.js/Bun/Deno/Python/Java/Go/Rub…...

独立开发者如何借助 Taotoken 的透明计费模式精准控制 AI 应用成本

独立开发者如何借助 Taotoken 的透明计费模式精准控制 AI 应用成本 1. 理解 Taotoken 的计费机制 Taotoken 采用按实际消耗 token 计费的模式,这与直接调用大模型厂商 API 的计费方式一致。每 1000 个 token 作为一个计费单位,开发者可以在控制台的定价…...

WRF气象模式编译前传:手把手搞定netcdf-c-4.8.1、hdf5-1.10.5等7个核心依赖库

WRF气象模式编译前传:7大核心依赖库的深度解析与实战指南 气象数值模拟的世界里,WRF(Weather Research and Forecasting)模式无疑是科研与业务预报的利器。但在这把利剑出鞘之前,我们需要为其锻造坚实的剑鞘——编译环…...

企业安全自查:手把手教你用Python脚本检测金蝶Apusic应用服务器的任意文件上传漏洞

企业安全自查:Python自动化检测金蝶Apusic文件上传漏洞实战指南 金蝶Apusic应用服务器作为企业级中间件,承载着ERP、CRM等核心业务系统的稳定运行。近期曝光的任意文件上传漏洞可能让攻击者通过恶意文件植入获取服务器控制权,这对企业数据安全…...

如何在 Taotoken 平台快速接入 OpenAI 兼容 API 并调用多模型

如何在 Taotoken 平台快速接入 OpenAI 兼容 API 并调用多模型 1. 获取 API Key 与模型 ID 登录 Taotoken 控制台后,在「API 密钥」页面点击「创建新密钥」生成 API Key。建议复制并妥善保存该密钥,页面关闭后将无法再次查看完整内容。随后进入「模型广…...

告别if-else!用SVA断言给你的SystemVerilog验证代码做个大瘦身

用SVA断言重构SystemVerilog验证代码:从if-else到高效断言的艺术 在数字芯片验证领域,SystemVerilog Assertions (SVA) 正逐渐成为验证工程师的必备技能。传统验证代码中充斥着大量if-else语句和手写checker,不仅维护成本高,而且难…...

3分钟快速上手Vue Designer:让Vue组件开发告别浏览器刷新

3分钟快速上手Vue Designer:让Vue组件开发告别浏览器刷新 【免费下载链接】vue-designer Vue component design tool 项目地址: https://gitcode.com/gh_mirrors/vu/vue-designer 你是否厌倦了在Vue组件开发过程中频繁切换编辑器与浏览器的繁琐操作&#xff…...