当前位置：首页 > article >正文

别再只盯着准确率了！用sklearn实战搞懂分类模型的Precision、Recall和F1

article 2026/5/3 13:12:20

别再只盯着准确率了用sklearn实战搞懂分类模型的Precision、Recall和F1当你第一次用sklearn训练完分类模型看到测试集上90%的准确率时是不是觉得稳了但实际部署后才发现这个高准确率模型根本抓不住关键事件——比如把癌症误诊为健康或者让垃圾邮件塞满收件箱。这时候你需要的不是accuracy而是三个更犀利的武器精确率、召回率和F1分数。1. 为什么准确率会骗人上周帮朋友分析一个信用卡欺诈检测模型测试集准确率高达99.5%但银行风控团队却抱怨完全抓不到骗子。打开混淆矩阵一看就明白了——在10000笔交易中欺诈交易只有50笔模型只要把所有交易都预测为正常就能轻松获得9950/1000099.5%的准确率。这种情况在类别不平衡的场景中尤为常见医疗诊断健康样本远多于患病样本异常检测正常事件占绝大多数推荐系统用户未点击商品远多于点击from sklearn.datasets import make_classification from sklearn.dummy import DummyClassifier # 生成极度不平衡数据集正负样本比例1:99 X, y make_classification(n_samples10000, weights[0.99], flip_y0, random_state42) # 使用总是预测多数类的策略 dummy DummyClassifier(strategymost_frequent).fit(X, y) print(f准确率: {dummy.score(X, y):.2%}) # 输出: 准确率: 99.00%提示当正样本比例低于5%时准确率指标基本失效此时需要关注precision和recall2. 三大核心指标实战解析2.1 精确率Precision宁缺毋滥精确率回答的问题是模型预测为正的样本中有多少是真的正样本这在误判成本高的场景至关重要。比如法律量刑预测错判比漏判更严重电商推荐用户对误推商品更敏感from sklearn.metrics import precision_score # 真实标签1代表重要邮件0代表普通邮件 y_true [1, 0, 0, 1, 1, 0, 1, 1] # 模型预测第2、5个预测错误 y_pred [1, 1, 0, 1, 0, 0, 1, 1] precision precision_score(y_true, y_pred) print(f精确率: {precision:.2f}) # 输出: 精确率: 0.80计算过程解析TP真正例 4第1、4、7、8个样本FP假正例 1第2个样本Precision TP / (TP FP) 4/(41) 0.82.2 召回率Recall宁可错杀召回率关注实际为正的样本中模型抓住了多少适用于漏网之鱼代价大的场景癌症筛查宁可误诊也不能漏诊安全监控不能放过任何潜在威胁from sklearn.metrics import recall_score recall recall_score(y_true, y_pred) print(f召回率: {recall:.2f}) # 输出: 召回率: 0.80计算逻辑FN假负例 1第5个样本Recall TP / (TP FN) 4/(41) 0.82.3 F1分数精准与召回的艺术平衡F1是precision和recall的调和平均数在两者需要兼顾时使用。比如搜索引擎结果排序既要相关度高又要覆盖广客服机器人既要准确回答又要覆盖多问题类型from sklearn.metrics import f1_score f1 f1_score(y_true, y_pred) print(fF1分数: {f1:.2f}) # 输出: F1分数: 0.80计算公式F1 2 × (precision × recall) / (precision recall)3. 多分类场景下的指标计算当类别超过两类时sklearn提供了多种平均策略策略类型计算方式适用场景macro各类别指标的算术平均重视所有类别平等micro全局统计TP/FP/TN/FN关注样本量大的类weighted按类别样本量加权平均考虑类别不平衡from sklearn.metrics import precision_score y_true [0, 1, 2, 0, 1, 2] y_pred [0, 2, 1, 0, 0, 1] print(macro精度:, precision_score(y_true, y_pred, averagemacro)) # 0.22 print(micro精度:, precision_score(y_true, y_pred, averagemicro)) # 0.33 print(加权精度:, precision_score(y_true, y_pred, averageweighted)) # 0.22 print(各类别精度:, precision_score(y_true, y_pred, averageNone)) # [0.67, 0. , 0. ]4. 实际项目中的指标选择策略在金融风控项目中我们这样制定评估策略确定业务优先级反欺诈高Recall宁可误拦也不能漏掉欺诈信用评分高Precision拒绝好客户比放过坏客户更糟调整分类阈值from sklearn.linear_model import LogisticRegression from sklearn.metrics import precision_recall_curve model LogisticRegression().fit(X_train, y_train) y_scores model.predict_proba(X_test)[:, 1] precisions, recalls, thresholds precision_recall_curve(y_test, y_scores) # 找到满足recall90%的最低阈值 threshold_90recall thresholds[np.argmax(recalls 0.90)]绘制P-R曲线import matplotlib.pyplot as plt plt.plot(recalls, precisions, linewidth2) plt.xlabel(Recall) plt.ylabel(Precision) plt.title(Precision-Recall Tradeoff)选择最佳平衡点医疗诊断选择recall突然下降的拐点内容审核选择precision陡降前的阈值最后在客户流失预测项目中我们发现单纯追求recall会导致给太多客户发放优惠成本激增只看precision又会漏掉高价值客户收入损失最终选择F1最高的阈值使保留客户数提升37%

别再只盯着准确率了！用sklearn实战搞懂分类模型的Precision、Recall和F1

相关文章：

别再只盯着准确率了！用sklearn实战搞懂分类模型的Precision、Recall和F1

企业级应用如何通过 Taotoken 实现 AI 服务的访问控制与审计

Python量化策略实盘延迟骤降87%（Cython+NUMBA双引擎实战手记）

VMware Horizon桌面USB重定向全指南：从基础配置到摄像头、大容量U盘等疑难场景处理

任务栏变身全能监控中心：TrafficMonitor插件让你的Windows桌面焕然一新 ✨

实测 Taotoken 多模型聚合服务的响应延迟与稳定性表现

想进民航局搞适航审定？一文说清CAAC适航司、审定中心、地区管理局的职责与招聘门槛

别再傻傻分不清了！一文搞懂4G/5G打电话背后的三种技术：CSFB、VoLTE和VoNR到底啥区别？

别再只用MD5了！用Python的pycryptodome库实现文件完整性校验（附AES-GCM实战）

重塑你的数字工作空间：Farouk‘s Homepage主题深度体验指南

别再重训模型了！：用Python实现风控决策在线热更新——零停机、无状态、支持AB灰度的轻量级DSL方案

nodejs后端服务如何无缝集成taotoken的多模型能力

Go语言构建飞书ChatGPT机器人：多模态AI助手企业级部署指南

使用Taotoken后大模型API调用延迟与用量可视化的实际体验

QMCDecode终极指南：3步解锁QQ音乐加密文件，实现音乐播放自由

Orion-MSP：高效处理表格数据的多尺度稀疏注意力模型

如何在Mac上实现300%性能提升：GPT-SoVITS语音合成终极优化指南

Tiny11Builder：基于DISM的Windows 11镜像精简架构与优化方案

终极PL2303驱动解决方案：让老旧串口设备在Windows 10/11重获新生

揭秘Windows热键冲突：精准定位与智能检测实战解析

如何10分钟完成视频字幕制作：开源神器VideoSrt让语音转字幕变得如此简单

Figma中文界面插件：5分钟解决英文界面困扰，提升设计效率70%

别再用Delay了！STM32按键控制LED的3种高级写法（中断、状态机、滤波）

告别Docker臃肿：PhpWebStudy轻量级本地开发环境终极指南

独立开发者如何借助 Taotoken 的透明计费模式精准控制 AI 应用成本

WRF气象模式编译前传：手把手搞定netcdf-c-4.8.1、hdf5-1.10.5等7个核心依赖库

企业安全自查：手把手教你用Python脚本检测金蝶Apusic应用服务器的任意文件上传漏洞

如何在 Taotoken 平台快速接入 OpenAI 兼容 API 并调用多模型

告别if-else！用SVA断言给你的SystemVerilog验证代码做个大瘦身

3分钟快速上手Vue Designer：让Vue组件开发告别浏览器刷新