当前位置：首页 > article >正文

【漫话机器学习系列】265.普拉托变换的相关问题（Issues With Platt Scaling）

article 2026/2/8 7:21:59

Platt Scaling 的相关问题详解 | 模型校准中的隐患分析

在机器学习模型中，模型预测的“置信度”并不一定等于真实的概率。为了提高模型预测结果的可解释性和实用性，我们通常会使用一种后处理的概率校准方法——Platt Scaling（普拉托变换）。

然而，Platt Scaling 虽然常用，也并非万能。在实践中，它可能会带来一些潜在的问题。本文将结合下图，详细分析使用 Platt Scaling 时常见的两个关键问题。

一、Platt Scaling 简介

Platt Scaling 是一种基于逻辑回归的概率校准方法。它的核心思想是：
在模型已经输出一个打分（如 SVM 的输出距离）之后，再训练一个逻辑回归模型来将这些分数映射为概率。

数学形式为：

$P(y=1 \mid f) = \frac{1}{1 + \exp(Af + B)}$

其中，ff 是原模型输出的打分，AA、BB 是通过最小化负对数似然（NLL）训练得到的参数。

二、问题一：资源消耗显著增加

“由于我们训练了额外的交叉验证模型，单位时间内的资源会有一个明显的增长。”

解读：

Platt Scaling 在实际应用时，为了避免过拟合，通常会采用交叉验证（如 3-fold、5-fold）来训练概率校准模型。也就是说，在原有模型训练之外，还需要构建若干个额外模型用于拟合 Platt Scaling 的 A 和 B 参数。

影响：

训练资源消耗：需要更多的计算资源（如 CPU/GPU、内存）；
训练时间延长：模型训练周期变长，尤其在大规模数据集上；
部署复杂性增加：多模型串联带来的管理复杂性。

建议：

如果资源有限，可考虑使用更轻量的校准方法，如 Isotonic Regression；
对模型部署进行优化，比如提前离线训练好校准模型，仅保存参数 A 和 B。

三、问题二：预测概率已知可能导致失真

“由于预测概率已知，因此可能会造成预测结果与预测概率不匹配。”

解读：

Platt Scaling 的目标是将模型输出映射为概率。但因为训练过程中，目标是最小化负对数似然损失（NLL），这可能导致模型更关注概率拟合而非最终分类正确性。

此外，在某些数据分布不平衡的情况下，Platt Scaling 会受到过拟合干扰。例如，极端样本过多时，预测概率会被“压缩”或“放大”，与实际预测结果不一致。

举例说明：

假设原始模型对某个样本打分是 2.5，意味着分类器非常自信。但经过 Platt Scaling 后，映射的概率可能只有 0.6。这会影响到后续使用这些概率的任务，比如排序、风险评估等。

建议：

对不平衡数据进行重采样或加权训练；
考虑使用温度缩放（Temperature Scaling），对预测概率进行平滑调整；
对比不同校准方法在验证集上的表现，再决定是否采用 Platt Scaling。

四、结语

Platt Scaling 是一种经典且有效的概率校准方法，但它并非完美。在使用时，我们应充分了解其带来的代价和潜在失配问题，合理评估其适用性。

优点：

简单易实现；
理论基础扎实；
通常对 SVM 等 margin-based 模型效果较好。

缺点：

增加训练资源需求；
对小样本、偏态分布不鲁棒；
在某些场景下可能失真模型原始置信度。

【漫话机器学习系列】265.普拉托变换的相关问题（Issues With Platt Scaling）

Platt Scaling 的相关问题详解 | 模型校准中的隐患分析在机器学习模型中，模型预测的“置信度”并不一定等于真实的概率。为了提高模型预测结果的可解释性和实用性，我们通常会使用一种后处理的概率校准方法——Platt Scaling（普拉托变换&…...

编程日记 2026/2/2 7:56:41

【Linux高级全栈开发】2.2.1 Linux服务器百万并发实现2.2.2 Posix API与网络协议栈

【Linux高级全栈开发】2.2.1 Linux服务器百万并发实现2.2.2 Posix API与网络协议栈高性能网络学习目录基础内容（两周完成）： 2.1网络编程 2.1.1多路复用select/poll/epoll2.1.2事件驱动reactor2.1.3http服务器的实现 2.2网络原理百万并发…...

编程日记 2026/2/3 2:08:16

LlamaIndex

1、大语言模型开发框架的价值是什么？ SDK：Software Development Kit，它是一组软件工具和资源的集合，旨在帮助开发者创建、测试、部署和维护应用程序或软件。所有开发框架（SDK）的核心价值，都是降低开发、维护成本。大语言模型开发框架的价值，是让开发者可以更方便地…...

编程日记 2026/2/3 2:09:10

springboot使用xdoc-report包导出word

背景：项目需要使用xdoc-report.jar根据设置好的word模版，自动填入数据导出word 框架使用我的需求是我做一个模板然后往里面填充内容就导出我想要的word文件，问了下chatgpt还有百度，最后选用了xdocreport这个框架，主…...

编程日记 2026/2/4 22:41:36

leetcode 3356. 零数组变换 II 中等

给定一个长度为 n 的整数数组 nums 和一个二维数组 queries，其中 queries[i] [li, ri]。对于每个查询 queries[i]： 在 nums 的下标范围 [li, ri] 内选择一个下标子集。将选中的每个下标对应的元素值减 1。零数组是指所有元素都等于 0 的数组。 …...

编程日记 2026/1/5 6:30:21

重拾GMP

目录 GMP总结线程协程三家对比GMP调度模型 mgp过一遍流程 g 一个G的生命周期 mpschedt全局队列g0视角看看G的调度流程四大调度类型主动调度被动调度正常调度抢占调度宏观的调度流程上面流程的具体细节 schedule()findRunnable()execute()gosched_m()park_m()与ready()goe…...

编程日记 2026/2/3 2:08:16

实验分享|基于千眼狼sCMOS科学相机的流式细胞仪细胞核成像实验

实验背景流式细胞仪与微流控技术，为细胞及细胞核成像提供新的路径。传统流式细胞仪在细胞核成像检测方面存在检测通量低，荧光信号微弱等局限，故某光学重点实验室开发一种基于高灵敏度sCMOS科学相机并集成在自组荧光显微镜的微流控细胞核成像…...

编程日记 2026/2/3 2:08:17

C++学习：六个月从基础到就业——C++11/14：其他语言特性

C学习：六个月从基础到就业——C11/14：其他语言特性本文是我C学习之旅系列的第四十四篇技术文章，也是第三阶段"现代C特性"的第六篇，主要介绍C11/14中引入的其他重要语言特性。查看完整系列目录了解更多内容。引言在前…...

编程日记 2025/12/14 22:26:51

【Linux笔记】——线程池项目与线程安全单例模式

🔥个人主页🔥：孤寂大仙V 🌈收录专栏🌈：Linux 🌹往期回顾🌹： 【Linux笔记】——简单实习一个日志项目 🔖流水不争，争的是滔滔不息一、线程池设计二…...

编程日记 2026/2/4 20:06:25

数据驱动的社会舆情监测与分析——用算法洞察世界脉动

数据驱动的社会舆情监测与分析——用算法洞察世界脉动在信息爆炸的时代，社会舆情的变化可以在极短时间内产生深远影响。从企业品牌到公共政策，社交媒体和新闻平台上的讨论能够直接影响决策者的策略制定。因此，数据驱动的舆情监测与分析逐渐成为政府、企业以及社会机构的重…...

编程日记 2025/6/15 1:12:01

OD 算法题 B卷【最佳植树距离】

文章目录最佳植树距离最佳植树距离在直线的公路上种树，给定坑位数量和位置，及需要种多少棵树苗；树苗之间的最小距离是多少时，可以保证种的最均匀（树苗之间的最小距离最大）； 输入描述&#…...

编程日记 2026/2/7 2:50:42

ZooKeeper 原理解析及优劣比较

大家好，这里是架构资源栈！点击上方关注，添加“星标”，一起学习大厂前沿架构！ 引言在分布式系统中，服务注册、配置管理、分布式锁、选举等场景都需要一个高可用、一致性强的协调服务。Apache ZooKeeper 凭…...

编程日记 2026/2/3 2:08:21

实战5：个性化数字艺术生成与销售

盈利思路数字艺术销售： 平台销售：将生成的数字艺术作品上传到像OpenSea、Foundation等NFT平台进行售卖。每一件独特的艺术品可以通过NFT技术保证其唯一性，吸引收藏家和投资者。定价策略：根据作品的复杂度、创意性以及市场需求来…...

编程日记 2026/1/27 18:31:40

是德科技 | 单通道448G未来之路：PAM4? PAM6? PAM8?

内容来源：是德科技随着数据中心规模的不断扩大以及AI大模型等技术的兴起，市场对高速、大容量数据传输的需求日益增长。例如，AI训练集群中GPU等设备之间的互联需要更高的传输速率来提升效率。在技术升级方面，SerDes技术的不断进步…...

编程日记 2026/2/4 21:34:11

OceanBase 开发者大会，拥抱 Data*AI 战略，构建 AI 数据底座

5 月 17 号以“当 SQL 遇见 AI”为主题的 OceanBase 开发者大会在广州举行，因为行程的原因未能现场参会，仍然通过视频直播观看了全部的演讲。总体来说，这届大会既有对未来数据库演进方向的展望，也有 OceanBase 新产品的发布&#…...

编程日记 2026/2/5 16:25:08

STM32IIC协议基础及Cube配置

STM32IIC协议基础及Cube配置一，IC协议简介1，核心特点2，应用场景二，IC协议基础概念1，总线结构2，主从架构3，设备寻址4，起始和停止条件5，数据传输6，应答机制三…...

编程日记 2026/2/5 15:10:22

CNN vs ViT：图像世界的范式演进

一、图像建模，是不是也可以“大一统” 在前文中我们提到，多模态大模型打破“只能处理文字”的限制。在 NLP 世界里，Transformer 已经证明自己是理解语言的王者。那么在图像世界，我们是否也能有一种“通用架构”，让模…...

编程日记 2026/2/4 2:32:06

cocos creator使用jenkins打包微信小游戏，自动上传资源到cdn,windows版运行jenkins

cocos 版本2.4.11 在windows上jenkins的具体配置和部署，可参考上一篇文章cocos creator使用jenkins打包流程，打包webmobile_jenkins打包,发布,部署cocoscreator-CSDN博客特别注意，windows上运行jenkins需要关闭windows自己的jenkins服务&a…...

编程日记 2026/2/2 13:29:57

定时器的两种实现方式

1、基于优先级队列/堆队列是先进先出，优先级队列是优先级越高就存放在队列之前，我们可以将过期时间越早设置为优先级越高，那么临近过期时间的任务就会在队列前面，距离过期时间越晚的任务就在队列后面。可以分配一个线程&#…...

编程日记 2026/2/5 1:04:15

Python、Pytorch、TensorFlow、Anconda、PySide、Jupyter

一、Python Python是一种高级、通用、解释型的开源编程语言，由Guido van Rossum于1990年代初设计。它具有以下显著特点： 1‌.语言特性‌ (1) 语法简洁易读，接近自然语言（如print(“Hello World!”)） (2) 采用强制缩进而非大括号定义代码块 (3) 支持面向对象、函数式和过…...

编程日记 2026/1/6 20:19:34

[Java实战]Spring Boot整合MinIO：分布式文件存储与管理实战（三十）

[Java实战]Spring Boot整合MinIO：分布式文件存储与管理实战（三十） 一、MinIO简介与核心原理 MinIO 是一款高性能、开源的分布式对象存储系统，兼容 Amazon S3 API，适用于存储图片、视频、日志等非结构化数据。其核心特…...

编程日记 2026/2/7 2:27:02

MacBook Air A2179（Intel版）安装macOS Catalina所需时间

MacBook Air A2179（Intel版）安装macOS Catalina所需时间如下： 一、标准安装时间范围常规安装（通过App Store） • 下载时间：约30-60分钟（取决于网络速度，安装包约8GB） •…...

编程日记 2025/11/14 10:53:19

AI在人力资源领域的应用：把握时代浪潮

借鉴历史经验，引领技术变革历史总是呈现出惊人的相似性。十年前，众多企业未能及时洞察移动技术与社交技术的潜在价值，迟迟没有将这些创新引入职场环境。随着时间推移，这些组织才意识到BYOD（自带设备办公）…...

编程日记 2026/2/3 2:09:14

【VxWorks 实时操作系统(RTOS)】常用函数汇总

VxWorks 实时操作系统（RTOS）中的核心函数 1. taskSpawn 函数功能：用于动态创建并激活一个新任务（线程）。参数解析（以 VxWorks 为例）：int taskSpawn(char *name, // 任务名…...

编程日记 2025/11/27 1:49:49

vr制作公司提供什么服务？

随着科技的迅猛进步，虚拟现实（Virtual Reality，简称VR）技术已经悄然渗透到我们的日常生活与工作中，成为推动数字化转型的重要力量。VR制作公司，作为前沿领域的探索者和实践者，以专业的技术和创新…...

编程日记 2026/2/4 16:19:47

下一代电子电气架构（EEA）的关键技术

我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：钝感力的“钝”，不是木讷、迟钝，而是直面困境的韧劲和耐力，是面对外界噪音的通透淡然。生活中有两种人，一种人格外在意别人的眼光;另一种人无论…...

编程日记 2026/2/7 3:07:50

matlab慕课学习3.5

于20250520 3.5 用while 语句实现循环结构 3.5.1while语句多用于循环次数不确定的情况，循环次数确定的时候用for更为方便。 3.5.2break语句和continue语句 break用来跳出循环体，结束整个循环。 continue用来结束本次循环，接着执行下一次…...

编程日记 2026/2/3 2:09:11

大语言模型（LLM）如何通过“思考时间”（即推理时的计算资源）提升推理能力

大语言模型（LLM）如何通过“思考时间”（即推理时的计算资源）提升推理能力核心围绕人类思维机制、模型架构改进、训练方法优化等展开一、人类思维的启发：快思考与慢思考类比心理学：人类思维分两种模式：快思考（系统1）：直觉驱动，快速但易出错（如估算简单问题）。…...

编程日记 2025/9/27 13:40:10

Ollama 如何在显存资源有限的情况下合理分配给不同的服务？

在 Windows PowerShell 中启动两个 Ollama 实例的推荐步骤是： 打开第一个 PowerShell 窗口，并执行： $env:OLLAMA_HOST"0.0.0.0:11434" ollama serve打开第二个 PowerShell 窗口，并执行： $env:OLLAMA_HOST&qu…...

编程日记 2025/11/18 21:21:21

Qt音视频开发过程中一个疑难杂症的解决方法/ffmpeg中采集本地音频设备无法触发超时回调

一、前言最近在做实时音视频通话的项目中，遇到一个神奇的问题，那就是用ffmpeg采集本地音频设备，当音频设备拔掉后，采集过程会卡死在av_read_frame函数中，尽管设置了超时时间，也设置了超时回调interrupt_c…...

编程日记 2026/2/3 2:08:22