当前位置：首页 > news >正文

【机器学习】机器学习的基本分类-监督学习-逻辑回归-对数似然损失函数（Log-Likelihood Loss Function）

news 2026/2/9 6:11:10

对数似然损失函数（Log-Likelihood Loss Function）

对数似然损失函数是机器学习和统计学中广泛使用的一种损失函数，特别是在分类问题（例如逻辑回归、神经网络）中应用最为广泛。它基于最大似然估计原理，通过最小化负对数似然（negative log-likelihood, NLL）来优化模型参数。

1. 对数似然损失的定义

对于一个分类问题，我们的目标是预测输入 x 属于类别 y∈{0,1} 的概率。假设模型输出的概率为 $P(y=1|x) = \hat{y}$ ，则：

对数似然函数

似然函数衡量模型参数在观察到数据下的概率。假设数据集为 $\{(x_i, y_i)\}_{i=1}^N$ ，样本 i 的预测概率为 $\hat{y}_i$ ，其似然函数为：

$L(\theta) = \prod_{i=1}^N P(y_i | x_i; \theta)$

对数似然函数

对数化简乘积：

$\ell(\theta) = \log L(\theta) = \sum_{i=1}^N \log P(y_i | x_i; \theta)$

2. 损失函数形式

为了简化计算，优化通常使用负对数似然损失函数（即最大化对数似然的对立面）：

$\mathcal{L}(\theta) = -\ell(\theta) = -\sum_{i=1}^N \log P(y_i | x_i; \theta)$

二分类问题

对二分类问题，假设 $P(y=1|x) = \hat{y}$ ， $P(y=0|x) = 1 - \hat{y}$ ，则：

$P(y|x) = \hat{y}^y (1 - \hat{y})^{1-y}$

对数化并取负得到：

$\mathcal{L}(\theta) = -\sum_{i=1}^N \left[ y_i \log \hat{y}_i + (1 - y_i) \log (1 - \hat{y}_i) \right]$

这就是交叉熵损失函数的形式，广泛用于二分类问题。

3. 推导直观理解

1. 对数似然的意义

对数似然量化了模型预测的质量：

$y_i = 1$ ：我们希望预测概率 $\hat{y}_i$ 越大越好。
$y_i = 0$ ：我们希望预测概率 $1 - \hat{y}_i$ 越大越好。

通过最大化对数似然（或最小化负对数似然），模型会调整参数使其预测概率最接近真实概率。

2. 为什么对数？

简化计算：对数化后，将乘积变为求和，优化更加高效。
凸性：对数函数的特性使得损失函数在很多情况下是凸的，便于求解全局最优解。

4. 多分类问题

对于多分类问题（如 softmax 分类器），假设类别标签为 y∈{1,2,…,K}y，模型预测类别 j 的概率为 $\hat{y}_j = P(y=j|x)$ 。

似然函数

$P(y|x) = \prod_{j=1}^K \hat{y}_j^{\mathbb{1}(y=j)}$

其中 ${1}(y=j)$ 是指示函数，表示样本 y 是否属于类别 j。

对数化

$\ell(\theta) = \log P(y|x) = \sum_{j=1}^K \mathbb{1}(y=j) \log \hat{y}_j$

负对数似然损失

对于整个数据集：

$\mathcal{L}(\theta) = -\frac{1}{N} \sum_{i=1}^N \log \hat{y}_{i,y_i}$

其中， $\hat{y}_{i,y_i}$ 是样本 i 对真实类别 $y_i$ 的预测概率。

5. 代码实现

以下是二分类和多分类对数似然损失的 Python 实现：

1. 二分类损失

import numpy as npdef binary_log_likelihood_loss(y_true, y_pred):"""计算二元对数似然损失函数。参数:y_true: 真实标签数组，包含0和1，表示负类和正类。y_pred: 预测标签数组，包含0到1之间的浮点数，表示属于正类的概率。返回:返回二元对数似然损失函数的负均值。"""# 避免数值问题y_pred = np.clip(y_pred, 1e-10, 1 - 1e-10)# 计算并返回二元对数似然损失return -np.mean(y_true * np.log(y_pred) + (1 - y_true) * np.log(1 - y_pred))# 示例
y_true = np.array([1, 0, 1, 1, 0])
y_pred = np.array([0.9, 0.1, 0.8, 0.7, 0.3])
# 计算损失并输出
loss = binary_log_likelihood_loss(y_true, y_pred)
print("Binary Log-Likelihood Loss:", loss)

输出结果

Binary Log-Likelihood Loss: 0.22944289410146546

2. 多分类损失

from sklearn.metrics import log_loss# 示例数据
# 实际的类别标签
y_true = [0, 2, 1, 2]
# 预测的类别概率，每个子列表代表一个样本预测为各个类别的概率
y_pred = [[0.9, 0.05, 0.05],[0.1, 0.1, 0.8],[0.2, 0.7, 0.1],[0.05, 0.1, 0.85]
]# 使用 sklearn 计算对数似然损失
# 该函数计算的是模型预测的类别概率与实际类别标签之间的对数似然损失
# 对于多分类问题，该损失函数可以衡量模型预测概率与真实标签之间的差异程度
loss = log_loss(y_true, y_pred)
print("Multi-class Log-Likelihood Loss:", loss)

输出结果

Multi-class Log-Likelihood Loss: 0.2119244851021358

6. 对数似然损失的应用

逻辑回归：
- 二分类逻辑回归中，使用对数似然损失来拟合模型参数。
神经网络：
- 输出层通常采用 softmax 函数并结合对数似然损失，用于多分类任务。
最大熵模型：
- 最大化熵等价于最小化负对数似然。

7. 优点与缺点

优点

对概率建模有理论支撑，直观解释预测置信度。
能有效捕捉预测概率的质量。

缺点

对异常值敏感：错误分类的高置信预测会导致损失剧增。
数值问题：log⁡(0) 会引发计算错误，需引入数值稳定策略。

对数似然损失函数连接了统计学中的最大似然估计与机器学习中的损失优化，是现代监督学习模型的理论基石之一！

【机器学习】机器学习的基本分类-监督学习-逻辑回归-对数似然损失函数（Log-Likelihood Loss Function）

对数似然损失函数（Log-Likelihood Loss Function） 对数似然损失函数是机器学习和统计学中广泛使用的一种损失函数，特别是在分类问题（例如逻辑回归、神经网络）中应用最为广泛。它基于最大似然估计原理，通过…...

编程日记 2024/11/30 19:23:04

51c自动驾驶~合集35

我自己的原文哦~ https://blog.51cto.com/whaosoft/12206500 #纯视觉方案的智驾在大雾天还能用吗？ 碰上大雾天气，纯视觉方案是如何识别车辆和障碍物的呢？ 如果真的是纯纯的，特头铁的那种纯视觉方案的话。可以简单粗暴的理解为…...

编程日记 2024/11/30 19:22:03

网络安全体系与网络安全模型

4.1 网络安全体系概述 4.1.1 网络安全体系概述一般面言，网络安全体系是网络安全保障系统的最高层概念抽象，是由各种网络安全单元按照一定的规则组成的，共同实现网络安全的目标。网络安全体系包括法律法规政策文件、安全策略、组织管理、技术…...

编程日记 2024/11/30 19:21:02

antd table 自定义表头过滤表格内容

注意：该功能只能过滤可一次性返回全部数据的表格，通过接口分页查询的请自主按照需求改动哈~ 实现步骤： 1.在要过滤的列表表头增加过滤图标，点击图标显示浮窗 2.浮窗内显示整列可选选项，通过勾选单选或者全选、搜索框来…...

编程日记 2024/11/30 19:19:00

Elasticsearch实战：从搜索到数据分析的全面应用指南

Elasticsearch（简称 ES）是一个强大的分布式搜索引擎和分析工具，它能够快速处理海量数据，并提供全文检索、结构化搜索、数据分析等功能。在现代系统中，它不仅是搜索的核心组件，也是数据分析的有力工具。本文…...

编程日记 2024/11/30 19:17:59

BEPUphysicsint定点数3D物理引擎介绍

原文：BEPUphysicsint定点数3D物理引擎介绍 - 哔哩哔哩帧同步的游戏中如果用物理引擎，为了保证不同设备上的结果一致,需要采用定点数来计算迭代游戏过程中的物理运算。也就是我们通常说的定点数物理引擎(确定性物理引擎)。本系列教程给大家详细的讲解如…...

编程日记 2024/11/30 19:16:58

宠物领养平台构建：SpringBoot技术路线图

摘要如今社会上各行各业，都在用属于自己专用的软件来进行工作，互联网发展到这个时候，人们已经发现离不开了互联网。互联网的发展，离不开一些新的技术，而新技术的产生往往是为了解决现有问题而产生的。针对于宠物领养…...

编程日记 2024/11/30 19:15:57

解决Flink读取kafka主题数据无报错无数据打印的重大发现（问题已解决）

亦菲、彦祖们，今天使用idea开发的时候，运行flink程序（读取kafka主题数据）的时候，发现操作台什么数据都没有只有满屏红色日志输出，关键干嘛？一点报错都没有，一开始我觉得应该执行程序…...

编程日记 2024/11/30 19:14:55

python自动化测开面试题汇总(持续更新)

介绍他们测某云，底层是linux可以挂多个磁盘，有现有的接口，用python实现热插拔，查看它的功能，项目目前用到的是python,linux和虚拟云，结合你之前的项目介绍下三者(3min之内) 列表判断是否有重复元素求1-9的…...

编程日记 2024/11/30 19:13:54

1-1 Gerrit实用指南

注：学习gerrit需要拥有git相关知识，如果没有学习过git请先回顾git相关知识点黑马程序员git教程一小时学会git git参考博客 git 实操博客 1.0 定义 Gerrit 是一个基于 Web 的代码审查系统，它使用 Git 作为底层版本控制系统。Gerrit 的主要功…...

编程日记 2024/11/30 19:12:53

docker如何安装redis

第一步如果未指定redis，则安装的是最新版的 docker pull redis 创建一个目录 mkdir /usr/local/docker/redis 然后直接可以下载redis，这是方式确实不怎么好，应该找在官网上找对应的redis配置文件 wget http://download.redis.io/redis-stab…...

编程日记 2024/11/30 19:11:52

省级新质生产力数据（蔡湘杰版本）2012-2022年

测算方式：参考《当代经济管理》蔡湘杰（2024）老师研究的做法，本文以劳动者、劳动对象和劳动资料为准则层，从新质生产力“量的积累、质的提升、新的拓展”三维目标出发，构建新质生产力综合评价指标体系&#…...

编程日记 2024/11/30 19:09:50

【游资悟道】-作手新一悟道心法

作手新一经典语录节选： 乔帮主传完整版：做股票5年，炼成18式，成为A股低吸大神！从小白到大神，散户炒股的六个过程，不看不知道自己水平围着主线做，多研究龙头，研究涨停&am…...

编程日记 2024/11/30 19:08:49

Diffusion中的Unet （DIMP）

针对UNet2DConditionModel模型查看Unet的源码，得知Unet的down,mid,up blocks的类型分别是： down_block_types: Tuple[str] ("CrossAttnDownBlock2D","CrossAttnDownBlock2D","CrossAttnDownBlock2D","DownBlock2…...

编程日记 2024/11/30 19:05:46

编译以前项目更改在x64下面时报错:函数“PVOID GetCurrentFiber(void)”已有主体

win32下面编译成功，但是x64报错 1>GetWord.c 1>md5.c 这两个文件无法编译 1>C:\Program Files (x86)\Windows Kits\10\Include\10.0.22000.0\um\winnt.h(24125,1): error C2084: 函数“PVOID GetCurrentFiber(void)”已有主体 1>C:\Program Files (x…...

编程日记 2024/11/30 19:03:44

【AIGC】大模型面试高频考点-数据清洗篇

【AIGC】大模型面试高频考点-数据清洗篇 （一）常用文本清洗方法1.去除无用的符号2.去除表情符号3.文本只保留汉字4.中文繁体、简体转换5.删除 HTML 标签和特殊字符6.标记化7.小写8.停用词删除9.词干提取和词形还原10.处理缺失数据11.删除重复文本12.处理嘈…...

编程日记 2024/11/30 19:01:42

当测试时间与测试资源有限时，你会如何优化测试策略？

1.优先级排序：根据项目的需求和紧急程度进行优先级排序，将测试用例用例划分优先级，合理安排测试资源和时间。这样能够保障在有限的时间内测试到最关键的功能 2.提前介入测试：在开发过程中提前进行测试，可以迅速发现问…...

编程日记 2024/11/30 19:00:41

基于R语言森林生态系统结构、功能与稳定性分析与可视化

在生态学研究中，森林生态系统的结构、功能与稳定性是核心研究内容之一。这些方面不仅关系到森林动态变化和物种多样性，还直接影响森林提供的生态服务功能及其应对环境变化的能力。森林生态系统的结构主要包括物种组成、树种多样性、树木的空间分布与密度…...

编程日记 2024/11/30 18:59:39

如何使用 Python 实现插件式架构

使用 Python 实现插件式架构可以通过动态加载和调用模块或类，构建一个易于扩展和维护的系统。以下是实现插件式架构的步骤和核心思想。 1. 插件式架构核心概念主程序：负责加载、管理插件，并调用插件的功能。插件：独立的模块或类…...

编程日记 2024/11/30 18:55:33

【北京迅为】iTOP-4412全能版使用手册-第二十章搭建和测试NFS服务器

iTOP-4412全能版采用四核Cortex-A9，主频为1.4GHz-1.6GHz，配备S5M8767 电源管理，集成USB HUB,选用高品质板对板连接器稳定可靠，大厂生产，做工精良。接口一应俱全，开发更简单,搭载全网通4G、支持WIFI、蓝牙、…...

编程日记 2024/11/30 18:54:32

Linux 文件类型，目录与路径，文件与目录管理

文件类型后面的字符表示文件类型标志普通文件：-（纯文本文件，二进制文件，数据格式文件） 如文本文件、图片、程序文件等。目录文件：d（directory） 用来存放其他文件或子目录。设备…...

编程新知 2026/2/8 20:42:46

Java 语言特性(面试系列1)

一、面向对象编程 1. 封装（Encapsulation） 定义：将数据（属性）和操作数据的方法绑定在一起，通过访问控制符（private、protected、public）隐藏内部实现细节。示例： public …...

编程新知 2025/10/6 4:03:40

Unity3D中Gfx.WaitForPresent优化方案

前言在Unity中，Gfx.WaitForPresent占用CPU过高通常表示主线程在等待GPU完成渲染（即CPU被阻塞），这表明存在GPU瓶颈或垂直同步/帧率设置问题。以下是系统的优化方案： 对惹，这里有一个游戏开发交流小组&…...

编程新知 2026/2/7 17:31:44

如何为服务器生成TLS证书

TLS（Transport Layer Security）证书是确保网络通信安全的重要手段，它通过加密技术保护传输的数据不被窃听和篡改。在服务器上配置TLS证书，可以使用户通过HTTPS协议安全地访问您的网站。本文将详细介绍如何在服务器上生成一个TLS证…...

编程新知 2025/12/17 5:54:30

k8s业务程序联调工具-KtConnect

概述原理工具作用是建立了一个从本地到集群的单向VPN，根据VPN原理，打通两个内网必然需要借助一个公共中继节点，ktconnect工具巧妙的利用k8s原生的portforward能力，简化了建立连接的过程，apiserver间接起到了中继节…...

编程新知 2026/2/1 4:14:14

网络编程（UDP编程）

思维导图 UDP基础编程（单播） 1.流程图服务器：短信的接收方创建套接字 (socket)-----------------------------------------》有手机指定网络信息-----------------------------------------------》有号码绑定套接字 (bind)--------------…...

编程新知 2026/2/4 17:31:44