当前位置：首页 > news >正文

【Math】导数、梯度、雅可比矩阵、黑塞矩阵

news 2025/7/9 17:21:04

导数、梯度、雅可比矩阵、黑塞矩阵都是与求导相关的一些概念，比较容易混淆，本文主要是对它们的使用场景和定义进行区分。

首先需要先明确一些函数的叫法（是否多元，以粗体和非粗体进行区分）：

一元函数： $f(x):\mathbb{R} \longrightarrow \mathbb{R}$
多元函数： $f(\mathbf{x}):\mathbb{R}^{n} \longrightarrow \mathbb{R}$
向量函数： $\mathbf{f(x)}:\mathbb{R}^{n} \longrightarrow \mathbb{R}^{m}$

例如：

函数 $y = x$ 为一元函数
函数 $y=x_1+2x_2$ 为多元函数
函数 $\begin{cases} y_1 =x_1+2x_2 \\ y_2=2x_1+x_2 \end{cases}$ 为向量函数

概念详解

导数

针对一元函数： $f(x):\mathbb{R} \longrightarrow \mathbb{R}$ ，近似：

$f(x)\approx f(x_{0})+f^{\prime}(x_{0})(x-x_{0})$

梯度

针对多元函数： $f(\mathbf{x}):\mathbb{R}^{n} \longrightarrow \mathbb{R}$ ，是导数的推广，它的结果是一个向量：

$\bigtriangledown f=\begin{bmatrix} \frac{\partial f}{\partial x_{1}} \\ \frac{\partial f}{\partial x_{2}} \\ ... \\ \frac{\partial f}{\partial x_{n}} \end{bmatrix}$

近似：

$f(\mathbf{x} )\approx f(\mathbf{x}_{0})+\bigtriangledown f(\mathbf{x}_{0})(\mathbf{x}-\mathbf{x}_{0})$

雅可比矩阵

针对向量函数： $\mathbf{f(x)}:\mathbb{R}^{n} \longrightarrow \mathbb{R}^{m}$

如果函数 $\mathbf{f(x)}:\mathbb{R}^{n} \longrightarrow \mathbb{R}^{m}$ 在点 $\mathbf{x}$ 处可微的话，在点 $\mathbf{x}$ 的雅可比矩阵即为该函数在该点的最佳线性逼近，也代表雅可比矩阵是一元函数的导数在向量函数的推广。在这种情况下，雅可比矩阵也被称作函数 $\mathbf{f}$ 在点 $\mathbf{x}$ 的微分或者导数，其中行数为 $\mathbf{f}$ 的维数；列数为 $\mathbf{x}$ 的维度。

$\mathbf{J}=\begin{bmatrix} \frac{\partial \mathbf{f}}{\partial x_{1}} & ... & \frac{\partial \mathbf{f}}{\partial x_{n}} \end{bmatrix} = \begin{bmatrix} \frac{\partial f_{1}}{\partial x_{1}} & ... & \frac{\partial f_{1}}{\partial x_{n}} \\ \vdots & \ddots & \vdots \\ \frac{\partial f_{m}}{\partial x_{1}} & ... & \frac{\partial f_{m}}{\partial x_{n}} \end{bmatrix}$

矩阵分量：

$\mathbf{J}_{ij}=\frac{\partial f_{i}}{\partial x_{j}}$

近似：

$\mathbf{f}(\mathbf{x} )\approx \mathbf{f}(\mathbf{x}_{0})+ \mathbf{J}(\mathbf{x}_{0})(\mathbf{x}-\mathbf{x}_{0})$

黑塞矩阵

针对多元函数： $f:\mathbb{R}^{n} \longrightarrow \mathbb{R}$ ，有点二阶导数的意思。

$\mathbf{H}=\begin{bmatrix} \frac{\partial^{2} f}{\partial x_{1}^{2}} & \frac{\partial^{2} f}{\partial x_{1}\partial x_{2}} & ... & \frac{\partial^{2} f}{\partial x_{1}\partial x_{n}} \\ \frac{\partial^{2} f}{\partial x_{2}\partial x_{1}} & \frac{\partial^{2} f}{\partial x_{2}^{2}} & ... & \frac{\partial^{2} f}{\partial x_{2}\partial x_{n}} \\ \vdots & \vdots & \ddots & \vdots \\ \frac{\partial^{2} f}{\partial x_{n}\partial x_{1}} & \frac{\partial^{2} f}{\partial x_{n}\partial x_{2}} & ... & \frac{\partial^{2} f}{\partial x_{n}^{2}} \end{bmatrix}$

矩阵分量：

$\mathbf{H}_{ij}=\frac{\partial^{2} f}{\partial x_{i}\partial x_{j}}$

近似：

$f(\mathbf{x} )\approx f(\mathbf{x}_{0})+\bigtriangledown f(\mathbf{x}_{0})(\mathbf{x}-\mathbf{x}_{0}) + \frac{1}{2}(\mathbf{x}-\mathbf{x}_{0})^{T}\mathbf{H}(\mathbf{x}_{0})(\mathbf{x}-\mathbf{x}_{0})$

实例

对于最简单的一元函数 $y = 2 x$ ，则该一元函数的导数为： $y^{\prime}=2$ 。这是最基础的了。

对于一个多元函数 $y=x_1^4x_2+3x_2+x_2e^{x_3}$ ，则：

该多元函数的梯度为：

$\bigtriangledown =\begin{bmatrix} \frac{\partial y}{\partial x_1} \\ \frac{\partial y}{\partial x_2} \\ \frac{\partial y}{\partial x_3} \end{bmatrix}=\begin{bmatrix} 4x_1^3x_2 \\ x_1^4+3+e^{x_3} \\ x_2e^{x_3}\end{bmatrix}$

该多元函数的黑塞矩阵为：

$\mathbf{H}=\begin{bmatrix} \frac{\partial^{2} y}{\partial x_{1}^{2}} & \frac{\partial^{2} y}{\partial x_{1}\partial x_{2}} & \frac{\partial^{2} y}{\partial x_{1}\partial x_{3}} \\ \frac{\partial^{2} y}{\partial x_{2}\partial x_{1}} & \frac{\partial^{2} y}{\partial x_{2}^{2}} & \frac{\partial^{2} y}{\partial x_{2}\partial x_{3}} \\ \frac{\partial^{2} y}{\partial x_{3}\partial x_{1}} & \frac{\partial^{2} y}{\partial x_{3}\partial x_{2}} & \frac{\partial^{2} y}{\partial x_{3}^{2}} \end{bmatrix} = \begin{bmatrix} 12x_1^2x_2 & 4x_1^3 & 0\\ 4x_1^3 & 0 & e^{x_3}\\ 0 & e^{x_3} & x_2e^{x_3} \end{bmatrix}$

视该多元函数的梯度为一个向量函数，即：

$\begin{cases} y_1 =4x_1^3x_2 \\ y_2=x_1^4+3+e^{x_3} \\ y_3=x_2e^{x_3} \end{cases}$

那么，该多元函数的雅可比矩阵为：

$\mathbf{J}= \begin{bmatrix} \frac{\partial y_{1}}{\partial x_{1}} & \frac{\partial y_{1}}{\partial x_{2}} & \frac{\partial y_{1}}{\partial x_{3}} \\ \frac{\partial y_{2}}{\partial x_{1}} & \frac{\partial y_{2}}{\partial x_{2}} & \frac{\partial y_{2}}{\partial x_{3}} \\ \frac{\partial y_{3}}{\partial x_{1}} & \frac{\partial y_{3}}{\partial x_{2}} & \frac{\partial y_{3}}{\partial x_{3}} \end{bmatrix} = \begin{bmatrix} 12x_1^2x_2 & 4x_1^3 & 0\\ 4x_1^3 & 0 & e^{x_3}\\ 0 & e^{x_3} & x_2e^{x_3} \end{bmatrix}$

可以看出，黑塞矩阵是多元函数 $f(\mathbf{x})$ 的梯度对自变量 $\mathbf{x}$ 的雅可比矩阵。

总结

梯度是雅可比矩阵的一个特例：当向量函数为标量函数时（ $\mathbf{f}$ 向量维度为1），雅可比矩阵是梯度向量
黑塞矩阵是多元函数 $f(\mathbf{x})$ 的梯度对自变量 $\mathbf{x}$ 的雅可比矩阵

【Math】导数、梯度、雅可比矩阵、黑塞矩阵

概念详解

导数

梯度

雅可比矩阵

黑塞矩阵

实例

总结

相关阅读

相关文章：

【Math】导数、梯度、雅可比矩阵、黑塞矩阵

【C语言】——调试技巧

【Python】pytorch，CUDA是否可用，查看显卡显存剩余容量

React16入门到入土

【GPT引领前沿】GPT4技术与AI绘图

【LeetCode】19. 删除链表的倒数第 N 个结点

spring boot3.x集成swagger出现Type javax.servlet.http.HttpServletRequest not present

《低代码指南》——智能化低代码开发实践案例

268_C++_字节计算(((bits) + 7) / 8)、字节对齐(((number) + 3) / 4 * 4)

JavaWeb知识梳理(后端部分)

AI：07-基于卷积神经网络的海洋生物的识别

centos7下docker设置新的下载镜像源并调整存放docker下载镜像的仓库位置

Gitea--私有git服务器搭建详细教程

SOLIDWORKS放样是什么意思？

Xcode打包ipa文件，查看app包内文件

AJAX学习笔记6 JQuery对AJAX进行封装

阿里云服务器退款规则_退款政策全解析

ExpressLRS开源之基本调试数据含义

DOM 简介 | 深入了解DOM

机器学习丨2. 线性回归（Linear Regression）

React hook之useRef

反向工程与模型迁移：打造未来商品详情API的可持续创新体系

云启出海，智联未来｜阿里云网络「企业出海」系列客户沙龙上海站圆满落地

【Java学习笔记】Arrays类

聊聊 Pulsar：Producer 源码解析

《通信之道——从微积分到 5G》读书总结

聊一聊接口测试的意义有哪些？

蓝桥杯3498 01串的熵

Razor编程中@Html的方法使用大全

PH热榜 | 2025-06-08