当前位置：首页 > news >正文

常见的向量范数、矩阵范数和对偶范数-对偶范数详细证明过程

news 2026/2/9 11:36:05

文章目录

对偶范数
- 一般定义： $p$ -范数和 $q$ -范数的对偶性
- - 特例 1：无穷范数和 1 范数的对偶性
  - 特例 2：2 范数的对偶是自身
  - 特例 3：有限范数与 0 范数的对偶关系（稀疏性）
  - 特例 4：核范数（Nuclear Norm）与谱范数（Spectral Norm）的对偶关系
2范数自对偶证明
1范数和无穷范数互为对偶证明
对偶范数中既有向量范数也有矩阵范数
向量范数和矩阵范数
- 一、向量范数
- - 向量范数定义
  - 例子：计算向量范数
- 二、矩阵范数
- - 矩阵范数定义
  - 例子：计算矩阵范数

对偶范数

对偶范数的定义帮助我们理解不同范数间的互补关系，特别是在优化问题中。以下是对偶范数的概念及一些常见的特例说明：

一般定义： $p$ -范数和 $q$ -范数的对偶性

对于任意的 $p$ -范数，定义为：
$\frac{1}{p} + \frac{1}{q} = 1, \quad p, q \geq 1$
其中 $q$ -范数定义为：
$\|y\|_q = \left( \sum_{i=1}^n |y_i|^q \right)^{1/q}$
换句话说， $p$ -范数和 $q$ -范数构成对偶关系。对于向量 $y$ ，其 $q$ -范数的定义满足：
$\|y\|_q = \sup_{\|x\|_p \leq 1} x^T y$
即在 $\|x\|_p \leq 1$ 的约束下， $x^T y$ 的最大值就是 $y\|_q$ 。

特例 1：无穷范数和 1 范数的对偶性

无穷范数（ $\infty$ -范数）和 1 范数构成对偶关系。当 $\infty$ 时， $q = 1$ 。其关系如下：

无穷范数定义为：
$\|x\|_\infty = \max_{i} |x_i|$
1 范数定义为：
$\|y\|_1 = \sum_{i=1}^n |y_i|$

根据对偶性，有
$\|x\|_\infty = \sup_{\|y\|_1 \leq 1} x^T y$
此时，若 $y$ 满足 1 范数约束，其与 $x$ 的内积达到最大时即为 $x$ 的无穷范数。

特例 2：2 范数的对偶是自身

对于 2 范数（欧几里得范数），有 $p = q = 2$ ，即 2 范数的对偶范数是自身：

2 范数定义为：
$\|x\|_2 = \left( \sum_{i=1}^n |x_i|^2 \right)^{1/2}$

在这种情况下，我们可以写成：
$\|y\|_2 = \sup_{\|x\|_2 \leq 1} x^T y$
也就是说，当 $x$ 的 2 范数不超过 1 时， $x^T y$ 的最大值是 $y$ 的 2 范数。这反映了 2 范数的自对偶性。

除了 $p$ -范数和 $q$ -范数的典型对偶组合（如 $\infty$ -范数与 $1$ -范数的对偶关系，和 $2$ -范数的自对偶性）之外，还有其他常见的特例：

特例 3：有限范数与 0 范数的对偶关系（稀疏性）

在一些优化问题中，尤其是稀疏信号处理和压缩感知中，出现了一种与“伪范数”相关的对偶关系。具体而言：

0 范数（严格意义上它并不是范数）表示向量中非零元素的数量：
$\|x\|_0 = \text{number of non-zero elements in } x$
1 范数与 0 范数相关，因为它能够在某种程度上作为 0 范数的凸近似，帮助解决稀疏性问题。

虽然 0 范数和 1 范数没有直接的对偶关系，但在稀疏优化中，经常使用 1 范数作为一种替代方式来促进解的稀疏性。这意味着通过最小化 1 范数来近似最小化 0 范数的效果，尤其是在压缩感知问题中，1 范数能够产生与 0 范数优化类似的稀疏解。

特例 4：核范数（Nuclear Norm）与谱范数（Spectral Norm）的对偶关系

在矩阵的范数理论中，核范数（Nuclear Norm）和谱范数（Spectral Norm）之间具有对偶关系：

核范数，也称为迹范数，是矩阵奇异值的和。对于矩阵 $X$ ，核范数定义为：
$\|X\|_* = \sum_{i=1}^n \sigma_i(X)$
其中 $\sigma_i(X)$ 是矩阵 $X$ 的第 $i$ 个奇异值。
谱范数，也称为算子范数或 2-范数，表示矩阵的最大奇异值：
$\|X\|_2 = \max_i \sigma_i(X)$

核范数和谱范数的对偶关系可写为：
$\|X\|_* = \sup_{\|Y\|_2 \leq 1} \text{Tr}(Y^T X)$
在这里，核范数是对矩阵的稀疏性（低秩）的一个度量，而谱范数对矩阵的行列式约束进行控制。因此，这对对偶性在矩阵稀疏和低秩优化问题中起到重要作用。

2范数自对偶证明

对于 2 范数的对偶性，具体地，我们希望证明 2 范数的对偶范数是自身。也就是说，对于任何向量 $\in \mathbb{R}^n$ ，以下关系成立：
$\|y\|_2 = \sup_{\|x\|_2 \leq 1} x^T y$
即 2 范数是其自身的对偶范数。

证明过程

1. 2 范数的定义

对于向量 $(y_1, y_2, \dots, y_n) \in \mathbb{R}^n$ ，其 2 范数（欧几里得范数）定义为：
$\|y\|_2 = \left( \sum_{i=1}^n y_i^2 \right)^{1/2}$

2. 对偶问题的设定

为了证明 2 范数是自身的对偶范数，我们需要求解在 $\|x\|_2 \leq 1$ 的约束条件下最大化 $x^T y$ 的问题。这相当于找到一个向量 $x$ ，使得 $x^T y$ 尽可能大，并满足 $x$ 的 2 范数不超过 1。

所以我们构造以下优化问题：
$\sup_{\|x\|_2 \leq 1} x^T y$

3. 计算内积的最大化

为了解决这个优化问题，我们使用柯西-施瓦茨不等式（Cauchy-Schwarz Inequality），它表明对于任意两个向量 $\in \mathbb{R}^n$ ：
$|x^T y| \leq \|x\|_2 \|y\|_2$
其中等号成立的条件是 $x$ 与 $y$ 共线，即存在实数 $\lambda$ 使得 $\lambda y$ 。

4. 取到等号的条件

在 $\|x\|_2 \leq 1$ 的限制下，要使 $x^T y$ 取到最大值，可以选择 $x$ 的方向与 $y$ 相同，即令 $\frac{y}{\|y\|_2}$ 。这样可以确保 $x$ 的 2 范数为 1（满足约束条件），并且内积 $x^T y$ 达到最大值。

因此，我们有
$x^T y = \left( \frac{y}{\|y\|_2} \right)^T y = \frac{y^T y}{\|y\|_2} = \frac{\|y\|_2^2}{\|y\|_2} = \|y\|_2$

5. 结论

因此，在 $\|x\|_2 \leq 1$ 的条件下， $x^T y$ 的最大值为 $y\|_2$ ，即：
$\sup_{\|x\|_2 \leq 1} x^T y = \|y\|_2$
这证明了 2 范数的对偶范数是其自身。

1范数和无穷范数互为对偶证明

我们来详细推导无穷范数（ $\|\cdot\|_\infty$ ）和 1 范数（ $\|\cdot\|_1$ ）的对偶关系。

目标

证明对于向量 $\in \mathbb{R}^n$ ，有以下关系成立：
$\|y\|_1 = \sup_{\|x\|_\infty \leq 1} x^T y$
即 1 范数是无穷范数约束下的内积 $x^T y$ 的最大值。

证明步骤

1. 无穷范数和 1 范数的定义

给定向量 $(y_1, y_2, \dots, y_n)$ 和 $(x_1, x_2, \dots, x_n)$ ：

无穷范数定义为
$\|x\|_\infty = \max_{i} |x_i|$
因此约束 $\|x\|_\infty \leq 1$ 表示 $|x_i| \leq 1$ 对于所有 $\dots, n$ 。
1 范数定义为
$\|y\|_1 = \sum_{i=1}^n |y_i|$

2. 构造最优 $x$

在约束 $\|x\|_\infty \leq 1$ 下，我们希望最大化 $x^T y = \sum_{i=1}^n x_i y_i$ 。为了使内积 $x^T y$ 最大，我们需要选择 $x_i$ 的符号与 $y_i$ 的符号一致，并取 $x_i = \operatorname{sign}(y_i)$ （即 $x_i = 1$ 当 $y_i \geq 0$ ，否则 $x_i = -1$ ）。这样可以确保每一项 $x_i y_i$ 的值都为正，从而使得和最大化。

因此，对于每个 $i$ ，我们设
$x_i = \begin{cases} 1 & \text{如果 } y_i \geq 0 \\ -1 & \text{如果 } y_i < 0 \end{cases}$

3. 计算 $x^T y$ 的最大值

在上述选择下，内积 $x^T y$ 成为
$x^T y = \sum_{i=1}^n x_i y_i = \sum_{i=1}^n |y_i|$

这正是 $y$ 的 1 范数，即
$\|y\|_1 = \sum_{i=1}^n |y_i|$

4. 取上确界

因此，我们得出
$\sup_{\|x\|_\infty \leq 1} x^T y = \|y\|_1$
这表明在无穷范数限制下， $x^T y$ 的最大值等于 $y$ 的 1 范数，从而证明了无穷范数与 1 范数的对偶性。

结论

无穷范数和 1 范数是对偶范数对，因为在 $\|x\|_\infty \leq 1$ 的条件下， $x^T y$ 的最大值恰好是 $y$ 的 1 范数，即
$\|y\|_1 = \sup_{\|x\|_\infty \leq 1} x^T y$

在上述选择下，内积 $x^T y$ 成为
$x^T y = \sum_{i=1}^n x_i y_i = \sum_{i=1}^n |y_i|$

这正是 $y$ 的 1 范数，即
$\|y\|_1 = \sum_{i=1}^n |y_i|$

4. 取上确界

结论

无穷范数和 1 范数是对偶范数对，因为在 $\|x\|_\infty \leq 1$ 的条件下， $x^T y$ 的最大值恰好是 $y$ 的 1 范数，即
$\|y\|_1 = \sup_{\|x\|_\infty \leq 1} x^T y$

对偶范数中既有向量范数也有矩阵范数

谱范数是矩阵范数，而不是向量范数。谱范数（2-范数）定义为矩阵的最大奇异值，适用于矩阵而不是单独的向量。它用于衡量线性变换对向量的伸缩程度。

向量范数

对于向量 $x$ 而言， $p$ -范数 $x\|_p$ ）定义为
$\|x\|_p = \left( \sum_{i=1}^n |x_i|^p \right)^{1/p}$
矩阵范数
而矩阵的谱范数 $X\|_2$ 则是矩阵作用在向量上时的最大伸缩量。对于矩阵 $X$ 的谱范数，有
$\|X\|_2 = \sup_{\|x\|_2 \leq 1} \|Xx\|_2$
即，谱范数是使得 $X x$ 达到最大长度的 $x$ 的伸缩量。这也是为什么谱范数涉及奇异值，因为奇异值表示矩阵作用下的尺度变化。

向量范数和矩阵范数

一、向量范数

向量范数用于衡量向量的大小或长度。常见的向量范数包括 1 范数、2 范数（欧几里得范数）和无穷范数。

向量范数定义

给定向量 $(x_1, x_2, \dots, x_n)$ ，定义如下：

1 范数（曼哈顿范数）：
$\|x\|_1 = \sum_{i=1}^n |x_i|$
2 范数（欧几里得范数）：
$\|x\|_2 = \left( \sum_{i=1}^n |x_i|^2 \right)^{1/2}$
无穷范数（最大范数）：
$\|x\|_\infty = \max_{i} |x_i|$

例子：计算向量范数

设定向量 $x = (3, - 4)$ ，计算它的 1 范数、2 范数和无穷范数。

1 范数：
$x\|_1 = |3| + |-4| = 3 + 4 = 7$
2 范数：
$\|x\|_2 = \sqrt{3^2 + (-4)^2} = \sqrt{9 + 16} = \sqrt{25} = 5$
无穷范数：
$\|x\|_\infty = \max(|3|, |-4|) = \max(3, 4) = 4$

二、矩阵范数

矩阵范数用于衡量矩阵作为线性变换的“伸缩效应”。常见的矩阵范数包括 1 范数、Frobenius 范数、无穷范数和谱范数（2-范数）。

矩阵范数定义

对于矩阵 $(x_{ij}) \in \mathbb{R}^{m \times n}$ ，定义如下：

1 范数（列和范数）：最大列和
$\|X\|_1 = \max_{1 \leq j \leq n} \sum_{i=1}^m |x_{ij}|$
Frobenius 范数（矩阵的 2 范数）：矩阵元素平方和的平方根
$\|X\|_F = \sqrt{\sum_{i=1}^m \sum_{j=1}^n |x_{ij}|^2}$
无穷范数（行和范数）：最大行和
$\|X\|_\infty = \max_{1 \leq i \leq m} \sum_{j=1}^n |x_{ij}|$
谱范数（最大奇异值）：矩阵的最大奇异值
$\|X\|_2 = \sigma_{\max}(X)$
谱范数 $X\|_2$ 是矩阵 $X$ 的最大奇异值。如果矩阵 $\in \mathbb{R}^{m \times n}$ 的奇异值为 $\sigma_1, \sigma_2, \dots, \sigma_{\min(m, n)}$ ，则谱范数为：

$\|X\|_2 = \max_{i} \sigma_i(X)$
奇异值是从矩阵 $X$ 的协方差矩阵 $X^T X$ 的特征值中得出的。假设特征值为 $\lambda_1, \lambda_2, \dots, \lambda_{\min(m, n)}$ ，则奇异值为 $\sigma_i = \sqrt{\lambda_i}$ 。

例子：计算矩阵范数

设定矩阵
$\begin{pmatrix} 1 & -2 \\ -3 & 4 \end{pmatrix}$

1 范数：
$X\|_1 = \max(|1| + |-3|, |-2| + |4|) = \max(4, 6) = 6$
Frobenius 范数：
$\|X\|_F = \sqrt{1^2 + (-2)^2 + (-3)^2 + 4^2} = \sqrt{1 + 4 + 9 + 16} = \sqrt{30}$
无穷范数：
$\|X\|_\infty = \max(|1| + |-2|, |-3| + |4|) = \max(3, 7) = 7$
谱范数：
计算 $X^T X$ 并求特征值，取平方根得到最大奇异值。

谱范数例子1【矩阵维度相等】
考虑一个简单的 2x2 矩阵：
$\begin{pmatrix} 3 & 1 \\ 1 & 3 \end{pmatrix}$

步骤 1：计算 $X^T X$

为了找到奇异值，我们首先计算 $X^T X$ ：

$X^T X = \begin{pmatrix} 3 & 1 \\ 1 & 3 \end{pmatrix} \begin{pmatrix} 3 & 1 \\ 1 & 3 \end{pmatrix} = \begin{pmatrix} 3 \cdot 3 + 1 \cdot 1 & 3 \cdot 1 + 1 \cdot 3 \\ 1 \cdot 3 + 3 \cdot 1 & 1 \cdot 1 + 3 \cdot 3 \end{pmatrix}$

$\begin{pmatrix} 9 + 1 & 3 + 3 \\ 3 + 3 & 1 + 9 \end{pmatrix} = \begin{pmatrix} 10 & 6 \\ 6 & 10 \end{pmatrix}$

步骤 2：计算 $X^T X$ 的特征值

特征值 $\lambda$ 满足特征方程：
$\det(X^T X - \lambda I) = 0$
即：
$\begin{vmatrix} 10 - \lambda & 6 \\ 6 & 10 - \lambda \end{vmatrix} = 0$
展开行列式：
$\lambda)(10 - \lambda) - 6 \cdot 6 = 0$

$\lambda^2 - 20\lambda + 64 = 0$

解得：
$\lambda = 16 \quad \text{和} \quad \lambda = 4$

步骤 3：计算奇异值

奇异值为特征值的平方根，因此：
$\sigma_1 = \sqrt{16} = 4, \quad \sigma_2 = \sqrt{4} = 2$

步骤 4：求谱范数

谱范数是最大奇异值，因此：
$\|X\|_2 = \max(\sigma_1, \sigma_2) = 4$

总结
通过计算奇异值的最大值，我们得到矩阵 $X$ 的谱范数为 4。对称矩阵的谱范数也是奇异值的最大值。
谱范数例子2【矩阵维度不相等】

我们可以通过一个非方阵（矩阵维数不相等）的例子来理解谱范数的计算。假设我们有一个 $\times 2$ 矩阵：
$\begin{pmatrix} 1 & 2 \\ 3 & 4 \\ 5 & 6 \end{pmatrix}$

步骤 1：计算 $X^T X$

因为谱范数等于最大奇异值，我们可以通过计算矩阵 $X^T X$ 的特征值来获得奇异值。首先，计算 $X^T X$ ：
$X^T = \begin{pmatrix} 1 & 3 & 5 \\ 2 & 4 & 6 \end{pmatrix}$

$X^T X = \begin{pmatrix} 1 & 3 & 5 \\ 2 & 4 & 6 \end{pmatrix} \begin{pmatrix} 1 & 2 \\ 3 & 4 \\ 5 & 6 \end{pmatrix}$

执行矩阵乘法：
$X^T X = \begin{pmatrix} 1 \cdot 1 + 3 \cdot 3 + 5 \cdot 5 & 1 \cdot 2 + 3 \cdot 4 + 5 \cdot 6 \\ 2 \cdot 1 + 4 \cdot 3 + 6 \cdot 5 & 2 \cdot 2 + 4 \cdot 4 + 6 \cdot 6 \end{pmatrix}$

$\begin{pmatrix} 1 + 9 + 25 & 2 + 12 + 30 \\ 2 + 12 + 30 & 4 + 16 + 36 \end{pmatrix} = \begin{pmatrix} 35 & 44 \\ 44 & 56 \end{pmatrix}$

步骤 2：计算 $X^T X$ 的特征值

特征值 $\lambda$ 满足以下特征方程：
$\det(X^T X - \lambda I) = 0$
即：

$\begin{vmatrix} 35 - \lambda & 44 \\ 44 & 56 - \lambda \end{vmatrix} = 0$
展开行列式得到特征方程：

$\lambda)(56 - \lambda) - 44^2 = 0$
计算：

$\lambda^2 - 91\lambda + 36 = 0$
解得两个特征值

接着求解上一步的特征值方程：

我们得到特征方程为：
$\lambda^2 - 91\lambda + 36 = 0$
可以使用二次方程公式求解：
$\lambda = \frac{91 \pm \sqrt{91^2 - 4 \cdot 1 \cdot 36}}{2}$
计算根号内部分：
$91^2 = 8281$

$\cdot 1 \cdot 36 = 144$

$8281 - 144 = 8137$

因此，
$\lambda = \frac{91 \pm \sqrt{8137}}{2}$
计算出两个特征值（记为 $\lambda_1$ 和 $\lambda_2$ ），然后取平方根得到奇异值 $\sigma_1 = \sqrt{\lambda_1}$ 和 $\sigma_2 = \sqrt{\lambda_2}$ 。

最终步骤：谱范数

矩阵 $X$ 的谱范数 $X\|_2$ 为最大奇异值：
$\|X\|_2 = \max(\sigma_1, \sigma_2)$
通过这个过程，我们可以得到非方矩阵的谱范数，即奇异值中的最大值。

常见的向量范数、矩阵范数和对偶范数-对偶范数详细证明过程

文章目录对偶范数一般定义： p p p-范数和 q q q-范数的对偶性特例 1：无穷范数和 1 范数的对偶性特例 2：2 范数的对偶是自身特例 3：有限范数与 0 范数的对偶关系（稀疏性）特例 4：核范数&#xff…...

编程日记 2024/11/2 5:34:45

Android 滴滴面经

Android 滴滴面经文章目录 Android 滴滴面经一面二面三面一面 Activity的启动的四种模式，四种启动模式的应用场景，单例模式的启动场景，我回答的是闹钟，反问：在单例模式下闹钟运行时点击back键，是回退到闹…...

编程日记 2024/11/2 5:33:44

angular登录按钮输入框监听

说明：angular实现简单的登录页面，监听输入框的值，打印出来，按钮监听，打印数据效果图: step1:E:\projectgood\ajnine\untitled4\src\app\app.config.ts import { ApplicationConfig, provideZoneChangeDetection } …...

编程日记 2024/11/2 5:31:42

硅谷甄选（10）用户管理

用户管理模块 9.1 静态搭建主要是el-form、el-pagination <template><el-card style"height: 80px"><el-form :inline"true" class"form"><el-form-item label"用户名:"><el-input placeholder"请…...

编程日记 2024/11/2 5:29:40

Unity XR Interaction Toolkit 开发教程（2）：导入 SDK【3.0 以上版本】

文章目录 📕课程总结📕安装 Unity 编辑器与打包模块📕导入 OpenXR📕导入 XR Interaction Toolkit📕打包发布获取完整课程以及答疑，工程文件下载： https://www.spatialxr.tech/ 视频试看链接&a…...

编程日记 2024/11/2 5:28:39

element-plus校验单个form对象合法性

在 Vue 中，循环生成的表单列表，并且每个表单中包含多个对象，使用 v-for 来创建这些表单，并且使用动态 prop 路径来验证单个对象是否满足必填校验。 <template><el-form ref"formRef" :model"form" …...

编程日记 2024/11/2 5:27:38

Linux常见命令合集

目录 1.ls 列出指定目录下的文件和和文件夹 2.cd change directory 切换目录 3. cat 查看文件 4.more 分屏查看文件 5.tail从后往前查看指定文件 6.mkdir 创建目录 7.rm强制删除指定目录和文件 8.cp复制文件和目录 9.mv移动和重命名命令 10.tar命令打包和拆包重点是…...

编程日记 2024/11/2 5:26:37

init.py all和 name的作用及其用法

__ init__.py 的作用及其用法： 包下的__init__.py 所在目录是一个模块包,本身也是一个模块,可用于定义模糊导入时要导入的内容。当我们导入一个包的时候，包下的__init__.py中的代码会自动执行，因此在某些大的项目被使用频率较高的模块&#x…...

编程日记 2024/11/2 5:25:36

js操作数组的方法 / js操作字符串的方法

操纵数组的方法常见的有10种 push() -在数组末尾添加一个或多个元素，并返回新的长度。 pop() -删除数组的最后一个元素，并返回那个元素。 shift() -删除数组的第一个元素，并返回那个元素。 unshift() -在数组的开始添加一个或多个元素&…...

编程日记 2024/11/2 5:23:35

Docker 部署RocketMQ

FROM: Docker安装RocketMQ教程_docker 安装rocketmq-CSDN博客...

编程日记 2024/11/2 5:22:34

Linux(Cent OS)环境离线安装mkfontscale mkfontdir命令解决java项目在linux系统下无法获取中文字体问题

https://download.csdn.net/download/mlc19860417/89938093 1 附件下载 1.libfontenc-1.1.3-3.amzn2.0.2.x86_64.rpm 2.libXfont-1.5.2-1.amzn2.0.2.x86_64.rpm 3.xorg-x11-font-utils-7.5-20.amzn2.0.2.x86_64.rpm 4.fontpackages-filesystem-1.44-8.amzn2.noarch.rpm 5.sti…...

编程日记 2024/11/2 5:21:33