当前位置: 首页 > news >正文

机器学习笔记之最优化理论与方法(五)凸优化问题(上)

机器学习笔记之最优化理论与方法——凸优化问题[上]

  • 引言
    • 凸优化问题的基本定义
      • 凸优化定义:示例
    • 凸优化与非凸优化问题的区分
      • 局部最优解即全局最优解
      • 凸优化问题的最优性条件
      • 几种特殊凸问题的最优性条件
        • 无约束凸优化
        • 等式约束凸优化
        • 非负约束凸优化

引言

本节将介绍凸优化问题,主要介绍凸优化问题的基本定义凸优化与非凸优化问题的区分

凸优化问题的基本定义

关于最优化问题 P \mathcal P P描述如下:
P ⇒ { min ⁡ f ( x 1 , x 2 , ⋯ , x n ) s.t.  { G i ( x 1 , x 2 , ⋯ , x n ) ≤ 0 i = 1 , 2 , ⋯ , m H j ( x 1 , x 2 , ⋯ , x n ) = 0 j = 1 , 2 , ⋯ , l \mathcal P \Rightarrow \begin{cases} \min f(x_1,x_2,\cdots,x_n) \\ \text{s.t. } \begin{cases} \mathcal G_i(x_1,x_2,\cdots,x_n) \leq 0 \quad i=1,2,\cdots,m \\ \mathcal H_j(x_1,x_2,\cdots,x_n) = 0 \quad j=1,2,\cdots,l \end{cases} \end{cases} P minf(x1,x2,,xn)s.t. {Gi(x1,x2,,xn)0i=1,2,,mHj(x1,x2,,xn)=0j=1,2,,l
同时记最优化问题可行域 S \mathcal S S为:
可行域中采样出的 x ∈ S x \in \mathcal S xS也被称作可行解
S = { x ∈ R n ∣ G i ( x ) ≤ 0 , i = 1 , 2 , ⋯ , m ; H j ( x ) = 0 , j = 1 , 2 , ⋯ , l } \mathcal S = \{x \in \mathbb R^n \mid \mathcal G_i(x) \leq 0,i=1,2,\cdots,m;\mathcal H_j(x) = 0,j=1,2,\cdots,l\} S={xRnGi(x)0,i=1,2,,m;Hj(x)=0,j=1,2,,l}
什么情况下,最优化问题 P \mathcal P P被称作凸优化问题 ? ? ?针对上述描述,需要满足如下三个条件:

  • 目标函数 f ( x ) f(x) f(x)是关于决策变量 x x x凸函数
  • m m m不等式约束函数 G i ( x ) , i = 1 , 2 , ⋯ , m \mathcal G_i(x),i=1,2,\cdots,m Gi(x),i=1,2,,m均是关于决策变量 x x x的凸函数
  • l l l等式约束函数 H j ( x ) , j = 1 , 2 , ⋯ , l \mathcal H_j(x),j=1,2,\cdots,l Hj(x),j=1,2,,l均是关于决策变量 x x x的线性函数

观察不等式约束函数 G i ( x ) \mathcal G_i(x) Gi(x),为什么要强调它们是凸函数 ? ? ?,首先,观察不等式约束的描述:
G i ( x ) ≤ 0 i = 1 , 2 , ⋯ , m \mathcal G_i(x) \leq 0 \quad i=1,2,\cdots,m Gi(x)0i=1,2,,m
这种描述明显是:关于函数 G i ( x ) \mathcal G_i(x) Gi(x)在水平值 a = 0 a=0 a=0处的水平集 L i ; 0 \mathcal L_{i;0} Li;0
关于水平集的概念,详见凸函数:定义与基本性质。
L i ; 0 = { x ∣ G i ( x ) ≤ 0 , x ∈ R n ; i = 1 , 2 , ⋯ , m } \mathcal L_{i;0} = \{x \mid \mathcal G_i(x) \leq 0,x \in \mathbb R^n;i=1,2,\cdots,m\} Li;0={xGi(x)0,xRn;i=1,2,,m}
根据水平集的定义:如果 G i ( x ) , i = 1 , 2 , ⋯ , m \mathcal G_i(x),i=1,2,\cdots,m Gi(x),i=1,2,,m凸函数,那么其对应的水平集 L i ; 0 , i = 1 , 2 , ⋯ , m \mathcal L_{i;0},i=1,2,\cdots,m Li;0,i=1,2,,m必然是凸集。而 m m m个不等式约束对应的结果是 m m m个水平集的交集,而该交集必然也是凸集
关于凸集的交集也是凸集同样见上述链接几种保持函数凸性的运算

同样,观察等式约束函数 H j ( x ) , j = 1 , 2 , ⋯ , l \mathcal H_j(x),j=1,2,\cdots,l Hj(x),j=1,2,,l,如果它们是线性函数
H j ( x ) : A j T x + b j = 0 j = 1 , 2 , ⋯ , l \mathcal H_j(x):\mathcal A_j^T x + b_j = 0 \quad j=1,2,\cdots,l Hj(x):AjTx+bj=0j=1,2,,l
而线性函数同样是凸函数,因而等式约束函数描述的集合同样也是凸集。从而在上述两类约束条件下的可行域 S \mathcal S S也必然是凸集。根据凸集的简单认识中介绍的:凸优化问题与凸集合凸函数的关系中的两个条件:

  • 目标函数 f ( x ) f(x) f(x)是一个凸函数
  • x x x可行域 S ⇒ x ∈ S \mathcal S \Rightarrow x \in \mathcal S SxS是一个凸集

满足条件的最优化问题才属于凸优化问题。

相反,如果目标函数 f ˉ ( x ) \bar{f}(x) fˉ(x)描述为: max ⁡ f ˉ ( x ) \max \bar{f}(x) maxfˉ(x),想要将其转化为凸优化问题,我们需要判定: f ˉ ( x ) \bar{f}(x) fˉ(x)是否为凹函数。如果 f ˉ ( x ) \bar{f}(x) fˉ(x)是凹函数,可以将其转化为相应凸函数的优化问题
关于凹函数,同样见凸函数:定义与基本性质
max ⁡ f ˉ ( x ) ⇔ min ⁡ − f ˉ ( x ) \max \bar{f}(x) \Leftrightarrow \min - \bar{f}(x) maxfˉ(x)minfˉ(x)

凸优化定义:示例

观察:下面的最优化问题是否为凸优化问题 ? ? ?
{ min ⁡ f ( x ) = x 1 2 + x 2 2 s.t.  { G ( x ) = x 1 1 + x 2 2 ≤ 0 H ( x ) = ( x 1 + x 2 ) 2 = 0 \begin{cases} \min f(x) = x_1^2 + x_2^2 \\ \text{s.t. } \begin{cases} \begin{aligned} \mathcal G(x) & = \frac{x_1}{1 + x_2^2} \leq 0 \\ \mathcal H(x) & = (x_1 + x_2)^2 = 0 \end{aligned} \end{cases} \end{cases} minf(x)=x12+x22s.t.  G(x)H(x)=1+x22x10=(x1+x2)2=0

  • 首先,观察到该最优化问题是最小化问题,并且目标函数 f ( x ) = x 1 2 + x 2 2 f(x) = x_1^2 + x_2^2 f(x)=x12+x22凸函数
    该函数对应决策变量 x x x Hessian Matrix ⇒ ∇ 2 f ( x ) \text{Hessian Matrix} \Rightarrow \nabla^2 f(x) Hessian Matrix2f(x)是固定结果: ( 2 0 0 2 ) \begin{pmatrix}2 \quad 0 \\ 0 \quad 2\end{pmatrix} (2002),它是一个正定矩阵(凸函数的二阶条件)
  • 观察不等式约束 G ( x ) = x 1 1 + x 2 2 \begin{aligned}\mathcal G(x) = \frac{x_1}{1 + x_2^2}\end{aligned} G(x)=1+x22x1,从表面上看:它并不是一个凸函数。但我们可以推出如下表达:
    由于分母 1 + x 2 2 > 0 1 +x_2^2 > 0 1+x22>0恒成立,因此只需要观察分子的符号即可。
    G ( x ) = x 1 1 + x 2 2 ≤ 0 ⇔ x 1 ≤ 0 ⇒ G ˉ ( x ) = x 1 \mathcal G(x) = \frac{x_1}{1 + x_2^2} \leq 0 \Leftrightarrow x_1 \leq 0 \Rightarrow \bar{\mathcal G}(x) = x_1 G(x)=1+x22x10x10Gˉ(x)=x1
    G ˉ ( x ) = x 1 \bar{\mathcal G}(x) = x_1 Gˉ(x)=x1线性函数,自然也是凸函数
  • 观察等式约束 H ( x ) = ( x 1 + x 2 ) 2 = 0 \mathcal H(x) = (x_1 + x_2)^2 = 0 H(x)=(x1+x2)2=0,很明显它不是线性函数。但我们同样可以推出如下表达:
    H = ( x 1 + x 2 ) 2 = 0 ⇔ x 1 + x 2 = 0 ⇒ H ˉ ( x ) = x 1 + x 2 \mathcal H = (x_1 + x_2)^2 =0 \Leftrightarrow x_1 + x_2 = 0 \Rightarrow \bar{\mathcal H}(x) = x_1 + x_2 H=(x1+x2)2=0x1+x2=0Hˉ(x)=x1+x2
    H ˉ ( x ) \bar{\mathcal H}(x) Hˉ(x)是线性函数。综上,该示例描述的最优化问题是凸优化问题
    关于约束条件,可能并不是上来直接用,能够化简的部分需要进行化简。

凸优化与非凸优化问题的区分

凸集的简单认识中,介绍了凸优化相关的两个优秀性质

局部最优解即全局最优解

关于局部最优解 x ˉ \bar{x} xˉ的定义表示为:
f ( x ˉ ) ≤ f ( x ) ∀ ∈ S ∩ N ϵ ( x ˉ ) f(\bar{x}) \leq f(x) \quad \forall \in \mathcal S \cap \mathcal N_{\epsilon}(\bar {x}) f(xˉ)f(x)SNϵ(xˉ)
其中 N ϵ ( x ˉ ) \mathcal N_{\epsilon}(\bar{x}) Nϵ(xˉ)表示包含 x ˉ \bar{x} xˉ的小的邻域范围。也就是说:仅在较小的邻域范围 S ∩ N ϵ ( x ˉ ) \mathcal S \cap \mathcal N_{\epsilon}(\bar{x}) SNϵ(xˉ)内,某可行解 x ˉ \bar{x} xˉ的目标函数值 ≤ \leq 所有目标函数值,称可行解 x ˉ \bar{x} xˉ局部最优解
相反,关于全局最优解 x ∗ x^* x的定义表示为:
f ( x ∗ ) ≤ f ( x ) ∀ x ∈ S f(x^*) \leq f(x) \quad \forall x \in \mathcal S f(x)f(x)xS
也就是说:在整个可行域 S \mathcal S S范围内,某可行解 x ∗ x^* x的目标函数值 ≤ \leq 所有目标函数值。称可行解 x ∗ x^* x全局最优解

回到凸优化问题上:如果在 S \mathcal S S中找到某一个局部最优解,那么该解一定也是全局最优解

(反证法)证明

  • 假设找到某个解 x ˉ \bar{x} xˉ是局部最优解,但不是全局最优解,可以推出:必然存在某个解 x ∗ ∈ S x^* \in \mathcal S xS,有:
    如果不存在,这个局部解就是全局解~
    f ( x ∗ ) < f ( x ˉ ) f(x^*) < f(\bar{x}) f(x)<f(xˉ)
  • x ˉ \bar{x} xˉ开始,沿着 x ∗ − x ˉ x^* - \bar{x} xxˉ方向前进一个小的步长,得到一个新的点 x ˉ + λ ⋅ ( x ∗ − x ˉ ) , λ ∈ ( 0 , 1 ) \bar {x} + \lambda \cdot (x^* - \bar{x}),\lambda \in (0,1) xˉ+λ(xxˉ),λ(0,1),它的目标函数结果: f [ x ˉ + λ ⋅ ( x ∗ − x ˉ ) ] f[\bar{x} + \lambda \cdot (x^* - \bar{x})] f[xˉ+λ(xxˉ)]可表示为:
    可以将 x ˉ + λ ⋅ ( x ∗ − x ˉ ) = ( 1 − λ ) ⋅ x ˉ + λ ⋅ x ∗ \bar{x} + \lambda \cdot (x^* - \bar{x}) = (1 - \lambda) \cdot \bar{x} + \lambda \cdot x^* xˉ+λ(xxˉ)=(1λ)xˉ+λx重新组合,可看作点 x ˉ , x ∗ \bar{x},x^* xˉ,x凸组合
    将上面的 f ( x ∗ ) < f ( x ˉ ) f(x^*) <f(\bar{x}) f(x)<f(xˉ)代入。
    f [ λ ⋅ x ∗ + ( 1 − λ ) ⋅ x ˉ ] ≤ λ ⋅ f ( x ∗ ) + ( 1 − λ ) ⋅ f ( x ˉ ) < λ ⋅ f ( x ˉ ) + ( 1 − λ ) ⋅ f ( x ˉ ) = f ( x ˉ ) \begin{aligned} f[\lambda \cdot x^* + (1 - \lambda) \cdot \bar{x}] & \leq \lambda \cdot f(x^*) + (1 - \lambda) \cdot f(\bar{x}) \\ & < \lambda \cdot f(\bar{x}) + (1 - \lambda) \cdot f(\bar{x}) \\ & = f(\bar{x}) \end{aligned} f[λx+(1λ)xˉ]λf(x)+(1λ)f(xˉ)<λf(xˉ)+(1λ)f(xˉ)=f(xˉ)
  • 可以发现:无论 λ \lambda λ如何取值, f [ x ˉ + λ ⋅ ( x ∗ − x ˉ ) ] < f ( x ˉ ) f[\bar{x} + \lambda \cdot (x^* - \bar{x})] < f(\bar{x}) f[xˉ+λ(xxˉ)]<f(xˉ)恒成立。如果 λ ⇒ 0 \lambda \Rightarrow 0 λ0,小到 x ˉ + λ ⋅ ( x ∗ − x ˉ ) \bar{x} + \lambda \cdot (x^* - \bar{x}) xˉ+λ(xxˉ)位于局部最优解邻域 N ϵ ( x ˉ ) \mathcal N_{\epsilon}(\bar{x}) Nϵ(xˉ)内,会出现矛盾: x ˉ \bar{x} xˉ是该邻域内的最优解,但存在另一个解 x ˉ + λ ⋅ ( x ∗ − x ˉ ) \bar{x} +\lambda \cdot (x^* - \bar{x}) xˉ+λ(xxˉ),其函数值小于 f ( x ˉ ) f(\bar{x}) f(xˉ),这意味着: x ˉ \bar{x} xˉ不是该邻域内的最优解。至此,得证:如过 x ˉ \bar{x} xˉ是局部最优解,那么它一定是全局最优解

凸优化问题的最优性条件

什么样的解是凸优化问题的最优解 ? ? ?关于最优解有如下充要条件
x ∗ ∈ S is Optimal  ⇔ [ ∇ f ( x ∗ ) ] T ( x − x ∗ ) ≥ 0 ∀ x ∈ S x^* \in \mathcal S \text{ is Optimal } \Leftrightarrow [\nabla f(x^*)]^T (x - x^*) \geq 0 \quad \forall x \in \mathcal S xS is Optimal [f(x)]T(xx)0xS
为什么满足该充要条件就一定是最优解 ? ? ?证明如下:
充分性:已知某解 x ∗ x^* x满足 [ ∇ f ( x ∗ ) ] T ( x − x ∗ ) ≥ 0 , ∀ x ∈ S [\nabla f(x^*)]^T(x - x^*) \geq 0,\forall x \in \mathcal S [f(x)]T(xx)0,xS

  • 观察 f ( x ) f(x) f(x) f ( x ∗ ) + [ ∇ f ( x ∗ ) ] T ( x − x ∗ ) , ∀ x ∈ S f(x^*) + [\nabla f(x^*)]^T(x - x^*),\forall x \in \mathcal S f(x)+[f(x)]T(xx),xS两者之间的大小关系。必然有:

    • 其中不等式右侧描述:过 [ x ∗ , f ( x ∗ ) ] [x^*,f(x^*)] [x,f(x)]点并与凸函数 f ( ⋅ ) f(\cdot) f()相切的直线。根据凸函数的定义,函数图像必然全部在切线上方。
    • 又根据上述条件,必然有: f ( x ∗ ) + [ ∇ f ( x ∗ ) ] T ( x − x ∗ ) ≥ f ( x ∗ ) f(x^*) + [\nabla f(x^*)]^T(x - x^*) \geq f(x^*) f(x)+[f(x)]T(xx)f(x)

    f ( x ) ≥ f ( x ∗ ) + [ ∇ f ( x ∗ ) ] T ( x − x ∗ ) ≥ f ( x ∗ ) f(x) \geq f(x^*) + [\nabla f(x^*)]^T (x - x^*) \geq f(x^*) f(x)f(x)+[f(x)]T(xx)f(x)

  • 总上,对于 x ∈ S x \in \mathcal S xS,都有上述式子 f ( x ) ≥ f ( x ∗ ) f(x) \geq f(x^*) f(x)f(x)成立,因而 x ∗ x^* x全局最优解

必要性:已知某解 x ∗ x^* x全局最优解。(反证法)证明

  • 假设 ∃ x ˉ ∈ S \exist \bar{x} \in \mathcal S xˉS,使得: [ ∇ f ( x ∗ ) ] T ( x ˉ − x ∗ ) < 0 [\nabla f(x^*)]^T(\bar{x} - x^*) < 0 [f(x)]T(xˉx)<0
  • 基于上述假设,以 x ∗ x^* x为起始,向 x ˉ \bar{x} xˉ方向移动一个较小距离 λ ⋅ ( x ˉ − x ∗ ) , λ ∈ ( 0 , 1 ) \lambda \cdot (\bar{x} - x^*),\lambda \in (0,1) λ(xˉx),λ(0,1),观察函数值从 f ( x ∗ ) f(x^*) f(x) f [ x ∗ + λ ⋅ ( x ˉ − x ∗ ) ] f[x^* + \lambda \cdot (\bar{x} - x^*)] f[x+λ(xˉx)]的变化情况。这里使用泰勒公式 f [ x ∗ + λ ⋅ ( x ˉ − x ∗ ) ] f[x^* + \lambda \cdot (\bar{x} - x^*)] f[x+λ(xˉx)] x ∗ x^* x处进行展开:
    其中 O ( ⋅ ) \mathcal O(\cdot) O()表示高阶无穷小。
    f [ x ∗ + λ ⋅ ( x ˉ − x ∗ ) ] = f ( x ∗ ) + 1 1 ! ⋅ λ [ ∇ f ( x ∗ ) ] T ( x ˉ − x ∗ ) + O ( λ ∣ ∣ x ˉ − x ∗ ∣ ∣ ) λ ∈ ( 0 , 1 ) f[x^* + \lambda \cdot(\bar{x} - x^*)] = f(x^*) + \frac{1}{1 !} \cdot \lambda [\nabla f(x^*)]^T(\bar{x} - x^*) +\mathcal O(\lambda ||\bar{x} - x^*||) \quad \lambda \in (0,1) f[x+λ(xˉx)]=f(x)+1!1λ[f(x)]T(xˉx)+O(λ∣∣xˉx∣∣)λ(0,1)
    整理得:
    f [ x ∗ + λ ⋅ ( x ˉ − x ∗ ) ] − f ( x ∗ ) λ = [ ∇ f ( x ∗ ) ] T ( x ˉ − x ∗ ) + O ( λ ⋅ ∣ ∣ x ˉ − x ∗ ∣ ∣ ) λ \frac{f[x^* + \lambda \cdot (\bar{x} - x^*)] - f(x^*)}{\lambda} = [\nabla f(x^*)]^T(\bar{x} - x^*) + \frac{\mathcal O(\lambda \cdot ||\bar{x} - x^*||)}{\lambda} λf[x+λ(xˉx)]f(x)=[f(x)]T(xˉx)+λO(λ∣∣xˉx∣∣)
    λ ⇒ 0 \lambda \Rightarrow 0 λ0时,等式右侧的符号由 [ ∇ f ( x ∗ ) ] T ( x ˉ − x ∗ ) [\nabla f(x^*)]^T(\bar{x} - x^*) [f(x)]T(xˉx)控制 < 0 <0 <0;等式左侧自然也 < 0 <0 <0
    关于高阶无穷小: O ( λ ⋅ ∣ ∣ x ˉ − x ∗ ∣ ∣ ) λ \begin{aligned}\frac{\mathcal O(\lambda \cdot ||\bar{x} - x^*||)}{\lambda}\end{aligned} λO(λ∣∣xˉx∣∣) λ ⇒ 0 \lambda \Rightarrow 0 λ0时,分子趋于 0 0 0的速度更快。因而 lim ⁡ λ ⇒ 0 O ( λ ⋅ ∣ ∣ x ˉ − x ∗ ∣ ∣ ) λ = 0 \begin{aligned}\mathop{\lim}\limits_{\lambda \Rightarrow 0} \frac{\mathcal O(\lambda \cdot ||\bar{x} - x^*||)}{\lambda} = 0\end{aligned} λ0limλO(λ∣∣xˉx∣∣)=0
    lim ⁡ λ ⇒ 0 f [ x ∗ + λ ⋅ ( x ˉ − x ∗ ) ] − f ( x ∗ ) λ < 0 ⇒ lim ⁡ λ ⇒ 0 f [ x ∗ + λ ⋅ ( x ˉ − x ∗ ) ] − f ( x ∗ ) < 0 \mathop{\lim}\limits_{\lambda \Rightarrow 0} \frac{f[x^* + \lambda \cdot (\bar{x} - x^*)] - f(x^*)}{\lambda} <0 \Rightarrow \mathop{\lim}\limits_{\lambda \Rightarrow 0} f[x^* + \lambda \cdot(\bar{x} - x^*)] - f(x^*) <0 λ0limλf[x+λ(xˉx)]f(x)<0λ0limf[x+λ(xˉx)]f(x)<0
    这意味着:存在一点 x ∗ + λ ⋅ ( x ˉ − x ∗ ) x^* + \lambda \cdot(\bar{x} - x^*) x+λ(xˉx),其函数值 f [ x ∗ + λ ⋅ ( x ˉ − x ∗ ) ] < f ( x ∗ ) f[x^* + \lambda \cdot(\bar{x} - x^*)] < f(x^*) f[x+λ(xˉx)]<f(x)。也就是说: x ∗ x^* x不是全局最优解。这与条件相矛盾,证毕。

关于凸优化问题最优性条件几何解释

对上述最优性条件变换成如下形式:
x ∗ ∈ S is Optimal  ⇔ − [ ∇ f ( x ∗ ) ] T x ∗ ≥ − [ ∇ f ( x ∗ ) ] T x ∀ x ∈ S x^* \in \mathcal S \text{ is Optimal } \Leftrightarrow - [\nabla f(x^*)]^T x^* \geq - [\nabla f(x^*)]^T x \quad \forall x \in \mathcal S xS is Optimal [f(x)]Tx[f(x)]TxxS
根据凸集的支撑超平面定理,如果 − [ ∇ f ( x ∗ ) ] ≠ 0 -[\nabla f(x^*)] \neq 0 [f(x)]=0,则可以找到 x ∗ x^* x为边界点,并垂直于向量 − [ ∇ f ( x ∗ ) ] -[\nabla f(x^*)] [f(x)]的超平面,使该超平面支撑凸集 S \mathcal S S。而 − [ ∇ f ( x ∗ ) ] -[\nabla f(x^*)] [f(x)]作为负梯度方向,必然有: ∀ x ∈ S , s.t.  − [ ∇ f ( x ∗ ) ] ( x − x ∗ ) ≤ 0 \forall x \in \mathcal S,\text{ s.t. }-[\nabla f(x^*)](x - x^*) \leq 0 xS, s.t. [f(x)](xx)0。对应图像表示如下:

  • 其中支撑超平面定理是凸集的自身性质。
  • 也就是说:向量 − [ ∇ f ( x ∗ ) ] -[\nabla f(x^*)] [f(x)]与向量 x − x ∗ x -x^* xx之间的夹角 ≥ 9 0 。 \geq 90^。 90恒成立。
    凸优化问题最优性条件的几何解释

个人深度思考:上述最优性条件成立建立在 − [ ∇ f ( x ∗ ) ] ≠ 0 -[\nabla f(x^*)] \neq 0 [f(x)]=0的情况下,如果 − [ ∇ f ( x ∗ ) ] = 0 - [\nabla f(x^*)] =0 [f(x)]=0时,有: ∀ x ∈ S , [ ∇ f ( x ∗ ) ] T ( x − x ∗ ) ≥ 0 \forall x \in \mathcal S,[\nabla f(x^*)]^T (x - x^*) \geq 0 xS,[f(x)]T(xx)0恒成立。也就是说:在凸集中的任意一点,都可以满足该条件。在迭代寻找最优解的过程中,如果 − [ ∇ f ( x ∗ ) ] = 0 -[\nabla f(x^*)] = 0 [f(x)]=0,可能会选择错误的方向

什么时候会出现这种情况:梯度消失的时候。也就是说:如果出现梯度消失的情况下,在迭代寻找最优解的过程中,可能会选择错误的方向。最终找到的最优解可能并不是凸集的某个边界点,而是某个内点
当然,如果选择的点是内点并且目标函数结果又返回至较大的情况,此时的梯度又存在了,会继续重新收敛至最优解。这里只是描述出现的这种反弹现象。

几种特殊凸问题的最优性条件

无约束凸优化

无约束凸优化问题:在目标函数 f ( ⋅ ) f(\cdot) f()是凸函数的条件下, x ∈ R n x \in \mathbb R^n xRn,关于 min ⁡ f ( x ) \min f(x) minf(x)最优性条件表示如下:
x ∗ is Optimal  ⇔ ∇ f ( x ∗ ) = 0 x^* \text{ is Optimal } \Leftrightarrow \nabla f(x^*) = 0 x is Optimal f(x)=0
如果将该问题带入凸优化问题最优性条件中,可以得到:
x ∗ is Optimal  ⇔ [ ∇ f ( x ∗ ) ] T ( x − x ∗ ) ≥ 0 , ∀ x ∈ R n ⇔ ∇ f ( x ∗ ) = 0 x^* \text{ is Optimal } \Leftrightarrow [\nabla f(x^*)]^T(x - x^*) \geq 0,\forall x \in \mathbb R^n \Leftrightarrow \nabla f(x^*) = 0 x is Optimal [f(x)]T(xx)0,xRnf(x)=0
可以理解为: ∀ x ∈ R n \forall x \in \mathbb R^n xRn构成的向量 x − x ∗ x - x^* xx均满足 [ ∇ f ( x ∗ ) ] T ( x − x ∗ ) ≥ 0 [\nabla f(x^*)]^T(x - x^*) \geq 0 [f(x)]T(xx)0,那只有一种情况: ∇ f ( x ) \nabla f(x) f(x)是零向量
这里需要与上面描述的梯度消失的情况区分一下。上述的最优性条件必须满足可行域 S \mathcal S S是凸集。如果在 S \mathcal S S是凸集情况下, ∇ f ( x ∗ ) = 0 \nabla f(x^*) =0 f(x)=0会导致无法找到 x ∗ x^* x位置下关于凸集 S \mathcal S S的支撑超平面;相反,在无约束凸优化问题中,对可行域 S \mathcal S S没有约束

等式约束凸优化

等式约束的凸优化问题:在目标函数 f ( ⋅ ) f(\cdot) f()是凸函数的条件下,关于 min ⁡ { f ( x ) ∣ A x = b } \min \{f(x) \mid \mathcal A x = b\} min{f(x)Ax=b}最优性条件表示如下:
关于凸优化问题的等式约束函数是线性函数
x ∗ is Optimal  ⇔ ∃ μ , s.t.  ∇ f ( x ∗ ) + A T μ = 0 , A x ∗ = 0 x^* \text{ is Optimal } \Leftrightarrow \exist \mu, \text{ s.t. } \nabla f(x^*) + \mathcal A^T \mu = 0,\mathcal A x^* = 0 x is Optimal μ, s.t. f(x)+ATμ=0,Ax=0
证明
如果 x ∗ x^* x全局最优解,必然有:
x ∗ is Optimal  ⇔ [ ∇ f ( x ∗ ) ] T ( x − x ∗ ) ≥ 0 ∀ x : A x = b , A x ∗ = b x^* \text{ is Optimal } \Leftrightarrow [\nabla f(x^*)]^T(x - x^*) \geq 0 \quad \forall x:\mathcal Ax = b,\mathcal Ax^* = b x is Optimal [f(x)]T(xx)0x:Ax=b,Ax=b
根据 A x = A x ∗ = b \mathcal Ax = \mathcal Ax^* = b Ax=Ax=b,因而有: A ( x − x ∗ ) = b − b = 0 \mathcal A(x - x^*) = b - b =0 A(xx)=bb=0。记向量 d = x − x ∗ d = x - x^* d=xx,从而有:
x ∗ is Optimal  ⇔ [ ∇ f ( x ∗ ) ] T d ≥ 0 ∀ d : A d = 0 x^* \text{ is Optimal } \Leftrightarrow [\nabla f(x^*)]^T d \geq 0 \quad \forall d:\mathcal Ad = 0 x is Optimal [f(x)]Td0d:Ad=0
很明显, A d = 0 \mathcal Ad =0 Ad=0是一个齐次线性方程组,可以将 d d d描述为: A x = 0 \mathcal Ax = 0 Ax=0解集中的一个解。即: d ∈ N ( A ) d \in \mathcal N(\mathcal A) dN(A)
其中 N ( A ) \mathcal N(\mathcal A) N(A)表示系数矩阵 A \mathcal A A的零空间。
x ∗ is Optimal  ⇔ [ ∇ f ( x ∗ ) ] T d ≥ 0 ∀ d ∈ N ( A ) x^* \text{ is Optimal } \Leftrightarrow [\nabla f(x^*)]^T d \geq 0 \quad \forall d \in \mathcal N(\mathcal A) x is Optimal [f(x)]Td0dN(A)
发现这样一个现象:如果 d ∈ N ( A ) d \in \mathcal N(\mathcal A) dN(A)那么 − d ∈ N ( A ) ⇒ − A d = 0 -d \in \mathcal N(\mathcal A) \Rightarrow -\mathcal Ad = 0 dN(A)Ad=0,将 d , − d d,-d d,d都带入上式中:
{ [ ∇ f ( x ∗ ) ] T d ≥ 0 [ ∇ f ( x ∗ ) ] T ( − d ) ≥ 0 ⇒ [ ∇ f ( x ∗ ) ] T d ≤ 0 \begin{cases} [\nabla f(x^*)]^Td \geq 0 \\ [\nabla f(x^*)]^T(-d) \geq 0 \Rightarrow [\nabla f(x^*)]^T d \leq 0 \end{cases} {[f(x)]Td0[f(x)]T(d)0[f(x)]Td0
也就是说:关于 [ ∇ f ( x ∗ ) ] T d [\nabla f(x^*)]^T d [f(x)]Td可行域 d ∈ N ( A ) d \in \mathcal N(\mathcal A) dN(A)只能取等
x ∗ is Optimal  ⇔ [ ∇ f ( x ∗ ) ] T d = 0 ∀ d ∈ N ( A ) x^* \text{ is Optimal } \Leftrightarrow [\nabla f(x^*)]^T d = 0 \quad \forall d \in \mathcal N(\mathcal A) x is Optimal [f(x)]Td=0dN(A)
这意味着:向量 ∇ f ( x ∗ ) \nabla f(x^*) f(x) N ( A ) \mathcal N(\mathcal A) N(A)中的任意解向量 d d d均是垂直关系,即向量 ∇ f ( x ∗ ) \nabla f(x^*) f(x) N ( A ) \mathcal N(\mathcal A) N(A)垂直
x ∗ is Optimal  ⇔ ∇ f ( x ∗ ) ∈ N ( A ) ⊥ x^* \text{ is Optimal } \Leftrightarrow \nabla f(x^*) \in \mathcal N(\mathcal A)^{\bot} x is Optimal f(x)N(A)
对应图像表示如下:
其中 [ ∇ f ( x ∗ ) ] T d = ∥ ∇ f ( x ∗ ) ∥ ⋅ ∥ d ∥ ⋅ cos ⁡ θ = 0 → cos ⁡ θ = 0 [\nabla f(x^*)]^Td = \|\nabla f(x^*)\| \cdot \|d\| \cdot \cos \theta = 0\rightarrow \cos \theta = 0 [f(x)]Td=∥∇f(x)dcosθ=0cosθ=0
垂直描述
因而 ∇ f ( x ∗ ) \nabla f(x^*) f(x)必然能够表达为系数矩阵 A \mathcal A A行向量的线性组合。对应数学符号表示为:
这实际上就是 KKT \text{KKT} KKT条件在等式约束凸问题的具体化。后续有机会介绍~
x ∗ is Optimal  ⇔ ∇ f ( x ∗ ) + A T μ = 0 x^* \text{ is Optimal } \Leftrightarrow \nabla f(x^*) + \mathcal A^T \mu = 0 x is Optimal f(x)+ATμ=0

非负约束凸优化

基于非负约束的凸优化问题:在目标函数 f ( ⋅ ) f(\cdot) f()是凸函数的条件下,关于 min ⁡ { f ( x ) ∣ x ≥ 0 } \min\{f(x) \mid x \geq 0\} min{f(x)x0}最优性条件表示如下:
x ∗ is Optimal  ⇔ ∇ f ( x ∗ ) i ⋅ x i ∗ = 0 x ∗ ≥ 0 ; ∇ f ( x ∗ ) ≥ 0 x^* \text{ is Optimal } \Leftrightarrow \nabla f(x^*)_i \cdot x_i^* = 0\quad x^* \geq 0;\nabla f(x^*) \geq 0 x is Optimal f(x)ixi=0x0;f(x)0
证明:依然根据凸优化问题的最优性条件,有:
其中 x ∗ x^* x作为可行域内的最优解,必然也满足 x ∗ ≥ 0 x^* \geq 0 x0
x ∗ is Optimal  ⇔ [ ∇ f ( x ∗ ) ] T ( x − x ∗ ) ≥ 0 ∀ x ≥ 0 ; x ∗ ≥ 0 x^* \text{ is Optimal } \Leftrightarrow [\nabla f(x^*)]^T (x - x^*) \geq 0 \quad \forall x \geq 0;x^* \geq 0 x is Optimal [f(x)]T(xx)0x0;x0
将上式展开,整理有:
x ∗ is Optimal  ⇔ [ ∇ f ( x ∗ ) ] T x ≥ [ ∇ f ( x ∗ ) ] T x ∗ ∀ x ≥ 0 ; x ∗ ≥ 0 x^* \text{ is Optimal } \Leftrightarrow [\nabla f(x^*)]^T x \geq [\nabla f(x^*)]^T x^* \quad \forall x \geq 0;x^* \geq 0 x is Optimal [f(x)]Tx[f(x)]Txx0;x0
观察上式: ∀ x ≥ 0 \forall x \geq 0 x0,并满足: [ ∇ f ( x ∗ ) ] T x ≥ [ ∇ f ( x ∗ ) ] T x ∗ [\nabla f(x^*)]^T x \geq [\nabla f(x^*)]^T x^* [f(x)]Tx[f(x)]Tx,必然有:

  • 解释:如果 ∇ f ( x ∗ ) \nabla f(x^*) f(x)中存在某一个/若干个分量 < 0 <0 <0,在执行线性运算 [ ∇ f ( x ∗ ) ] T x [\nabla f(x^*)]^Tx [f(x)]Tx时,由于 x x x可在 x ≥ 0 x\geq 0 x0范围内任意取值,假设 x x x中对应上述 ∇ f ( x ∗ ) \nabla f(x^*) f(x)分量 < 0 <0 <0的分量位置是 + ∞ +\infty +,那么 [ ∇ f ( x ∗ ) ] T x [\nabla f(x^*)]^Tx [f(x)]Tx的结果必然是 − ∞ -\infty 。这是可能发生的结果。但该结果可能不满足 [ ∇ f ( x ∗ ) ] T x ≥ [ ∇ f ( x ∗ ) ] T x ∗ [\nabla f(x^*)]^T x \geq [\nabla f(x^*)]^T x^* [f(x)]Tx[f(x)]Tx。因此: ∇ f ( x ∗ ) ≥ 0 \nabla f(x^*) \geq 0 f(x)0必须成立
  • x = 0 x = 0 x=0时,必然也满足: [ ∇ f ( x ∗ ) ] T x ∗ ≤ [ ∇ f ( x ∗ ) ] ⋅ 0 = 0 [\nabla f(x^*)]^Tx^* \leq [\nabla f(x^*)] \cdot 0 = 0 [f(x)]Tx[f(x)]0=0
    x ∗ is Optimal  ⇔ { ∇ f ( x ∗ ) ≥ 0 ; x ∗ ≥ 0 [ ∇ f ( x ∗ ) ] T x ∗ ≤ 0 x^* \text{ is Optimal } \Leftrightarrow \begin{cases} \nabla f(x^*) \geq 0;x^* \geq 0 \\ [\nabla f(x^*)]^T x^* \leq 0 \end{cases} x is Optimal {f(x)0;x0[f(x)]Tx0

继续观察上式:在 ∇ f ( x ∗ ) , x ∗ ≥ 0 \nabla f(x^*),x^* \geq 0 f(x),x0情况下, [ ∇ f ( x ∗ ) ] T x ∗ ≤ 0 [\nabla f(x^*)]^T x^* \leq 0 [f(x)]Tx0。因此只有一种情况
x ∗ is Optimal  ⇔ { ∇ f ( x ∗ ) ≥ 0 ; x ∗ ≥ 0 [ ∇ f ( x ∗ ) ] T x ∗ = 0 x^* \text{ is Optimal } \Leftrightarrow \begin{cases} \nabla f(x^*) \geq 0;x^* \geq 0 \\ [\nabla f(x^*)]^T x^* = 0 \end{cases} x is Optimal {f(x)0;x0[f(x)]Tx=0
这意味着:线性运算 [ ∇ f ( x ∗ ) ] T x [\nabla f(x^*)]^T x [f(x)]Tx过程执行加法运算的每一个分量 ∇ f ( x ∗ ) i ⋅ x i ( i = 1 , 2 , ⋯ , n ) \nabla f(x^*)_i \cdot x_i(i=1,2,\cdots,n) f(x)ixi(i=1,2,,n)均为 0 0 0
相反,如果存在某分量乘积结果 ∇ f ( x ∗ ) k ⋅ x k ∗ > 0 ( k ∈ { 1 , 2 , ⋯ , n } ) \nabla f(x^*)_k \cdot x_k^*> 0(k \in \{1,2,\cdots,n\}) f(x)kxk>0(k{1,2,,n})最终的 [ ∇ f ( x ∗ ) ] T x [\nabla f(x^*)]^T x [f(x)]Tx结果必然 > 0 >0 >0,不满足上述条件。

证毕。

Reference \text{Reference} Reference
最优化理论与方法-第四讲-凸优化问题

相关文章:

机器学习笔记之最优化理论与方法(五)凸优化问题(上)

机器学习笔记之最优化理论与方法——凸优化问题[上] 引言凸优化问题的基本定义凸优化定义&#xff1a;示例 凸优化与非凸优化问题的区分局部最优解即全局最优解凸优化问题的最优性条件几种特殊凸问题的最优性条件无约束凸优化等式约束凸优化非负约束凸优化 引言 本节将介绍凸优…...

在Windows10上编译grpc工程,得到protoc.exe和grpc_cpp_plugin.exe

grpc是google于2015年发布的一款跨进程、跨语言、开源的RPC(远程过程调用)技术。使用C/S模式&#xff0c;在客户端、服务端共享一个protobuf二进制数据。在点对点通信、微服务、跨语言通信等领域应用很广&#xff0c;下面介绍grpc在windows10上编译&#xff0c;这里以编译grpc …...

一些测试知识

希望能起到帮助&#xff0c;博主主页&#xff1a; https://blog.csdn.net/qq_57785602/category_12023254.html?spm1001.2014.3001.5482 软件测试理论 测试的依据&#xff1a; 需求&#xff0c;规格说明&#xff0c;模型&#xff0c;用户需求等 什么是软件测试 描述一种来…...

Socket交互的基本流程?

TCP socket通信过程图 什么是网络编程&#xff0c;网络编程就是编写程序使两台连联网的计算机相互交换数据。怎么交换数据呢&#xff1f;操作系统提供了“套接字”&#xff08;socket&#xff09;的组件我们基于这个组件进行网络通信开发。tcp套接字工作流程都以“打电话”来生…...

css 分割线中间带文字

效果图 代码块&#xff08;自适应&#xff09; <div class"line"><span class"text">我是文字</span></div>.line{height:0;border-top:1px solid #000;text-align:center;}.text{position:relative;top:-14px;background-color:#…...

会不会激发对modern c++的新兴趣

可变参数好像很厉害的样子&#xff0c;会节省很多手写代码&#xff0c;让编译器自动帮我们生成代码 template<typename Fun, typename...Args> void invoke(Fun&& fun, Args&&...args) { fun(std::forward<Args>(args)...); } 任意函数包装器…...

Nginx服务器如何配合Java开发项目

Nginx服务器如何才能配合好相关的编程语言进行服务器搭建呢&#xff1f;下面我们就来看看有关的技术如何融合。希望大家有所收获。 在进行Nginx服务器建设的时候有很多语言的应用&#xff0c;其中Java 开发的web项目就是很常见的。下面我们就看看Nginx服务器如何才能与Java编程…...

【LeetCode-中等题】994. 腐烂的橘子

文章目录 题目方法一&#xff1a;bfs层序遍历 题目 该题值推荐用bfs&#xff0c;因为是一层一层的感染&#xff0c;而不是一条线走到底的那种&#xff0c;所以深度优先搜索不适合 方法一&#xff1a;bfs层序遍历 广度优先搜索&#xff0c;就是从起点出发&#xff0c;每次都尝…...

K8s部署单机mysql

文章目录 一、K8s部署单机mysql1.1 说明1.2 不足 二、部署三、检查 一、K8s部署单机mysql 1.1 说明 定制配置数据存放在configMapmysql数据放在/opt/mysql目录下(/opt/mysql目录需要事先创建)root账号密码使用环境变量env服务暴露方式为nodePort&#xff0c;端口30336 1.2 不…...

Midjourney学习(二)参数的基础

prompt的组成 prompt 可以由三部分组成&#xff0c; 第一部分是垫图部分&#xff0c;也就是一张网络图片 第二部分是文本描述内容 第三部分则是参数 参数列表 --aspect <value> 或者 --ar <value> 控制画面的比例&#xff0c;横竖比例 --version <value> -…...

Ubuntu安装Protobuf,指定版本

参考&#xff1a;https://github.com/protocolbuffers/protobuf#readme https://github.com/protocolbuffers/protobuf/blob/v3.20.3/src/README.md 其实官网的readme给的步骤很详细。 1.安装相关依赖 sudo apt-get install autoconf automake libtool curl make g unzip …...

没有使用sniffer dongle在windows抓包蓝牙方法分享

网上很多文章都是介绍买一个sniffer dongle来抓蓝牙数据,嫌麻烦又费钱,目前找到一个好方法,不需要sniffer就可以抓蓝牙数据过程,现分享如下: (1)在我资源附件找到相关安装包或者查看如下链接 https://learn.microsoft.com/zh-cn/windows-hardware/drivers/bluetooth/testing-bt…...

解决Debian系统通过cifs挂载smb后,中文目录乱码问题

解决Debian系统通过cifs挂载smb后&#xff0c;中文目录乱码问题 //$smb_server/share /mnt/nas_share cifs credentials/root/.smbcredentials,iocharsetutf8 0 0默认通过以上命令挂载smb&#xff0c;但是在查看文件目录时&#xff0c;中文乱码 解决问题方式&#xff1a; de…...

springboot整合jquery实现前后端数据交互

一 实施逻辑 1.1 前端 <!doctype html> <html lang"en"><head><meta charset"UTF-8"><meta name"Generator" content"EditPlus"><meta name"Author" content""><meta n…...

TypeScript 中的类型检查实用函数

TypeScript 中的类型检查实用函数 文章目录 TypeScript 中的类型检查实用函数一、概述二、代码实现 一、概述 在前端开发中&#xff0c;我们经常需要判断变量的类型以进行相应的操作或处理。TypeScript 提供了基础的类型检查&#xff0c;但有时我们需要更复杂或更灵活的类型检…...

JavaScript中的事件委托(event delegation)

聚沙成塔每天进步一点点 ⭐ 专栏简介⭐ JavaScript事件委托⭐ 事件冒泡&#xff08;Event Bubbling&#xff09;⭐ 事件委托的优点⭐ 如何使用事件委托⭐ 写在最后 ⭐ 专栏简介 前端入门之旅&#xff1a;探索Web开发的奇妙世界 记得点击上方或者右侧链接订阅本专栏哦 几何带你启…...

ubuntu OCR 脚本

1. 百度 PaddleOCR 介绍 2. 环境安装 pip install paddlepaddle -i https://pypi.tuna.tsinghua.edu.cn/simple # 进入 https://github.com/PaddlePaddle/PaddleOCR # 这里有个 requirements.txt pip install paddleocr -i https://mirror.baidu.com/pypi/simple pip instal…...

Go死码消除

概念: 死码消除(dead code elimination, DCE) 是一种编译器优化技术, 作用是在编译阶段去掉对程序运行结果没有任何影响的代码 和 逃逸分析[1],内联优化[2]并称为 Go编译器执行的三个重要优化 效果: 对于 const.go代码如下: package mainimport "fmt"func max(a, b i…...

基于改进莱维飞行和混沌映射的粒子群优化BP神经网络分类研究(Matlab代码实现)

&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜密&#xff0c;逻辑清晰&#xff0c;为了方便读者。 ⛳️座右铭&a…...

12. 自动化项目实战

目录 1. 登录测试 2. 测试首页的帖子列表数不为0 3. 帖子详情页校验 4. 发布帖子 5. 退出登录 自动化项目实施的基本流程如下图所示&#xff1a; 手工测试用例、自动化测试用例。 1. 登录测试 校验登录后主页显示的用户名称和登录时输入的用户名是否相等。 public class…...

Window11下载安装jdk8-jdk11与环境变量的配置

目录 一、下载jdk 二、安装jdk 三、配置环境变量 四、检查JDK是否配置成功 一、下载jdk jdk8下载链接&#xff1a;请点击网址 jdk11下载链接&#xff1a;请点击网址 二、安装jdk 按照提示一步一步安装即可。 默认安装位置&#xff1a;C:\Program Files\Java 三、配置…...

Vector Search with OpenAI Embeddings: Lucene Is All You Need

本文是LLM系列文章&#xff0c;针对《Vector Search with OpenAI Embeddings: Lucene Is All You Need》的翻译。 使用OpenAI嵌入的向量搜索&#xff1a;Lucence是你所需的一切 摘要1 引言2 从架构到实现3 实验4 讨论5 结论 摘要 我们在流行的MS MARCO文章排名测试集上使用Lu…...

JS算法与树(二)

前言 二叉搜索树&#xff08;BST&#xff09;存在一个问题&#xff1a;当你添加的节点数够多的时候&#xff0c;树的一边可能会非常的深。而其他的分支却只有几层。 AVL树 为了解决上面的问题&#xff0c;我们提出一种自平衡二叉搜索树。意思是任何一个节点左右两侧子树的高度之…...

composer 扩展库。助手库文档

composer helpers packagist 简介 death_satan/composer 作用于在有composer管理工具的项目中。封装了上层由 composer V2 提供的 ClassLoader 和 InstallVersion 轻量级的封装&#xff0c;无任何第三方包集成。便捷式的使用composer V2 API 安装要求 php > 7.4composer &g…...

Web弹性布局

/*弹性盒子 弹性布局 */ /* 默认从左到右 */ display: flex; /* 从右到左 */ /* flex-direction: row-reverse; */ /* 从上到下 */ /* flex-direction: column; */ …...

基于深度学习的AI生成式人脸图像鉴别

AIGC&#xff08;AI内容生成&#xff09;技术的快速发展确实为创作者提供了高效生产力工具&#xff0c;但同时也引发了一些问题和挑战。这些技术可以生成以假乱真的图像、视频换脸等&#xff0c;给不法分子提供了滥用的机会。其中&#xff0c;一些不法分子可能利用AIGC技术制造…...

iOS开发Swift-1-Xcode创建项目

1.创建项目 双击Xcode App&#xff0c;选择Create a new Xcode project。 选择创建一个iOS普通的App项目。选择Single View App&#xff0c;点击Next。 填写项目名&#xff0c;组织名称等&#xff0c;点击next。 选择好文件的存储路径&#xff0c;点击create。 2.为前端添加组件…...

AI 领域中 SLAM、Planning 和 Perception 的区别和联系

在人工智能&#xff08;AI&#xff09;领域&#xff0c;SLAM、Planning 和 Perception 是三个关键的概念&#xff0c;它们在机器人、自主驾驶车辆等领域中扮演着重要的角色。以下是它们之间的区别和联系&#xff1a; SLAM SLAM&#xff08;Simultaneous Localization and Map…...

【数据库】MySQL基础知识全解

系列综述&#xff1a; &#x1f49e;目的&#xff1a;本系列是个人整理为了秋招面试的&#xff0c;整理期间苛求每个知识点&#xff0c;平衡理解简易度与深入程度。 &#x1f970;来源&#xff1a;材料主要源于拓跋阿秀、小林coding等大佬博客进行的&#xff0c;每个知识点的修…...

【golang】调度系列之goroutine

前面的两篇&#xff0c;从相对比较简单的锁的内容入手(也是干货满满)&#xff0c;开始了go的系列。这篇开始&#xff0c;进入更核心的内容。我们知道&#xff0c;go应该是第一门在语言层面支持协程的编程语言(可能是我孤陋寡闻)&#xff0c;goroutine也完全算的上是go的门面。g…...