当前位置：首页 > news >正文

凸优化理论学习一|最优化及凸集的基本概念

news 2026/2/9 2:21:16

文章目录

一、优化问题
- （一）数学优化
- （二）凸优化
二、凸集
- （一）一些标准凸集
- （二）保留凸性的运算
- （三）正常锥和广义不等式
- （四）分离和支撑超平面

一、优化问题

（一）数学优化

从本质上讲，人工智能的目标就是最优化——在复杂环境中与多体交互中做出最优决策。几乎所有的人工智能问题都会归结为一个优化问题。

优化目标：minimize $f_0(x)$
约束条件：
- 非等式约束： $f_i(x)\leq0，i=1,...,m$
- 等式约束： $g_i(x)=0，i=1,...,m$

将最优化问题用于求解最佳决策时， $x$ 代表决策，约束用于限制决策或对结果施加条件
将最优化问题用于求解最优模型时， $x$ 表示模型中的参数，约束对模型参数提出要求（例如，非负性）

最优化问题一般情况下不能得到完全的解决，但是可以尝试近似地解决它，而且通常无伤大雅。这个问题的例外情况是：凸优化问题。

一般非凸问题的传统技术通常会涉及到一定的妥协：

局部优化方法（非线性规划）
- 在其附近的可行点中找到一个使 $f_0$ 最小的点
- 可以处理大问题，例如神经网络训练
- 需要初始猜测，并且通常需要算法参数微调
- 不提供有关找到的点有多次优的信息
全局优化方法
- 找到（全局）解决方案
- 最坏情况的复杂性随着问题的规模呈指数级增长
- 通常基于解决凸子问题

（二）凸优化

凸优化问题是特殊形式的优化问题，包括线性规划 (LP)、二次规划 (QP) 等，我们通常能够可靠、高效地解决这些问题。

优化目标：minimize $f_0(x)$
约束条件：
- 非等式约束： $f_i(x)\leq0，i=1,...,m$
- 等式约束： $A x = b$

凸优化问题与最优化问题的对比：

凸优化问题的等式约束是线性的
$f_0,..., f_m$ 是凸的： $\theta \in [0,1],f_i(\theta x+(1-\theta)y)\leq\theta f_i(x)+(1-\theta)f_i(y)$

二、凸集

（一）一些标准凸集

仿射集包含通过集合中任意两个不同点的线（通过 $x_1$ 、 $x_2$ 两点的线： $x=\theta x_1+(1-\theta)x_2,\theta \in R$ ）

函数形式为f=Ax+b，则称函数是仿射的，即线性函数加常数的形式。
比如线性方程组的解 ${x |Ax = b\}$ ，并且每个仿射集都可以表示为线性方程组的解集

凸集包含集合中任意两点之间的线段（ $x_1$ 和 $x_2$ 两点间的线段： $x=\theta x_1+(1-\theta)x_2,0\leq\theta\leq1$ ）

凸集满足对于 $x_1,x_2\in C,0\leq\theta\leq1$ ,有 $\theta x_1+(1-\theta)x_2\in C$ ；
以下为一个凸集和两个非凸集的示意：

为什么 $x=\theta x_1+(1-\theta)x_2$ 可以表示任意两点连接线段的所有点？将上式展开得：
$x=\theta x_1+(1-\theta)x_2=\theta x_1+x_2-\theta x_2=\theta(x_1-x_2)+x_2$

凸包： S 中所有点的凸组合的集合（ $x_1,...,x_k$ 的凸组合： $x=\theta_1 x_1+\theta_2 x_2+...+\theta_k x_k$ ，其中 $\theta_1+...+\theta_k =1,\theta_i \geq 0$ ）
在这里插入图片描述
凸锥体：包含集合中点的所有圆锥组合的集合（ $x_1$ 和 $x_2$ 的圆锥组合： $x=\theta_1 x_1+\theta_2 x_2$ ，且 $\theta_1\geq0,\theta_2\geq0$ ）