当前位置：首页 > news >正文

两端约束的最优控制问题及其数值解法

news 2026/2/10 13:55:51

问题的基本形式

设 $n$ 维系统状态房产 $\dot{x}(t)=f[x(t),u(t),t]$ ，控制向量 $u(t)\in\Omega$ 是分段连续函数， $\Omega\in R^m$ 是有界闭集，满足约束 $g[x(t),u(t),t]\ge 0$ ，终端时刻固定为 $t_f$ 。目标是使状态从初态 $x(t_0)=x_0$ 转移到终态 $x(t_f)$ ，其中 $G[x(t_f),t_f]=0$ ，且使得性能指标 $J[u(t)]=\Phi[x(t_f),t_f]+\int_{t_0}^{t_f}L[x(t),u(t),t]dt$ 达到最小。

基本解法

构造Hamilton函数 $H[x(t),u(t),\lambda(t),t]=L[x(t),u(t),t]+\lambda(t)^Tf[x(t),u(t),t]$ 。设 $u^*(t)$ 为最优控制， $x^*(t)$ 是最优轨线，则存在与 $u=u^*(t)$ 和 $x=x^*(t)$ 对应的最优伴随向量 $\lambda=\lambda^*(t)$ ，使得： $\begin{cases} \dot{x}=\frac{\partial H}{\partial \lambda} \\ \dot{\lambda}=-\frac{\partial H}{\partial x}\\ \end{cases}$
其中， $u^*=\arg\min_{u\in \Omega}H[x^*(t),u(t),\lambda^*(t)]$ ；

上述方程同时还满足边界条件 $x(t_0)=x_0,G[x(t_f),t_f]=0$ ；

横截条件 $\lambda(t_f)=\frac{\partial \Phi(t_f)}{\partial x}+[\frac{\partial G(t_f)}{\partial x}]^Tv$ 。

数值解法

直接法

在考虑控制量约束 $g[x(t),u(t),t]\ge 0$ 和终端约束 $G[x(t_f),t_f]=0$ 存在的条件下，需要对原来的性能指标 $J [u (t)]$ 加罚函数项得到 $\bar{J}[u(t)]$ ：
$\bar{J}[u(t)]=J[u(t)]+\mu\sum_{i=1}^rG_i[x(t_f),t_f]^2+\eta\int_{t_0}^{t_f}\sum_{i=1}^l\min(g_i,0)^2dt$
直接法多采用梯度法及其变型进行求解，具体的计算步骤如下：

Step1. 根据经验选定初始控制 $u^0(t)$ ，允许误差 $\varepsilon>0$ ；

Step2. 将 $u^0(t)$ 代入状态方程并求解得到 $x^0(t)$ ；

Step3. 计算 $\bar{J}[u^0(t)]$ ，并根据协态方程从 $t_f$ 到 $t_0$ 反向积分计算 $\lambda^0(t)$ ；

Step4. 计算 $u^0$ 处的梯度 $\nabla \bar{J}[u^0(t)]=\frac{\partial H[x^0(t),u^0(t),\lambda^0(t),t]}{\partial u}$ ；

Step5. 确定搜索步长 $\alpha^0=\arg\min_{\alpha >0} \bar{J}[u^0-\alpha\nabla \bar{J}[u^0(t)]]$ ；

Step6. 修正控制向量 $u^1(t)=u^0(t)-\alpha^0\nabla \bar{J}[u^0(t)]$ ；

Step7. 若满足终止条件 $||\nabla \bar{J}[u^0(t)]||\leq \varepsilon$ ，则结束循环；否则，令 $u^0=u^1$ 回到Step2.

Step2和Step3往往是比较难计算的。

另外，若 $u (t)$ 满足上下界限约束，则在Step6中需要对 $u (t)$ 进行限幅。而针对横截条件中的 $v$ 可以采用 $2\mu G$ 估算：
$\lambda_i(t_f)=\frac{\partial \Phi(t_f)}{\partial x_i}+\sum_{j=1}^r2\mu G_j[x(t_f),t_f]\frac{\partial G_j(t_f)}{\partial x_i}$

间接法

直接法中修正后的控制向量 $u$ 不一定满足约束 $g\geq 0$ ，而是通过施加罚函数，限幅等手段进行迭代。而间接法则是尽量充分保证 $u$ 能满足约束 $g\geq 0$ ，这里给出间接法中的拟线性化方法实现逼近。该方法的核心是首先求出 $u(x,\lambda,t)$ 带入正则方程，引入增广状态 $Y(t)=[x(t),\lambda(t)]^T,Y(t)\in R^{2n}$ ，将正则方程转化为 $\dot{Y}=g(Y,t)$ ，再将该方程进一步线性化得到：
$\dot{Y}^{K+1}=(\frac{\partial g}{\partial Y})_KY^{K+1}+[g(Y^K,t)-(\frac{\partial g}{\partial Y})_KY^{K}]$
其中， $Y^K$ 代表第 $K$ 步迭代的解。若对于给定的 $\varepsilon>0$ ，当 $||Y^{k+1}(t)-Y^k(t)||\leq \varepsilon$ 时停止计算。

两端约束的最优控制问题及其数值解法

问题的基本形式

基本解法

数值解法

直接法

间接法

相关文章：

两端约束的最优控制问题及其数值解法

电磁仿真--基本操作-CST-(6)-导线周围磁场

用Java手写jvm之模拟方法调用指令invokexxx和方法返回指令xreturn

自定义枚举类型检查

探索四川财谷通抖音小店：安全与信赖的购物新体验

systemd-manage系统服务图形化管理工具使用教程

移除元素（LeetCode）

代码随想录27期|Python|Day38|509斐波那契|738.爬楼梯|746.746. 使用最小花费爬楼梯

windows docker容器部署前端项目

科普文：微服务之全文检索ElasticSearch 集群的搭建

QtObject是干什么的？

锐捷RCNA | 远程登录与路由技术

实现Vue-tiny-diff算法

正则表达式测试工具

Github 2024-08-02 开源项目日报 Top9

重生之我学习【数据结构之顺序表（SeqList）】

前端day4-表单标签

vue3-print-nb 表格打印分页，第一页有空白的情况出现解决方法（两种：一种原生，一种基于element表格）

搜维尔科技：借助 Xsens中的远程人体录制功能，可以在任何位置以无限量同时捕捉无限数量演员的身体动作

2024/08 近期关于AI的阅读和理解[笔记]

浏览器访问 AWS ECS 上部署的 Docker 容器（监听 80 端口）

51c自动驾驶~合集58

边缘计算医疗风险自查APP开发方案

关于nvm与node.js

Frozen-Flask ：将 Flask 应用“冻结”为静态文件

页面渲染流程与性能优化

视频字幕质量评估的大规模细粒度基准

如何为服务器生成TLS证书

成都鼎讯硬核科技！雷达目标与干扰模拟器，以卓越性能制胜电磁频谱战

华为云Flexus+DeepSeek征文｜DeepSeek-V3/R1 商用服务开通全流程与本地部署搭建