线性二次高斯(LQG)控制问题的分离原理与最优控制求解过程
字数 1862 2025-12-01 10:54:59
线性二次高斯(LQG)控制问题的分离原理与最优控制求解过程
题目描述
线性二次高斯(LQG)控制是随机控制理论中的经典问题,旨在为线性动态系统(受高斯噪声干扰)设计最优控制器,以最小化二次型代价函数。系统模型包含过程噪声和观测噪声,且状态无法直接测量,需通过观测信号估计。LQG控制的核心是"分离原理":它将问题分解为状态估计(卡尔曼滤波)和确定性线性二次调节器(LQR)设计两个独立部分。本题将详细讲解LQG问题的数学模型、分离原理的推导,以及卡尔曼滤波与LQR的协同求解过程。
解题过程
-
问题定义
- 系统动态(状态空间模型):
\(x_{t+1} = A x_t + B u_t + w_t\),其中 \(w_t \sim \mathcal{N}(0, Q)\) 为过程噪声。 - 观测模型:
\(y_t = C x_t + v_t\),其中 \(v_t \sim \mathcal{N}(0, R)\) 为观测噪声,且 \(w_t\)、\(v_t\) 相互独立。 - 代价函数(最小化目标):
\(J = \mathbb{E} \left[ \sum_{t=0}^{T-1} (x_t^\top W_t x_t + u_t^\top U_t u_t) + x_T^\top W_T x_T \right]\),其中 \(W_t \succeq 0\)、\(U_t \succ 0\) 为权重矩阵。
- 系统动态(状态空间模型):
-
分离原理的核心思想
- 若状态 \(x_t\) 完全可测,问题退化为确定性LQR,通过Riccati方程求解反馈增益 \(K_t\),最优控制为 \(u_t = -K_t x_t\)。
- 在状态不可测时,分离原理表明:最优控制律可分解为:
步骤1:用卡尔曼滤波器估计状态 \(\hat{x}_t = \mathbb{E}[x_t \mid y_0, \dots, y_{t-1}]\)。
步骤2:将估计值 \(\hat{x}_t\) 代入LQR反馈律,即 \(u_t = -K_t \hat{x}_t\)。 - 关键点:状态估计和控制器设计可独立进行,互不影响。
-
卡尔曼滤波器的设计
- 预测步骤(先验估计):
\(\hat{x}_{t \mid t-1} = A \hat{x}_{t-1 \mid t-1} + B u_{t-1}\)
误差协方差: \(P_{t \mid t-1} = A P_{t-1 \mid t-1} A^\top + Q\) - 更新步骤(后验估计):
卡尔曼增益: \(K_t = P_{t \mid t-1} C^\top (C P_{t \mid t-1} C^\top + R)^{-1}\)
状态更新: \(\hat{x}_{t \mid t} = \hat{x}_{t \mid t-1} + K_t (y_t - C \hat{x}_{t \mid t-1})\)
协方差更新: \(P_{t \mid t} = (I - K_t C) P_{t \mid t-1}\)
- 预测步骤(先验估计):
-
LQR控制器的设计
- 从终端时刻 \(T\) 反向迭代求解Riccati方程:
\(S_T = W_T\)
\(S_t = A^\top S_{t+1} A + W_t - A^\top S_{t+1} B (B^\top S_{t+1} B + U_t)^{-1} B^\top S_{t+1} A\) - 反馈增益矩阵:
\(K_t = (B^\top S_{t+1} B + U_t)^{-1} B^\top S_{t+1} A\)
- 从终端时刻 \(T\) 反向迭代求解Riccati方程:
-
LQG控制器的整合
- 将卡尔曼滤波器的输出 \(\hat{x}_t\) 作为LQR的输入,控制律为:
\(u_t = -K_t \hat{x}_t\) - 闭环系统性能由分离原理保证:估计误差 \(e_t = x_t - \hat{x}_t\) 与控制代价分离,总代价为LQR代价(基于 \(\hat{x}_t\) )加上估计误差的附加代价。
- 将卡尔曼滤波器的输出 \(\hat{x}_t\) 作为LQR的输入,控制律为:
-
扩展讨论
- 若系统参数(\(A, B, C\))或噪声统计量(\(Q, R\))未知,需结合自适应控制方法。
- LQG对模型不确定性敏感,鲁棒性需通过 \(H_\infty\) 控制等方法增强。