线性二次高斯(LQG)控制问题的分离原理与最优控制求解过程
字数 1862 2025-12-01 10:54:59

线性二次高斯(LQG)控制问题的分离原理与最优控制求解过程

题目描述
线性二次高斯(LQG)控制是随机控制理论中的经典问题,旨在为线性动态系统(受高斯噪声干扰)设计最优控制器,以最小化二次型代价函数。系统模型包含过程噪声和观测噪声,且状态无法直接测量,需通过观测信号估计。LQG控制的核心是"分离原理":它将问题分解为状态估计(卡尔曼滤波)和确定性线性二次调节器(LQR)设计两个独立部分。本题将详细讲解LQG问题的数学模型、分离原理的推导,以及卡尔曼滤波与LQR的协同求解过程。

解题过程

  1. 问题定义

    • 系统动态(状态空间模型):
      \(x_{t+1} = A x_t + B u_t + w_t\),其中 \(w_t \sim \mathcal{N}(0, Q)\) 为过程噪声。
    • 观测模型:
      \(y_t = C x_t + v_t\),其中 \(v_t \sim \mathcal{N}(0, R)\) 为观测噪声,且 \(w_t\)\(v_t\) 相互独立。
    • 代价函数(最小化目标):
      \(J = \mathbb{E} \left[ \sum_{t=0}^{T-1} (x_t^\top W_t x_t + u_t^\top U_t u_t) + x_T^\top W_T x_T \right]\),其中 \(W_t \succeq 0\)\(U_t \succ 0\) 为权重矩阵。
  2. 分离原理的核心思想

    • 若状态 \(x_t\) 完全可测,问题退化为确定性LQR,通过Riccati方程求解反馈增益 \(K_t\),最优控制为 \(u_t = -K_t x_t\)
    • 在状态不可测时,分离原理表明:最优控制律可分解为:
      步骤1:用卡尔曼滤波器估计状态 \(\hat{x}_t = \mathbb{E}[x_t \mid y_0, \dots, y_{t-1}]\)
      步骤2:将估计值 \(\hat{x}_t\) 代入LQR反馈律,即 \(u_t = -K_t \hat{x}_t\)
    • 关键点:状态估计和控制器设计可独立进行,互不影响。
  3. 卡尔曼滤波器的设计

    • 预测步骤(先验估计):
      \(\hat{x}_{t \mid t-1} = A \hat{x}_{t-1 \mid t-1} + B u_{t-1}\)
      误差协方差: \(P_{t \mid t-1} = A P_{t-1 \mid t-1} A^\top + Q\)
    • 更新步骤(后验估计):
      卡尔曼增益: \(K_t = P_{t \mid t-1} C^\top (C P_{t \mid t-1} C^\top + R)^{-1}\)
      状态更新: \(\hat{x}_{t \mid t} = \hat{x}_{t \mid t-1} + K_t (y_t - C \hat{x}_{t \mid t-1})\)
      协方差更新: \(P_{t \mid t} = (I - K_t C) P_{t \mid t-1}\)
  4. LQR控制器的设计

    • 从终端时刻 \(T\) 反向迭代求解Riccati方程:
      \(S_T = W_T\)
      \(S_t = A^\top S_{t+1} A + W_t - A^\top S_{t+1} B (B^\top S_{t+1} B + U_t)^{-1} B^\top S_{t+1} A\)
    • 反馈增益矩阵:
      \(K_t = (B^\top S_{t+1} B + U_t)^{-1} B^\top S_{t+1} A\)
  5. LQG控制器的整合

    • 将卡尔曼滤波器的输出 \(\hat{x}_t\) 作为LQR的输入,控制律为:
      \(u_t = -K_t \hat{x}_t\)
    • 闭环系统性能由分离原理保证:估计误差 \(e_t = x_t - \hat{x}_t\) 与控制代价分离,总代价为LQR代价(基于 \(\hat{x}_t\) )加上估计误差的附加代价。
  6. 扩展讨论

    • 若系统参数(\(A, B, C\))或噪声统计量(\(Q, R\))未知,需结合自适应控制方法。
    • LQG对模型不确定性敏感,鲁棒性需通过 \(H_\infty\) 控制等方法增强。
线性二次高斯(LQG)控制问题的分离原理与最优控制求解过程 题目描述 线性二次高斯(LQG)控制是随机控制理论中的经典问题,旨在为线性动态系统(受高斯噪声干扰)设计最优控制器,以最小化二次型代价函数。系统模型包含过程噪声和观测噪声,且状态无法直接测量,需通过观测信号估计。LQG控制的核心是"分离原理":它将问题分解为状态估计(卡尔曼滤波)和确定性线性二次调节器(LQR)设计两个独立部分。本题将详细讲解LQG问题的数学模型、分离原理的推导,以及卡尔曼滤波与LQR的协同求解过程。 解题过程 问题定义 系统动态(状态空间模型): \( x_ {t+1} = A x_ t + B u_ t + w_ t \),其中 \( w_ t \sim \mathcal{N}(0, Q) \) 为过程噪声。 观测模型: \( y_ t = C x_ t + v_ t \),其中 \( v_ t \sim \mathcal{N}(0, R) \) 为观测噪声,且 \( w_ t \)、\( v_ t \) 相互独立。 代价函数(最小化目标): \( J = \mathbb{E} \left[ \sum_ {t=0}^{T-1} (x_ t^\top W_ t x_ t + u_ t^\top U_ t u_ t) + x_ T^\top W_ T x_ T \right] \),其中 \( W_ t \succeq 0 \)、\( U_ t \succ 0 \) 为权重矩阵。 分离原理的核心思想 若状态 \( x_ t \) 完全可测,问题退化为确定性LQR,通过Riccati方程求解反馈增益 \( K_ t \),最优控制为 \( u_ t = -K_ t x_ t \)。 在状态不可测时,分离原理表明:最优控制律可分解为: 步骤1 :用卡尔曼滤波器估计状态 \( \hat{x} t = \mathbb{E}[ x_ t \mid y_ 0, \dots, y {t-1} ] \)。 步骤2 :将估计值 \( \hat{x}_ t \) 代入LQR反馈律,即 \( u_ t = -K_ t \hat{x}_ t \)。 关键点:状态估计和控制器设计可独立进行,互不影响。 卡尔曼滤波器的设计 预测步骤(先验估计): \( \hat{x} {t \mid t-1} = A \hat{x} {t-1 \mid t-1} + B u_ {t-1} \) 误差协方差: \( P_ {t \mid t-1} = A P_ {t-1 \mid t-1} A^\top + Q \) 更新步骤(后验估计): 卡尔曼增益: \( K_ t = P_ {t \mid t-1} C^\top (C P_ {t \mid t-1} C^\top + R)^{-1} \) 状态更新: \( \hat{x} {t \mid t} = \hat{x} {t \mid t-1} + K_ t (y_ t - C \hat{x} {t \mid t-1}) \) 协方差更新: \( P {t \mid t} = (I - K_ t C) P_ {t \mid t-1} \) LQR控制器的设计 从终端时刻 \( T \) 反向迭代求解Riccati方程: \( S_ T = W_ T \) \( S_ t = A^\top S_ {t+1} A + W_ t - A^\top S_ {t+1} B (B^\top S_ {t+1} B + U_ t)^{-1} B^\top S_ {t+1} A \) 反馈增益矩阵: \( K_ t = (B^\top S_ {t+1} B + U_ t)^{-1} B^\top S_ {t+1} A \) LQG控制器的整合 将卡尔曼滤波器的输出 \( \hat{x}_ t \) 作为LQR的输入,控制律为: \( u_ t = -K_ t \hat{x}_ t \) 闭环系统性能由分离原理保证:估计误差 \( e_ t = x_ t - \hat{x}_ t \) 与控制代价分离,总代价为LQR代价(基于 \( \hat{x}_ t \) )加上估计误差的附加代价。 扩展讨论 若系统参数(\( A, B, C \))或噪声统计量(\( Q, R \))未知,需结合自适应控制方法。 LQG对模型不确定性敏感,鲁棒性需通过 \( H_ \infty \) 控制等方法增强。