非线性规划中的信赖域法基础题

字数 1985 2025-10-25 18:57:06

非线性规划中的信赖域法基础题

题目描述
考虑非线性约束优化问题：
最小化 \(f(x) = (x_1 - 1)^2 + (x_2 - 2.5)^2\)
满足约束 \(g_1(x) = x_1 - 2x_2 + 2 \geq 0\)，\(g_2(x) = -x_1 - 2x_2 + 6 \geq 0\)，\(g_3(x) = -x_1 + 2x_2 + 2 \geq 0\)，且 \(x_1, x_2 \geq 0\)。
要求使用信赖域法求解该问题，初始点选为 \(x^{(0)} = (2, 0)\)，初始信赖域半径 \(\Delta_0 = 0.5\)。

解题过程

1. 问题分析
目标函数 \(f(x)\) 是二次凸函数，约束为线性不等式，构成凸优化问题。信赖域法通过迭代求解子问题逼近最优解：每步在当前点 \(x^{(k)}\) 用二次模型近似目标函数，并在半径 \(\Delta_k\) 的球内求解该模型，根据实际改进与预测改进的比例调整信赖域半径。

2. 构建二次近似模型
在点 \(x^{(k)}\) 处，目标函数的二次近似为：

\[m_k(d) = f(x^{(k)}) + \nabla f(x^{(k)})^T d + \frac{1}{2} d^T B_k d, \]

其中 \(d\) 为步长，\(B_k\) 为Hessian矩阵或其近似。本题中 \(f(x)\) 是二次函数，Hessian矩阵恒定：

\[\nabla^2 f(x) = \begin{bmatrix} 2 & 0 \\ 0 & 2 \end{bmatrix}. \]

因此取 \(B_k = \nabla^2 f(x)\)。梯度为：

\[\nabla f(x) = [2(x_1 - 1),\ 2(x_2 - 2.5)]^T. \]

3. 子问题定义
第 \(k\) 步的子问题为：

\[\min_d m_k(d) = f(x^{(k)}) + \nabla f(x^{(k)})^T d + \frac{1}{2} d^T B_k d, \]

满足 \(\|d\| \leq \Delta_k\) 和线性约束（需在 \(x^{(k)} + d\) 处满足原问题约束）。
由于约束是线性的，子问题仍是二次规划，但信赖域约束 \(\|d\| \leq \Delta_k\) 为球形边界，需用数值方法（如折线法或Dogleg法）求解。

4. 迭代步骤（以第一步为例）

初始点：\(x^{(0)} = (2, 0)\)，\(\Delta_0 = 0.5\)。
计算梯度：

\[ \nabla f(x^{(0)}) = [2(2-1),\ 2(0-2.5)]^T = [2,\ -5]^T. \]

子问题：

\[ m_0(d) = f(2,0) + [2,\ -5] d + \frac{1}{2} d^T \begin{bmatrix} 2 & 0 \\ 0 & 2 \end{bmatrix} d. \]

其中 \(f(2,0) = (2-1)^2 + (0-2.5)^2 = 7.25\)。
约束需满足 \(x^{(0)} + d\) 在原问题可行域内，且 \(\|d\| \leq 0.5\)。

求解子问题：由于信赖域半径小，可近似为线性搜索。忽略约束时，最优步长为 \(d^* = -B_k^{-1} \nabla f(x^{(0)}) = [-1,\ 2.5]^T\)，但范数超界，需投影到信赖域内。实际需用数值工具求解，假设解得 \(d^{(0)} = (-0.34,\ 0.34)\)（示例值）。
新点：\(x^{(1)} = x^{(0)} + d^{(0)} = (1.66,\ 0.34)\)。
评估改进比例：

\[ \rho_k = \frac{f(x^{(k)}) - f(x^{(k)}+d)}{m_k(0) - m_k(d)}. \]

若 \(\rho_k\) 接近1，接受步长并扩大 \(\Delta_{k+1}\)；若过小则缩小信赖域。

5. 收敛判断
重复以上步骤，直到梯度在约束边界满足KKT条件（例如梯度与约束梯度线性相关，且步长变化小于阈值）。本题最优解在 \(x^* = (1.4,\ 1.7)\) 处（通过解析验证），\(f(x^*) = 0.8\)。

关键点总结

信赖域法通过控制步长范围保证模型可靠性；
子问题需同时处理信赖域边界和线性约束；
半径调整策略基于实际改进与预测改进的比例。

非线性规划中的信赖域法基础题题目描述考虑非线性约束优化问题：最小化 \( f(x) = (x_ 1 - 1)^2 + (x_ 2 - 2.5)^2 \) 满足约束 \( g_ 1(x) = x_ 1 - 2x_ 2 + 2 \geq 0 \)，\( g_ 2(x) = -x_ 1 - 2x_ 2 + 6 \geq 0 \)，\( g_ 3(x) = -x_ 1 + 2x_ 2 + 2 \geq 0 \)，且 \( x_ 1, x_ 2 \geq 0 \)。要求使用信赖域法求解该问题，初始点选为 \( x^{(0)} = (2, 0) \)，初始信赖域半径 \( \Delta_ 0 = 0.5 \)。解题过程 1. 问题分析目标函数 \( f(x) \) 是二次凸函数，约束为线性不等式，构成凸优化问题。信赖域法通过迭代求解子问题逼近最优解：每步在当前点 \( x^{(k)} \) 用二次模型近似目标函数，并在半径 \( \Delta_ k \) 的球内求解该模型，根据实际改进与预测改进的比例调整信赖域半径。 2. 构建二次近似模型在点 \( x^{(k)} \) 处，目标函数的二次近似为： \[ m_ k(d) = f(x^{(k)}) + \nabla f(x^{(k)})^T d + \frac{1}{2} d^T B_ k d, \] 其中 \( d \) 为步长，\( B_ k \) 为Hessian矩阵或其近似。本题中 \( f(x) \) 是二次函数，Hessian矩阵恒定： \[ \nabla^2 f(x) = \begin{bmatrix} 2 & 0 \\ 0 & 2 \end{bmatrix}. \] 因此取 \( B_ k = \nabla^2 f(x) \)。梯度为： \[ \nabla f(x) = [ 2(x_ 1 - 1),\ 2(x_ 2 - 2.5) ]^T. \] 3. 子问题定义第 \( k \) 步的子问题为： \[ \min_ d m_ k(d) = f(x^{(k)}) + \nabla f(x^{(k)})^T d + \frac{1}{2} d^T B_ k d, \] 满足 \( \|d\| \leq \Delta_ k \) 和线性约束（需在 \( x^{(k)} + d \) 处满足原问题约束）。由于约束是线性的，子问题仍是二次规划，但信赖域约束 \( \|d\| \leq \Delta_ k \) 为球形边界，需用数值方法（如折线法或Dogleg法）求解。 4. 迭代步骤（以第一步为例）初始点：\( x^{(0)} = (2, 0) \)，\( \Delta_ 0 = 0.5 \)。计算梯度： \[ \nabla f(x^{(0)}) = [ 2(2-1),\ 2(0-2.5)]^T = [ 2,\ -5 ]^T. \] 子问题： \[ m_ 0(d) = f(2,0) + [ 2,\ -5 ] d + \frac{1}{2} d^T \begin{bmatrix} 2 & 0 \\ 0 & 2 \end{bmatrix} d. \] 其中 \( f(2,0) = (2-1)^2 + (0-2.5)^2 = 7.25 \)。约束需满足 \( x^{(0)} + d \) 在原问题可行域内，且 \( \|d\| \leq 0.5 \)。求解子问题：由于信赖域半径小，可近似为线性搜索。忽略约束时，最优步长为 \( d^* = -B_ k^{-1} \nabla f(x^{(0)}) = [ -1,\ 2.5 ]^T \)，但范数超界，需投影到信赖域内。实际需用数值工具求解，假设解得 \( d^{(0)} = (-0.34,\ 0.34) \)（示例值）。新点：\( x^{(1)} = x^{(0)} + d^{(0)} = (1.66,\ 0.34) \)。评估改进比例： \[ \rho_ k = \frac{f(x^{(k)}) - f(x^{(k)}+d)}{m_ k(0) - m_ k(d)}. \] 若 \( \rho_ k \) 接近1，接受步长并扩大 \( \Delta_ {k+1} \)；若过小则缩小信赖域。 5. 收敛判断重复以上步骤，直到梯度在约束边界满足KKT条件（例如梯度与约束梯度线性相关，且步长变化小于阈值）。本题最优解在 \( x^* = (1.4,\ 1.7) \) 处（通过解析验证），\( f(x^* ) = 0.8 \)。关键点总结信赖域法通过控制步长范围保证模型可靠性；子问题需同时处理信赖域边界和线性约束；半径调整策略基于实际改进与预测改进的比例。