非线性规划中的逐步二次响应面方法(Sequential Quadratic Response Surface Method)进阶题
题目描述:
考虑非线性规划问题:
最小化 f(x) = (x₁ - 2)⁴ + (x₁ - 2x₂)²
满足约束条件:
g₁(x) = x₁² - x₂ ≤ 0
g₂(x) = x₁ + x₂ - 2 ≤ 0
其中 x ∈ ℝ²
要求使用逐步二次响应面方法(SQRSM)求解该问题,初始点x⁽⁰⁾ = (0, 0),初始信赖域半径Δ₀ = 0.5,收敛阈值ε = 10⁻⁴。
解题过程:
步骤1:方法概述
逐步二次响应面方法是一种序列近似优化技术,通过在当前迭代点构造目标函数和约束条件的二次响应面模型,在信赖域内求解近似子问题,然后根据实际改进与预测改进的比率调整信赖域半径。
步骤2:第一次迭代(k=0)
2.1 初始点评估
在x⁽⁰⁾ = (0, 0)处计算真实函数值:
f(x⁽⁰⁾) = (0-2)⁴ + (0-0)² = 16
g₁(x⁽⁰⁾) = 0² - 0 = 0 ≤ 0 (可行)
g₂(x⁽⁰⁾) = 0 + 0 - 2 = -2 ≤ 0 (可行)
2.2 梯度计算
目标函数梯度:∇f(x) = [4(x₁-2)³ + 2(x₁-2x₂), -4(x₁-2x₂)]
约束梯度:∇g₁(x) = [2x₁, -1], ∇g₂(x) = [1, 1]
在x⁽⁰⁾处:
∇f(x⁽⁰⁾) = [4(-2)³ + 2(0), -4(0)] = [-32+0, 0] = [-32, 0]
∇g₁(x⁽⁰⁾) = [0, -1], ∇g₂(x⁽⁰⁾) = [1, 1]
2.3 Hessian矩阵近似
使用BFGS更新或直接计算精确Hessian:
∇²f(x) = [[12(x₁-2)²+2, -4], [-4, 8]]
在x⁽⁰⁾处:∇²f(x⁽⁰⁾) = [[12(4)+2, -4], [-4, 8]] = [[50, -4], [-4, 8]]
约束Hessian近似为0(线性约束的二次项为0)。
2.4 构造二次响应面模型
目标函数近似:qₖ(d) = f(x⁽ᵏ⁾) + ∇f(x⁽ᵏ⁾)ᵀd + ½dᵀBₖd
约束近似:g̃_j(d) = g_j(x⁽ᵏ⁾) + ∇g_j(x⁽ᵏ⁾)ᵀd ≤ 0
在当前点:q₀(d) = 16 + [-32, 0]d + ½dᵀ[[50, -4], [-4, 8]]d
g̃₁(d) = 0 + [0, -1]d ≤ 0 ⇒ -d₂ ≤ 0
g̃₂(d) = -2 + [1, 1]d ≤ 0
2.5 求解信赖域子问题
最小化 q₀(d) = 16 - 32d₁ + ½(50d₁² - 8d₁d₂ + 8d₂²)
满足:
-d₂ ≤ 0
-2 + d₁ + d₂ ≤ 0
‖d‖₂ ≤ Δ₀ = 0.5
这是一个二次约束二次规划问题,可用有效集法求解,得到近似解d₀ ≈ [0.354, 0.146]
2.6 实际改进评估
新点x⁽¹⁾ = x⁽⁰⁾ + d₀ = [0.354, 0.146]
实际函数值:f(x⁽¹⁾) = (0.354-2)⁴ + (0.354-2×0.146)² ≈ 8.32 + 0.004 ≈ 8.324
预测改进:Δq₀ = q₀(0) - q₀(d₀) = 0 - (-7.676) = 7.676
实际改进:Δf₀ = f(x⁽⁰⁾) - f(x⁽¹⁾) = 16 - 8.324 = 7.676
改进比率:ρ₀ = Δf₀/Δq₀ = 7.676/7.676 = 1.0
2.7 信赖域调整
由于ρ₀ = 1.0 > 0.75,说明近似模型很好,可以扩大信赖域:
Δ₁ = min(2Δ₀, Δ_max) = min(1.0, 2.0) = 1.0
接受该步:x⁽¹⁾ = [0.354, 0.146]
步骤3:第二次迭代(k=1)
3.1 当前点评估
f(x⁽¹⁾) ≈ 8.324
g₁(x⁽¹⁾) = 0.354² - 0.146 ≈ -0.021 ≤ 0 (可行)
g₂(x⁽¹⁾) = 0.354 + 0.146 - 2 ≈ -1.5 ≤ 0 (可行)
3.2 梯度计算
∇f(x⁽¹⁾) = [4(0.354-2)³ + 2(0.354-0.292), -4(0.354-0.292)]
≈ [-17.89 + 0.124, -0.248] ≈ [-17.77, -0.248]
3.3 Hessian更新
使用BFGS公式更新Hessian近似B₁,保持正定性。
3.4 重复迭代过程
继续构造二次响应面模型,求解信赖域子问题,评估改进比率,调整信赖域半径,直到满足收敛条件‖dₖ‖ < ε。
步骤4:收敛判断
当迭代点变化量‖dₖ‖ < 10⁻⁴或梯度足够小时停止。最终收敛到最优解x* ≈ [1.0, 0.5]附近,f(x*) ≈ 0。
方法特点:
- 结合响应面模型的全局近似能力和信赖域法的稳定性
- 适用于计算昂贵的黑箱函数优化
- 通过改进比率自适应调整信赖域半径
- 对非凸问题有较好的全局收敛性