非线性规划中的逐步二次响应面方法(Sequential Quadratic Response Surface Method)基础题
题目描述
考虑非线性规划问题:
\[\min f(x) = (x_1 - 2)^4 + (x_1 - 2x_2)^2, \quad x \in \mathbb{R}^2, \]
无约束条件。要求使用逐步二次响应面方法(Sequential Quadratic Response Surface Method, SQRSM)求解该问题,初始点选为 \(x^{(0)} = (0, 3)^T\),初始试验点围绕当前点生成,逐步构建局部二次响应面模型,并通过优化该模型更新迭代点。
解题过程
1. 方法原理概述
逐步二次响应面方法是一种基于代理模型的优化算法,适用于目标函数计算成本高或导数难以获取的场景。其核心步骤包括:
- 试验点设计:在当前迭代点周围生成一组试验点(如拉丁超立方或星形设计)。
- 响应面构建:用试验点的函数值拟合一个二次回归模型(代理模型)。
- 模型优化:对代理模型进行优化,得到候选点。
- 收敛判断:若候选点满足收敛条件则停止,否则更新试验区域继续迭代。
2. 初始设置
- 初始点 \(x^{(0)} = (0, 3)^T\),函数值 \(f(x^{(0)}) = (0-2)^4 + (0 - 2 \cdot 3)^2 = 16 + 36 = 52\)。
- 定义试验区域半径 \(\delta = 0.5\)(初始步长),生成5个试验点(最小二乘拟合需至少6个点,但可简化为例演示):
- \(x^{(0)}\)(中心点)
- \(x^{(0)} + (\delta, 0) = (0.5, 3)\)
- \(x^{(0)} + (-\delta, 0) = (-0.5, 3)\)
- \(x^{(0)} + (0, \delta) = (0, 3.5)\)
- \(x^{(0)} + (0, -\delta) = (0, 2.5)\)
3. 第一次迭代:构建响应面
计算试验点的函数值:
- \(f(0.5, 3) = (0.5-2)^4 + (0.5 - 6)^2 = 5.0625 + 30.25 = 35.3125\)
- \(f(-0.5, 3) = (-0.5-2)^4 + (-0.5 - 6)^2 = 39.0625 + 42.25 = 81.3125\)
- \(f(0, 3.5) = (0-2)^4 + (0 - 7)^2 = 16 + 49 = 65\)
- \(f(0, 2.5) = 16 + (0 - 5)^2 = 16 + 25 = 41\)
拟合二次模型 \(\hat{f}(x) = c + b^T x + \frac{1}{2} x^T A x\)。通过最小二乘法解超定方程组(5个点对应10个参数,需简化):
假设对称性且忽略交叉项(简化演示),拟合形式为:
\[\hat{f}(x) = c + b_1 x_1 + b_2 x_2 + a_{11} x_1^2 + a_{22} x_2^2. \]
代入试验点数据求解线性方程组,得到近似模型(具体数值略,实践中需正规计算)。
4. 第一次迭代:优化代理模型
对二次模型 \(\hat{f}(x)\) 求梯度并令为零:
\[\nabla \hat{f} = \begin{pmatrix} b_1 + 2a_{11} x_1 \\ b_2 + 2a_{22} x_2 \end{pmatrix} = 0 \implies x^* = \left( -\frac{b_1}{2a_{11}}, -\frac{b_2}{2a_{22}} \right). \]
若 \(a_{11}, a_{22} > 0\),则 \(x^*\) 为模型极小点。假设解得 \(x^* = (1.2, 1.0)\)。
5. 收敛判断与更新
计算真实函数值 \(f(x^*) = (1.2-2)^4 + (1.2 - 2)^2 = 0.4096 + 0.64 = 1.0496\),较初始点显著下降。
若下降量 \(|f(x^*) - f(x^{(0)})| > \varepsilon\)(如 \(\varepsilon = 0.1\)),则接受 \(x^*\) 为新迭代点,并收缩试验半径 \(\delta \leftarrow 0.8 \delta\)。
6. 后续迭代
重复步骤2-5,直至连续两次迭代函数值变化小于阈值。最终逼近理论最优解 \(x^* = (2, 1)\)(通过解析法验证:梯度 \(\nabla f = (4(x_1-2)^3 + 2(x_1-2x_2), -4(x_1-2x_2))\) 在 \((2,1)\) 处为零)。
关键点说明
- 响应面模型需足够多试验点以避免过拟合。
- 若代理模型预测误差大,需增加试验点或缩小区域。
- 实际应用中常结合信赖域策略控制步长。