非线性规划中的序列无约束极小化方法(SUMT)基础题
题目描述
考虑一个简单的非线性规划问题:
最小化目标函数 \(f(x) = x^2\),
满足约束条件 \(g(x) = x - 2 \geq 0\)。
要求使用序列无约束极小化方法(SUMT)求解该问题,并解释其基本原理和步骤。
解题过程循序渐进讲解
1. SUMT方法基本思想
序列无约束极小化方法(SUMT)的核心思想是将一个带约束的非线性规划问题转化为一系列无约束优化问题来求解。通过引入罚函数或障碍函数,将约束条件整合到目标函数中,并通过迭代调整参数,使无约束问题的解逐渐逼近原约束问题的解。本题使用罚函数法(属于SUMT的一种)来处理不等式约束。
2. 构造罚函数
对于不等式约束 \(g(x) \geq 0\),罚函数通常定义为:
\[ P(x) = \left[\min(0, g(x))\right]^2 \]
但注意:本题约束为 \(g(x) = x - 2 \geq 0\),即要求 \(x \geq 2\)。若 \(x < 2\),则 \(g(x) < 0\),此时罚函数 \(P(x) = (x - 2)^2\);若 \(x \geq 2\),则 \(P(x) = 0\)。
整合罚函数后,新的无约束目标函数为:
\[ F(x, \mu) = f(x) + \mu P(x) = x^2 + \mu \cdot \left[\min(0, x - 2)\right]^2 \]
其中 \(\mu > 0\) 是罚因子。当 \(x \geq 2\) 时,\(F(x, \mu) = x^2\);当 \(x < 2\) 时,\(F(x, \mu) = x^2 + \mu (x - 2)^2\)。
3. 求解无约束问题(以 \(\mu = 1\) 为例)
- 情况1:若 \(x \geq 2\),则 \(F(x, 1) = x^2\)。最小值在 \(x = 2\) 处,值为 \(4\)。
- 情况2:若 \(x < 2\),则 \(F(x, 1) = x^2 + (x - 2)^2 = 2x^2 - 4x + 4\)。
求导:\(F'(x, 1) = 4x - 4\),令导数为零得 \(x = 1\)。
检查 \(x = 1 < 2\),有效。此时函数值 \(F(1, 1) = 1 + 1 = 2\)。
比较两种情况,全局最小值在 \(x = 1\)(但注意:\(x = 1\) 不满足原约束 \(x \geq 2\),这是因为罚因子 \(\mu = 1\) 太小,惩罚不足)。
4. 增大罚因子(例如 \(\mu = 10\))
- 当 \(x < 2\) 时,\(F(x, 10) = x^2 + 10(x - 2)^2 = 11x^2 - 40x + 40\)。
求导:\(F'(x, 10) = 22x - 40\),解得 \(x = \frac{40}{22} \approx 1.818\)。
函数值 \(F(1.818, 10) \approx 3.306\)。 - 当 \(x \geq 2\) 时,\(F(x, 10) = x^2\),最小值在 \(x = 2\) 处,值为 \(4\)。
此时无约束问题的最小值在 \(x \approx 1.818\)(仍不满足约束,但比 \(\mu = 1\) 时更接近可行域)。
5. 序列迭代与收敛
通过不断增大罚因子 \(\mu \to +\infty\),无约束问题的最优解会逐渐逼近原问题的最优解。
- 一般形式:对 \(x < 2\),\(F(x, \mu) = x^2 + \mu (x - 2)^2\)。
求导得 \(x(\mu) = \frac{2\mu}{1 + \mu}\)。 - 当 \(\mu \to +\infty\) 时,\(x(\mu) \to 2\),且 \(f(x) \to 4\)。
最终得到原问题的最优解为 \(x^* = 2\),\(f(x^*) = 4\)。
6. 关键点总结
- SUMT通过罚函数将约束问题转化为无约束问题序列。
- 罚因子 \(\mu\) 需逐渐增大以确保收敛。
- 最终解在约束边界上取得(本例中约束是积极的)。