多元微积分笔记(五)极值、临界点与函数凹凸性

本文最后更新于:2022年3月30日 下午

第五讲 极值、临界点与函数凹凸性

1.临界点及其分类,二阶微分,Hesse 矩阵

\(\mathscr{C}^{2}\) 函数 \(f\), 其二阶微分 \[ \mathrm{d}^{2} f\left(\mathbf{x}_{0}\right)(\mathbf{v}, \mathbf{w})=\sum_{1 \leq i, j \leq m} \partial_{i, j}^{2} f\left(\mathbf{x}_{0}\right) v^{i} w^{j}=\mathbf{v}^{T} H_{f}\left(\mathbf{x}_{0}\right) \mathbf{w} \] 是一个对称双线性型, 矩阵 \(H_{f}\left(\mathbf{x}_{0}\right)=\left(\partial_{i, j}^{2} f\left(\mathbf{x}_{0}\right)\right)_{m \times m}\) 是一个对称 的 \(m\) 阶方阵,称为 \(f\)\(\mathbf{x}_{0}\) 处的 Hesse 矩阵。 于是二阶 Taylor 展开可以写成 \[ f(\mathbf{x})=f\left(\mathbf{x}_{0}\right)+d f\left(\mathbf{x}_{0}\right)\left(\mathbf{x}-\mathbf{x}_{0}\right)+\frac{1}{2}\left(\mathbf{x}-\mathbf{x}_{0}\right)^{T} H_{f}\left(\mathbf{x}_{0}+\xi\left(\mathbf{x}-\mathbf{x}_{0}\right)\right)\left(\mathbf{x}-\mathbf{x}_{0}\right) . \]\(\mathbf{x}_{0}\)\(f\) 的一个临界点, 如果 \(\mathrm{d} f\left(\mathbf{x}_{0}\right)=0\) 。 称 \(\mathscr{C}^{2}\) 函数 \(f\) 的临界点 \(\mathrm{x}_{0}\)非退化的, 如果 Hesse 矩阵 \(H_{f}\left(\mathrm{x}_{0}\right)\) 可逆。 称 \(f\) 的临界点 \(x_{0}\)鞍形的, 如果 \(x_{0}\) 是非退化临界点, 并且 Hesse 矩阵 \(H_{f}\left(\mathbf{x}_{0}\right)\) 既有正特征值又有负特征值。

定理:设 \(\mathrm{x}_{0}\)\(\mathscr{C}^{2}\) 函数 \(f\) 的一个非退化临界点。则 1. 若 Hesse 矩阵 \(H_{f}\left(\mathbf{x}_{0}\right)\) 正定, 则 \(\mathbf{x}_{0}\) 是一个极小值点; 2. 若 Hesse 矩阵 \(H_{f}\left(\mathbf{x}_{0}\right)\) 负定, 则 \(\mathbf{x}_{0}\) 是一个极大值点; 3. 若 Hesse 矩阵 \(H_{f}\left(\mathbf{x}_{0}\right)\) 既不是正定又不是负定, 则 \(\mathbf{x}_{0}\) 是鞍形临界点,鞍形临界点不是极值点。它在某些方向为极小,在另外一些方向为极大。

  1. \(H_{f}\left(\mathbf{x}_{0}\right)\) 正定。则 \(H_{f}\left(\mathbf{x}_{0}\right)\) 的所有顺序主子式都为正。由 \(f \in \mathscr{C}^{2}\) 以及行列式的连续性,在 \(\mathbf{x}_{0}\) 附近,\(H_{f}(\mathbf{x})\) 的所有顺序主子式也都是正的,所以 \(H_{f}(\mathbf{x})\) 正定的,从而由 Taylor 公式知 \(f(\mathbf{x})-f\left(\mathbf{x}_{0}\right)=\dfrac{1}{2}\left(\mathbf{x}-\mathbf{x}_{0}\right)^{T} H_{f}\left(\mathbf{x}_{0}+\xi\left(\mathbf{x}-\mathbf{x}_{0}\right)\right)\left(\mathbf{x}-\mathbf{x}_{0}\right)>0, \quad \forall \mathbf{x} \neq \mathbf{x}_{0}\) 所以 \(x_{0}\) 是严格极小值点。
  2. 类似可证当 \(H_{f}\left(x_{0}\right)\) 负定时,\(x_{0}\) 是严格极大值点。

关于极值点:其邻域内的点必须有定义且全部大于/小于该点函数值,也就是说极值点一定是内点。从这个意义上说,我们可以说可导函数的极值点必然是临界点。