多元微积分笔记(一)多元函数的连续性
本文最后更新于:2022年4月30日 下午
第一章 多元函数的连续性
连续性(局部可用常值逼近),可微性(局部可用线性逼近)
多元函数是依赖于多个自变量的函数。其中函数值(映射的像)可以是数、点、向量等等。
多元函数例子:
欧氏空间 \(\mathbb R^n\) 下三角形的三个顶点分别是 \(P_1,P_2,P_3\) ,则其面积可以表示为: \[ \begin{aligned} &S(P_1,P_2,P_3)=\frac{1}{2}||P_1-P_2||||P_1-P_3||\sin \theta\\&=\frac{1}{2}\sqrt{||P_1-P_2||^2||P_1-P_3||^2-<P_1-P_2,P_1-P_3>^2} \\&=\frac{1}{2} \sqrt{\sum_{i=1}^{n}\left(x_{2}^{i}-x_{1}^{i}\right)^{2} \sum_{j=1}^{n}\left(x_{3}^{j}-x_{1}^{j}\right)^{2}-\left(\sum_{i=1}^{n}\left(x_{2}^{i}-x_{1}^{i}\right)\left(x_{3}^{i}-x_{1}^{i}\right)\right)^{2} }\\&=\frac{1}{2} \sqrt{\sum_{i, j}\left[\left(x_{2}^{i}-x_{1}^{i}\right)^{2}\left(x_{3}^{j}-x_{1}^{j}\right)^{2}-\left(x_{2}^{i}-x_{1}^{i}\right)\left(x_{3}^{i}-x_{1}^{i}\right)\left(x_{2}^{j}-x_{1}^{j}\right)\left(x_{3}^{j}-x_{1}^{j}\right)\right]}\\&=\frac{1}{2} \sqrt{\sum_{1 \leq i<j \leq n}\left|\begin{array}{ll} x_{2}^{i}-x_{1}^{i} & x_{3}^{i}-x_{1}^{i} \\ x_{2}^{j}-x_{1}^{i} & x_{3}^{j}-x_{1}^{j} \end{array}\right|^{2} }\\&=\frac{1}{2}\sqrt{\sum\limits_{1\leq i\leq j\leq n}{\begin{vmatrix}1 &1&1\\x_1^i&x_2^i&x_3^i\\x_1^j&x_2^j&x_3^j\\\end{vmatrix} } } \end{aligned} \] 多元函数的定义
\(A \subseteq \mathbb{R}^{m}, \quad B\) 是集合。
映射:\(f: A \rightarrow B\) ,对每一个 \(\mathbf x \in A\) ,有唯一的 \(y \in B\) 与 \(\mathbf x\) 对应,记为 \(y=f(\mathbf{x})\)。
函数:映射 \(f: A \rightarrow \mathbb{R}\) 。
表示函数的方法:图像(直观);等值集(降维)
微积分的一个目标是通过局部线性近似来研究函数,所以需要的空间是线性空间。
1.空间
\(\mathbb{R}^{m}=\{(x^{1}, x^{2}, \ldots, x^{m})^{T} \mid x^{k} \in \mathbb{R}, k=1,2, \ldots, m\}\) 是一个m维线性空间(在这里,上标通常表示坐标的序号,用以代替 \(x,y,\cdots\) ,而下标则表示点的序号。)此空间中元素的加法和数乘是线性的。
2.距离
\(\mathbb R^m\) 上的距离:\(d:\mathbb R^m \times \mathbb R^m \to \mathbb R\) 。满足1)对称 \(d(\mathbf{x}, \mathbf{y})=d(\mathbf{y}, \mathbf{x})\) ,2)正定(大于等于 \(0\) ,等于 \(0\) 当且仅当两向量相同),3)三角形不等式 \(\forall \mathbf{x}, \mathbf{y}, \mathbf{z} \in \mathbb{R}^{m}, \quad d(\mathbf{x}, \mathbf{y}) \leq d(\mathbf{x}, \mathbf{z})+d(\mathbf{z}, \mathbf{y})\) 。称距离是平移不变的,如果 \(d(\mathbf{x}+\mathbf{z}, \mathbf{y}+\mathbf{z})=d(\mathbf{x}, \mathbf{y}), \quad \forall \mathbf{x}, \mathbf{y}, \mathbf{z} \in \mathbb{R}^{m}\) 。
3.范数
\(\mathbb R^m\) 上的范数:\(|| \cdot ||:\mathbb R^m\to\mathbb R\) 。1)正定(等于 \(0\) 当且仅当 \(\mathbf x=0\)),2)三角形不等式 \(\forall \mathbf{x}, \mathbf{y} \in \mathbb{R}^{m}, \quad\|\mathbf{x}+\mathbf{y}\| \leq\|\mathbf{x}\|+\|\mathbf{y}\|\) ,3)正齐次性 \(||\lambda \mathbf x||=|\lambda|||\mathbf x||\) 。
由范数可以得到一个平移不变的距离:\(d(\mathbf{x}, \mathbf{y})=\|\mathbf{x}-\mathbf{y}\|\) 。
验证一个函数是不是范数:先验证正定和正齐次性。重点是三角形不等式:在 \(\forall\mathbf y\) 下先验证 \(\mathbf{x=0}\) 时是否满足,再验证 \(\mathbf{x=e}_i\) 时是否满足。若都满足,由于正齐次性,三角形不等式必成立。
p-范数:\(\displaystyle\|\mathbf{x}\|_{p}=\left(\sum_{i=1}^{m}\left|x^{i}\right|^{p}\right)^{\frac{1}{p} }\) ( \(p\geq1\) ) 可验证是一个范数(注意,当 \(p<1\) 时不满足三角形不等式,不是范数!可画此时的“单位圆”来验证。)同时也定义了一个平移不变的距离:\(\displaystyle d_{p}(\mathbf{x}, \mathbf{y})=\left(\sum_{i=1}^{m}\left|x^{i}-y^{i}\right|^{p}\right)^{\frac{1}{p} }\) 。
其中 \(p=1\) (折线长)称为“曼哈顿距离”,而 \(p=2\) 就是欧几里得距离。
若是 \(p\to\infty\) ,则 \(d_{p}(\mathbf{x}, \mathbf{y}) \rightarrow \max\limits_{1 \leq i \leq m}\left|x^{i}-y^{i}\right|=: d_{\infty}(\mathbf{x}, \mathbf{y})\) ,以及\(\|\mathbf{x}\|_{\infty}=\max\limits_{1 \leq i \leq m}\left|x^{i}\right|\) (此范数称为无穷范数)
下图分别是二维和三维中不同 \(p\) 值下的“单位圆/球”
对 \(\mathbb R^m\) 的任意范数,任意 \(\mathbf x\in\mathbb R^m\) ,有 \[ \begin{aligned} ||\mathbf x||&=||x^1\mathbf e_1+\cdot\cdot\cdot+x^m\mathbf e_m||\\ &\leq|x^1|||\mathbf e_1||+\cdot\cdot\cdot+|x^m||\mathbf e_m||\\ &\leq m||\mathbf x||_{\infty} \end{aligned} \]
4.内积
\(\mathbb R^m\) 上的内积:\(\langle\cdot,\cdot\rangle:\mathbb R^m \times \mathbb R^m \to \mathbb R\) 。1)对称 \(\langle\mathbf{x}, \mathbf{y}\rangle=\langle\mathbf{y}, \mathbf{x}\rangle\) ,2)正定 \(\langle\mathbf{x}, \mathbf{x}\rangle \geq 0, \forall \mathbf{x} \in \mathbb{R}^{m} ; \langle\mathbf{x}, \mathbf{x}\rangle=0 \Leftrightarrow \mathbf x=0\) ,3)双线性。
由内积可以得到一个范数: \(||\mathbf x||=\sqrt{\langle\mathbf x,\mathbf x\rangle}\) 。
以及Cauchy-Schwarz不等式:\(||\mathbf x||\cdot||\mathbf y||\geq \, \langle\mathbf x,\mathbf y\rangle\) 等号成立当且仅当 \(\mathbf{x}\),\(\mathbf{y}\) 线性相关。
5.点列的极限
点列关于范数有界,收敛,的极限,是Cauchy点列的定义与数列几乎相同,只要把数列中的数(与数的差值)换成点(指向点的向量)的范数就行了。那么根据基于 \(\varepsilon-N\) 语言的这种极限定义,可以得到以下结论:
由 \(\|x\|\leq m\|x\|_{\infty}\) 知
A: \(\left\{\mathbf{x}_{n}\right\}_{n \geq 1}\) 在范数 \(\|\cdot\|_{\infty}\) 下有界/收敛(于 \(\mathbf{a}\) )/是 Cauchy 点列
\(\Rightarrow\) B: \(\left\{\mathbf{x}_{n}\right\}_{n \geq 1}\) 在任何范数 \(\|\cdot\|\) 下有界/收敛(于 \(\mathbf{a}\) )/是 Cauchy 点列。
由不等式 \(\left|x^{k}\right| \leq\|\mathbf{x}\|_{\infty} \leq\left|x^{1}\right|+\cdots+\left|x^{m}\right|\) 知
A: \(\left\{\mathbf{x}_{n}\right\}_{n \geq 1}\) 在范数 \(\|\cdot\|_{\infty}\) 下有界/收敛(于 \(\mathbf{a}\) )/是 Cauchy 点列
\(\Leftrightarrow\) C: 对每个 \(k\),\(\left\{x_{n}^{k}\right\}_{n \geq 1}\) 是有界/收敛 (于 \(a^{k}\) )/Cauchy 数列。
又因为可以证明引理:
对 \(\mathbb{R}^{m}\) 的任何范数 \(\|\cdot\|\), 存在常数 \(M>0\) 使得对任意 \(x \in \mathbb{R}^{m}\), \(\|\mathbf{x}\|_{\infty} \leq M\|\mathbf{x}\|\) 。
因此,A,B,C彼此是完全等价的。这意味着,无论使用哪一种范数做标准,点列的有界/收敛/是Cauchy列等性质不会改变。
6.连续函数
多元函数的连续函数定义与一元函数大致相同,使用了范数(同样与范数选取无关)。多元复合函数的连续性也与一元函数的情形一样。
例:范数是连续函数。
证:范数的三角形不等式。
例:线性映射是连续函数。
证:\(\displaystyle||L\mathbf x-L\mathbf x_0||=||L(\mathbf x-\mathbf x_0)||\leq||\mathbf x-\mathbf x_0||_{\infty}\sum\limits_{k=1}^n{L\mathbf e_k}\)
推论:数乘和内积(都是双线性映射,把两个自变量合并成一个向量后就是线性映射)都是连续函数。严格证明
类似可证任意k-重线性映射 \(f(\mathbf v_1,\cdot\cdot\cdot,\mathbf v_k)\) 都是连续的。因此,所以行列式函数都是连续函数。又因为(数和矩阵的)四则运算都是线性的,连续多元函数经过加减乘除后仍是连续函数。更复杂的情况需要具体分析。
7.有界闭集上的连续映射
若集合 \(E\in\mathbb R^m\) 对极限封闭,则称 \(E\) 是一个闭子集。
定理:若 \(E\in\mathbb R^m\) 是一个有界非空闭子集, \(f:E\to\mathbb R^p\) 连续。则 \(f(E)\) 是 \(\mathbb R^p\) 的一个有界非空闭子集。证明
推论:设 \(E \subseteq \mathbb{R}^{m}\) 是一个非空有界闭子集, \(f: E \rightarrow \mathbb{R}\) 连续。则 \(f\) 在 \(E\) 上有最大值和最小值。
应用:对称线性变换的特征值与特征向量
称线性映射 \(A\in\mathbb R^m\) 对称:\(\forall\mathbf x,\mathbf y,<A\mathbf x,\mathbf y>=<\mathbf x,A\mathbf y>\)
定理:对称线性映射 \(A\) 存在 \(m\) 个特征值。证明
应用:等周三角形
给定周长的三角形怎样面积最大?由椭圆和对称性仅能证明有最大面积的三角形的话等边三角形是面积最大的三角形,而是否存在这样一个最大值却没有说明。
事实上,以 \(P_{1}\) (不妨设 \(P_{1}=O\) ), \(P_{2}, P_{3}\) 为顶点的三角形面积 \[ S(P_{2}, P_{3})=\frac{1}{2} \sqrt{\operatorname{det}\left(\begin{array}{cc} \left\langle P_{2}, P_{2}\right\rangle & \left\langle P_{2}, P_{3}\right\rangle \\ \left\langle P_{2}, P_{3}\right\rangle & \left\langle P_{3}, P_{3}\right\rangle \end{array}\right)} \] 是一个连续函数。同时,设周长为定值 \(L\) ,则集合 \[ K=\left\{\left(P_{2}, P_{3}\right) \in \mathbb{R}^{2} \times \mathbb{R}^{2} \mid\left\|P_{2}\right\|+\left\|P_{3}\right\|+\left\|P_{2}-P_{3}\right\| \leq L\right\} \] 是一个有界闭集(这一点其实并不一目了然,且需要用到多元函数极限的知识),因此 \(S(P_2,P_3),(P_2,P_3)\in K\) 必定存在最大值!下证最大值必定在周长最大( \(=L\) )时取到:
设 \(S\left(P_{2}, P_{3}\right)\) 在 \(K\) 上取得最大值 \(S\left(P_{2}^{*}, P_{3}^{*}\right)\)。若\(\left\|P_{2}^{*}\right\|+\left\|P_{3}^{*}\right\|+\left\|P_{2}^{*}-P_{3}^{*}\right\|<L\), 则取\(\lambda=\frac{L}{\left\|P_{2}^{*}\right\|+\left\|P_{3}^{*}\right\|+\left\|P_{2}^{*}-P_{3}^{*}\right\|}, P_{k}^{'}=\lambda P_{k}^{*}\), 从而 \(\left(P_{2}^{'}, P_{3}^{'}\right) \in K\), \(S\left(P_{2}^{'}, P_{3}^{'}\right)=\lambda^{2} S\left(P_{2}^{*}, P_{3}^{*}\right)>S\left(P_{2}^{*}, P_{3}^{*}\right)\) 。这与 \(S\left(P_{2}^{*}, P_{3}^{*}\right)\) 是最大 值矛盾。因此 \(\left\|P_{2}^{*}\right\|+\left\|P_{3}^{*}\right\|+\left\|P_{2}^{*}-P_{3}^{*}\right\|=L_{\circ}\) 再根据之前的分析,这个最大值就是等边三角形。
8.压缩映射原理(验证连续性的重要工具!)
设 \(E \subseteq \mathbb{R}^{m}\) 是一个闭子集, 映射 \(f: E \rightarrow \mathbb{R}^{m}\) 满足 \(f(E) \subseteq E\) (封闭), 且存在常数 \(0<\lambda<1\) 使得 \[ \|f(\mathbf{x})-f(\mathbf{y})\| \leq \lambda\|\mathbf{x}-\mathbf{y}\|, \quad \forall \mathbf{x}, \mathbf{y} \in E . \] 则可以证明:
存在唯一的 \(\mathbf{x}^{*} \in E\) 使得: \(f\left(\mathbf{x}^{*}\right)=\mathbf{x}^{*}\), 且对任意 \(\mathbf{x} \in E\), 迭代点列 \(\mathbf{x}_{n}=f^{n}(\mathbf{x})\) 收敛到 \(\mathbf{x}^{*}\) (称为不动点), 事实上, 对任意正整数 \(n\), \[ \left\|f^{n}(\mathbf{x})-\mathbf{x}^{*}\right\| \leq \frac{\lambda^{n} }{1-\lambda}\|f(\mathbf{x})-\mathbf{x}\| . \]
9.矩阵的算子范数
此部分主要讨论求逆和解方程的操作是否连续和可微。
我们记 \(\mathcal{L}(m, n)\) 表示所有 \(n\) 行 \(m\) 列的实数矩阵的全体, 它可以看成是所有 \(\mathbb{R}^{m} \rightarrow \mathbb{R}^{n}\) 的线性映射组成的向量空间。显然 \(\mathcal{L}(m, n)\) 也可以看成 \(\mathbb{R}^{n \times m}\) ,因此具有范数。
由于每个线性映射 \(L\) 都是连续函数,约定 \(\|L \mathbf{x}\|\) 在有界闭集 \(\|\mathbf{x}\|=1\) 上取得最大值表示为 \[ \|L\|:=\max _{\|\mathbf{x}\|=1}\|L \mathbf{x}\| . \] 由线性代数的知识可以证明,这种运算满足正定性、正齐次性和三角形不等式,因此是范数(称为矩阵的谱范数,详见线性代数教材)并可以证明结论:对任意 \(L_{1} \in \mathcal{L}(m, n)\) 和 \(L_{2} \in \mathcal{L}(n, p)\), 都有 \(\left\|L_{2} L_{1}\right\| \leq\left\|L_{2}\right\|\left\|L_{1}\right\|\) 。
一个特殊情况(方阵):\(\mathcal{L}(m)=\mathcal{L}(m, m)\) 是一个向量空间, 它上面不仅有线性运算(加法、数乘),还有乘法:\(\forall L_{1}, L_{2} \in \mathcal{L}(m), L_{2} L_{1} \in \mathcal{L}(m)\) 。现设 \(\|\cdot\|\) 为此 \(\mathcal{L}(m)\) 上的算子范数。则可以证明对任意 \(B \in \mathcal{L}(m)\) ,当 \(\|B\|<1\) 时,\(I-B\) 是可逆矩阵,并且 \(\left\|(I-B)^{-1}-I\right\| \leq \frac{\|B\|}{1-\|B\|}\) 。
这些定理可以用于证明矩阵的求逆运算是连续的。事实上 \[ A+\Delta A=A\left(I+A^{-1} \Delta A\right) \] 所以当 \(\|\Delta A\|<\dfrac{1}{\left\|A^{-1}\right\|}\) 时, \(\left\|A^{-1} \Delta A\right\| \leq\left\|A^{-1}\right\|\|\Delta A\|<1\), 从而 \(I+A^{-1} \Delta A\) 可逆,进而 \(A+\Delta A\) 可逆。那么逆的变化与矩阵的变化是什么关系呢? \[ \begin{aligned} \left\|(A+\Delta A)^{-1}-A^{-1}\right\| &=\left\|\left(I+A^{-1} \Delta A\right)^{-1} A^{-1}-A^{-1}\right\| \\ & \leq\left\|A^{-1}\right\|\left\|\left(I+A^{-1} \Delta A\right)^{-1}-I\right\| \\ & \leq \frac{\left\|A^{-1}\right\|^{2}\|\Delta A\|}{1-\left\|A^{-1}\right\|\|\Delta A\|} \end{aligned} \] 可以看到,当 \(\|\Delta A\|<\dfrac{1}{\left\|A^{-1}\right\|}\) ,且 \((1-\left\|A^{-1}\right\|\|\Delta A\|)\) 不是特别小时,逆的变化与矩阵的变化同级。这表明求逆运算是一种连续映射。
10.误差扰动下线性方程的解
在求解线性方程组 \(A \mathbf{x}=\mathbf{b}\) 时,由于现实情况的影响,求解的实际上是\((A+\Delta A) \mathbf{x}=\mathbf{b}+\Delta \mathbf{b}\) 。解的变化是连续的吗?
由之前的理论铺垫我们知道,若 \(\|\Delta A\|<\dfrac{1}{\left\|A^{-1}\right\|}\) ,线性方程组仍有唯一解。且因求逆和线性变换都是连续的,解的变化也是连续的。严谨的证明
11.连通性与连续性
(区间的推广)称 \(E \subseteq \mathbb{R}^{m}\) 是一个道路连通集,如果对任意 \(\mathbf{x}, \mathbf{y} \in E\) ,存在连续映射 \(f:[0,1] \rightarrow \mathbb{R}^{m}\) 使得 \(f(0)=\mathbf{x}, f(1)=\mathbf{y}\) ,且对任意 \(0 \leq t \leq 1, f(t) \in E\) 。
定理:设 \(E \subseteq \mathbb{R}^{m}\) 是一个道路连通集, \(f: E \rightarrow \mathbb{R}^{p}\) 连续。则 \(f(E)\) 是 \(\mathbb{R}^{p}\) 中的一个道路连通集。
由上可推知,m阶可逆矩阵全体不是一个道路连通集(因为 \(\det\) 是连续函数,而可逆矩阵的 \(\det\) 不包含 \(0\) )而 $ ^{+}(m)={A (m) (A)>0} $ \(\mathcal{G L}^{-}(m)=\{A \in \mathcal{G L}(m) \mid \operatorname{det}(A)<0\}\) 都是道路连通的。
老师的思考题:在二维或更高维数的线性空间中, 是否存在一个全序, 使得它与空间中由范数给出的拓扑相容?(不大懂,大概是说只有一维数轴上的数才能比大小,也就是说答案是否定的)
证明区
证明1.5
假设结论不对。则存在点列 \(\left\{\mathbf{x}_{n}\right\}\) 使得 \(\left\|\mathbf{x}_{n}\right\|_{\infty}>n\left\|\mathbf{x}_{n}\right\|\) 。于是 \(\mathbf{x}_{n} \neq \mathbf{0}\), 取 \(\mathbf{y}_{n}=\frac{\mathbf{x}_{n} }{\left\|\mathbf{x}_{n}\right\|_{\infty} }\) ,则 \(\left\|\mathbf{y}_{n}\right\|_{\infty}=1,\left\|\mathbf{y}_{n}\right\|<\frac{1}{n}\) 。由 \(\left|y_{n}^{k}\right| \leq\left\|\mathbf{y}_{n}\right\|_{\infty}=1\) 知 \(\left\{y_{n}^{k}\right\}_{n \geq 1}\) 是有界数列,从而有收敛子列。
因此不妨设对每个 \(k \in\{1,2, \ldots, m\},\left\{y_{n}^{k}\right\}_{n \geq 1}\) 都收敛。 从而 \(\left\{\mathbf{y}_{n}\right\}\) 在范数 \(\|\cdot\|_{\infty}\) 下收敛。记 \(\mathbf{y}_{0}\) 为相应极限。则 \(\lim\limits_{n \rightarrow+\infty}\left\|\mathbf{y}_{n}-\mathbf{y}_{0}\right\|_{\infty}=0\) 。因此 \(\lim\limits_{n \rightarrow+\infty}\left\|\mathbf{y}_{n}-\mathbf{y}_{0}\right\|=0\) (因为 \(\|x\|\leq m\|x\|_{\infty}\) )。所以: \[ \left\|\mathbf{y}_{0}\right\| \leq\left\|\mathbf{y}_{n}-\mathbf{y}_{0}\right\|+\left\|\mathbf{y}_{n}\right\|<\left\|\mathbf{y}_{n}-\mathbf{y}_{0}\right\|+\frac{1}{n} \rightarrow 0, \quad n \rightarrow+\infty \] 于是 \(\mathbf{y}_{0}=\mathbf{0}\) 。而这导致如下矛盾 \[ 1=\left\|\mathbf{y}_{n}\right\|_{\infty}=\left\|\mathbf{y}_{n}-\mathbf{y}_{0}\right\|_{\infty} \rightarrow 0, \quad n \rightarrow+\infty \] 所以原结论成立。实话说,这是一个有点让人摸不着头脑的证明。返回
证明1.6
对双线性映射 \(B: \mathbb{R}^{m} \times \mathbb{R}^{n} \rightarrow \mathbb{R}^{p}\) ,设 \(\mathbf{e}_{1}, \ldots, \mathbf{e}_{m}\) 和 \(\mathbf{f}_{1}, \ldots, \mathbf{f}_{n}\) 分别是 \(\mathbb{R}^{m}\) 和 \(\mathbb{R}^{n}\) 的基底。记 \(M=\sum\limits_{i, j}\left\|B\left(\mathbf{e}_{i}, \mathbf{f}_{j}\right)\right\|\) 。则对 \(\mathbf{x}=\sum\limits_{i} x^{i} \mathbf{e}_{i}, \mathbf{y}=\sum\limits_{j} y^{j} \mathbf{f}_{i}\) \[ \begin{aligned} \|B(\mathbf{x}, \mathbf{y})\| &=\left\|\sum_{i, j} x^{i} y^{j} B\left(\mathbf{e}_{i}, \mathbf{f}_{j}\right)\right\| \leq \sum_{i, j} \mid x^{i}\mid\mid y^{j}\mid \|B\left(\mathbf{e}_{i}, \mathbf{f}_{j}\right) \| \\ & \leq\|\mathbf{x}\|_{\infty}\|\mathbf{y}\|_{\infty} \sum_{i, j}\left\|B\left(\mathbf{e}_{i}, \mathbf{f}_{j}\right)\right\|=M\|\mathbf{x}\|_{\infty}\|\mathbf{y}\|_{\infty} . \end{aligned} \] 从而 \[ \begin{aligned} &\left\|B(\mathbf{x}, \mathbf{y})-B\left(\mathbf{x}_{0}, \mathbf{y}_{0}\right)\right\| \\ \leq &\left\|B\left(\mathbf{x}-\mathbf{x}_{0}, \mathbf{y}-\mathbf{y}_{0}\right)\right\|+\left\|B\left(\mathbf{x}-\mathbf{x}_{0}, \mathbf{y}_{0}\right)\right\|+\left\|B\left(\mathbf{x}_{0}, \mathbf{y}-\mathbf{y}_{0}\right)\right\| \\ \leq & M\left(\left\|\mathbf{x}-\mathbf{x}_{0}\right\|_{\infty}\left\|\mathbf{y}-\mathbf{y}_{0}\right\|_{\infty}+\left\|\mathbf{x}-\mathbf{x}_{0}\right\|_{\infty}\left\|\mathbf{y}_{0}\right\|_{\infty}+\left\|\mathbf{x}_{0}\right\|_{\infty}\left\|\mathbf{y}-\mathbf{y}_{0}\right\|_{\infty}\right) \end{aligned} \] 对任意 \(\varepsilon>0\), 当 \[ \max \left\{\left\|\mathbf{x}-\mathbf{x}_{0}\right\|_{\infty},\left\|\mathbf{y}-\mathbf{y}_{0}\right\|_{\infty}\right\}<\frac{\varepsilon}{\varepsilon+3 M\left(1+\left\|\mathbf{y}_{0}\right\|_{\infty}+\left\|\mathbf{x}_{0}\right\|_{\infty}\right)} \] 时, \(\left\|B(\mathbf{x}, \mathbf{y})-B\left(\mathbf{x}_{0}, \mathbf{y}_{0}\right)\right\|<\varepsilon_{\circ}\) 所以 \(B\) 是连续映射。
这里的构造很奇妙。而且感觉放缩得有点多了。返回
证明1.7.1
1)证明有界
假设 \(f(E)\) 无界, 则对任意正整数 \(n\), 存在 \(\mathbf{x}_{n} \in E\) 使得 \(\left\|f\left(\mathbf{x}_{n}\right)\right\|>n\) 。 因为 \(E \subseteq \mathbb{R}^{m}\) 有界, 所以 \(\left\{\mathbf{x}_{n}\right\}\) 有界。从而 \(\left\{\mathbf{x}_{n}\right\}\) 有收敛子列 \(\left\{\mathbf{x}_{n_{k}}\right\}_{k \geq 1}, \mathbf{a}=\lim \limits_{k \rightarrow+\infty} \mathbf{x}_{n_{k}}\) 。因为 \(E\) 是闭集, 所以 \(\mathbf{a} \in E\), 从而 \(f\) 在 \(\mathbf{a}\) 连续。于是 \(k \leq n_k\leq\left\|f\left(\mathbf{x}_{n_{k}}\right)\right\| \leq\|f(\mathbf{a})\|+\left\|f\left(\mathbf{x}_{n_{k}}\right)-f(\mathbf{a})\right\| \rightarrow\|f(\mathbf{a})\|, k \rightarrow+\infty\) ,其中第一个 \(\leq\) 号是收敛子列的性质。然而这个式子矛盾,因此 \(f(E)\) 有界。
2)证明闭集
设 \(\mathbf{x}_{n} \in E\) 使得 \(\mathbf{b}=\lim\limits _{n \rightarrow+\infty} f\left(\mathbf{x}_{n}\right)\) 。我们希望证明 \(\mathbf{b} \in f(E)\) 。因为 \(E\) 是有界闭集, 所以 \(\left\{\mathbf{x}_{n}\right\}\) 有收敛子列 \(\lim\limits _{k \rightarrow+\infty} \mathbf{x}_{n_{k}}=\mathbf{a}\), 且 \(\mathbf{a} \in E\) 。所以 \(\|\mathbf{b}-f(\mathbf{a})\| \leq\left\|\mathbf{b}-f\left(\mathbf{x}_{n_{k}}\right)\right\|+\left\|f\left(\mathbf{x}_{n_{k}}\right)-f(\mathbf{a})\right\| \rightarrow 0, k \rightarrow+\infty .\) 因此 \(\mathbf{b}=f(\mathbf{a}) \in f(E)\) 。所以 \(f(E)\) 是闭集。
因此 \(f(E)\) 是有界闭集。返回
证明1.7.2
这里是要证明:如果 \(A\) 是 \(\mathbb{R}^{m}\) 上的对称线性变换, 则存在 \(m\) 个正交的单位向量 \(\mathbf{v}_{1}, \ldots, \mathbf{v}_{m}\) 以及 \(m\) 个实数 \(\lambda_{1}, \ldots, \lambda_{m}\) 使得对 \(k=1,2, \ldots, m\), \(A \mathbf{v}_{k}=\lambda_{k} \mathbf{v}_{k}\) 。
1)先找到一组:
记 \(K=\left\{\mathbf{v} \in \mathbb{R}^{m} \mid\|\mathbf{v}\|=1\right\}\) 。则 \(K\) 是有界闭集。函数 \(f(\mathbf{v})=\langle A \mathbf{v}, \mathbf{v}\rangle\) 是连续函数。于是 \(f\) 在 \(K\) 上取得最大值, \(f\left(\mathbf{v}_{1}\right)=\max\limits _{\mathbf{v} \in K} f(\mathbf{v})\) 。
下面证明这就是一个特征向量。做些小扰动:任取与 \(\mathbf{v}_{1}\) 正交的单位向量 \(\mathbf{u} \in K\), 则 \(\cos \theta \mathbf{v}_{1}+\sin \theta \mathbf{u} \in K\) 。记 \[ g(\theta)=f\left(\cos \theta \mathbf{v}_{1}+\sin \theta \mathbf{u}\right) . \] 则 \(g(\theta)\) 在 \(\theta=0\) 时取最大值, 而 \[ \begin{aligned} g(\theta) &=\left\langle A\left(\cos \theta \mathbf{v}_{1}+\sin \theta \mathbf{u}\right), \cos \theta \mathbf{v}_{1}+\sin \theta \mathbf{u}\right\rangle \\ &=\cos ^{2} \theta f\left(\mathbf{v}_{1}\right)+\sin ^{2} \theta f(\mathbf{u})+2 \sin \theta \cos \theta\left\langle A \mathbf{v}_{1}, \mathbf{u}\right\rangle \\ &=g(0)+2 \theta\left\langle A \mathbf{v}_{1}, \mathbf{u}\right\rangle+o(\theta), \quad \theta \rightarrow 0 \end{aligned} \] 因此 \(g^{\prime}(0)=2\left\langle A \mathbf{v}_{1}, \mathbf{u}\right\rangle=0\) 。所以 \(A \mathbf{v}_{1}\) 与 \(\mathbf{u}\) 正交。由 \(\mathbf{u}\) 的任意性知 \(A \mathbf{v}_{1}\) 与 \(\mathbf{v}_{1}\) 线性相关, 从而存在 \(\lambda_{1}\) 使得 \(A \mathbf{v}_{1}=\lambda_{1} \mathbf{v}_{1}\) 。
2)证明可以扩展到 \(m\) 组
假设已经找到特征向量 \(\mathbf{v}_{1}, \ldots, \mathbf{v}_{k}, k<m\) 。记它们张成的线性子空间为 \(W\) ,而 \(W^{\perp}\) 是 \(W\) 的正交补空间。则 \(W\) 是 \(A\) 不变子空间(即 \(\forall \mathbf{w}\in W,A\mathbf{w}\in W\) ),\(\operatorname{dim} W^{\perp} \geq 1\) 。任取 \(\mathbf{v} \in W^{\perp}\) 和 \(\mathbf{w} \in W\), \[ \langle A \mathbf{v}, \mathbf{w}\rangle=\langle\mathbf{v}, A \mathbf{w}\rangle=0, \] 所以 \(A \mathbf{v} \in W^{\perp}\) ,从而 \(W^{\perp}\) 是 \(A\) 不变子空间。在 \(K \cap W^{\perp}\) 上重复上述关于 \(A\) 的讨论,得到 \(\mathbf{v}_{k+1} \in K \cap W^{\perp}\) 使得 \(A \mathbf{v}_{k+1}=\lambda_{k+1} \mathbf{v}_{k+1}\) 。返回
证明1.7.3
当固定三角形的周长和一条边时,其第三个点将落在以其余两点为焦点的椭圆上。为使面积最大,此点应落在使三角形等腰的位置。由于对称性,对三边都有此要求,因此三角形应为等边才能面积最大。返回
证明1.8
存在性:观察迭代点列 \(\mathbf{x}_{n}=f^{n}(\mathbf{x})\) ,可以证明这是一个Cauchy列: \[ \begin{aligned} \left\|\mathbf{x}_{n+p}-\mathbf{x}_{n}\right\| & \leq \sum_{k=1}^{p}\left\|\mathbf{x}_{n+k}-\mathbf{x}_{n+k-1}\right\| \leq \sum_{k=1}^{p} \lambda^{n+k-1}\|f(\mathbf{x})-\mathbf{x}\| \\ & \leq \frac{\lambda^{n} }{1-\lambda}\|f(\mathbf{x})-\mathbf{x}\| \end{aligned}\tag{*} \] 因此存在 \(\mathbf{x}^{*} \in \mathbb{R}^{m}\) 使得 \(\lim\limits_{n \rightarrow+\infty} \mathbf{x}_{n}=\mathbf{x}^{*}\) 。因为 \(E\) 是闭集, 所以 \(\mathbf{x}^{*} \in E\) 。又 \[ \begin{aligned} \left\|f\left(\mathbf{x}^{*}\right)-\mathbf{x}^{*}\right\| & \leq\left\|f\left(\mathbf{x}^{*}\right)-f\left(\mathbf{x}_{n}\right)\right\|+\left\|f\left(\mathbf{x}_{n}\right)-\mathbf{x}^{*}\right\| \\ & \leq \lambda\left\|\mathbf{x}^{*}-\mathbf{x}_{n}\right\|+\left\|\mathbf{x}_{n+1}-\mathbf{x}^{*}\right\| \rightarrow 0, \quad n \rightarrow+\infty \end{aligned} \] 因此 \(f\left(\mathbf{x}^{*}\right)=\mathbf{x}^{*}\) ,即 \(\mathbf{x}^{*}\) 就是不动点。让 \((*)\) 式中 \(p\to+\infty\) 就可以得到 \[ \left\|\mathbf{x}^{*}-\mathbf{x}_{n}\right\| \leq \frac{\lambda^{n} }{1-\lambda}\|f(\mathbf{x})-\mathbf{x}\| \] 唯一性:若 \(f\left(\mathbf{x}^{'}\right)=\mathbf{x}^{'}\), 则 \[ \left\|\mathbf{x}^{'}-\mathbf{x}^{*}\right\|=\left\|f\left(\mathbf{x}^{'}\right)-f\left(\mathbf{x}^{*}\right)\right\| \leq \lambda\left\|\mathbf{x}^{'}-\mathbf{x}^{*}\right\| . \] 因此 \(\mathbf{x}^{'}=\mathbf{x}^{*}\) 。返回
证明1.9.1
这里仅证明该映射满足三角形不等式,即 \(\left\|L_{2}+ L_{1}\right\| \leq\left\|L_{2}\right\|+\left\|L_{1}\right\|,L_1,L_2\in\mathbb R^{n\times m}\) 。设 \(\mathbf{x}\in\mathbb R^m\) ,有 \[ \begin{aligned} \|(L_{2}+ L_{1})\mathbf{x}\| &\leq\|L_{2}\mathbf{x}\|+\|L_{1}\mathbf{x}\|\quad \text{(向量范数的三角形不等式)} \\ &\leq\|L_1\| \|\mathbf{x}\|+\|L_2\| \|\mathbf{x}\| \quad \text{(定义)}\\ &=(\|L_1\|+\|L_2\|)\|\mathbf{x}\| \end{aligned} \] 又由定义和向量范数的正齐次性知 \(\dfrac{\|(L_1+L_2)\mathbf{x}\|}{\|\mathbf{x}\|}\geq\left\|L_{2}+ L_{1}\right\|\) ,证毕。返回
证明1.9.2
要证明 \(\left\|L_{2} L_{1}\right\| \leq\left\|L_{2}\right\|\left\|L_{1}\right\|,L_1\in\mathbb R^{m\times n},L_2\in\mathbb R^{n\times p}\) 。设 \(\mathbf{x}\in\mathbb R^p\) ,有 \[ \begin{aligned} \|L_1L_2\mathbf{x}\|&\leq\|L_1\|\|(L_2\mathbf{x})\|\quad\text{(定义)}\\ &\leq\|L_1\|\|L_2\|\|\mathbf{x}\|\quad\text{(定义)} \end{aligned} \] 又因 \(\dfrac{\|L_1L_2\mathbf{x}\|}{\|\mathbf{x}\|}\geq\|L_{2}\|\|L_{1}\|\) ,证毕。返回
证明1.9.3
思路:通过转化为不动点问题来寻求 \(I-B\) 形如 \(I+C\) 的逆矩阵。我们发现 \[ (I-B)(I+C)=I \text { 当且仅当 } C=B+B C \text {. } \] 记 \(f: \mathcal{L}(m) \rightarrow \mathcal{L}(m), f(C)=B+B C\) ,于是问题变成了一个迭代是否存在不动点的问题。有 \[ \left\|f\left(C_{1}\right)-f\left(C_{2}\right)\right\|=\left\|B C_{1}-B C_{2}\right\|=\left\|B\left(C_{1}-C_{2}\right)\right\| \leq\|B\|\left\|C_{1}-C_{2}\right\| \] 因为 \(\|B\|<1\) ,所以 \(f\) 是压缩映射,根据压缩不动点定理,存在 \(C \in \mathcal{L}(m)\) 使得 \(f(C)=C\) 。因此 \(I-B\) 可逆, \((I-B)^{-1}=I+C\) 。又因 \(\|C\|=\|B+B C\| \leq\|B\|+\|B\|\|C\|\) ,有 \(\|C\| \leq \dfrac{\|B\|}{1-\|B\|}\) 。返回
证明1.10
\[ \begin{aligned} &\|\mathbf{x}(A+\Delta A, \mathbf{b}+\Delta \mathbf{b})-\mathbf{x}(A, \mathbf{b})\| \\ =&\left\|\left((A+\Delta A)^{-1}-A^{-1}\right) \mathbf{b}+(A+\Delta A)^{-1} \Delta \mathbf{b}\right\| \\ \leq & \frac{\left\|A^{-1}\right\|^{2}\|\Delta A\|\|\mathbf{b}\|}{1-\left\|A^{-1}\right\|\|\Delta A\|}+\left(\left\|A^{-1}\right\|+\frac{\left\|A^{-1}\right\|^{2}\|\Delta A\|}{1-\left\|A^{-1}\right\|\|\Delta A\|}\right)\|\Delta \mathbf{b}\| \end{aligned} \]
对任意 \(\varepsilon>0\) ,当 \[ \|\Delta \mathbf{b}\|<\frac{\varepsilon}{4\left\|A^{-1}\right\|}, \quad\|\Delta A\|<\frac{\varepsilon}{4\left\|A^{-1}\right\|^{2}\|\mathbf{b}\|+2\left\|A^{-1}\right\| \varepsilon} \] 时, \(\|\mathbf{x}(A+\Delta A, \mathbf{b}+\Delta \mathbf{b})-\mathbf{x}(A, \mathbf{b})\|<\varepsilon\) 。所以 \(\mathbf{x}(A, \mathbf{b})\) 连续。返回