由于篇幅太长所以将笔记分成了两部分 (上 & 下)

数值计算下_1731638053834

# 数值计算下

# 线性方程组的直接解法

要点

高斯消元法：

高斯消元法的思想
高斯消元法的一般步骤
高斯消元法分析

主元素法：

主元素法分析

矩阵三角分解法：

直接三角分解法（LU 分解或杜利特尔分解）
平方根法（乔列斯基分解）
改进的平方根法（分解）
追赶法

向量与矩阵的范数

针对具体的线性方程组会用指定的方法求解

常用的数值解法分为直接法和迭代法。

一、直接法

直接法是指不考虑计算过程中的舍入误差，通过有限步运算得到方程精确解的方法。

高斯消元法（Gauss elimination）：通过逐步消元将线性方程组转化为上三角方程组，然后进行回代求解。
平方根法（Cholesky decomposition）：主要用于对称正定矩阵的求解，将矩阵分解为特定形式进行求解。
主元素法（Pivoting method）：通过选择主元素提高计算的稳定性和精度。
三角分解法（LU decomposition）：将系数矩阵分解为下三角矩阵和上三角矩阵的乘积，然后求解两个三角方程组得到解。
追赶法（TDMA）：主要用于求解三对角线性方程组。

直接法适用于小型稠密矩阵。

二、迭代法

迭代法采用逐次逼近的方法，从某一个初始解出发，按照某种迭代格式逐步逼近方程组的解，直至满足精度要求。

雅可比（Jacobi）迭代法。
高斯 - 塞德尔（Gauss-Seidel）迭代法。
松弛 SOR 迭代法。

迭代法适用于大型稀疏矩阵。

# 高斯消元法

高斯消元法（Gaussian Elimination）是一种用于求解线性方程组的直接方法。

一、基本思想

通过一系列的初等行变换将线性方程组的增广矩阵化为行阶梯形矩阵。
再进一步化为行最简形矩阵，从而得到方程组的解。

二、具体步骤

首先，对于线性方程组，其中是系数矩阵，是未知数向量，是常数向量。将其写成增广矩阵的形式。
然后进行初等行变换：
- 对换两行。
- 以非零数乘某一行。
- 把某一行的若干倍加到另一行上。
目标是把增广矩阵化为行阶梯形矩阵：
- 从上往下，逐行进行处理。使得每一行第一个非零元素（称为主元）所在的列，下面的行中该列元素全为零。
接着进一步化为行最简形矩阵：
- 使得每一行的主元变为 1，并且主元所在列的其他元素变为零。
最后进行回代求解：
- 从最后一行开始，依次求出每个未知数的值。

消元法全部计算量： $S = S_1 + S_2=\frac{n}{3}(n^{2}+3n - 1)$ 。

高斯消元法的限制： $a_{kk}^{(k)}\neq0$ ， $k = 1,2,\cdots,n - 1$ 。

定理：方程 $Ax = b$ 可以使用高斯消元法求解的充要条件是 $A$ 的所有顺序主子式不为 0，即

$\begin{vmatrix}a_{11}&\cdots&a_{1i}\\\vdots&\ddots&\vdots\\a_{i1}&\cdots&a_{ii}\end{vmatrix}\neq0$

$\forall i = 1,2,\cdots,n$ 。 $|A|\neq0$ 可以保证方程组有唯一解，但不能保证高斯消元法可以进行。

当 $|a_{kk}^{(k)}|\to0$ 时，舍入误差会被放大，导致计算失败。

原因：

$\epsilon\left(x_{1}^{*} / x_{2}^{*}\right)\leq\frac{\vert x_{1}^{*}\vert\epsilon\left(x_{2}^{*}\right)+\vert x_{2}^{*}\vert\epsilon\left(x_{1}^{*}\right)}{\vert x_{2}^{*}\vert^{2}}$

选取绝对值最大的为主元。

主元素法分析

主元素法分析：

若 $\vert A\vert\neq0$ ，则 $\vert a_{kk}\vert\cdots\vert a_{nk}\vert$ 一定至少有一非零元。（否则 $\vert A\vert = 0$ ）。
主元素法的适用范围： $\vert A\vert\neq0$ 。
主元素法在一定程度上克服了高斯消元中的不稳定现象。
- 列主元系法增加了 $\sum^{n - 1}_{i=1}\left(n-i\right)$ 次比较操作。
- 全主元素法增加了 $\sum_{i = 1}^{n - 1}[(n - i + 1)^{2}-1]$ 次比较操作。
不论哪种方式选出主元，再按上面步骤进行计算，都称为选主元的高斯消元法。
计算经验与理论分析均表明：列主元素法与全主元素法具有同样良好的数值稳定性。实际中常采用列主元素法求解中小型稠密方程组。

# 三角分解

# LU 分解

LU 分解（LU Decomposition）是线性代数中一种重要的矩阵分解方法。它将一个方阵 $A$ 分解为一个下三角矩阵 $L$ 和一个上三角矩阵 $U$ 的乘积，即 $A = LU$ 。

其中， $L$ 是一个下三角矩阵，即矩阵中的所有元素都位于主对角线及其下方，且主对角线元素通常为 1（在一些特殊的 LU 分解形式中，如 Crout 分解， $L$ 的主对角线元素不一定为 1）； $U$ 是一个上三角矩阵，即矩阵中的所有元素都位于主对角线及其上方。

并不是所有方阵都可以进行 LU 分解，一个方阵 $A$ 可以进行 LU 分解的一个常见的充分条件是它的所有顺序主子式都不为 0。

LU 分解的主要应用包括：

求解线性方程组：给定线性方程组 $Ax = b$ ，可将其转换为两个更简单的方程组 $Ly = b$ 和 $Ux = y$ ，先解下三角方程组得到 $y$ ，再解上三角方程组得到 $x$ 。
计算矩阵的行列式：由于行列式可以通过对角线元素的乘积来计算，而 $A$ 的行列式等于 $L$ 和 $U$ 的行列式的乘积，对于标准 LU 分解， $L$ 的行列式为 1，所以 $A$ 的行列式的值即为 $U$ 的对角线元素乘积。
求矩阵的逆：利用 $A^{-1} = U^{-1}L^{-1}$ ，由于 $L$ 和 $U$ 是三角矩阵，它们的逆相对容易计算。

杜利特尔算法的具体步骤如下：

设矩阵 $A$ 为 $n×n$ 矩阵， $L$ 和 $U$ 的初始值设定如下：

$L$ 为单位下三角矩阵，即 $L(i, i) = 1$ （主对角线元素为 1）， $L(i, j) = 0$ （ $i < j$ 时，非主对角线元素为 0）；

$U$ 初始化为全零矩阵。

对于 $r$ 从 1 到 $n-1$ 进行以下操作：

计算 $U$ 的第 $r$ 行元素：
$u_{rj} = a_{rj} - \sum_{k=1}^{r-1} l_{rk}u_{kj} \quad (j = r, r + 1, \cdots, n)$
计算 $L$ 的第 $r$ 列元素（ $r \neq n$ ）：
$l_{ir} = \frac{a_{ir} - \sum_{k=1}^{r-1} l_{ik}u_{kr}}{u_{rr}} \quad (i = r + 1, r + 2, \cdots, n)$

经过这些步骤，最终得到的 $L$ 和 $U$ 矩阵即为 $A$ 的 LU 分解结果。

通过解方程组 $Ly = b$ 和 $Ux = y$ ，获得最终的结果。

# 平方根法 - 乔列斯基分解法

乔列斯基（Cholesky）分解是对于对称正定矩阵的一种分解方法。

若矩阵

$A=\begin{bmatrix}a_{11}&a_{12}&\cdots&a_{1n}\\a_{21}&a_{22}&\cdots&a_{2n}\\\vdots&\vdots&\ddots&\vdots\\a_{n1}&a_{n2}&\cdots&a_{nn}\end{bmatrix}$

则存在下三角矩阵

$L=\begin{bmatrix}l_{11}&0&\cdots&0\\l_{21}&l_{22}&\cdots&0\\\vdots&\vdots&\ddots&\vdots\\l_{n1}&l_{n2}&\cdots&l_{nn}\end{bmatrix}$

使得 $A = LL^T$ ，其中

$L^T=\begin{bmatrix}l_{11}&l_{21}&\cdots&l_{n1}\\0&l_{22}&\cdots&l_{n2}\\\vdots&\vdots&\ddots&\vdots\\0&0&\cdots&l_{nn}\end{bmatrix}$

通过比较法可得计算下三角矩阵 $L$ 中元素的公式为：

计算主对角线元素 $l_{jj}$ ： $l_{jj}=\sqrt{a_{jj}-\sum_{k = 1}^{j - 1}l_{jk}^{2}}$ ， $j = 1,2,\cdots,n$ .
计算非主对角线元素 $l_{ij}$ （ $i>j$ ）： $l_{ij}=\frac{1}{l_{jj}}\left(a_{ij}-\sum_{k = 1}^{j - 1}l_{ik}l_{jk}\right)$ .

紧凑法：对角类似 LU 分解步骤，但是需要开发，后续元素类似 LU 分解，要除子方阵的坐上顶角元素
见例题

# 改进的平方根法

$LDL^T$

设 $A$ 为对称正定阵，则 $A$ 可唯一分解为 $A = LDL^T$ ，其中 $L$ 为单位下三角阵， $D$ 为对角阵。即：

LDLT 分解过程

借助 LU 分解可得：

$A=\begin{bmatrix}1&0&\cdots&0\\l_{21}&1&\cdots&0\\\vdots&\vdots&\ddots&\vdots\\l_{n1}&l_{n2}&\cdots&1\end{bmatrix}\begin{bmatrix}d_{1}&&&\\&d_{2}&&\\&&\ddots&\\&&&d_{n}\end{bmatrix}\begin{bmatrix}1&l_{21}&\cdots&l_{n1}\\0&1&\cdots&l_{n2}\\\vdots&\vdots&\ddots&\vdots\\0&0&\cdots&1\end{bmatrix}=\begin{bmatrix}1&0&\cdots&0\\l_{21}&1&\cdots&0\\\vdots&\vdots&\ddots&\vdots\\l_{n1}&l_{n2}&\cdots&1\end{bmatrix}\begin{bmatrix}d_{1}&d_{1}l_{21}&\cdots&d_{1}l_{n1}\\0&d_{2}&\cdots&d_{2}l_{n2}\\\vdots&\vdots&\ddots&\vdots\\0&0&\cdots&d_{n}\end{bmatrix}$

其分解过程为：

$d_{i}=a_{ii}-\sum_{k = 1}^{i - 1}l_{ik}^{2}d_{k}$ .

$l_{ij}=\frac{1}{d_{j}}\left(a_{ij}-\sum_{k = 1}^{j - 1}l_{ik}l_{jk}d_{k}\right)$ .

# 平方根与改进的平方根法小结

一、平方根法

对于对称正定阵 $A$ $A$ 完成乔列斯基分解后，可转化为方程组求解：
- $L y = b$ ；
- $L^{\top}x = y$ .

二、改进的平方根法

对于对称正定阵 $A$ $A$ 完成 $LDL^T$ $L D L^{T}$ 分解后，可转化为：
- $L y = b$ ；
- $DL^{\top}x = y$ ，进一步可写成 $L^{\top}x = D^{-1}y$ .

三、共同点与优势

二者都只适用于对称正定阵。
引入辅助量后，计算量差不多。
改进的平方根法不需要开方运算，计算量约为高斯消元法的一半 $\Omega\left(\frac{n^3}{6}\right)$ ，且不必选主元，数值稳定性良好。

# 追赶法

追赶法与三对角矩阵分解定理

一、三对角矩阵

一个 $n \times n$ 的三对角矩阵 $A$ 具有如下形式：

$A = \begin{bmatrix} b_1 & c_1 & 0 & \cdots & 0 \\ a_2 & b_2 & c_2 & \cdots & 0 \\ 0 & a_3 & b_3 & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & b_n \end{bmatrix}$

其中 $a_i$ 、 $b_i$ 、 $c_i$ 为已知系数。

二、三对角矩阵分解定理

对于三对角矩阵

$A=\begin{bmatrix}b_{1}&c_{1}&&&\\a_{2}&b_{2}&c_{2}&&\\&a_{3}&b_{3}&c_{3}&\\&&\ddots&\ddots&\ddots\\&&a_{n - 1}&b_{n - 1}&c_{n - 1}\\&&&a_{n}&b_{n}\end{bmatrix}$

若满足

$\begin{cases}\vert b_{1}\vert>\vert c_{1}\vert>0\\\vert b_{i}\vert>\vert a_{i}\vert+\vert c_{i}\vert,a_{i}c_{i}\neq0,i = 2,\cdots,n - 1\\\vert b_{n}\vert>\vert a_{n}\vert\end{cases}$

则它可以分解为

$A = LU=\begin{bmatrix}\alpha_{1}&&&&\\r_{2}&\alpha_{2}&&&\\&r_{3}&\alpha_{3}&&\\&&\ddots&\ddots&\\&&&r_{n}&\alpha_{n}\end{bmatrix}\begin{bmatrix}1&\beta_{1}&&&\\&1&\beta_{2}&&\\&&\ddots&\ddots&\\&&&1&\beta_{n - 1}\\&&&&1\end{bmatrix}$

三对角阵的分解实质是 LU 分解的应用，其系数可由以下公式确定：

$\alpha_{1}=b_{1}$ 。
$\beta_{1}=c_{1}/b_{1}$ 。
$\beta_{i}=c_{i}/(b_{i}-a_{i}\beta_{i - 1}),i = 2,\cdots,n - 1$ 。
$r_{i}=a_{i},i = 2,\cdots,n$ 。
$\alpha_{i}=b_{i}-\alpha_{i}\beta_{i - 1},i = 2,\cdots,n$ 。

追赶法是一种高效的求解三对角线性方程组的方法，其计算复杂度为 $O(n)$ ，远低于一般的高斯消元法的 $O(n^3)$ 。

# 向量范数与矩阵范数

一、向量的范数

向量的范数是衡量向量大小的一种度量方式。

常见的向量范数有以下几种：
- $l_1$ 范数：也称为曼哈顿范数，对于向量 $x=(x_1,x_2,\cdots,x_n)$ ，其 $l_1$ 范数定义为 $\vert\vert x\vert\vert_1=\sum_{i=1}^{n}\vert x_i\vert$ 。
- $l_2$ 范数：也称为欧几里得范数，对于向量 $x=(x_1,x_2,\cdots,x_n)$ ，其 $l_2$ 范数定义为 $\vert\vert x\vert\vert_2=\sqrt{\sum_{i=1}^{n}x_i^2}$ 。
- $l_{\infty}$ 范数：也称为最大范数，对于向量 $x=(x_1,x_2,\cdots,x_n)$ ，其 $l_{\infty}$ 范数定义为 $\vert\vert x\vert\vert_{\infty}=\max_{1\leq i\leq n}\vert x_i\vert$ 。
向量范数的性质：
- 非负性：对于任意向量 $x$ ， $\vert\vert x\vert\vert\geq0$ ，当且仅当 $x=0$ 时， $\vert\vert x\vert\vert=0$ 。
- 齐次性：对于任意向量 $x$ 和标量 $\alpha$ ， $\vert\vert\alpha x\vert\vert=\vert\alpha\vert\vert\vert x\vert\vert$ 。
- 三角不等式：对于任意向量 $x$ 和 $y$ ， $\vert\vert x + y\vert\vert\leq\vert\vert x\vert\vert+\vert\vert y\vert\vert$ 。

二、矩阵的范数

矩阵的范数也是一种度量矩阵大小的方式。

常见的矩阵范数有以下几种：
- 矩阵的 $l_1$ 范数：对于矩阵 $A=(a_{ij})_{m\times n}$ ，其 $l_1$ 范数定义为 $\vert\vert A\vert\vert_1=\max_{1\leq j\leq n}\sum_{i=1}^{m}\vert a_{ij}\vert$ ，即矩阵每一列元素绝对值之和的最大值。
- 矩阵的 $l_2$ 范数：也称为谱范数，对于矩阵 $A$ ，其 $l_2$ 范数定义为 $\vert\vert A\vert\vert_2=\sqrt{\lambda_{max}(A^TA)}$ ，其中 $\lambda_{max}(A^TA)$ 表示矩阵 $A^TA$ 的最大特征值。
- 矩阵的 $l_{\infty}$ 范数：对于矩阵 $A=(a_{ij})_{m\times n}$ ，其 $l_{\infty}$ 范数定义为 $\vert\vert A\vert\vert_{\infty}=\max_{1\leq i\leq m}\sum_{j=1}^{n}\vert a_{ij}\vert$ ，即矩阵每一行元素绝对值之和的最大值。
- 弗罗贝尼乌斯范数（Frobenius norm）：对于矩阵 $A=(a_{ij})_{m\times n}$ ，其弗罗贝尼乌斯范数定义为 $\vert\vert A\vert\vert_F=\sqrt{\sum_{i=1}^{m}\sum_{j=1}^{n}\vert a_{ij}\vert^2}$ 。
矩阵范数的性质：
- 非负性：对于任意矩阵 $A$ ， $\vert\vert A\vert\vert\geq0$ ，当且仅当 $A=0$ 时， $\vert\vert A\vert\vert=0$ 。
- 齐次性：对于任意矩阵 $A$ 和标量 $\alpha$ ， $\vert\vert\alpha A\vert\vert=\vert\alpha\vert\vert\vert A\vert\vert$ 。
- 三角不等式：对于任意矩阵 $A$ 和 $B$ ， $\vert\vert A + B\vert\vert\leq\vert\vert A\vert\vert+\vert\vert B\vert\vert$ 。
- 相容性：对于任意矩阵 $A$ 和 $B$ ， $\vert\vert AB\vert\vert\leq\vert\vert A\vert\vert\vert\vert B\vert\vert$ 。

向量的范数和矩阵的范数在数值分析、线性代数、优化问题等领域中都有广泛的应用。

# 线性方程组的迭代解法

都是基于不动点，或者说序列收敛的原理进行迭代，所以迭代的前提是递推序列能够收敛。

# 雅可比（Jacobi）迭代法

一、基本原理

对于方程组 $\sum_{j = 1}^{n}a_{ij}x_{j}=b_{i}\ (i = 1,2,\cdots,n)$ ，记作 $Ax = b$ ，其中 $A$ 为非奇异阵且 $a_{ii}\neq0\ (i = 1,2,\cdots,n)$ 。

将矩阵 $A$ 分裂为 $A = D - L - U$ ，其中：
$D=\begin{pmatrix}a_{11}&&&\\&a_{22}&&\\&&\ddots&\\&&&a_{nn}\end{pmatrix}$
是对角矩阵。
$L = -\begin{pmatrix}0&&&\\a_{21}&0&&\\a_{31}&a_{32}&0&\\\vdots&\vdots&\ddots&\ddots&\\a_{n1}&a_{n2}&\cdots&a_{n,n - 1}&0\end{pmatrix}$
是下三角矩阵（不包括对角元素）。
$U = -\begin{pmatrix}0&a_{12}&a_{13}&\cdots&a_{1n}\\&0&a_{23}&\cdots&a_{2n}\\&&\ddots&\vdots\\&&&0&a_{n - 1,n}\\&&&&0\end{pmatrix}$
是上三角矩阵（不包括对角元素）。
将方程组的第 $i$ 个方程用 $a_{ii}$ 去除再移项，得到等价方程组
$x_{i}=\frac{1}{a_{ii}}\left(b_{i}-\sum_{\substack{j = 1\\j\neq i}}^{n}a_{ij}x_{j}\right)\ (i = 1,2,\cdots,n)$

二、迭代公式

从初始向量 $x^{(0)}=(x_{1}^{(0)},x_{2}^{(0)},\cdots,x_{n}^{(0)})^{T}$ 开始，根据迭代公式
$x_{i}^{(k + 1)}=\frac{1}{a_{ii}}\left(b_{i}-\sum_{\substack{j = 1\\j\neq i}}^{n}a_{ij}x_{j}^{(k)}\right)$
进行迭代，其中 $x^{(k)}=(x_{1}^{(k)},x_{2}^{(k)},\cdots,x_{n}^{(k)})^{T}$ 为第 $k$ 次迭代向量。
迭代公式的矩阵形式为
$\begin{cases}x^{(0)}&(初始向量)\\x^{(k + 1)}=B_{0}x^{(k)} + f\end{cases}$
其中 $B_{0}=I - D^{-1}A = D^{-1}(L + U)$ 称为雅可比方法迭代矩阵， $f = D^{-1}b$ 。

三、特点

公式简单，每迭代一次只需计算一次矩阵和向量乘法。
在用计算机计算时，需要两组工作单元，以存储 $x^{(k)}$ 及 $x^{(k + 1)}$ 。

雅可比迭代法适用于一些系数矩阵具有特定结构的线性方程组求解，但其收敛速度可能较慢，且收敛性取决于系数矩阵的性质。

# 高斯 - 塞得尔 (Gauss-Seidel) 迭代法

高斯 - 塞德尔（Gauss-Seidel）迭代法也是一种求解线性方程组的迭代方法。

一、基本原理

对于线性方程组 $Ax = b$ ，其中 $A$ 是 $n\times n$ 的非奇异矩阵， $x$ 是 $n$ 维未知向量， $b$ 是 $n$ 维已知向量。

同样将矩阵 $A$ 分解为 $A = D - L - U$ ，其中：
- $D$ 是对角矩阵，由 $A$ 的对角元素组成。
- $L$ 是下三角矩阵（不包括对角元素）。
- $U$ 是上三角矩阵（不包括对角元素）。
将线性方程组 $Ax = b$ 改写为 $(D - L)x = Ux + b$ ，进一步得到 $x = (D - L)^{-1}Ux + (D - L)^{-1}b$ .
确切的说是 $(D - L)x^{(k+1)} = Ux^{(k)} + b$ , 进一步得到 $x^{(k+1)} = (D - L)^{-1}Ux^{(k)} + (D - L)^{-1}b$
于是 Gauss-Seidel 迭代公式的矩阵形式为
$x^{(k+1)}=Gx^{(k)}+f\\ G=(D-L)^{-1}U,\quad f=(D-L)^{-1}b.$

二、迭代公式

从一个初始向量 $x^{(0)}=(x_{1}^{(0)},x_{2}^{(0)},\cdots,x_{n}^{(0)})^{T}$ 开始，进行迭代。
$x_{i}^{(k + 1)}=\frac{1}{a_{ii}}\left(b_{i}-\sum_{j = 1}^{i - 1}a_{ij}x_{j}^{(k + 1)}-\sum_{j = i + 1}^{n}a_{ij}x_{j}^{(k)}\right)\ (i = 1,2,\cdots,n)$ 。
迭代公式的矩阵形式为
$\begin{cases}x^{(0)}&(初始向量)\\x^{(k + 1)}=(D - L)^{-1}Ux^{(k)} + (D - L)^{-1}b\end{cases}$ .

三、特点

与雅可比迭代法相比，高斯 - 塞德尔迭代法在计算 $x_{i}^{(k + 1)}$ 时，使用了已经更新的 $x_{1}^{(k + 1)},\cdots,x_{i - 1}^{(k + 1)}$ 的值，而雅可比迭代法在计算 $x_{i}^{(k + 1)}$ 时只使用上一次迭代的 $x^{(k)}$ 的值。
通常情况下，高斯 - 塞德尔迭代法的收敛速度比雅可比迭代法快。
但收敛性仍然取决于系数矩阵 $A$ 的性质。如果矩阵 $A$ 是严格对角占优矩阵或对称正定矩阵等，高斯 - 塞德尔迭代法通常是收敛的。

# 迭代法基本定理

对于一阶定常迭代法 $x^{(k + 1)} = Bx^{(k)} + f$ ，迭代法收敛的充要条件是谱半径 $\rho(B)<1$ .

对于一个方阵 $A$ ，其谱半径 $\rho(A)$ 定义为 $A$ 的特征值的模的最大值。

首先求出矩阵 $A$ 的特征值。
- 求解特征方程 $\vert A-\lambda I\vert = 0$ ，其中 $I$ 是单位矩阵， $\lambda$ 为待求的特征值。
- 对于 $n\times n$ 的矩阵，这个特征方程是一个 $n$ 次多项式方程，求解这个方程可以得到 $n$ 个特征值 $\lambda_1,\lambda_2,\cdots,\lambda_n$ 。
然后计算特征值的模 $\vert\lambda_i\vert$ 。
最后确定谱半径 $\rho(A)=\max\{\vert\lambda_1\vert,\vert\lambda_2\vert,\cdots,\vert\lambda_n\vert\}$ ，即特征值的模的最大值。

若 $A$ 为严格对角占优矩阵则雅可比和高斯 - 赛德尔迭代法均收敛

优点：充分利用已经获得的最新数据
缺点：更新过程顺序执行，不适合并行

# 超松弛（SOR）迭代法

一、常见的线性方程组求解方法除了高斯 - 塞德尔迭代法还有：

直接法：如高斯消元法等，通过有限步运算直接求得方程组的精确解。适用于系数矩阵规模较小或结构特殊的情况。
雅可比迭代法：将系数矩阵分裂为对角矩阵、下三角矩阵和上三角矩阵之和，通过迭代逐步逼近方程组的解。
共轭梯度法：一种适用于求解对称正定线性方程组的迭代方法，具有收敛速度快的特点。

二、超松弛（SOR）迭代法

基本思想：
SOR 迭代法是对高斯 - 塞德尔迭代法的一种修正，旨在通过引入一个控制因子（松弛因子）ω 来更好地控制收敛速度。
记 $\Delta x^{(k)} = x^{(k + 1)} - x^{(k)}$ 为迭代格式的修正量，将迭代格式看成是前一步值加上一个修正量得到的。在修正量 $\Delta x^{(k)}$ 上乘以一个控制因子 ω。
当 ω>1 时为超松弛迭代；当 ω<1 时为低松弛迭代。
公式推导：
- 若 $x^{(k + 1)}$ 为雅可比迭代格式，则有：
  $x^{(k + 1)}=(1-\omega)x^{(k)}+\omega\left((I-D^{-1}A)x^{(k)}+D^{-1}b\right)=\left(I-\omega D^{-1}A\right)x^{(k)}+\omega D^{-1}b$ ，称为阻尼雅可比法。
- 若 $x^{(k + 1)}$ 为高斯 - 塞德尔迭代格式，则有：
  $x^{(k + 1)}=(1-\omega)x^{(k)}+\omega\left(D^{-1}\left(Lx^{(k + 1)}+Dx^{(k)} - 1\right)\right)=(D-\omega L)^{-1}((1-\omega)D+\omega U)x^{(k)}+\omega(D-\omega L)^{-1}$ ，称为逐次超松弛迭代法（SOR）
  B=L_{\omega}=(D-\omega L)^{-1}((1-\omega)D+\omega U),\quad f=\omega(D-\omega L)^
迭代过程：
- 首先用高斯 - 塞德尔迭代法定义辅助量 $\tilde{x}_{i}^{(k + 1)}=\left(b_{i}-\sum_{j = 1}^{i - 1}a_{ij}x_{j}^{(k + 1)}-\sum_{j = i + 1}^{n}a_{ij}x_{j}^{(k)}\right)/a_{ii}$ 。
- 再由 $x^{(k)}$ 与 $\tilde{x}^{(k + 1)}$ 的加权平均定义 $x^{(k + 1)}$ ，即： $x_{i}^{(k + 1)}=x_{i}^{(k)}+\omega\left(\tilde{x}_{i}^{(k + 1)}-x_{i}^{(k)}\right)=(1-\omega)x_{i}^{(k)}+\omega\tilde{x}_{i}^{(k + 1)}=x_{i}^{(k)}+\omega\left(b_{i}-\sum_{j = 1}^{i - 1}a_{ij}x_{j}^{(k + 1)}-\sum_{j = i}^{n}a_{ij}x_{j}^{(k)}\right)/a_{ii}$ .
笔算直接用公式就行了，写代码用矩阵分解
收敛条件：
- SOR 迭代法收敛的必要条件是 $0<\omega<2$ 。
- 若 $Ax = b$ ，且 $A$ 为对称正定阵， $0<\omega<2$ ，则 SOR 迭代法收敛。
- 若 $Ax = b$ ，且 $A$ 为严格对角占优矩阵， $0<\omega\leq1$ ，则 SOR 迭代法收敛。

# 非线性方程与方程组的数值解法

# 二分法

非线性方程二分法求根是一种用于求解方程 $f(x)=0$ 的数值方法，主要适用于求解在给定区间 $[a,b]$ 上连续且 $f(a)$ 与 $f(b)$ 异号的情况。

一、基本原理

由于函数 $f(x)$ 在区间 $[a,b]$ 上连续且 $f(a)$ 与 $f(b)$ 异号，根据零点定理可知，在区间 $[a,b]$ 内至少存在一个根。
取区间的中点 $c=(a + b)/2$ .
然后判断 $f(c)$ $f (c)$ 的值：
- 如果 $f(c)=0$ ，那么 $c$ 就是方程的根。
- 如果 $f(c)$ 与 $f(a)$ 异号，则说明根在区间 $[a,c]$ 内，此时令 $b = c$ .
- 如果 $f(c)$ 与 $f(b)$ 异号，则说明根在区间 $[c,b]$ 内，此时令 $a = c$ .
重复上述步骤，不断缩小根所在的区间，直到达到所需的精度。

二、精度分析

每次迭代后，区间长度变为原来的一半。
经过 $k$ 次迭代后，区间长度为 $(b - a)/2^{k}$ .
此时，根的近似值 $x_k$ 与精确值 $x^*$ 之间的误差满足 $\vert x^* - x_k\vert\leq(b - a)/2^{k + 1}$ .
给定精度 $\epsilon$ ，只需使 $(b - a)/2^{k + 1}\leq\epsilon$ ，可求得 $k$ 值。即有 $k\geq\log_2\frac{b - a}{\epsilon}-1$ .

三、优点和缺点

优点：
- 二分法是一种可靠的方法，只要满足条件，一定能收敛到方程的根。
- 算法简单，容易实现。
缺点：
- 收敛速度相对较慢，是线性收敛。
- 要求函数在区间上连续且两端点函数值异号，条件较为严格。

# 不动点迭代及其收敛性

一、不动点迭代的概念

对于方程 $f(x)=0$ ，通过变换将其转化为等价形式 $x=\varphi(x)$ 。若所求的 $x$ 满足 $f(x^*) = 0$ ，则 $x^*=\varphi(x^*)$ ，此时 $x^*$ 为函数 $\varphi(x)$ 的一个不动点。构造迭代方程 $x_{k + 1}=\varphi(x_k)$ ，若对任何 $x\in[a,b]$ ，序列 $\{x_k\}$ 有极限 $\lim\limits_{k\to\infty}x_k = x^*$ ，则称该迭代方程收敛，这种迭代法称为不动点迭代法.

二、收敛性分析

压缩映象原理：
- 设 $\varphi(x)\in C[a,b]$ $φ (x) \in C [a, b]$ 满足以下条件：
  - 对任意 $x\in[a,b]$ ，有 $a\leq\varphi(x)\leq b$ 。
  - 存在常数 $0<L<1$ ，对任意 $x,y\in[a,b]$ 有 $\vert\varphi(x)-\varphi(y)\vert\leq L\vert x - y\vert$ 。
- 则 $\varphi(x)$ 在 $[a,b]$ 存在唯一不动点 $x^*$ ，且对任意 $x_0\in[a,b]$ ，由 $x_{k + 1}=\varphi(x_k)$ 得到的序列 $\{x_k\}$ 有 $\lim\limits_{k\to\infty}x_k = x^*$ ，并有误差估计 $\vert x_k - x^*\vert\leq\frac{L^k}{1 - L}\vert x_1 - x_0\vert$ 。
条件 $\vert\varphi(x)-\varphi(y)\vert\leq L\vert x - y\vert$ $∣ φ (x) - φ (y) ∣ \leq L ∣ x - y ∣$ ：
- 设 $\varphi(x)\in C^1[a,b]$ 且对任意 $x\in[a,b]$ 都有 $\vert\varphi'(x)\vert\leq L<1$ 。
- 根据拉格朗日中值定理，对任意 $x,y\in[a,b]$ ，有 $\vert\varphi(x)-\varphi(y)\vert=\vert\varphi'(\xi)(x - y)\vert\leq L\vert x - y\vert$ ，其中 $\xi\in(a,b)$ 。
- 故上述定理中的条件常被表述成 $\vert\varphi'(x)\vert<1$ 。

三、总结

不动点迭代法是一种通过不断迭代函数 $\varphi(x)$ 来逼近方程 $f(x)=0$ 的根的方法。其收敛性取决于函数 $\varphi(x)$ 的性质，特别是满足一定的压缩条件时，迭代序列能够收敛到唯一的不动点。在实际应用中，需要根据具体问题选择合适的变换函数 $\varphi(x)$ ，并分析其收敛性，以确保迭代法的有效性。

# 不动点加速迭代

斯特芬森（Steffensen）迭代法是一种加速迭代收敛的方法。

一、基本原理

对于方程 $f(x)=0$ ，将其转化为等价形式 $x=\varphi(x)$ ，构造迭代公式 $x_{n + 1}=\varphi(x_n)$ 。斯特芬森迭代法是在这个基础上进行改进。

设 $y_n=\varphi(x_n)$ ， $z_n=\varphi(y_n)$ ，则斯特芬森迭代公式为：

$x_{n + 1}=x_n-\frac{(y_n - x_n)^2}{z_n - 2y_n + x_n}$

# 牛顿迭代法

# 牛顿迭代法原理

基本思路：
- 牛顿法的核心是将非线性方程 $f(x)=0$ 线性化。
推导过程：
- 假设方程 $f(x)=0$ 有根 $x_k$ ，将 $f(x)$ 在 $x_k$ 处展开，得到 $f(x)\approx f(x_k)+f'(x_k)(x - x_k)$ 。
- 由于 $f(x)=0$ ，所以可以近似表示为 $f(x_k)+f'(x_k)(x - x_k)=0$ 。
- 化简这个等式得到 $x=x_k-\frac{f(x_k)}{f'(x_k)}$ 。
迭代公式：
- 根据上述化简结果，牛顿法的迭代公式为 $x_{k + 1}=x_k-\frac{f(x_k)}{f'(x_k)}$ ，其中 $k = 0,1,\cdots$ 。

牛顿法通过不断迭代这个公式来逼近非线性方程的根。每次迭代都基于当前的近似根 $x_k$ ，利用函数值 $f(x_k)$ 和导数值 $f'(x_k)$ 来计算下一个更接近真实根的近似值 $x_{k+1}$ .

牛顿迭代法的收敛性：牛顿迭代格式在 $x^*$ 附件至少平凡收敛。

# 简化牛顿法

简化牛顿法又称平行弦法

定义
简化牛顿法是将牛顿迭代公式 $\varphi(x) = x - \frac{f(x)}{f'(x)}$ 中的 $f'(x)$ 用常数 $C$ 代替，得到新的迭代公式。
收敛性
为了在 $x^*$ （根的真实值）附近有更好的收敛性，令 $\left|\varphi'(x^*)\right|=\left|1 - \frac{f'(x^*)}{C}\right| = 0$ ，由此得到 $C = f'(x^*)$ 。然而在实际应用中，很难得到 $x^*$ 的值，所以通常取 $C = f'(x_0)$ ，其中 $x_0$ 是初始值。

引例 Sigmod

题目内容如下：

用牛顿迭代求解函数 $f(x)=\text{sig}(x) - 0.5$ 的根，其中 $\text{sig}(x)=\frac{e^{x}}{1 + e^{x}}$ 被称为 sigmoid 函数。

解答

由图像知， $x = 0$ 是 $f(x)$ 的根。
牛顿迭代格式为：
$x_{k + 1}=x_{k}-\frac{f(x_{k})}{f^{\prime}(x_{k})}=x_{k}-\frac{\frac{e^{x_{k}}}{1 + e^{x_{k}}}-0.5}{e^{x_{k}}\left(\frac{1}{1 + e^{x_{k}}}-\frac{e^{x_{k}}}{\left(1 + e^{x_{k}}\right)^{2}}\right)}=x_{k}-\frac{\frac{e^{x_{k}}}{1 + e^{x_{k}}}-0.5}{e^{x_{k}}\left(\frac{1 + e^{x_{k}}-e^{x_{k}}}{\left(1 + e^{x_{k}}\right)^{2}}\right)}=x_{k}-\frac{\frac{e^{x_{k}}}{1 + e^{x_{k}}}-0.5}{\frac{e^{x_{k}}}{\left(1 + e^{x_{k}}\right)^{2}}}=x_{k}-\left(\frac{e^{2x_{k}}-1}{2e^{x_k}}\right)$
选不同初值迭代结果如下：
初值 $x_{0}$ /k 0 1 2 3 4
$x_{0}=1.5$ 1.500 000 -0.629 280 0.042 362 -0.000 013 0.000 000
$x_{0}=2.5$ 2.500 000 -3.550 205 13.845 65 -515287.6 inf

初值 $x_{0}$ /k	0	1	2	3	4
$x_{0}=1.5$	1.500 000	-0.629 280	0.042 362	-0.000 013	0.000 000
$x_{0}=2.5$	2.500 000	-3.550 205	13.845 65	-515287.6	inf

平行弦法

对于方程 $f(x) = 0$ ，牛顿迭代公式为 $x_{k + 1}=x_{k}-\frac{f(x_{k})}{f^{\prime}(x_{k})}$ 。
- 平行弦法是将牛顿迭代公式中的 $f^{\prime}(x)$ 用常数 $C$ 代替，迭代公式变为x_{k + 1}=x_{k}-\frac{f(x_{k})}
- 在本题中 $f(x)=\text{sig}(x)-0.5=\frac{e^{x}}{1 + e^{x}}-0.5$ ， $f^{\prime}(x)=\frac{e^{x}}{\left(1 + e^{x}\right)^{2}}$ .

选择常数 $C$
- 一般取 $C = f^{\prime}(x_{0})$ ，这里我们需要分别对 $x_{0}=1.5$ 和 $x_{0}=2.5$ 进行计算。
- 当 $x_{0}=1.5$ $x_{0} = 1.5$ 时：
  - $f^{\prime}(1.5)=\frac{e^{1.5}}{\left(1 + e^{1.5}\right)^{2}}\approx0.22$ （保留两位小数）
  - 迭代公式为x_{k + 1}=x_{k}-\frac{\frac{e^{x_{k}}}{1 + e^{x_{k}}}-0.5}
- 当 $x_{0}=2.5$ $x_{0} = 2.5$ 时：
  - $f^{\prime}(2.5)=\frac{e^{2.5}}{\left(1 + e^{2.5}\right)^{2}}\approx0.08$ （保留两位小数）
  - 迭代公式为x_{k + 1}=x_{k}-\frac{\frac{e^{x_{k}}}{1 + e^{x_{k}}}-0.5}
迭代计算（以 $x_{0}=1.5$ 为例）
- $k = 0$ 时， $x_{0}=1.5$
- $k = 1$ $k = 1$ 时：
  - $x_{1}=x_{0}-\frac{\frac{e^{x_{0}}}{1 + e^{x_{0}}}-0.5}{0.22}=1.5-\frac{\frac{e^{1.5}}{1 + e^{1.5}}-0.5}{0.22}\approx1.5-\frac{0.31 - 0.5}{0.22}\approx1.5 + 0.86 = 2.36$
- $k = 2$ $k = 2$ 时：
  - x_{2}=x_{1}-\frac{\frac{e^{x_{1}}}{1 + e^{x_{1}}}-0.5}{0.22}=2.36-\frac{\frac{e^{2.36}}{1 + e^{2.36}}-0.5}
  - 继续计算下去，直到满足收敛条件。
迭代计算（以 $x_{0}=2.5$ 为例）
- $k = 0$ 时， $x_{0}=2.5$
- $k = 1$ $k = 1$ 时：
  - $x_{1}=x_{0}-\frac{\frac{e^{x_{0}}}{1 + e^{x_{0}}}-0.5}{0.08}=2.5-\frac{\frac{e^{2.5}}{1 + e^{2.5}}-0.5}{0.08}\approx2.5-\frac{0.92 - 0.5}{0.08}\approx2.5 - 5.25=- 2.75$
- $k = 2$ $k = 2$ 时：
  - x_{2}=x_{1}-\frac{\frac{e^{x_{1}}}{1 + e^{x_{1}}}-0.5}{0.08}=-2.75-\frac{\frac{e^{- 2.75}}{1 + e^{- 2.75}}-0.5}
  - 继续计算下去，直到满足收敛条件.

通过不断迭代，可以逐步逼近方程 $f(x)=\text{sig}(x)-0.5 = 0$ 的根.

# 牛顿下山法

图片内容介绍了一种改进的牛顿法，即在下山法保证函数值稳定下降的前提下，用牛顿法加快收敛速度，具体如下：

基本原理
- 先使用牛顿法计算 $\bar{x}_{k + 1}$ :
  $\tilde{x}_{k + 1}=x_{k}-\frac{f(x_{k})}{f^{\prime}(x_{k})}$
- 再对 $x_{k}$ 和 $\bar{x}_{k + 1}$ 加权平均得到新的x_
  $x_{k + 1}=\lambda\tilde{x}_{k + 1}+(1 - \lambda)x_{k}, \quad 0 < \lambda\leqslant1$
  $x_{k + 1}={x}_{k + 1}+\lambda \frac{f(x_{k})}{f^{\prime}(x_{k})}, \quad 0 < \lambda\leqslant1$
- 并且要满足 $\vert f(x_{k + 1})\vert<\vert f(x_{k})\vert$ ，这样能保证函数值在迭代过程中是下降的。
参数 $\lambda$ 的确定方法
- 开始时 $\lambda = 1$ ，如果不满足 $\vert f(x_{k + 1})\vert<\vert f(x_{k})\vert$ ，则逐次将 $\lambda$ 减半，直到 $\vert f(x_{k + 1})\vert<\vert f(x_{k})\vert$ 成立。
- 每轮都将 $\lambda$ 置 $1$ .

这种方法通过引入下山因子 $\lambda$ ，对牛顿法的迭代步长进行调整，改善了牛顿法对初值敏感的问题，提高了迭代收敛的可能性。

# 弦截法

图中介绍了弦截法的相关内容：

背景

牛顿法在计算 $f'(x_k)$ 时需要用到导函数的解析形式，并且计算量大。
简化牛顿法的收敛性为线性收敛。

弦截法的原理

弦截法使用差商近似 $f'(x_k)$ .
差商公式为：
$f[x_{k - 1}, x_k]=\frac{f(x_k)-f(x_{k - 1})}{x_k - x_{k - 1}}$

弦截法的迭代公式

弦截法的迭代公式为：
$x_{k + 1}=x_k-\frac{f(x_k)}{f[x_{k - 1}, x_k]}=x_k - f(x_k)\frac{x_k - x_{k - 1}}{f(x_k)-f(x_{k - 1})}$

弦截法通过差商近似导函数，避免了计算导函数的解析形式，从而减少了计算量。

# 非线性方程组数值求解

# 非线性方程组的牛顿迭代法

基本原理
- 对于非线性方程组 $\mathbf{F}(\mathbf{x})=\mathbf{0}$ ，其中 $\mathbf{x}=(x_1,x_2,\cdots,x_n)^T$ 是 $n$ 维向量， $\mathbf{F}=(F_1,F_2,\cdots,F_n)^T$ 是 $n$ 维向量函数.
- 牛顿迭代法的基本思想是将非线性方程组在某点附近线性化，然后求解线性方程组来得到下一个迭代点。
- 在点 $\mathbf{x}^{(k)}$ 处，对 $\mathbf{F}(\mathbf{x})$ 进行泰勒展开，忽略二阶及以上的高阶项，得到 $\mathbf{F}(\mathbf{x})\approx\mathbf{F}(\mathbf{x}^{(k)})+J(\mathbf{x}^{(k)})(\mathbf{x}-\mathbf{x}^{(k)})$ .，其中 $J(\mathbf{x}^{(k)})$ 是 $\mathbf{F}(\mathbf{x})$ 在 $\mathbf{x}^{(k)}$ 处的雅可比矩阵，其元素 $J_{ij}(\mathbf{x}^{(k)})=\frac{\partial F_i(\mathbf{x}^{(k)})}{\partial x_j}$ 。
- 令 $\mathbf{F}(\mathbf{x}) = 0$ ，则线性化后的方程为 $\mathbf{F}(\mathbf{x}^{(k)})+J(\mathbf{x}^{(k)})(\mathbf{x}-\mathbf{x}^{(k)})=0$ ，由此得到牛顿迭代公式. $\mathbf{x}^{(k + 1)}=\mathbf{x}^{(k)}-J^{-1}(\mathbf{x}^{(k)})\mathbf{F}(\mathbf{x}^{(k)})$ .
变换得： $\mathbf{F}(\mathbf{x}^{(k)})+\mathbf{F}'(\mathbf{x}^{(k)})\Delta \mathbf{x}^{(k)} = 0,\quad\mathbf{F'}=J$ ，其中 $k = 0,1,\cdots$

# 非线性方程组的不动点迭代

非线性方程组的一般形式

非线性方程组的一般形式为：
$\begin{cases} f_{1}(x_{1},x_{2},\cdots,x_{n}) = 0\\ f_{2}(x_{1},x_{2},\cdots,x_{n}) = 0\\ \cdots\\ f_{n}(x_{1},x_{2},\cdots,x_{n}) = 0 \end{cases}$
可以将其构造为如下的形式结构：
$G(X)=\begin{cases} x_{1}=\varphi_{1}(x_{1},x_{2},\cdots,x_{n})\\ x_{2}=\varphi_{2}(x_{1},x_{2},\cdots,x_{n})\\ \cdots\\ x_{n}=\varphi_{n}(x_{1},x_{2},\cdots,x_{n}) \end{cases}$
其中 $X = [x_{1},x_{2},\cdots,x_{n}]^{T}$ 。如果存在 $X^{*}$ ，使得 $X^{*}=G(X^{*})$ ，则称 $X^{*}$ 为上述形式的不动点。

不动点迭代公式

可以构造如下的迭代公式：
$\begin{cases} x_{1}^{(k + 1)}=\varphi_{1}(x_{1}^{(k)},x_{2}^{(k)},\cdots,x_{n}^{(k)})\\ x_{2}^{(k + 1)}=\varphi_{2}(x_{1}^{(k)},x_{2}^{(k)},\cdots,x_{n}^{(k)})\\ \cdots\\ x_{n}^{(k + 1)}=\varphi_{n}(x_{1}^{(k)},x_{2}^{(k)},\cdots,x_{n}^{(k)}) \end{cases}$

不动点迭代法的收敛性判定方法

对于函数 $G(X)$ 有不动点 $X^{*}$ ，且函数 $G(X)$ 在点 $X^{*}$ 处有一阶连续偏导数 $G^{\prime}(X^{*})$ ，如果 $G^{\prime}(X^{*})$ 的谱半径 $\rho(G^{\prime}(X^{*}))<1$ ，则不动点迭代收敛。
其中 $G^{\prime}(X)$ 的矩阵形式为：
$G^{\prime}(X)=\begin{bmatrix} \frac{\partial\varphi_{1}}{\partial x_{1}}&\cdots&\frac{\partial\varphi_{1}}{\partial x_{n}}\\ \cdots&\cdots&\cdots\\ \frac{\partial\varphi_{n}}{\partial x_{1}}&\cdots&\frac{\partial\varphi_{n}}{\partial x_{n}} \end{bmatrix}$

# 题目

用高斯消元法解线性方程组：
$\begin{cases}x_{1}+2x_{2}+3x_{3}=8\\2x_{1}+6x_{2}+11x_{3}=25\\3x_{1}+10x_{2}+21x_{3}=44\end{cases}$
$x_1 = 1, x_2 = 2, x_3 = 1$
用 LU 分解法求解方程组：
$\begin{bmatrix}1&2&3&4\\2&9&12&15\\3&26&41&49\\5&40&107&135\end{bmatrix}\begin{bmatrix}x_{1}\\x_{2}\\x_{3}\\x_{4}\end{bmatrix}=\begin{bmatrix}1\\2\\3\\4\end{bmatrix}$
1. 计算 $y$ 的值：计算可得 $\boldsymbol{y}=[1,0,0,-1]^T$
2. 求解方程组 $\bold{U}\boldsymbol{x}=\boldsymbol{y}$ :
\begin{bmatrix}1&2&3&4\\0&5&6&7\\0&0&8&9\\0&0&0&10\end{bmatrix}\begin{bmatrix}x_{1}\\x_{2}\\x_{3}\\x_{4}\end{bmatrix}=\begin{bmatrix}1\\0\\0\\-1\end
首先对系数矩阵 $A=\begin{bmatrix}1&2&3&4\\2&9&12&15\\3&26&41&49\\5&40&107&135\end{bmatrix}$ 进行 LU 分解。
- 设 $A = LU$ ，其中 $L$ 是单位下三角矩阵， $U$ 是上三角矩阵。
- 对于 $i = 1$ ， $u_{1j}=a_{1j}$ ， $l_{ij}=\frac{a_{ij}}{u_{11}}$ （ $i>1$ ）。
- 对于 $i>1$ ， $u_{ij}=a_{ij}-\sum_{k=1}^{i - 1}l_{ik}u_{kj}$ ， $l_{ij}=\frac{1}{u_{ii}}(a_{ij}-\sum_{k=1}^{i - 1}l_{ik}u_{kj})$ （ $j<i$ ）。
- 计算可得：
  $u_{11}=1$ ， $u_{12}=2$ ， $u_{13}=3$ ， $u_{14}=4$ 。
  $l_{21}=\frac{2}{1}=2$ ， $u_{22}=9 - 2\times2 = 5$ ， $u_{23}=12 - 2\times3 = 6$ ， $u_{24}=15 - 2\times4 = 7$ 。
  $l_{31}=\frac{3}{1}=3$ ， $l_{32}=\frac{26 - 3\times2}{5}=\frac{20}{5}=4$ ， $u_{33}=41 - 3\times3 - 4\times6 = 8$ ， $u_{34}=49 - 3\times4 - 4\times7 = 9$ 。
  $l_{41}=\frac{5}{1}=5$ ， $l_{42}=\frac{40 - 5\times2}{5}=6$ ， $l_{43}=\frac{107 - 5\times3 - 6\times6}{8}=\frac{107 - 15 - 36}{8}=\frac{56}{8}=7$ ， $u_{44}=135 - 5\times4 - 6\times7 - 7\times9 = 10$ 。
- 所以 $L=\begin{bmatrix}1&0&0&0\\2&1&0&0\\3&4&1&0\\5&6&7&1\end{bmatrix}$ ， $U=\begin{bmatrix}1&2&3&4\\0&5&6&7\\0&0&8&9\\0&0&0&10\end{bmatrix}$ 。
然后求解方程组 $Ly = b$ ，其中 $b=\begin{bmatrix}1\\2\\3\\4\end{bmatrix}$ 。
$y_1 = 1$ 。
$y_2 = 2 - 2y_1 = 2 - 2\times1 = 0$ 。
$y_3 = 3 - 3y_1 - 4y_2 = 3 - 3\times1 - 4\times0 = 0$ 。
$y_4 = 4 - 5y_1 - 6y_2 - 7y_3 = 4 - 5\times1 - 6\times0 - 7\times0 = -1$ 。
最后求解方程组 $Ux = y$ ，其中 $y=\begin{bmatrix}1\\0\\0\\-1\end{bmatrix}$ 。
$x_4=\frac{-1}{10}=-\frac{1}{10}$ 。
$x_3=\frac{y_3 - 9x_4}{8}=\frac{0 - 9\times(-\frac{1}{10})}{8}=\frac{\frac{9}{10}}{8}=\frac{9}{80}$ 。
$x_2=\frac{y_2 - 6x_3 - 7x_4}{5}=\frac{0 - 6\times\frac{9}{80}-7\times(-\frac{1}{10})}{5}=\frac{-\frac{27}{40}+\frac{7}{10}}{5}=\frac{-\frac{27}{40}+\frac{28}{40}}{5}=\frac{1}{200}$ 。
$x_1=y_1 - 2x_2 - 3x_3 - 4x_4=1 - 2\times\frac{1}{200}-3\times\frac{9}{80}-4\times(-\frac{1}{10})=1-\frac{1}{100}-\frac{27}{80}+\frac{4}{10}=\frac{800 - 8 - 270 + 320}{800}=\frac{421}{400}$ 。
综上，方程组的解为 $x=\begin{bmatrix}\frac{81}{80}\\\frac{1}{40}\\\frac{9}{80}\\-\frac{1}{10}\end{bmatrix}$ 。
使用平方根分解矩阵
$\begin{bmatrix}4&12&-16\\12&37&-43\\-16&-43&98\end{bmatrix}$
\begin{bmatrix}2&6&-8\\6&1&5\\-8&5&3\end
1. 首先求左上对角第一个元素 $l_{11}$ ：
  $l_{11}=\sqrt{a_{11}}=\sqrt{4}=2$ .
2. 接着求第一行的其他元素 $l_{12}$ 和 $l_{13}$ ：
  $l_{12}=\frac{a_{12}}{l_{11}}=\frac{12}{2}=6$ .
  $l_{13}=\frac{a_{13}}{l_{11}}=\frac{-16}{2}=-8$ .
3. 根据对称性可得第一列的元素 $l_{21}$ 和 $l_{31}$ ：
  由于 $l_{21}=l_{12}=6$ .
  $l_{31}=l_{13}=-8$ .
4. 然后求第二个对角元素 $l_{22}$ ：
  $l_{22}=\sqrt{a_{22}-\sum_{k = 1}^{1}l_{2k}^{2}}=\sqrt{37-l_{21}^{2}}=\sqrt{37 - 6^{2}}=\sqrt{37 - 36}=1$ .
5. 接着求第二行的其他元素 $l_{23}$ ：
  $l_{23}=\frac{1}{l_{22}}(a_{23}-\sum_{k = 1}^{1}l_{2k}l_{3k})=\frac{1}{1}\left(-43-(6\times(-8))\right)=-43 + 48 = 5$ .
6. 根据对称性可得第三列的对应元素 $l_{32}$ ：
  $l_{32}=l_{23}=5$ .
7. 最后求第三个对角元素 $l_{33}$ ：
  $l_{33}=\sqrt{a_{33}-\sum_{k = 1}^{2}l_{3k}^{2}}=\sqrt{98-l_{31}^{2}-l_{32}^{2}}=\sqrt{98 - (-8)^{2}-5^{2}}=\sqrt{98 - 64 - 25}=\sqrt{9}$ ，所以 $l_{33}=3$ .
综上，分解后的下三角矩阵 $L=\begin{bmatrix}2&0&0\\6&1&0\\-8&5&3\end{bmatrix}$ .
题目：对矩阵 $A=\begin{bmatrix}4&12&-16\\12&37&-43\\-16&-43&98\end{bmatrix}$ 进行 $LDL^T$ 分解。
借助杜利特尔分解，有
\begin{align*} A&=\begin{bmatrix}1&0&0\\l_{21}&1&0\\l_{31}&l_{32}&1\end{bmatrix}\begin{bmatrix}d_{1}&d_{1}l_{21}&d_{1}l_{31}\\0&d_{2}&d_{2}l_{32}\\0&0&d_{3}\end{bmatrix}\\ &=\begin{bmatrix}1&0&0\\3&1&0\\-4&5&1\end{bmatrix}\begin{bmatrix}4&4×3&4×(-4)\\0&d_{2}&d_{2}l_{32}\\0&0&d_{3}\end{bmatrix}\\ &=\begin{bmatrix}1&0&0\\3&1&0\\-4&5&1\end{bmatrix}\begin{bmatrix}4&12&-16\\0&1&1×5\\0&0&9\end{bmatrix}\\ &=\begin{bmatrix}1&0&0\\3&1&0\\-4&5&1\end{bmatrix}\begin{bmatrix}4&12&-16\\0&1&5\\0&0&9\end{bmatrix} \end{align*}
所以有 $L=\begin{bmatrix}1&0&0\\3&1&0\\-4&5&1\end{bmatrix}$ ， $D=\begin{bmatrix}4&0&0\\0&1&0\\0&0&9\end{bmatrix}$ .
计算下面矩阵的矩阵二范数 (谱范数)
$A=\begin{bmatrix}1 & 2\\3 & 4\end{bmatrix}$ .
1. 计算矩阵 $A$ 的转置 $A^T=\begin{bmatrix}1 & 3\\2 & 4\end{bmatrix}$ 。
2. 计算 $A^T A=\begin{bmatrix}1 & 3\\2 & 4\end{bmatrix}\begin{bmatrix}1 & 2\\3 & 4\end{bmatrix}=\begin{bmatrix}10 & 14\\14 & 20\end{bmatrix}$ 。
3. 求 $A^T A$ 的特征值。
  特征方程为 $\vert A^T A-\lambda I\vert = 0$ ，即 $\begin{vmatrix}10-\lambda & 14\\14 & 20-\lambda\end{vmatrix}=0$ 。
  - 展开可得 $(10-\lambda)(20-\lambda)-196=0$ ，即 $\lambda^2 - 30\lambda + 200 - 196 = 0$ ， $\lambda^2 - 30\lambda + 4 = 0$ 。
  - 求解这个二次方程，根据求根公式 $\lambda=\frac{30\pm\sqrt{30^2 - 4\times4}}{2}=\frac{30\pm\sqrt{900 - 16}}{2}=\frac{30\pm\sqrt{884}}{2}=15\pm\sqrt{221}$ 。
4. 矩阵 $A$ 的二范数 $\vert\vert A\vert\vert_2=\sqrt{\lambda_{max}(A^T A)}=\sqrt{15+\sqrt{221}}$ .
  所以，矩阵 $A=\begin{bmatrix}1 & 2\\3 & 4\end{bmatrix}$ 的二范数约为 $\sqrt{15+\sqrt{221}}$ 。
求解矩阵 $A$ 的谱范数。矩阵 $A=\begin{bmatrix}2&1\\1&2\end{bmatrix}$ .
1. 求解特征方程 $\vert A-\lambda I\vert = 0$ ，即 $\begin{vmatrix}2-\lambda&1\\1&2-\lambda\end{vmatrix}=0$ .
  展开可得 $(2-\lambda)^2 - 1 = 0$ ，即 $4 - 4\lambda+\lambda^2 - 1 = 0$ ， $\lambda^2 - 4\lambda + 3 = 0$ .
  因式分解为 $(\lambda - 1)(\lambda - 3)=0$ ，解得特征值 $\lambda_1 = 1$ ， $\lambda_2 = 3$ .
2. 特征值的模分别为 $\vert\lambda_1\vert = 1$ ， $\vert\lambda_2\vert = 3$ .
3. 所以矩阵 $A$ 的谱半径 $\rho(A)=\max\{1,3\}=3$ .

题目：求方程 $f(x)=x^3 - x - 1 = 0$ 在区间 $[1.0, 1.5]$ 内的一个实根，要求准确到小数点后第 2 位。

二分法求解过程：(可以通过精度判断确认最大迭代次数)
迭代次数区间 $[a,b]$ 中点 $c=(a + b)/2$ $f(c)$ 判断
1 [ $1.0,1.5$ ] $1.25$ $f(1.25)=1.25^3 - 1.25 - 1\approx-0.297$ 根在 $[1.25,1.5]$ 内，令 $a = 1.25$
2 [ $1.25,1.5$ ] $1.375$ $f(1.375)=1.375^3 - 1.375 - 1\approx0.225$ 根在 $[1.25,1.375]$ 内，令 $b = 1.375$
3 [ $1.25,1.375$ ] $1.3125$ $f(1.3125)=1.3125^3 - 1.3125 - 1\approx-0.051$ 根在 $[1.3125,1.375]$ 内，令 $a = 1.3125$
4 [ $1.3125,1.375$ ] $1.34375$ $f(1.34375)=1.34375^3 - 1.34375 - 1\approx0.083$ 根在 $[1.3125,1.34375]$ 内，令 $b = 1.34375$
5 [ $1.3125,1.34375$ ] $1.328125$ $f(1.328125)=1.328125^3 - 1.328125 - 1\approx0.014$ 根在 $[1.3125,1.328125]$ 内，令 $b = 1.328125$
6 [ $1.3125,1.328125$ ] $1.3203125$ $f(1.3203125)=1.3203125^3 - 1.3203125 - 1\approx-0.019$ 根在 $[1.3203125,1.328125]$ 内，令 $a = 1.3203125$
此时区间长度为 $1.328125 - 1.3203125 = 0.0078125 < 0.5\times10^{-2}$ ，满足精度要求。
所以方程的根约为 $1.32$ （精确到小数点后第 2 位）。

题目提取：
为求方程 $x^3 - x^2 - 1 = 0$ 在 $x_0 = 1.5$ 附近的一个根。设将方程改写成下列等价形式，并建立相应的迭代公式：
1. $x = 1 + 1/x^{2}$ ，迭代公式 $x_{k + 1}=1 + 1/x_{k}^{2}$ 。
2. $x^{3}=1 + x^{2}$ ，迭代公式 $x_{k + 1}=\sqrt[3]{1 + x_{k}^{2}}$ 。
3. $x^{2}=\frac{1}{x - 1}$ ，迭代公式 $x_{k + 1}=1/\sqrt{x_{k}-1}$ 。
试分析每种迭代公式的收敛性，并选取一种公式求出具有四位有效数字的近似根。
解答过程：
考虑 $x_0 = 1.5$ 的邻域 $[1.3,1.6]$ 。
1. 对于迭代公式 $x_{k + 1}=1 + 1/x_{k}^{2}$ ：
  - 当 $x\in[1.3,1.6]$ 时， $\varphi(x)=1 + 1/x^{2}\in[1.3,1.6]$ 。
  - 计算 $\vert\varphi'(x)\vert=\vert-\frac{2}{x^{3}}\vert\leq\frac{2}{1.3^{2}}\approx0.910=L<1$ ，故该迭代在 $[1.3,1.6]$ 上整体收敛。
2. 对于迭代公式 $x_{k + 1}=\sqrt[3]{1 + x_{k}^{2}}$ ：
  - 当 $x\in[1.3,1.6]$ 时， $\varphi(x)=\sqrt[3]{1 + x^{2}}\in[1.3,1.6]$ 。
  - 计算 $\vert\varphi'(x)\vert=\frac{2}{3}\vert\frac{x}{(1 + x^{2})^{2/3}}\vert<\frac{2}{3}\frac{1.6}{(1 + 1.3^{2})^{2/3}}\approx0.522=L<1$ ，故该迭代在 $[1.3,1.6]$ 上整体收敛。
3. 对于迭代公式 $x_{k + 1}=1/\sqrt{x_{k}-1}$ ：
  - 当 $x\in[1.3,1.6]$ 时， $\varphi(x)=\frac{1}{\sqrt{x - 1}}\in[1.29,1.83]\nsubseteq[1.3,1.6]$ 。
  - 计算 $\vert\varphi'(x)\vert=\vert\frac{-1}{2(x - 1)^{3/2}}\vert>\frac{1}{2(1.6 - 1)}>1$ ，故该迭代不一定收敛。
由于迭代公式 $x_{k + 1}=\sqrt[3]{1 + x_{k}^{2}}$ 中的 $L$ 较小，故取该迭代公式计算。
要具有四位有效数字，只需 $\vert x_{k}-x^{*}\vert\leq\frac{L}{1 - L}\vert x_{k}-x_{k - 1}\vert<0.5\times10^{-3}$ ，即 $\vert x_{k}-x_{k - 1}\vert<\frac{1 - L}{L}\times0.5\times10^{-3}<0.5\times10^{-3}$ .
取 $x_0 = 1.5$ 计算：
k \boldsymbol
1 1.481248034
2 1.472705730
3 1.468817314
4 1.467047973
5 1.466243010
6 1.465876820
由于 $\vert x_6 - x_5\vert<0.5\times10^{-3}$ ，故可取 $x^*\approx x_6 = 1.466$ .
斯特芬森迭代法求解方程 $x^3 - x - 1 = 0$
1. 首先将方程转化为 $x=\sqrt[3]{x + 1}$ ，即 $\varphi(x)=\sqrt[3]{x + 1}$ 。
2. 取初始值 $x_0 = 1.5$ 。
3. 进行斯特芬森迭代：
  - 先计算 $y_n=\varphi(x_n)$ ， $z_n=\varphi(y_n)$ 。
  - 然后根据斯特芬森迭代公式 $x_{n + 1}=x_n-\frac{(y_n - x_n)^2}{z_n - 2y_n + x_n}$ 进行迭代。
具体计算过程如下：
当 $n = 0$ 时：
- $x_0 = 1.5$ 。
- $y_0=\varphi(x_0)=\sqrt[3]{1.5 + 1}\approx1.35721$ 。
- $z_0=\varphi(y_0)=\sqrt[3]{1.35721 + 1}\approx1.33086$ 。
- $x_1=x_0-\frac{(y_0 - x_0)^2}{z_0 - 2y_0 + x_0}=1.5-\frac{(1.35721 - 1.5)^2}{1.33086 - 2\times1.35721 + 1.5}\approx1.34711$ 。
当 $n = 1$ 时：
- $x_1\approx1.34711$ 。
- $y_1=\varphi(x_1)=\sqrt[3]{1.34711 + 1}\approx1.32794$ 。
- $z_1=\varphi(y_1)=\sqrt[3]{1.32794 + 1}\approx1.32472$ 。
- $x_2=x_1-\frac{(y_1 - x_1)^2}{z_1 - 2y_1 + x_1}=1.34711-\frac{(1.32794 - 1.34711)^2}{1.32472 - 2\times1.32794 + 1.34711}\approx1.32588$ 。
继续进行迭代，直到满足所需的精度要求。
通过斯特芬森迭代法，可以逐步逼近方程 $x^3 - x - 1 = 0$ 的根。
例：根据牛顿法写出求解 $\sqrt{a}$ （ $a > 0$ ）的计算公式，并计算 $\sqrt{115}$ 。
解：
设 $f(x)=x^{2}-a$ ，求 $\sqrt{a}$ 即计算 $f(x)$ 的根。
根据牛顿迭代公式可得：
$x_{k + 1}=x_{k}-\frac{f(x_{k})}{f^{\prime}(x_{k})}=x_{k}-\frac{x_{k}^{2}-a}{2x_{k}}=\frac{1}{2}\left(x_{k}+\frac{a}{x_{k}}\right)$
令 $a = 115$ ，有以下迭代结果：
$k$ 0 1 2 3 4
x_ 10 10.750 000 10.723 837 10.723 805 10.723 805
题目：用牛顿法求解方程组：
$\begin{cases} x_{1}^{2}-10x_{1}+x_{2}^{2}+8 = 0\\ x_{1}x_{2}^{2}+x_{1}-10x_{2}+8 = 0 \end{cases}$
解答
选择初始值 $x^{(0)}=(0,0)^{T}$ ，解线性方程组 $F^{\prime}(x^{(0)})\Delta x^{(0)}=-F(x^{(0)})$ ，即
$\begin{bmatrix} -10&0\\ 1&-10 \end{bmatrix}\begin{bmatrix} \Delta x_{1}^{(0)}\\ \Delta x_{2}^{(0)} \end{bmatrix}=\begin{bmatrix} -8\\ -8 \end{bmatrix}$
解得 $\Delta x^{(0)}=(0.8,0.88)^{T}$ ，然后 $x^{(1)}=x^{(0)}+\Delta x^{(0)}$ 。
$k$ x_{1}^ x_{2}^
0 0 0
1 0.80 0.88
2 0.9917872 0.9917117
3 0.9999752 0.9999685
4 1.0000000 1.0000000

迭代次数	区间 $[a,b]$	中点 $c=(a + b)/2$	$f(c)$	判断
1	[ $1.0,1.5$ ]	$1.25$	$f(1.25)=1.25^3 - 1.25 - 1\approx-0.297$	根在 $[1.25,1.5]$ 内，令 $a = 1.25$
2	[ $1.25,1.5$ ]	$1.375$	$f(1.375)=1.375^3 - 1.375 - 1\approx0.225$	根在 $[1.25,1.375]$ 内，令 $b = 1.375$
3	[ $1.25,1.375$ ]	$1.3125$	$f(1.3125)=1.3125^3 - 1.3125 - 1\approx-0.051$	根在 $[1.3125,1.375]$ 内，令 $a = 1.3125$
4	[ $1.3125,1.375$ ]	$1.34375$	$f(1.34375)=1.34375^3 - 1.34375 - 1\approx0.083$	根在 $[1.3125,1.34375]$ 内，令 $b = 1.34375$
5	[ $1.3125,1.34375$ ]	$1.328125$	$f(1.328125)=1.328125^3 - 1.328125 - 1\approx0.014$	根在 $[1.3125,1.328125]$ 内，令 $b = 1.328125$
6	[ $1.3125,1.328125$ ]	$1.3203125$	$f(1.3203125)=1.3203125^3 - 1.3203125 - 1\approx-0.019$	根在 $[1.3203125,1.328125]$ 内，令 $a = 1.3203125$

k	\boldsymbol
1	1.481248034
2	1.472705730
3	1.468817314
4	1.467047973
5	1.466243010
6	1.465876820

$k$	0	1	2	3	4
x_	10	10.750 000	10.723 837	10.723 805	10.723 805

$k$	x_{1}^	x_{2}^
0	0	0
1	0.80	0.88
2	0.9917872	0.9917117
3	0.9999752	0.9999685
4	1.0000000	1.0000000

Notes

# 数值计算下

# 线性方程组的直接解法

# 高斯消元法

# 三角分解

# LU 分解

# 平方根法 - 乔列斯基分解法

# 改进的平方根法

# 平方根与改进的平方根法小结

# 追赶法

# 向量范数与矩阵范数

# 线性方程组的迭代解法

# 雅可比（Jacobi）迭代法

# 高斯 - 塞得尔 (Gauss-Seidel) 迭代法

# 迭代法基本定理

# 超松弛（SOR）迭代法

# 非线性方程与方程组的数值解法

# 二分法

# 不动点迭代及其收敛性

# 不动点加速迭代

# 牛顿迭代法

# 牛顿迭代法原理

# 简化牛顿法

# 牛顿下山法

# 弦截法

# 非线性方程组数值求解

# 非线性方程组的牛顿迭代法

# 非线性方程组的不动点迭代

# 题目

异构计算课程笔记

未命名