矩阵分析与应用-1.1-矩阵的基本运算
文章目录
- 前言
- 一、矩阵与向量
- 1. 式中矩阵与向量
- 2. 向量分类
- 3. 常见的矩阵和向量
- 二、矩阵的基本运算
- 1. 矩阵转置和共轭
- 2. 矩阵加法
- 3. 矩阵和标量相乘
- 4. 矩阵和向量相乘
- 5. 矩阵和矩阵相乘
- 6. 运算规则
- 7. 逆矩阵
- 8. 其他
- 三、向量的线性无关性与非奇异矩阵
- 1. 线性无关性
- 2. 非奇异矩阵
- 四、初等行变换与阶梯型矩阵
- 1. 初等行变换
- 2. 阶梯型矩阵
- 五、基于初等行变换的矩阵方程求解
前言
本文学习过程来源是《矩阵分析与应用-张贤达》一书. 可以通过 z-lib 下载.
一、矩阵与向量
1. 式中矩阵与向量
在科学和工程中, 面对的是 m×nm \times nm×n 线性方程组.
{a11x1+a12x2+⋯+a1nxn=b1a21x1+a22x2+⋯+a2nxn=b2⋯am1x1+am2x2+⋯+amnxn=bm(1)\left\{ \begin{array}{c} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=b_1 \\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=b_2 \\ \cdots \\ a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n=b_m \end{array} \right. \tag{1} ⎩⎪⎪⎨⎪⎪⎧a11x1+a12x2+⋯+a1nxn=b1a21x1+a22x2+⋯+a2nxn=b2⋯am1x1+am2x2+⋯+amnxn=bm(1)
再简单通俗一点就是解 nnn 元一次方程. 引入矩阵向量之后就可以化简为以下式子:
Ax=b(2)Ax = b \tag{2} Ax=b(2)
式子
A=[a11a12⋯a1na21a22⋯a2n⋮⋮⋮⋮am1am2⋯amn](3)A = \begin{bmatrix} a_{11}& a_{12}& \cdots& a_{1n} \\ a_{21}& a_{22}& \cdots& a_{2n} \\ \vdots& \vdots& \vdots& \vdots \\ a_{m1}& a_{m2}& \cdots& a_{mn} \end{bmatrix} \tag{3} A=⎣⎢⎢⎢⎡a11a21⋮am1a12a22⋮am2⋯⋯⋮⋯a1na2n⋮amn⎦⎥⎥⎥⎤(3)
被称为一个 m×nm \times nm×n 的矩阵, 其中数字可以是复数也可以是实数.
而 (2) 中剩余两个变量为:
x=[x1x2⋮xm],b=[b1b2⋮bn](4)x = \begin{bmatrix} x_1\\ x_2\\ \vdots\\ x_m\\ \end{bmatrix}, \quad b = \begin{bmatrix} b_1\\ b_2\\ \vdots\\ b_n\\ \end{bmatrix} \tag{4} x=⎣⎢⎢⎢⎡x1x2⋮xm⎦⎥⎥⎥⎤,b=⎣⎢⎢⎢⎡b1b2⋮bn⎦⎥⎥⎥⎤(4)
分别是 m×1m \times 1m×1 和 n×1n \times 1n×1 的向量, 其中的数字可以是复数也可以是实数. 因为其只有一列所以也叫做列向量.
同理, 如果只有一行, 就可以称之为行向量, 如下面式子所示.
a=[a1,a2,⋯,an](5)a = [a1,a2,\cdots,a_n] \tag{5} a=[a1,a2,⋯,an](5)
代表了一个 1×n1 \times n1×n 的行向量.
2. 向量分类
矩阵可以是线性系统、滤波器、无线信道等的符号表示. 因为具有二维性, 类似表格所以才能这样表示.
而向量在科学和工程中常被分为三种:
速度、加速度和位移这样的有值和方向的物理向量.
用于表示有向线段的几何向量. 例如 起点 AAA 点到 终点 BBB 点的有向线段可以用向量 v=AB→v = \overrightarrow{AB}v=AB 表示.
同 2 中, 若起点坐标 A=(a1,a2)A = (a_1,a_2)A=(a1,a2), 终点坐标 B=(b1,b2)B = (b_1,b_2)B=(b1,b2). 那么此时的向量 v=[b1−a1b2−a2]v=\begin{bmatrix} b_1 - a_1 \\ b_2 - a_2 \end{bmatrix}v=[b1−a1b2−a2] 就从几何向量变成了代数向量, 因为几何上的点有了确定的数值.
以此类推, 二维空间的向量就可以推广到三维空间甚至更高维度的空间并可以使用代数表示.
根据向量中的元素不同也有不同的分类:
常数向量:向量中元素全为实数或者复数. 如 a=[1,5,4]Ta=[1,5,4]^\mathrm{T}a=[1,5,4]T, 其中 T\mathrm{T}T 表示转置, 相当于旋转一下矩阵或者向量.
函数向量: 向量中元素包含函数值. 如 x=[1,x2,…,xn]Tx=[1,x^2,\dots,x^n]^\mathrm{T}x=[1,x2,…,xn]T.
随机向量: 向量中元素为随机变量或者随机过程. 如 x(n)=[x1(n),x2(n),…,xm(n)]Tx(n)=[x_1(n),x_2(n),\dots,x_m(n)]^\mathrm{T}x(n)=[x1(n),x2(n),…,xm(n)]T. 其中 x1(n),x2(n),…,xm(n)x_1(n),x_2(n),\dots,x_m(n)x1(n),x2(n),…,xm(n) 是 mmm 个随机变量或随机过程.
3. 常见的矩阵和向量
对角矩阵: 在一个 n×nn \times nn×n 的矩阵中, 如果矩阵主对角线以外的元素全为 0 , 则被称为对角矩阵. 如下所示.
A=[a110⋯00a22⋯000a330⋮⋮⋮⋮00⋯ann](6)A = \begin{bmatrix} a_{11}& 0& \cdots& 0 \\ 0& a_{22}& \cdots& 0 \\ 0& 0& a_{33}& 0 \\ \vdots& \vdots& \vdots& \vdots \\ 0& 0& \cdots& a_{nn} \end{bmatrix} \tag{6} A=⎣⎢⎢⎢⎢⎢⎡a1100⋮00a220⋮0⋯⋯a33⋮⋯000⋮ann⎦⎥⎥⎥⎥⎥⎤(6)
a11a22a33…anna_{11} \ a_{22} \ a_{33} \dots \ a_{nn}a11 a22 a33… ann 所在的这一条线就叫做主对角线. 如果它们全为 1, 则矩阵 AAA 就叫做单位矩阵, 用符号 In×nI_{n \times n}In×n 表示.
另外, 在大小为 m×nm \times nm×n 的矩阵中, 如果全部元素为 0, 该矩阵就被称为零矩阵, 记做 Om×nO_{m \times n}Om×n.
可以想到, 向量无非是矩阵中的一行或者一列, 自然就可以用向量来表示矩阵. 除了这种方式, 矩阵同样可以用矩阵表示, 这样的做法称之为分块矩阵. 分块矩阵如下所示.
A=[Aij]=[A11A12⋯A1nA21A22⋯A2n⋮⋮⋮⋮Am1Am2⋯Amn](7)A=[A_{ij}]=\begin{bmatrix} A_{11}& A_{12}& \cdots& A_{1n} \\ A_{21}& A_{22}& \cdots& A_{2n} \\ \vdots& \vdots& \vdots& \vdots \\ A_{m1}& A_{m2}& \cdots& A_{mn} \end{bmatrix} \tag{7} A=[Aij]=⎣⎢⎢⎢⎡A11A21⋮Am1A12A22⋮Am2⋯⋯⋮⋯A1nA2n⋮Amn⎦⎥⎥⎥⎤(7)
二、矩阵的基本运算
1. 矩阵转置和共轭
若 A=[aij]A=[a_{ij}]A=[aij] 是一个 m×nm \times nm×n 矩阵, 则 AAA 的转置记作 ATA^\mathrm{T}AT, 是一个 n×mn \times mn×m 矩阵, 定义为 [AT]ij=aji[A^\mathrm{T}]_{ij} = a_{ji}[AT]ij=aji.
矩阵 AAA 的复数共轭 A∗A^*A∗ 定义为 [A∗]ij=aij∗[A^*]_{ij} = a^*_{ij}[A∗]ij=aij∗. 复共轭转置记作 AHA^\mathrm{H}AH, 定义为
AH=[a11∗a21∗⋯am1∗a12∗a22∗⋯am2∗⋮⋮⋮⋮a1n∗a2n∗⋯amn∗](8)A^\mathrm{H}=\begin{bmatrix} a^*_{11}& a^*_{21}& \cdots& a^*_{m1} \\ a^*_{12}& a^*_{22}& \cdots& a^*_{m2} \\ \vdots& \vdots& \vdots& \vdots \\ a^*_{1n}& a^*_{2n}& \cdots& a^*_{mn} \tag{8} \end{bmatrix} AH=⎣⎢⎢⎢⎡a11∗a12∗⋮a1n∗a21∗a22∗⋮a2n∗⋯⋯⋮⋯am1∗am2∗⋮amn∗⎦⎥⎥⎥⎤(8)
共轭转置又叫 HermitianHermitianHermitian 伴随、HermitianHermitianHermitian 转置或 HermitianHermitianHermitian 共轭. 满足 AH=AA^\mathrm{H} = AAH=A 的正方复矩阵称为 HermitianHermitianHermitian 矩阵或者共轭对称矩阵.
共轭转置和转置之间存在以下关系:
AH=(A∗)T=(AT)∗(9)A^\mathrm{H} = (A^*)^\mathrm{T} = (A^\mathrm{T})^* \tag{9} AH=(A∗)T=(AT)∗(9)
一个 m×nm \times nm×n 分块矩阵 A 的共轭转置是一个由 AAA 的元素的共轭转置组成的 n×mn \times mn×m 分块矩阵.
AH=[A11HA21H⋯Am1HA12HA22H⋯Am2H⋮⋮⋮⋮A1nHA2nH⋯AmnH]A^\mathrm{H}=\begin{bmatrix} A^\mathrm{H}_{11}& A^\mathrm{H}_{21}& \cdots& A^\mathrm{H}_{m1} \\ A^\mathrm{H}_{12}& A^\mathrm{H}_{22}& \cdots& A^\mathrm{H}_{m2} \\ \vdots& \vdots& \vdots& \vdots \\ A^\mathrm{H}_{1n}& A^\mathrm{H}_{2n}& \cdots& A^\mathrm{H}_{mn} \end{bmatrix} AH=⎣⎢⎢⎢⎡A11HA12H⋮A1nHA21HA22H⋮A2nH⋯⋯⋮⋯Am1HAm2H⋮AmnH⎦⎥⎥⎥⎤
列向量的转置结果为行向量, 行向量的转置结果为列向量.
!!!这个地方需要特别注意的是 A∗A^*A∗ 在之前学的时候是表示的伴随矩阵, 而不是这个地方的共轭转置矩阵, 具体求法在这个部分没有体现, 需要学习线性代数的酉空间了解.
2. 矩阵加法
两个 m×nm \times nm×n 矩阵 A=[aij]A = [a_{ij}]A=[aij] 和 B=[bij]B = [b_{ij}]B=[bij] 之和记作 A+BA+BA+B 定义为:
A+B=[A+B]ij=aij+bij(10)A+B = [A+B]_{ij} = a_{ij} + b_{ij} \tag{10} A+B=[A+B]ij=aij+bij(10)
3. 矩阵和标量相乘
令 A=[aij]A = [a_{ij}]A=[aij] 是一个 m×nm \times nm×n 矩阵, 且 α\alphaα 是一个标量. 乘积 αA\alpha AαA 是一个 m×nm \times nm×n 矩阵, 定义为 [αA]ij=αaij[\alpha A]_{ij} = \alpha a_{ij}[αA]ij=αaij
4. 矩阵和向量相乘
m×nm \times nm×n 矩阵 A=[aij]A=[a_{ij}]A=[aij] 与 r×1r \times 1r×1 向量 x=[x1,x2,…,xr]Tx=[x_1,x_2,\dots,x_r]^\mathrm{T}x=[x1,x2,…,xr]T 的乘积 AxAxAx 只有当 n=rn = rn=r 时才存在, 它是一个 m×1m \times 1m×1 向量, 定义为:
[Ax]i=∑j=1naijxj,i=1,2,…,m(11)[Ax]_i = \sum_{j=1}^{n}a_{ij}x_{j}, \quad i=1,2,\dots,m \tag{11} [Ax]i=j=1∑naijxj,i=1,2,…,m(11)
5. 矩阵和矩阵相乘
m×nm \times nm×n 矩阵 A=[aij]A=[a_{ij}]A=[aij] 与 r×sr \times sr×s 矩阵 B=[bij]B=[b_{ij}]B=[bij] 的乘积 ABABAB 只有当 n=rn=rn=r 时才存在, 它是一个 m×nm \times nm×n 矩阵, 定义为:
[AB]ij=∑k=1naikbkj,i=1,2,…,m;j=1,2,…,s;(12)[AB]_{ij} = \sum_{k=1}^{n}a_{ik}b_{kj}, \quad i=1,2,\dots,m;\quad j=1,2,\dots,s; \tag{12} [AB]ij=k=1∑naikbkj,i=1,2,…,m;j=1,2,…,s;(12)
6. 运算规则
和实数运算类似, 矩阵运算也有一些与之相通的规则.
加法交换律: A+B=B+AA + B = B + AA+B=B+A
加法结合律: (A+B)+C=A+(B+C)(A + B) + C = A + (B + C)(A+B)+C=A+(B+C)
除了加法, 矩阵还有乘法. 看矩阵是否能够分配交换结合只需要注意一点. 例如矩阵 AijA_{ij}Aij 和 矩阵 BmnB_{mn}Bmn 相乘, 在之前就说过必须要 j=mj = mj=m 才能相乘. 那么交换分配也要满足这个式子, 即前个矩阵的列数与后一个矩阵的行数一定要相等. 那么我们就有乘法相关运算规则.
乘法结合律: A(BC)=(AB)CA(BC) = (AB)CA(BC)=(AB)C
乘法左分配律: (A+B)C=AC+BC(A+B)C = AC + BC(A+B)C=AC+BC
乘法右分配律: A(B+C)=AB+ACA(B+C) = AB + ACA(B+C)=AB+AC
证明方法也很简单, 就是分别算出等式左右的式子, 然后再进行比较.
7. 逆矩阵
什么叫逆矩阵?
令 AAA 是一个 n×nn \times nn×n 矩阵. 要想使 AAA 可逆, 若可以找到一个 n×nn \times nn×n 矩阵 A−1A^{-1}A−1 满足 AA−1=A−1A=IAA^{-1} = A^{-1}A = IAA−1=A−1A=I, 则称 A−1A^{-1}A−1 是矩阵 AAA 的逆矩阵.
逆矩阵和共轭、转置、共轭转置之间关系
分配律:
(A+B)∗=A∗+B∗(A+B)T=AT+BT(A+B)H=AH+BH(13)\begin{aligned} (A+B)^* &= A^* + B^* \\ (A+B)^\mathrm{T} &= A^\mathrm{T} + B^\mathrm{T} \\ (A+B)^\mathrm{H} &= A^\mathrm{H} + B^\mathrm{H} \tag{13} \end{aligned} (A+B)∗(A+B)T(A+B)H=A∗+B∗=AT+BT=AH+BH(13)乘积关系:
(AB)T=BTAT(AB)H=BHAH(AB)−1=B−1A−1(A,B为可逆方阵)(14)\begin{aligned} (AB)^\mathrm{T} &= B^\mathrm{T} A^\mathrm{T}\\ (AB)^\mathrm{H} &= B^\mathrm{H} A^\mathrm{H} \\ (AB)^{-1} &= B^{-1} A^{-1} (A,B为可逆方阵) \tag{14} \end{aligned} (AB)T(AB)H(AB)−1=BTAT=BHAH=B−1A−1(A,B为可逆方阵)(14)相互转换:
(A∗)−1=(A−1)∗,(AT)−1=(A−1)T,(AH)−1=(A−1)H(15)(A^*)^{-1} = (A^{-1})^*, \quad (A^\mathrm{T})^{-1} = (A^{-1})^\mathrm{T}, \quad (A^\mathrm{H})^{-1} = (A^{-1})^\mathrm{H} \tag{15} (A∗)−1=(A−1)∗,(AT)−1=(A−1)T,(AH)−1=(A−1)H(15)对任意矩阵 AAA, 矩阵 B=AHAB=A^{\mathrm{H}}AB=AHA 都是 HermitianHermitianHermitian 矩阵. 若 AAA 可逆, 则对 HermitianHermitianHermitian 矩阵 B=AHAB=A^{\mathrm{H}}AB=AHA, 有 A−HBA−1=A−HAHAA−1=IA^{-\mathrm{H}}BA^{-1} = A^{-\mathrm{H}}A^{\mathrm{H}}AA^{-1} = IA−HBA−1=A−HAHAA−1=I. 矩阵 A−HA^{-\mathrm{H}}A−H 表示矩阵 AHA^{\mathrm{H}}AH 的逆矩阵.
8. 其他
幂等矩阵 An×nA_{n \times n}An×n :A2=AA=AA^2 = AA = AA2=AA=A
对合矩阵 An×nA_{n \times n}An×n :A2=AA=IA^2 = AA = IA2=AA=I
复矩阵 AAA 和 BBB 内积 :⟨A,B⟩=AHB\left \langle A,B \right \rangle = A^{\mathrm{H}}B⟨A,B⟩=AHB
矩阵的指数和对数:
exp(A)=∑k=0∞1k!Ak(16)exp(A)=\sum_{k=0}^{\infty}\frac{1}{k!}A^k \tag{16} exp(A)=k=0∑∞k!1Ak(16)
log(In−A)=−∑k=0∞1k!Ak(17)log(I_n - A) = -\sum_{k=0}^{\infty}\frac{1}{k!}A^k \tag{17} log(In−A)=−k=0∑∞k!1Ak(17)
矩阵的导数和积分就是在之前微积分的基础上对矩阵中的每个含参元素进行求导和积分. 这是一个从局部到整体的过程.
矩阵导数定义: 如果矩阵 AAA 的元素 aija_{ij}aij 都是参数 ttt 的函数, 则矩阵导数定义为
dAdt=A=[da11dtda12dt⋯da1ndtda21dtda22dt⋯da2ndt⋮⋮⋮⋮dam1dtdam2dt⋯damndt](18)\frac{dA}{dt} = A =\begin{bmatrix} \frac{da_{11}}{dt}& \frac{da_{12}}{dt}& \cdots& \frac{da_{1n}}{dt} \\ \frac{da_{21}}{dt}& \frac{da_{22}}{dt}& \cdots& \frac{da_{2n}}{dt} \\ \vdots& \vdots& \vdots& \vdots \\ \frac{da_{m1}}{dt}& \frac{da_{m2}}{dt}& \cdots& \frac{da_{mn}}{dt} \end{bmatrix} \tag{18} dtdA=A=⎣⎢⎢⎢⎡dtda11dtda21⋮dtdam1dtda12dtda22⋮dtdam2⋯⋯⋮⋯dtda1ndtda2n⋮dtdamn⎦⎥⎥⎥⎤(18)矩阵积分定义:
dAdt=A=[∫a11dt∫a12dt⋯∫a1ndt∫a21dt∫a22dt⋯∫a2ndt⋮⋮⋮⋮∫am1dt∫am2dt⋯∫amndt](19)\frac{dA}{dt} = A =\begin{bmatrix} \int a_{11}dt& \int a_{12}dt& \cdots& \int a_{1n}dt \\ \int a_{21}dt& \int a_{22}dt& \cdots& \int a_{2n}dt \\ \vdots& \vdots& \vdots& \vdots \\ \int a_{m1}dt& \int a_{m2}dt& \cdots& \int a_{mn}dt \end{bmatrix} \tag{19} dtdA=A=⎣⎢⎢⎢⎡∫a11dt∫a21dt⋮∫am1dt∫a12dt∫a22dt⋮∫am2dt⋯⋯⋮⋯∫a1ndt∫a2ndt⋮∫amndt⎦⎥⎥⎥⎤(19)
矩阵函数及其导数定义
指数矩阵函数
exp(At)=I+At+A2t22!+A3t33!+…(20)exp(At) =I+At+\frac{A^2t^2}{2!}+\frac{A^3t^3}{3!}+\dots \tag{20} exp(At)=I+At+2!A2t2+3!A3t3+…(20)指数矩阵函数的导数
ddtexp(At)=Aexp(At)=exp(At)A(21)\frac{d}{dt}exp(At)=Aexp(At)=exp(At)A \tag{21} dtdexp(At)=Aexp(At)=exp(At)A(21)矩阵乘积的导数
ddt(AB)=dAdtB+AdBdt(22)\frac{d}{dt}(AB)=\frac{dA}{dt}B + A\frac{dB}{dt} \tag{22} dtd(AB)=dtdAB+AdtdB(22)
其中, AAA 和 BBB 都是变量 ttt 的矩阵函数. 指数矩阵的导数很像指数函数求导, 矩阵乘积的导数又像对乘积的求导法则. 变化无非是从单个函数变成了以矩阵组织的多个函数.
三、向量的线性无关性与非奇异矩阵
1. 线性无关性
在最开始提到的 m×nm \times nm×n 线性方程组, 可以写成 Ax=bAx=bAx=b, 用向量 ana_nan 表示 AAA 可得 A=[a1,a2,…,an]A=[a_1,a_2,\dots,a_n]A=[a1,a2,…,an]. 此时方程可以化简为:
a1x1+a2x2+⋯+anxn=ba_1x_1 + a_2x_2 + \dots +a_nx_n = b a1x1+a2x2+⋯+anxn=b
并称为列向量 a1,a2,…,ana_1,a_2,\dots,a_na1,a2,…,an 的线性组合.
一组 mmm 维向量组 u1,u2,…,un{u_1,u_2,\dots,u_n}u1,u2,…,un 称为线性无关, 若方程
c1u1+c2u2+⋯+cnun=0c_1u_1 + c_2u_2 + \dots + c_nu_n = 0 c1u1+c2u2+⋯+cnun=0
只有零解 c1=c2=⋯=cn=0c_1 = c_2 = \dots = c_n = 0c1=c2=⋯=cn=0. 要是找到一组不为 0 的解就称这个向量组线性相关.
若向量组线性无关, 那么方程就有唯一零解.
2. 非奇异矩阵
奇异这个词语听起来很奇怪, 倒不如把它理解为奇怪的意思. 奇怪的矩阵和不是奇怪的矩阵. 那么矩阵奇怪在哪个地方呢?
之前看 MIT 的课程, Gilbert Strang 说过要是这个可逆就会拥有一系列的优秀性质, 就能给计算提供极大的帮助, 这样它就不奇怪了.
所谓可逆, 就是和之前线性无关性相对应. 如果一个向量组线性无关, 那么方程只有 0 解, 那么这个矩阵就可逆, 就被称为非奇异矩阵. 特殊的是, 这句话只存在于这个矩阵是一个 n×nn \times nn×n 的方阵.
四、初等行变换与阶梯型矩阵
1. 初等行变换
这部分是矩阵运算中的精髓, 开始之前我们需要了解一下矩阵的一部分性质.
互换矩阵任意两行叫做 I 型初等行变换.
矩阵中一行元素乘以一个非 0 常数 α\alphaα, 称为 II 型初等行变换.
矩阵中一行元素乘以一个非 0 常数 β\betaβ, 然后加给另一行, 称为 III 型初等行变换.
最重要的一点就是通过初等行变换的两个矩阵是等价的.
2. 阶梯型矩阵
阶梯型矩阵需要满足的条件:
全为 0 的行在矩阵最下面.
非零行从左往右数第一个非零元素总是出现在上一行左往右数第一个非零元素右边.
非零行从左往右数第一个非零元素下面同一列元素要为0.
举例:
A=[1030024000000083](example 1)A=\begin{bmatrix} 1& 0& 3& 0 \\ 0& 2& 4& 0 \\ 0& 0& 0& 0 \\ 0& 0& 8& 3 \end{bmatrix} \tag{example 1} A=⎣⎢⎢⎡1000020034080003⎦⎥⎥⎤(example 1)
AAA矩阵不是阶梯型矩阵, 因为第三行全0行不在矩阵最下面.
B=[0130204000400003](example 2)B=\begin{bmatrix} 0& 1& 3& 0 \\ 2& 0& 4& 0 \\ 0& 0& 4& 0 \\ 0& 0& 0& 3 \end{bmatrix} \tag{example 2} B=⎣⎢⎢⎡0200100034400003⎦⎥⎥⎤(example 2)
BBB矩阵不是阶梯型矩阵, 因为第二行首个非 0 元素 2 在第一行首个非 0 元素 1 的左边.
C=[1130024002400003](example 3)C=\begin{bmatrix} 1& 1& 3& 0 \\ 0& 2& 4& 0 \\ 0& 2& 4& 0 \\ 0& 0& 0& 3 \end{bmatrix} \tag{example 3} C=⎣⎢⎢⎡1000122034400003⎦⎥⎥⎤(example 3)
CCC矩阵不是阶梯型矩阵, 因为第二行首个非 0 元素 2 同一列下面元素为 2 和 0, 而不是全 0.
D=[1130024000400003](example 4)D=\begin{bmatrix} 1& 1& 3& 0 \\ 0& 2& 4& 0 \\ 0& 0& 4& 0 \\ 0& 0& 0& 3 \end{bmatrix} \tag{example 4} D=⎣⎢⎢⎡1000120034400003⎦⎥⎥⎤(example 4)
DDD矩阵是阶梯型矩阵, 满足阶梯型矩阵的三个条件.
五、基于初等行变换的矩阵方程求解
步骤就是通过初等行变换将矩阵转换为阶梯型矩阵. 没有什么概念, 那么我就通过实际解决一个问题来展示.
求解方程组:
{−3x1+6x2−x3=13x1−2x2+4x3=06x1−4x2+5x3=8\left\{ \begin{array}{r} -3x_1 + 6x_2 - x_3 = 1 \\ 3x_1 - 2x_2 + 4x_3 = 0 \\ 6x_1 - 4x_2 + 5x_3 = 8 \end{array} \right. ⎩⎨⎧−3x1+6x2−x3=13x1−2x2+4x3=06x1−4x2+5x3=8
根据方程组可以将其转化为 Ax=bAx=bAx=b
其中矩阵 AAA 为
A=[−36−13−246−45]A = \begin{bmatrix} -3& 6& -1 \\ 3& -2& 4 \\ 6& -4& 5 \end{bmatrix} A=⎣⎡−3366−2−4−145⎦⎤
向量 bbb 为
b=[108]b = \begin{bmatrix} 1 \\ 0 \\ 8 \end{bmatrix} b=⎣⎡108⎦⎤
根据解决的办法, 将向量 bbb 做为新的一列添加到 AAA 中得 A′A'A′
A′=[−36−113−2406−458]A' = \begin{bmatrix} -3& 6& -1& 1 \\ 3& -2& 4& 0 \\ 6& -4& 5& 8 \end{bmatrix} A′=⎣⎡−3366−2−4−145108⎦⎤
可得矩阵 A′A'A′ 是一个 3×53 \times 53×5 的矩阵.
Step1: 第一行乘以 1 加到第二行, 第一行乘以 2 加到第 3 行得到
A1′=[−36−1104316−458]A'_1 = \begin{bmatrix} -3& 6& -1& 1 \\ 0& 4& 3& 1 \\ 6& -4& 5& 8 \end{bmatrix} A1′=⎣⎡−30664−4−135118⎦⎤
Step2: 第一行乘以 2 加到第 3 行得到
A2′=[−36−11043108310]A'_2 = \begin{bmatrix} -3& 6& -1& 1 \\ 0& 4& 3& 1 \\ 0& 8& 3& 10 \end{bmatrix} A2′=⎣⎡−300648−1331110⎦⎤
Step3: 第二行乘以 -2 加到第三行得到
A3′=[−36−11043100−38]A'_3 = \begin{bmatrix} -3& 6& -1& 1 \\ 0& 4& 3& 1 \\ 0& 0& -3& 8 \end{bmatrix} A3′=⎣⎡−300640−13−3118⎦⎤
至此得到了阶梯型矩阵 A3′A'_3A3′. 为了方便计算再次化简使得 AAA 矩阵那部分主对角线值为 1
Step4: 第一行除以 -3 , 第二行除以 4 , 第三行除以 -3 得
A4′=[1−21/3−1/3013/41/4001−8/3]A'_4 = \begin{bmatrix} 1& -2& 1/3& -1/3 \\ 0& 1& 3/4& 1/4 \\ 0& 0& 1& -8/3 \end{bmatrix} A4′=⎣⎡100−2101/33/41−1/31/4−8/3⎦⎤
所以就有方程组
{x1−2x2+13x3=−13x2+34x3=14x3=−83\left\{ \begin{array}{l} x_1 - 2x_2 + \frac{1}{3}x_3 = -\frac{1}{3} \\ x_2 + \frac{3}{4}x_3 = \frac{1}{4} \\ x_3 = -\frac{8}{3} \end{array} \right. ⎩⎨⎧x1−2x2+31x3=−31x2+43x3=41x3=−38
更容易得到
{x1=9118x2=94x3=−83\left\{ \begin{array}{l} x_1 = \frac{91}{18}\\ x_2 = \frac{9}{4}\\ x_3 = -\frac{8}{3} \end{array} \right. ⎩⎨⎧x1=1891x2=49x3=−38
至此求出了矩阵方程的解.
如果方程组右边为全0, 这样就被叫做齐次线性方程组
{a11x1+a12x2+⋯+a1nxn=0a21x1+a22x2+⋯+a2nxn=0⋯am1x1+am2x2+⋯+amnxn=0\left\{ \begin{array}{c} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=0 \\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=0 \\ \cdots \\ a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n=0 \end{array} \right. ⎩⎪⎪⎨⎪⎪⎧a11x1+a12x2+⋯+a1nxn=0a21x1+a22x2+⋯+a2nxn=0⋯am1x1+am2x2+⋯+amnxn=0
显然 x=[0,0,…,0]Tx=[0,0,\dots,0]^{\mathrm{T}}x=[0,0,…,0]T 是这个齐次线性方程组的一个解. 这样全零解称为平凡解, 平凡解之外的其他任何解被称为非平凡解.
对于复矩阵方程 Am×nxn×1=bm×1A_{m \times n}x_{n \times 1} = b_{m \times 1}Am×nxn×1=bm×1 都可以写为
(Ar+jAi)(xr+jxi)=br+jbi(23)(A_r + jA_i)(x_r + jx_i) = b_r + jb_i \tag{23} (Ar+jAi)(xr+jxi)=br+jbi(23)
式中, Ar,xr,brA_r,x_r,b_rAr,xr,br 和 Ai,xi,biA_i,x_i,b_iAi,xi,bi 分别代表 A,x,bA,x,bA,x,b 的实部和虚部. 展开式子 (14)得
Arxr−Aixi=br(24)A_rx_r - A_ix_i = b_r \tag{24} Arxr−Aixi=br(24)
Aixr+Arxi=bi(25)A_ix_r + A_rx_i = b_i \tag{25} Aixr+Arxi=bi(25)
利用矩阵分块形式, 上式可合并为
[Ar−AiAiAr][xrxi]=[brbi](26)\begin{bmatrix} A_r& -A_i \\ A_i& A_r \end{bmatrix} \begin{bmatrix} x_r \\ x_i \end{bmatrix}= \begin{bmatrix} b_r \\ b_i \end{bmatrix} \tag{26} [ArAi−AiAr][xrxi]=[brbi](26)
于是, 含 nnn 个复未知数的 mmm 个复方程转变为含 2n2n2n 个实未知数的 2m2m2m 个实方程.
矩阵分析与应用-1.1-矩阵的基本运算相关推荐
- 矩阵分析与多元统计12 0-1矩阵 交换矩阵与Kronecker乘积
矩阵分析与多元统计12 0-1矩阵 交换矩阵与Kronecker乘积 基本性质 用交换矩阵的构造证明基本性质 这一讲介绍交换矩阵与Kronecker乘积相关的性质.对于矩阵A∈Fm×nA \in F^ ...
- 矩阵分析与多元统计12 0-1矩阵 交换矩阵简介
矩阵分析与多元统计12 0-1矩阵 交换矩阵简介 选择矩阵 交换矩阵 顾名思义,0-1矩阵就是所有元素取值均为0和1的矩阵,这类矩阵在矩阵分析.多元统计乃至组合学和图论中都有很重要的应用.在这个主题中 ...
- c++矩阵类_Python线性代数学习笔记——矩阵的基本运算和基本性质,实现矩阵的基本运算...
当学习完矩阵的定义以后,我们来学习矩阵的基本运算,与基本性质 矩阵的基本运算:矩阵的加法,每一个对应元素相加,对应结果的矩阵 例子:矩阵A和矩阵B表示的是同学上学期和下学期的课程的成绩,两个矩阵相加就 ...
- c++ 二维矩阵 转vector_Python线性代数学习笔记——矩阵的基本运算和基本性质,实现矩阵的基本运算...
当学习完矩阵的定义以后,我们来学习矩阵的基本运算,与基本性质 矩阵的基本运算:矩阵的加法,每一个对应元素相加,对应结果的矩阵 例子:矩阵A和矩阵B表示的是同学上学期和下学期的课程的成绩,两个矩阵相加就 ...
- python 矩阵除法_Python线性代数学习笔记——矩阵的基本运算和基本性质,实现矩阵的基本运算...
当学习完矩阵的定义以后,我们来学习矩阵的基本运算,与基本性质 矩阵的基本运算:矩阵的加法,每一个对应元素相加,对应结果的矩阵 例子:矩阵A和矩阵B表示的是同学上学期和下学期的课程的成绩,两个矩阵相加就 ...
- matlab 矩阵命令,matlab中的矩阵的基本运算命令
matlab中的矩阵的基本运算命令 (2013-07-19 08:45:49) 1.1 矩阵的表示 1.2 矩阵运算 1.2.14 特殊运算 1.矩阵对角线元素的抽取 函数 diag 格式 X = d ...
- 4.1-4.3 什么是矩阵 矩阵的基本运算及性质
什么是矩阵 Matrix 向量是对数的拓展,一个向量表示一组数. 矩阵是对向量的拓展,一个矩阵表示一组向量. 以行来看矩阵, 以列看矩阵 行数与列数相等的矩阵 称为 方阵 使用大写字母代表矩阵,用矩阵 ...
- 数学基础 - 矩阵的基本运算(Matrix Operations)
矩阵的基本运算(Matrix Operations) 目录 矩阵的基本运算(Matrix Operations) 目录 三个初等行(列)变换 加法(Plus) 乘法(Multiply) 与数的乘法 与 ...
- MatLab之矩阵及其基本运算
目录 矩阵的基本操作 线性方程组的求解 求线性齐次方程组的通解 求非齐次线性方程组的通解 矩阵的基本操作 %matlab矩阵及其基本运算 a=[1,2,3,4,5,6];%用空格或者逗号分割: siz ...
- 矩阵分析与应用-1.7-逆矩阵
文章目录 前言 一.逆矩阵的定义与性质 二.矩阵求逆引理 前言 本文学习过程来源是<矩阵分析与应用-张贤达>一书. 可以通过 z-lib 下载. 这部分内容与线性代数的内容重合, 讲述的是 ...
最新文章
- gradle常用命令
- POJ 1837 Balance(01背包变型)
- 浏览器本地mysql_IndexedDB:浏览器里的本地数据库
- GCC编译选项 -OX[转]
- 深入剖析ASP.NET的编译原理之二:预编译(Precompilation)
- 遇到 ORACLE 错误 1658
- 红旗linux挂载硬盘命令,红旗6sp1修改默认挂载的硬盘分区
- Linux memcache操作命令
- webpack4升级指南
- MyBatis教程目录
- jQuery 图片滚动 Carousel Lite 使用说明
- Linux内存管理学习资料
- 读《图解HTTP》有感-(HTTP报文内的HTTP消息)
- Linux DHCP服务详解
- 网页flash加载不出来
- 停机状态下的电磁流量计保养方法
- SqlServer 计算年龄(岁月天)的函数
- linux-ext4格式文件误删除恢复
- python爬虫实战:之爬取京东商城实例教程!(含源代码)
- 9个常用的免费高清壁纸图库网站