前言
本文只会记录人工智能中所用到的线性代数知识,并不会记录大学线性代数教材中的所有知识。
现在CSDN不能发超长的文章了,只能分成多篇发布。
人工智能数学基础之线性代数(一)
人工智能数学基础之线性代数(二)
人工智能数学基础之线性代数(三)
行列式的性质
记
D=∣a11a12⋯a1na21a22⋯a2n⋮⋮⋮an1an2⋯ann∣,DT=∣a11a21⋯an1a12a22⋯an2⋮⋮⋮a1na2n⋯ann∣D = \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2n}\\ \vdots &\vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn}\\ \end{vmatrix}, \quad D^T = \begin{vmatrix} a_{11} & a_{21} & \cdots & a_{n1}\\ a_{12} & a_{22} & \cdots & a_{n2}\\ \vdots &\vdots & & \vdots \\ a_{1n} & a_{2n} & \cdots & a_{nn}\\ \end{vmatrix} D=∣∣a11a21⋮an1a12a22⋮an2⋯⋯⋯a1na2n⋮ann∣∣,DT=∣∣a11a12⋮a1na21a22⋮a2n⋯⋯⋯an1an2⋮ann∣∣
行列式DTD^TDT称为行列式DDD的转置行列式。
性质1 行列式与它的转置行列式相等
性质2 互换行列式的两行(列),行列式变号
推论 如果行列式有两行(列)完全相同,则此行列式等于零
性质3 行列式的某一行(列)中所有的元素都乘以同一数kkk,等于用数kkk乘此行列式
推论 行列式中某一行(列)的所有元素的公因子可以提到行列式记号的外面
性质4 行列式中如果有两行(列)元素成比例,则此行列式等于零
性质5 若行列式的某一列(行)的元素都是两数之和,例如第iii列的元素都是两数之和:
D=∣a11a12⋯(a1i+a1i′)⋯a1na21a22⋯(a2i+a2i′)⋯a2n⋮⋮⋮⋮an1an2⋯(ani+ani′)⋯ann∣,D= \begin{vmatrix} a_{11} & a_{12} & \cdots & (a_{1i} + a_{1i}^\prime)& \cdots &a_{1n}\\ a_{21} & a_{22} & \cdots & (a_{2i} + a_{2i}^\prime)& \cdots &a_{2n}\\ \vdots & \vdots && \vdots& &\vdots\\ a_{n1} & a_{n2} & \cdots & (a_{ni} + a_{ni}^\prime)& \cdots &a_{nn}\\ \end{vmatrix}, D=∣∣a11a21⋮an1a12a22⋮an2⋯⋯⋯(a1i+a1i′)(a2i+a2i′)⋮(ani+ani′)⋯⋯⋯a1na2n⋮ann∣∣,
则DDD等于下列两个行列式之和:
D=∣a11a12⋯a1i⋯a1na21a22⋯a2i⋯a2n⋮⋮⋮⋮an1an2⋯ani⋯ann∣+∣a11a12⋯a1i′⋯a1na21a22⋯a2i′⋯a2n⋮⋮⋮⋮an1an2⋯ani′⋯ann∣.D= \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1i}& \cdots &a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2i} & \cdots &a_{2n}\\ \vdots & \vdots && \vdots& &\vdots\\ a_{n1} & a_{n2} & \cdots & a_{ni}& \cdots &a_{nn}\\ \end{vmatrix} + \\ \qquad \qquad \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1i}^\prime& \cdots &a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2i}^\prime& \cdots &a_{2n}\\ \vdots & \vdots && \vdots& &\vdots\\ a_{n1} & a_{n2} & \cdots & a_{ni}^\prime& \cdots &a_{nn}\\ \end{vmatrix}. D=∣∣a11a21⋮an1a12a22⋮an2⋯⋯⋯a1ia2i⋮ani⋯⋯⋯a1na2n⋮ann∣∣+∣∣a11a21⋮an1a12a22⋮an2⋯⋯⋯a1i′a2i′⋮ani′⋯⋯⋯a1na2n⋮ann∣∣.
性质6 把行列式的某一列(行)的各元素乘以同一数然后加到另一列(行)对应的元素上去,行列式不变。
例如以数kkk乘第jjj列加到第iii列上(记作ci+kcjc_i + kc_jci+kcj),有
∣a11⋯a1i⋯a1j⋯a1na21⋯a2i⋯a2j⋯a2n⋮⋮⋮⋮an1⋯ani⋯anj⋯ann∣=ci+kcj∣a11⋯(a1i+ka1j)⋯a1j⋯a1na21⋯(a2i+ka2j)⋯a2j⋯a2n⋮⋮⋮⋮an1⋯(ani+kanj)⋯anj⋯ann∣(i≠j)\begin{vmatrix} a_{11} & \cdots& a_{1i} & \cdots & a_{1j}& \cdots &a_{1n}\\ a_{21} & \cdots& a_{2i} & \cdots & a_{2j}& \cdots &a_{2n}\\ \vdots & & \vdots & & \vdots & & \vdots\\ a_{n1} & \cdots& a_{ni} & \cdots & a_{nj}& \cdots &a_{nn}\\ \end{vmatrix} \\ \overset{c_i + kc_j}{=} \begin{vmatrix} a_{11} & \cdots& (a_{1i} + ka_{1j}) & \cdots & a_{1j}& \cdots &a_{1n}\\ a_{21} & \cdots& (a_{2i} + ka_{2j})& \cdots & a_{2j}& \cdots &a_{2n}\\ \vdots & & \vdots & & \vdots & & \vdots\\ a_{n1} & \cdots& (a_{ni} + ka_{nj})& \cdots & a_{nj}& \cdots &a_{nn}\\ \end{vmatrix} (i \neq j) ∣∣a11a21⋮an1⋯⋯⋯a1ia2i⋮ani⋯⋯⋯a1ja2j⋮anj⋯⋯⋯a1na2n⋮ann∣∣=ci+kcj∣∣a11a21⋮an1⋯⋯⋯(a1i+ka1j)(a2i+ka2j)⋮(ani+kanj)⋯⋯⋯a1ja2j⋮anj⋯⋯⋯a1na2n⋮ann∣∣(i=j)
(以数kkk乘第jjj行加到第iii行上,记作ri+krjr_i + kr_jri+krj)
行列式按行(列)展开
一般来说,低阶行列式的计算比高阶行列式的计算要简便,于是,我们自然地考虑用低阶行列式来表示高阶行列式的问题。为此,先引入余子式和代数余子式的概念。
在nnn阶行列式中,把(i,j)(i,j)(i,j)元aija_{ij}aij所在的第iii行和第jjj列划去后,留下来的n−1n-1n−1阶行列式叫作(i,j)(i,j)(i,j)元aija_{ij}aij的余子式,记作MijM_{ij}Mij;记
Aij=(−1)i+jMij,A_{ij} = (-1)^{i+j}M_{ij}, Aij=(−1)i+jMij,
AijA_{ij}Aij叫做(i,j)(i,j)(i,j)元aija_{ij}aij的代数余子式。
例如四阶行列式
D=∣a11a12a13a14a21a22a23a24a31a32a33a34a41a42a43a44∣D = \begin{vmatrix} a_{11} & a_{12} & a_{13} & a_{14}\\ a_{21} & a_{22} & a_{23} & a_{24}\\ a_{31} & a_{32} & a_{33} & a_{34}\\ a_{41} & a_{42} & a_{43} & a_{44}\\ \end{vmatrix} D=∣∣a11a21a31a41a12a22a32a42a13a23a33a43a14a24a34a44∣∣
中(3,2)(3,2)(3,2)元a32a_{32}a32的余子式和代数余子式分别为
M32=∣a11a13a14a21a23a24a41a43a44∣,A32=(−1)3+2M32=−M32.M_{32} = \begin{vmatrix} a_{11} & a_{13} & a_{14}\\ a_{21} & a_{23} & a_{24}\\ a_{41} & a_{43} & a_{44}\\ \end{vmatrix}, \\ A_{32} = (-1)^{3+2} M_{32} = -M_{32}. M32=∣∣a11a21a41a13a23a43a14a24a44∣∣,A32=(−1)3+2M32=−M32.
引理 一个nnn阶行列式,如果其中第iii行所有元素除(i,j)(i,j)(i,j)元aija_{ij}aij外都为零,那么这行列式等于aija_{ij}aij与它的代数余子式的乘积,即
D=aijAij.D = a_{ij}A_{ij}. D=aijAij.
定理3 行列式等于它的任一行(列)的各元素与其对应的代数余子式乘积之和,即
D=ai1Ai1+ai2Ai2+⋯+ainAin(i=1,2,⋯,n),D=a1jA1j+a2jA2j+⋯+anjAnj(j=1,2,⋯,n)D = a_{i1}A_{i1} + a_{i2}A_{i2} + \cdots +a_{in}A_{in} \quad (i=1,2,\cdots,n),\\ D = a_{1j}A_{1j} + a_{2j}A_{2j} + \cdots +a_{nj}A_{nj} \quad (j=1,2,\cdots,n) D=ai1Ai1+ai2Ai2+⋯+ainAin(i=1,2,⋯,n),D=a1jA1j+a2jA2j+⋯+anjAnj(j=1,2,⋯,n)
证
D=∣a11a12⋯a1n⋮⋮⋮ai1+0+⋯+00+ai2+⋯+0⋯0+⋯+0+ain⋮⋮⋮an1an2⋯ann∣=∣a11a12⋯a1n⋮⋮⋮ai10⋯0⋮⋮⋮an1an2⋯ann∣+∣a11a12⋯a1n⋮⋮⋮0ai2⋯0⋮⋮⋮an1an2⋯ann∣+⋯+∣a11a12⋯a1n⋮⋮⋮00⋯ain⋮⋮⋮an1an2⋯ann∣,D = \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ \vdots & \vdots & & \vdots\\ a_{i1} + 0 + \cdots + 0& 0 + a_{i2} + \cdots + 0 &\cdots & 0 + \cdots +0 + a_{in}\\ \vdots & \vdots & & \vdots\\ a_{n1} & a_{n2} & \cdots & a_{nn}\\ \end{vmatrix} \\ = \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ \vdots & \vdots & & \vdots \\ a_{i1} & 0 &\cdots & 0\\ \vdots & \vdots & & \vdots\\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{vmatrix} + \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ \vdots & \vdots & & \vdots \\ 0 & a_{i2} &\cdots & 0\\ \vdots & \vdots & & \vdots\\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{vmatrix} + \cdots + \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ \vdots & \vdots & & \vdots \\ 0 & 0 &\cdots & a_{in} \\ \vdots & \vdots & & \vdots\\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{vmatrix}, D=∣∣a11⋮ai1+0+⋯+0⋮an1a12⋮0+ai2+⋯+0⋮an2⋯⋯⋯a1n⋮0+⋯+0+ain⋮ann∣∣=∣∣a11⋮ai1⋮an1a12⋮0⋮an2⋯⋯⋯a1n⋮0⋮ann∣∣+∣∣a11⋮0⋮an1a12⋮ai2⋮an2⋯⋯⋯a1n⋮0⋮ann∣∣+⋯+∣∣a11⋮0⋮an1a12⋮0⋮an2⋯⋯⋯a1n⋮ain⋮ann∣∣,
根据引理,即得
D=ai1Ai1+ai2Ai2+⋯+ainAin(i=1,2,⋯,n)D = a_{i1}A_{i1} + a_{i2}A_{i2} + \cdots +a_{in}A_{in} \quad (i=1,2,\cdots,n) D=ai1Ai1+ai2Ai2+⋯+ainAin(i=1,2,⋯,n)
类似地,若按列证明,可得
D=a1jA1j+a2jA2j+⋯+anjAnj(j=1,2,⋯,n).D = a_{1j}A_{1j} + a_{2j}A_{2j} + \cdots +a_{nj}A_{nj} \quad (j=1,2,\cdots,n). D=a1jA1j+a2jA2j+⋯+anjAnj(j=1,2,⋯,n).
这个定理叫做行列式按行(列)展开法则。利用这一法则并结合行列式的性质,可以简化行列式的计算。
推论 行列式的某一行(列)的元素与另一行(列)的对应元素的代数余子式乘积之和等于零。即
ai1Aj1+ai2Aj2+⋯+ainAjn=0,i≠j,a1iA1j+a2iA2j+⋯+aniAnj=0,i≠j.a_{i1}A_{j1} + a_{i2}A_{j2} + \cdots+ a_{in}A_{jn} = 0,\quad i\neq j,\\ a_{1i}A_{1j} + a_{2i}A_{2j} + \cdots+ a_{ni}A_{nj} = 0,\quad i\neq j. ai1Aj1+ai2Aj2+⋯+ainAjn=0,i=j,a1iA1j+a2iA2j+⋯+aniAnj=0,i=j.
证 把行列式D=det(aij)D=det(a_{ij})D=det(aij)按第jjj行展开,有
aj1Aj1+aj2Aj2+⋯+ajnAjn=∣a11⋯a1n⋮⋮ai1⋯ain⋮⋮aj1⋯ajn⋮⋮an1⋯ann∣,a_{j1}A_{j1} + a_{j2}A_{j2} + \cdots+ a_{jn}A_{jn} =\begin{vmatrix} a_{11} & \cdots & a_{1n}\\ \vdots & & \vdots \\ a_{i1} & \cdots & a_{in}\\ \vdots & & \vdots \\ a_{j1} & \cdots & a_{jn}\\ \vdots & & \vdots \\ a_{n1} & \cdots & a_{nn}\\ \end{vmatrix}, aj1Aj1+aj2Aj2+⋯+ajnAjn=∣∣a11⋮ai1⋮aj1⋮an1⋯⋯⋯⋯a1n⋮ain⋮ajn⋮ann∣∣,
在上式中把ajka_{jk}ajk换成aik(k=1,⋯,n)a_{ik}(k=1,\cdots,n)aik(k=1,⋯,n),可得
ai1Aj1+ai2Aj2+⋯+ainAjn=∣a11⋯a1n⋮⋮ai1⋯ain(i行)⋮⋮ai1⋯ain(j行)⋮⋮an1⋯ann∣a_{i1}A_{j1} + a_{i2}A_{j2} + \cdots+ a_{in}A_{jn} =\begin{vmatrix} a_{11} & \cdots & a_{1n}\\ \vdots & & \vdots \\ a_{i1} & \cdots & a_{in} (i\text{行})\\ \vdots & & \vdots \\ a_{i1} & \cdots & a_{in}(j\text{行})\\ \vdots & & \vdots \\ a_{n1} & \cdots & a_{nn}\\ \end{vmatrix} ai1Aj1+ai2Aj2+⋯+ainAjn=∣∣a11⋮ai1⋮ai1⋮an1⋯⋯⋯⋯a1n⋮ain(i行)⋮ain(j行)⋮ann∣∣
当i≠ji\neq ji=j时,上式右端行列式中有两行对应元素相同,故行列式为零,即得
ai1Aj1+ai2Aj2+⋯+ainAjn=0,i≠j.a_{i1}A_{j1} + a_{i2}A_{j2} + \cdots+ a_{in}A_{jn} = 0,\quad i\neq j. ai1Aj1+ai2Aj2+⋯+ainAjn=0,i=j.
上述证法如按列进行,可得
a1iA1j+a2iA2j+⋯+aniAnj=0,i≠j.a_{1i}A_{1j} + a_{2i}A_{2j} + \cdots+ a_{ni}A_{nj} = 0,\quad i\neq j. a1iA1j+a2iA2j+⋯+aniAnj=0,i=j.
克拉默法则
又译为克莱姆法则。
含有nnn个未知数x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1,x2,⋯,xn的nnn个线性方程的方程组
{a11x1+a12x2+⋯+a1nxn=b1,a21x1+a22x2+⋯+a2nxn=b2,⋯an1x1+an2x2+⋯+annxn=bn,(8)\begin{cases} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n= b_1, \\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n= b_2, \\ \cdots \\ a_{n1}x_1 + a_{n2}x_2 + \cdots + a_{nn}x_n= b_n, \\ \end{cases} \tag{8} ⎩⎨⎧a11x1+a12x2+⋯+a1nxn=b1,a21x1+a22x2+⋯+a2nxn=b2,⋯an1x1+an2x2+⋯+annxn=bn,(8)
与二、三元线性方程组类似,它的解可以用nnn阶行列式表示,即有
克拉默法则 如果线性方程组(8)(8)(8)的系数行列式不等于零,即
D=∣a11⋯a1n⋮⋮an1⋯ann∣≠0,D =\begin{vmatrix} a_{11} & \cdots & a_{1n}\\ \vdots & & \vdots \\ a_{n1} & \cdots & a_{nn}\\ \end{vmatrix} \neq 0, D=∣∣a11⋮an1⋯⋯a1n⋮ann∣∣=0,
那么,方程组(11)(11)(11)有唯一解
x1=D1D,x2=D2D,xn=DnD,(9)x_1 = \frac{D_1}{D}, \quad x_2 = \frac{D_2}{D}, \quad x_n = \frac{D_n}{D}, \tag{9} x1=DD1,x2=DD2,xn=DDn,(9)
其中Dj(j=1,2,⋯,n)D_j(j=1,2,\cdots,n)Dj(j=1,2,⋯,n)是把系数行列式DDD中第jjj列的元素用方程组右端的常数项代替后得到的nnn阶行列式,即
Dj=∣a11⋯a1,j−1b1a1,j+1⋯a1n⋮⋮⋮⋮⋮an1⋯an,j−1bnan,j+1⋯ann∣.D_j =\begin{vmatrix} a_{11} &\cdots &a_{1,j-1}& b_1 & a_{1,j+1}&\cdots & a_{1n}\\ \vdots & &\vdots& \vdots & \vdots& & \vdots\\ a_{n1} &\cdots &a_{n,j-1}& b_n & a_{n,j+1}&\cdots & a_{nn} \end{vmatrix}. Dj=∣∣a11⋮an1⋯⋯a1,j−1⋮an,j−1b1⋮bna1,j+1⋮an,j+1⋯⋯a1n⋮ann∣∣.
定理4 如果线性方程组(8)(8)(8)的系数行列式D≠0D \neq 0D=0,则(8)(8)(8)一定有解,且解是唯一的。
该定理的逆否定理为
定理4’ 如果线性方程组(8)(8)(8)无解或有两个不同的解,则它的系数行列式比为零。
线性方程组(8)(8)(8)右端的常数项b1,b2,⋯,bnb_1,b_2,\cdots,b_nb1,b2,⋯,bn全为零时,线性方程组(8)(8)(8)叫做 齐次线性方程组。
对于齐次线性方程组
{a11x1+a12x2+⋯+a1nxn=0,a21x1+a22x2+⋯+a2nxn=0,⋯an1x1+an2x2+⋯+annxn=0,(10)\begin{cases} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n= 0, \\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n= 0, \\ \cdots \\ a_{n1}x_1 + a_{n2}x_2 + \cdots + a_{nn}x_n= 0, \\ \end{cases} \tag{10} ⎩⎨⎧a11x1+a12x2+⋯+a1nxn=0,a21x1+a22x2+⋯+a2nxn=0,⋯an1x1+an2x2+⋯+annxn=0,(10)
x1=x2=⋯=xn=0x_1=x_2=\cdots = x_n =0x1=x2=⋯=xn=0一定是它的解,这个解叫做齐次线性方程组的零解。
如果一组不全为零的数是(10)(10)(10)的解,则它叫做齐次线性方程组(10)(10)(10)的非零解。
矩阵
矩阵是一个按照长方阵列排列的复数或实数集合。
由m×nm × nm×n个数组成的一个mmm行nnn列的矩形表格。如图所示:
A=[a11a12⋯a1na21a22⋯a2n⋮⋮⋱⋮am1am2⋯amn]A = \left[ \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{matrix} \right]A=⎣⎡a11a21⋮am1a12a22⋮am2⋯⋯⋱⋯a1na2n⋮amn⎦⎤
称为mmm行nnn列矩阵,简称m×nm \times nm×n矩阵。
这个m×nm \times nm×n个数称为矩阵AAA的元素,简称为元,数aija_{ij}aij位于矩阵AAA的第iii行第jjj列,称为矩阵AAA的(i,j)(i,j)(i,j)元。
以数aija_{ij}aij为(i,j)(i,j)(i,j)元的矩阵可简记作(aij)(a_{ij})(aij)或(aij)m×n(a_{ij})_{m \times n}(aij)m×n,m×nm \times nm×n矩阵AAA也记作Am×nA_{m \times n}Am×n。
行数与列数都等于nnn的矩阵称为nnn阶矩阵或nnn阶方阵。
元素都是零的矩阵称为零矩阵,记作OOO。
nnn个变量x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1,x2,⋯,xn与mmm个变量y1,y2,⋯,ymy_1,y_2,\cdots,y_my1,y2,⋯,ym之间的关系式
{y1=a11x1+a12x2+⋯+a1nxn,y2=a21x1+a22x2+⋯+a2nxn,⋯ym=am1x1+am2x2+⋯+amnxn(2)\begin{cases} y_1= a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n, \\ y_2= a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n, \\ \cdots \\ y_m= a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n \\ \end{cases} \tag{2} ⎩⎨⎧y1=a11x1+a12x2+⋯+a1nxn,y2=a21x1+a22x2+⋯+a2nxn,⋯ym=am1x1+am2x2+⋯+amnxn(2)
表示从一个变量x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1,x2,⋯,xn与到变量y1,y2,⋯,ymy_1,y_2,\cdots,y_my1,y2,⋯,ym的线性变换,其中aija_{ij}aij为常数。线性变换(2)(2)(2)的系数aija_{ij}aij构成矩阵A=(aij)m×nA = (a_{ij})_{m \times n}A=(aij)m×n,称为系数矩阵。
矩阵的基本运算
两个矩阵的行数和列数分别相等,称它们为同型矩阵。
加法
矩阵的加法只能在两个同型矩阵之间进行,两个矩阵相加时,对应元素进行相加。
如:
[123457]+[002213]=[1256610]\left[ \begin{matrix} 1 & 2 & 3\\ 4 & 5 & 7 \end{matrix} \right] + \left[ \begin{matrix} 0 & 0 & 2\\ 2 & 1 & 3 \end{matrix} \right] = \left[ \begin{matrix} 1 & 2 & 5\\ 6 & 6 & 10 \end{matrix} \right] [142537]+[020123]=[1626510]
数乘
数λ\lambdaλ与矩阵AAA的乘积记作λA\lambda AλA或AλA\lambdaAλ,规定为
λA=Aλ=[λa11λa12⋯λa1nλa21λa22⋯λa2n⋮⋮⋱⋮λam1λam2⋯λamn]\lambda A = A\lambda = \left[ \begin{matrix} \lambda a_{11} & \lambda a_{12} & \cdots & \lambda a_{1n}\\ \lambda a_{21} & \lambda a_{22} & \cdots & \lambda a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ \lambda a_{m1} & \lambda a_{m2} & \cdots & \lambda a_{mn} \end{matrix} \right]λA=Aλ=⎣⎡λa11λa21⋮λam1λa12λa22⋮λam2⋯⋯⋱⋯λa1nλa2n⋮λamn⎦⎤
乘法
必须满足矩阵AAA的列数与矩阵BBB的行数相等,或者矩阵AAA的行数与矩阵BBB的列数相等。
记C=ABC=ABC=AB,矩阵CCC的第iii行第jjj列的元素等于矩阵AAA的第iii行的所有元素与矩阵BBB的第jjj列的对应元素的乘积之和,即:
Cij=∑k=1naikbkjC_{ij} = \sum_{k=1}^na_{ik}b_{kj} Cij=k=1∑naikbkj
如:
[123]1×3[456]3×1=1×4+2×5+3×6=32\left[ \begin{matrix} 1 & 2 & 3 \end{matrix} \right] _{1×3} \left[ \begin{matrix} 4 \\ 5 \\6 \end{matrix} \right]_{3×1} = 1×4 + 2×5 + 3×6 =32[123]1×3⎣⎡456⎦⎤3×1=1×4+2×5+3×6=32
[123]3×1[456]1×3=[45681012121518]3×3\left[ \begin{matrix} 1 \\ 2 \\3 \end{matrix} \right]_{3×1} \left[ \begin{matrix} 4 & 5 & 6 \end{matrix} \right] _{1×3} = \left[ \begin{matrix} 4 & 5 & 6\\ 8 & 10 & 12\\12 & 15 & 18 \end{matrix} \right]_{3×3}⎣⎡123⎦⎤3×1[456]1×3=⎣⎡48125101561218⎦⎤3×3
矩阵的乘法不满足交换律,但仍然满足结合律和分配律:
-
(AB)C=A(BC)(AB)C = A(BC)(AB)C=A(BC)
-
λ(AB)=(λA)B=A(λB)(其中λ为实数)\lambda (AB) = (\lambda A)B = A(\lambda B) \quad (其中\lambda为实数)λ(AB)=(λA)B=A(λB)(其中λ为实数)
-
A(B+C)=AB+AC,(B+C)A=BA+CAA(B+C) = AB + AC,\quad (B+C)A = BA +CAA(B+C)=AB+AC,(B+C)A=BA+CA
转置
矩阵AAA的转置矩阵,记作ATA^TAT,是将AAA的行列互换后所得矩阵,如果AAA是一个m×nm ×nm×n阶矩阵,ATA^TAT是一个n×mn×mn×m阶矩阵。
A=[142536]AT=[123456]A = \left[ \begin{matrix} 1 & 4 \\ 2 & 5 \\ 3 & 6 \end{matrix} \right] A^T = \left[ \begin{matrix} 1 & 2 & 3\\ 4 & 5 & 6 \end{matrix} \right]A=⎣⎡123456⎦⎤AT=[142536]
矩阵的转置的性质:
- (AT)T=A(A^T)^T = A(AT)T=A
- (A+B)T=AT+BT(A+B)^T = A^T +B^T(A+B)T=AT+BT
- (λA)T=λAT(\lambda A)^T=\lambda A^T(λA)T=λAT
- (AB)T=BTAT(AB)^T = B^TA^T(AB)T=BTAT
对称矩阵
定义 一个n×nn \times nn×n的矩阵AAA,若满足AT=AA^T =AAT=A,则称AAA为对称矩阵(symmetric matrix),简称对称阵。其特点为:它的元素以对角线为对称轴对应相等。
例 设列矩阵X=(x1,x2,⋯,xn)TX=(x_1,x_2,\cdots,x_n)^TX=(x1,x2,⋯,xn)T满足XTX=1X^TX=1XTX=1,EEE为nnn阶单位阵,H=E−2XXTH = E – 2XX^TH=E−2XXT,证明HHH是对称阵,且HHT=EHH^T=EHHT=E。
注意:XTXX^TXXTX = x12+x22+⋯+xn2x_1^2 + x_2^2 + \cdots + x_n^2x12+x22+⋯+xn2是一阶方阵,也就是一个数,而XXTXX^TXXT是nnn阶方阵。
证
HT=(E−2XXT)T=ET−2(XXT)T=E−2XXT=H\begin{aligned} H^T &= (E – 2XX^T)^T \\ &=E^T -2(XX^T)^T \\ &= E – 2XX^T = H \end{aligned} HT=(E−2XXT)T=ET−2(XXT)T=E−2XXT=H
所以HHH是对称阵。
HHT=H2=(E−2XXT)2=E−4XXT+4(XXT)(XXT)=E−4XXT+4X(XTX)XT=E−4XXT+4XXT=E\begin{aligned} HH^T &= H^2 = (E -2XX^T)^2 \\ &= E – 4XX^T + 4(XX^T)(XX^T) \\ &= E – 4XX^T + 4X(X^TX)X^T \\ &= E – 4XX^T + 4XX^T = E \end{aligned} HHT=H2=(E−2XXT)2=E−4XXT+4(XXT)(XXT)=E−4XXT+4X(XTX)XT=E−4XXT+4XXT=E
实对称矩阵
如果有nnn阶矩阵AAA,其矩阵的元素都为实数,且矩阵AAA的转置等于其本身,则称AAA为实对称矩阵。
主要性质:
- 实对称矩阵AAA的不同特征值对应的特征向量是正交的。
- 实对称矩阵AAA的特征值都是实数。
- nnn阶实对称矩阵AAA必可相似对角化,且相似对角阵上的元素即为矩阵本身特征值。
- 若AAA具有kkk重特征值λ0\lambda_0λ0,必有kkk个线性无关的特征向量,或者说秩r(λ0E−A)r(\lambda_0 E-A)r(λ0E−A)必为n−kn-kn−k,其中EEE为单位矩阵。
- 实对称矩阵AAA一定可正交相似对角化。
单位矩阵
如同数1位实数乘法中的单位元一样,也存在一个特殊矩阵EEE是矩阵乘法中的单位元,即
EA=AE=AEA = AE = A EA=AE=A
对任意n×nn \times nn×n的矩阵AAA都成立。
定义 n×nn \times nn×n的单位矩阵为矩阵E=(δij)E = (\delta_{ij})E=(δij),其中
δij={1当i=j0当i≠j\delta_{ij} = \left\{ \begin{array}{lr} 1 & 当 \,\, i =j\\ 0 & 当 \,\, i \neq j \end{array} \right. δij={10当i=j当i=j
即主对角元素均为111,其他元素均为000的n×nn \times nn×n矩阵。
一般地,若BBB为任一m×nm \times nm×n矩阵,且CCC为任一n×rn \times rn×r矩阵,则
BE=B且EC=CBE = B \,\,\,\, \text{且} \,\,\,\, EC = C BE=B且EC=C
n×nn \times nn×n单位矩阵EEE的列向量为用于定义nnn维欧几里得坐标空间的标准向量。EEE的第jjj列向量的标准记号为eje_jej。因此,n×nn \times nn×n单位矩阵可写为
E=(e1,e2,⋯,en)E = (e_1,e_2,\cdots,e_n) E=(e1,e2,⋯,en)
矩阵的迹
nnn阶方阵AAA的迹(trace)记作tr(A)tr(A)tr(A),是对角元素之和:
tr(A)=a11+a22+⋯+ann=∑i=1naiitr(A) = a_{11} + a_{22} + \cdots + a_{nn} = \sum_{i=1}^n a_{ii} tr(A)=a11+a22+⋯+ann=i=1∑naii
性质::
- 迹是所有特征值的和
- tr(AB)=tr(BA)tr(AB)=tr(BA)tr(AB)=tr(BA)
- 若矩阵AAA与矩阵BBB相似,则tr(A)=tr(B)tr(A)=tr(B)tr(A)=tr(B)
共轭矩阵
首先回顾下复数的概念,复数是实数的延伸,它使任意多项式方程都有跟。复数当中有个虚数单位iii,它是−1-1−1的一个平方根,即i2=−1i^2=-1i2=−1。
任一复数都可以表达为a+bia+bia+bi,其中aaa及bbb皆为实数,分别称为复数的实部和虚部。
复数z=a+biz = a+biz=a+bi的模为∣z∣=a2+b2|z| = \sqrt{a^2 +b^2}∣z∣=a2+b2。
z=a+biz = a+biz=a+bi的共轭复数定义为z=a−biz = a-biz=a−bi,即两个实部相等,虚部互为相反数。记作z‾\overline{z}z。有
- z+w‾=z‾+w‾\overline{z+w} = \overline{z} + \overline{w}z+w=z+w
- zw‾=z‾⋅w‾\overline{zw}=\overline{z}\cdot \overline{w}zw=z⋅w
- (zw)‾=z‾w‾\overline{\left( \frac{z}{w} \right)}=\frac{\overline{z}}{\overline{w}}(wz)=wz
- z‾‾=z\overline{\overline{z}}=zz=z
- z‾=z当且仅当z是实数\overline{z} =z \quad 当且仅当z是实数z=z当且仅当z是实数
- ∣z∣2=zz‾|z|^2 = z \overline{z}∣z∣2=zz
当虚部不为零时,共轭复数就是实部相等,虚部相反;
如果虚部为零,其共轭复数就是自身。即实数的共轭复数就是自身。
当A=(aij)A=(a_{ij})A=(aij)为复矩阵时,用a‾ij\overline{a}_{ij}aij表示aija_{ij}aij的共轭复数,记
A‾=(a‾ij),\overline{A} = (\overline{a}_{ij}), A=(aij),
A‾\overline{A}A称为AAA的共轭矩阵。
共轭矩阵满足下述运算规律(A,BA,BA,B为复矩阵,λ\lambdaλ为复数):
- A+B‾=A‾+B‾\overline{A+B}=\overline{A} + \overline{B}A+B=A+B
- λA‾=λ‾A‾\overline{\lambda A} = \overline{\lambda} \overline{A}λA=λA
- AB‾=A‾B‾\overline{AB}=\overline{A}\overline{B}AB=AB
埃尔米特矩阵
AAA的共轭矩阵A‾\overline{A}A的转置记为AHA^HAH。
定义 若一个矩阵AAA满足A=AHA =A^HA=AH,则称它为埃尔米特矩阵(Hermitian)。