目录
特征值和特征向量
对 n n n阶方阵 A A A,如果满足 A x = λ x (1) Ax=\lambda x \tag{1} Ax=λx(1)其中 x x x为 n n n维非0向量, λ \lambda λ为常数(可以为复数)
则称 λ \lambda λ为 A A A的特征值, x x x为 A A A属于 λ \lambda λ的特征向量
式(1)的几何意义是:向量 x x x经过转换矩阵 A A A后,依然保持原来的方向,只有 λ \lambda λ倍伸缩的变化
特征向量与特征值的求解
对式(1)稍作变形,有
(
A
−
λ
I
)
x
=
0
(2)
(A-\lambda I)x=0 \tag{2}
(A−λI)x=0(2)
要使得式(2)有非0解,则
A
−
λ
I
A-\lambda I
A−λI为奇异矩阵,即
d
e
t
(
A
−
λ
I
)
=
0
(3)
det(A-\lambda I)=0 \tag{3}
det(A−λI)=0(3)
求解式(3),可以得到所有特征值
λ
i
\lambda_i
λi
将特征值代入式(2),可以求得对应的特征向量
x
i
x_i
xi
特征向量的性质
- 所有特征值的和(迹)等于矩阵对角线之和
t r ( A ) = ∑ λ i = ∑ a k k (4) tr(A)=\sum{\lambda_i}=\sum{a_{kk}} \tag{4} tr(A)=∑λi=∑akk(4) - 所有特征值的乘积等于矩阵的行列式
∏ λ i = ∣ A ∣ (5) \prod{\lambda_i}=|A| \tag{5} ∏λi=∣A∣(5) - 对角矩阵和三角矩阵的特征值是其对角线上的元素
λ i = a i i (6) \lambda_i=a_{ii} \tag{6} λi=aii(6) - 对 n n n阶的方阵,如果其有 n n n个不同的特征值,那么对应的 n n n个特征向量线性无关(充分不必要条件)
方阵 A A A的 S Λ S − 1 S\Lambda S^{-1} SΛS−1分解
如果 n n n阶方阵 A A A有 n n n个线性无关的特征向量,则
A = S Λ S − 1 (7) A=S\Lambda S^{-1} \tag{7} A=SΛS−1(7)
其中
S S S是由 A A A的 n n n个特征向量(列向量)组成的特征矩阵
Λ \Lambda Λ是由 A A A的 n n n个特征值组成的对角阵
证明:
设
S
=
[
x
1
,
x
2
,
.
.
.
x
n
]
S=[x_1,x_2,...x_n]
S=[x1,x2,...xn],
Λ
=
d
i
a
g
(
λ
1
,
λ
2
,
.
.
.
λ
n
)
\Lambda=diag(\lambda_1,\lambda_2,...\lambda_n)
Λ=diag(λ1,λ2,...λn)
其中
λ
1
,
.
.
.
,
λ
n
\lambda_1,...,\lambda_n
λ1,...,λn是
A
A
A的特征值,
x
1
,
.
.
.
,
x
n
x_1,...,x_n
x1,...,xn是对应的线性无关的特征向量,有:
A
S
=
A
[
x
1
,
x
2
,
.
.
.
x
n
]
=
[
λ
1
x
1
,
λ
2
x
2
,
.
.
.
λ
n
x
n
]
=
[
x
1
,
x
2
,
.
.
.
,
x
n
]
d
i
a
g
(
λ
1
,
λ
2
,
.
.
.
,
λ
n
)
=
S
Λ
(8)
\begin{aligned}AS=&A[x_1,x_2,...x_n]\\=&[\lambda_1x_1,\lambda_2x_2,...\lambda_nx_n]\\=&[x_1,x_2,...,x_n]diag(\lambda_1,\lambda_2,...,\lambda_n)\\=&S\Lambda\end{aligned} \tag{8}
AS====A[x1,x2,...xn][λ1x1,λ2x2,...λnxn][x1,x2,...,xn]diag(λ1,λ2,...,λn)SΛ(8)
由(8)式易得(7)式
由式(7),易得
A
k
=
S
Λ
k
S
−
1
(9)
A^k=S\Lambda^kS^{-1} \tag{9}
Ak=SΛkS−1(9)
也就是说,方阵的k次幂不改变特征向量,特征值是原来的k倍
由式(9),如果 A A A所有的特征值 ∣ λ i ∣ < 1 |\lambda_i|<1 ∣λi∣<1,那么 A k → 0 a s k → ∞ A^k\to0\ as\ k\to\infty Ak→0 as k→∞
A u k = u k + 1 Au_k=u_{k+1} Auk=uk+1的推导
由
A
u
k
=
u
k
+
1
Au_k=u_{k+1}
Auk=uk+1可知
u
k
=
A
k
u
0
(10)
u_k=A^ku_0 \tag{10}
uk=Aku0(10)
令
x
1
,
x
2
,
.
.
.
,
x
n
x_1,x_2,...,x_n
x1,x2,...,xn是
A
A
A的
n
n
n个线性无关的特征向量,则
u
0
u_0
u0可分解为
u
0
=
c
1
x
1
+
c
2
x
2
+
.
.
.
+
c
n
x
n
(11)
u_0=c_1x_1+c_2x_2+...+c_nx_n \tag{11}
u0=c1x1+c2x2+...+cnxn(11)
式(11)两边左乘
A
k
A^k
Ak,有
A
k
u
0
=
u
k
=
c
1
λ
1
k
x
1
+
c
2
λ
2
k
x
2
+
.
.
.
+
c
n
λ
n
k
x
n
(12)
A^ku_0=u_k=c_1\lambda_1^kx_1+c_2\lambda_2^kx_2+...+c_n\lambda_n^kx_n \tag{12}
Aku0=uk=c1λ1kx1+c2λ2kx2+...+cnλnkxn(12)
一个例子
斐波那契数列: 0 , 1 , 1 , 2 , 3 , 5 , 8... 0,1,1,2,3,5,8... 0,1,1,2,3,5,8...,求 F 100 F_{100} F100
首先建立方程组
F
k
+
2
=
F
k
+
1
+
F
k
F
k
+
1
=
F
k
+
1
(13)
\begin{aligned}F_{k+2}=&F_{k+1}+F_k\\F_{k+1}=&F_{k+1}\end{aligned} \tag{13}
Fk+2=Fk+1=Fk+1+FkFk+1(13)
(第二个等式的意义是使得
A
A
A为方阵)
令
u
k
=
[
F
k
+
1
F
k
]
u_k=\left[\begin{matrix}F_{k+1}\\F_k\end{matrix}\right]
uk=[Fk+1Fk],则有
u
k
+
1
=
[
1
1
1
0
]
u
k
(14)
u_{k+1}=\left[\begin{matrix}1&1\\1&0\end{matrix}\right]u_k \tag{14}
uk+1=[1110]uk(14)
令
A
=
[
1
1
1
0
]
A=\left[\begin{matrix}1&1\\1&0\end{matrix}\right]
A=[1110],其特征值和对应的特征向量分别为:
λ
1
=
1
2
(
1
+
5
)
,
x
1
=
[
λ
1
1
]
λ
2
=
1
2
(
1
−
5
)
,
x
2
=
[
λ
2
1
]
\lambda_1=\frac{1}{2}(1+\sqrt{5}),x_1=\left[\begin{matrix}\lambda_1\\1\end{matrix}\right]\\ \lambda_2=\frac{1}{2}(1-\sqrt{5}),x_2=\left[\begin{matrix}\lambda_2\\1\end{matrix}\right]
λ1=21(1+5),x1=[λ11]λ2=21(1−5),x2=[λ21]
根据式(12),有
u
100
=
c
1
λ
1
100
x
1
+
c
2
λ
2
100
x
2
(15)
u_{100}=c_1\lambda_1^{100}x_1+c_2\lambda_2^{100}x_2 \tag{15}
u100=c1λ1100x1+c2λ2100x2(15)
又因为
λ
2
<
1
\lambda_2<1
λ2<1,所以
λ
2
100
→
0
\lambda_2^{100}\to 0
λ2100→0,有
u
100
≈
c
1
λ
1
100
x
1
(16)
u_{100}\approx c_1\lambda_1^{100}x_1 \tag{16}
u100≈c1λ1100x1(16)
即
[
F
101
F
100
]
≈
c
1
λ
1
100
[
λ
1
1
]
(17)
\left[\begin{matrix}F_{101}\\F_{100}\end{matrix}\right]\approx c_1\lambda_1^{100}\left[\begin{matrix}\lambda_1\\1\end{matrix}\right] \tag{17}
[F101F100]≈c1λ1100[λ11](17)
从而
F
100
≈
c
1
λ
1
100
F_{100}\approx c_1\lambda_1^{100}
F100≈c1λ1100
特征值在马尔科夫链中的应用
马尔科夫链是指:在一个系统中某些因素第 n n n次结果只受第 n − 1 n-1 n−1次结果的影响。描述这种状态转移的矩阵称为马尔科夫矩阵
表1. 天气转移概率表
| 晴 | 阴 | 雨 | |
|---|---|---|---|
| 晴 | 3/4 | 1/2 | 1/4 |
| 阴 | 1/8 | 1/4 | 1/2 |
| 雨 | 1/8 | 1/4 | 1/4 |
表1中行表示今天的天气,列表示明天的天气
如行2列3的1/2表示今天阴明天雨的概率为1/2
由表1得到对应的马尔科夫矩阵
A
=
[
3
/
4
1
/
2
1
/
4
1
/
8
1
/
4
1
/
2
1
/
8
1
/
4
1
/
4
]
(18)
A=\left[\begin{matrix}3/4&1/2&1/4\\1/8&1/4&1/2\\1/8&1/4&1/4\end{matrix}\right] \tag{18}
A=⎣⎡3/41/81/81/21/41/41/41/21/4⎦⎤(18)
观察上式可以得出马尔科夫矩阵的2条性质:
- 所有值均不大于1
0 ≤ a i j ≤ 1 (19) 0\leq a_{ij}\leq 1 \tag{19} 0≤aij≤1(19)
因为描述的都是概率 - 矩阵每列之和为1
∑ i = 1 n a i j = 1 (20) \sum_{i=1}^n{a_{ij}} = 1 \tag{20} i=1∑naij=1(20)
条件概率
此外从特征分解方面来看,马尔科夫矩阵的特征值有2个性质:
- λ = 1 \lambda=1 λ=1是一个特征值
- 其余特征值满足 ∣ λ i ∣ < 1 |\lambda_i|<1 ∣λi∣<1
从定义可以看出,上一节中 u k + 1 = A u k u_{k+1}=Au_k uk+1=Auk的 A A A就是马尔科夫矩阵,因为它连接了前后两个状态
由此,在已知马尔科夫矩阵后便可以利用式(10-12)计算状态的变化趋势
一个例子:
假设
A
2
×
2
A_{2\times 2}
A2×2矩阵表示加州和麻省的人口迁移概率:
[
U
加
U
麻
]
t
=
k
+
1
=
[
0.9
0.2
0.1
0.8
]
[
U
加
U
麻
]
t
=
k
(21)
\left[\begin{matrix}U_加\\U_麻\end{matrix}\right]_{t=k+1}=\left[\begin{matrix}0.9&0.2\\0.1&0.8\end{matrix}\right]\left[\begin{matrix}U_加\\U_麻\end{matrix}\right]_{t=k} \tag{21}
[U加U麻]t=k+1=[0.90.10.20.8][U加U麻]t=k(21)
并假定人口初始状态为
[
U
加
U
麻
]
t
=
0
=
[
0
1000
]
\left[\begin{matrix}U_加\\U_麻\end{matrix}\right]_{t=0}=\left[\begin{matrix}0\\1000\end{matrix}\right]
[U加U麻]t=0=[01000]
式(21)表示0.9概率的人留加州0.1概率的人迁移麻省,0.8概率的人留麻省0.2概率的人迁移加州(可以看出,加州的人会越来越多)
从式(21)可以得到2个特征值
λ
1
=
1
\lambda_1=1
λ1=1,
λ
2
=
0.7
\lambda_2=0.7
λ2=0.7
根据式(12),可以得到
k
k
k次迁移后的人口状况:
u
k
=
c
1
[
2
1
]
+
c
2
(
0.7
)
k
[
−
1
1
]
(22)
u_k=c_1\left[\begin{matrix}2\\1\end{matrix}\right]+c_2(0.7)^k\left[\begin{matrix}-1\\1\end{matrix}\right] \tag{22}
uk=c1[21]+c2(0.7)k[−11](22)
式(22)代入初始状态,可以求得
c
1
=
1000
/
3
c_1=1000/3
c1=1000/3,
c
2
=
2000
/
3
c_2=2000/3
c2=2000/3
又因为
0.
7
k
→
0
0.7^k\to 0
0.7k→0,因此有
u
∞
=
1000
3
[
2
1
]
u_{\infty}=\frac{1000}{3}\left[\begin{matrix}2\\1\end{matrix}\right]
u∞=31000[21]
傅里叶级数的求解
求傅里叶级数展开式(23)各个系数
a
i
a_i
ai
f
(
x
)
=
a
0
+
a
1
cos
x
+
a
2
sin
x
+
a
3
cos
2
x
+
a
4
sin
2
x
+
.
.
.
(23)
f(x)=a_0+a_1\cos{x}+a_2\sin{x}+a_3\cos{2x}+a_4\sin{2x}+... \tag{23}
f(x)=a0+a1cosx+a2sinx+a3cos2x+a4sin2x+...(23)
可以发现,上式中各个组成是正交基: 1 、 cos x 、 sin x 、 cos 2 x . . . 1、\cos{x}、\sin{x}、\cos{2x}... 1、cosx、sinx、cos2x...
对于连续函数,向量内积变成了函数积分:
∫
0
2
π
s
i
n
x
c
o
s
x
=
0
\int_0^{2\pi}sinxcosx=0
∫02πsinxcosx=0
将式(23)两边与
cos
x
\cos{x}
cosx做积分,根据标准正交基性质,有
∫
0
2
π
cos
x
f
(
x
)
=
∫
0
2
π
a
0
cos
x
+
a
1
cos
2
x
+
a
2
sin
x
cos
x
+
.
.
.
=
a
1
∫
0
2
π
cos
2
x
(24)
\begin{aligned}\int_0^{2\pi}\cos{x}f(x)=&\int_0^{2\pi}a_0\cos{x}+a_1\cos^2{x}+a_2\sin{x}\cos{x}+...\\ =&a_1\int_0^{2\pi}\cos^2{x}\end{aligned} \tag{24}
∫02πcosxf(x)==∫02πa0cosx+a1cos2x+a2sinxcosx+...a1∫02πcos2x(24)
得
a
1
=
∫
0
2
π
f
(
x
)
cos
x
d
x
π
a_1=\frac{\int_0^{2\pi}f(x)\cos{x}dx}{\pi}
a1=π∫02πf(x)cosxdx
以此类推,可以得到各个系数
本文详细介绍了线性代数中的特征值和特征向量概念,包括它们的求解方法、性质及应用。通过矩阵的SΛS^-1分解解释了特征向量如何影响矩阵的幂运算,并探讨了特征值在马尔科夫链中的作用。此外,还举例说明了如何使用特征值求解傅里叶级数。
&spm=1001.2101.3001.5002&articleId=104512074&d=1&t=3&u=9a171eb85b98478e8328b65f372af099)
2767

被折叠的 条评论
为什么被折叠?



