欧洲女孩评价中国男孩:分享:特征值和特征向量的物理意义

来源:百度文库 编辑:偶看新闻 时间:2024/05/05 05:54:20

特征值和特征向量的物理意义

ABSTRACT:

特征向量:它经过这种特定的变换后保持方向不变.只是进行长度上的伸缩而已。

特征值: 一个变换(矩阵)可由它的所有特征向量完全表示,而每一个向量所对应的特征值,就代表了矩阵在这一向量上的贡献率——说的通俗一点就是能量(power)。

内积:内积可以简单的理解为两个函数的相似程度,内积值越大表示两个函数相似程度越大,内积为零表示完全不相似。两个函数内积为零则两个函数正交,在三维空间中它们的夹角为90度,在三维以上不是这样的。

CONTENT

矩阵(既然讨论特征向量的问题.当然是方阵.这里不讨论广义特征向量的概念)乘以一个向量的结果仍是同维数的一个向量.因此.矩阵乘法对应了一个变换.把一个向量变成同维数的另一个向量.那么变换的效果是什么呢?这当然与方阵的构造有密切关系.比如可以取适当的二维方阵.使得这个变换的效果就是将平面上的二维向量逆时针旋转30度.这时我们可以问一个问题.有没有向量在这个变换下不改变方向呢?可以想一下.除了零向量.没有其他向量可以在平面上旋转30度而不改变方向的.所以这个变换对应的矩阵(或者说这个变换自身)没有特征向量(注意:特征向量不能是零向量).所以一个变换的特征向量是这样一种向量.它经过这种特定的变换后保持方向不变.只是进行长度上的伸缩而已(再想想特征向量的原始定义Ax= cx.你就恍然大悟了.看到了吗?cx是方阵A对向量x进行变换后的结果.但显然cx和x的方向相同).而且x是特征向量的话.ax也是特征向量(a是标量且不为零).所以所谓的特征向量不是一个向量而是一个向量族. 另外.特征值只不过反映了特征向量在变换时的伸缩倍数而已.对一个变换而言.特征向量指明的方向才是很重要的.特征值不是那么重要.虽然我们求这两个量时 先求出特征值.但特征向量才是更本质的东西!

比如平面上的一个变换.把一个向量关于横轴做镜像对称变换.即保持一个向量的横坐标不变.但纵坐标取相反数.把这个变换表示为矩阵就是[1 0;0 -1].其中分号表示换行.显然[1 0;0 -1]*[a b]'=[a –b]'.其中上标 ' 表示取转置.这正是我们想要的效果.那么现在可以猜一下了.这个矩阵的特征向量是什么?想想什么向量在这个变换下保持方向不变.显然,横轴上的向量在这个变换下保持方向不变(记住这个变换是镜像对称变换.那镜子表面上(横轴上)的向量当然不会变化).所以可以直接猜测其特征向量是 [a 0]'(a不为0).还有其他的吗?有.那就是纵轴上的向量.这时经过变换后.其方向反向.但仍在同一条轴上.所以也被认为是方向没有变化。

当我们引用了Spectral theorem(谱定律)的时候,情况就不一样了。Spectral theorem的核心内容如下:一个线性变换A(用矩阵乘法表示)可表示为它的所有的特征向量的一个线性组合,其中的线性系数就是每一个向量对应的特征值,写成公式就是:
T(x)=(V1.x)λ1V1+(V2.x)λ2V2+(V3.x)λ3V3+...
其中,V1 V2 V3等表示特征向量,λ1 λ2 λ3等表示特征值,V表示输入向量,T(x)即变换后的向量。

从这里我们可以看出,一个变换(矩阵)可由它的所有特征向量完全表示(即T(x)=Ax)。而每一个向量所对应的特征值,就代表了矩阵在这一向量上的贡献率——说的通俗一点就是能量(power),这种贡献是一种整体上的贡献率,对于单个向量来说还要考虑特征向量V与输入向量x的点积,即dot(V,x)部分。也就是说,即使λ1相比其它特征值来说很大,使得V1的贡献率很高,但是(V1.x)=0,T(x)在V1上也没有任何表现。

我们知道,一个变换可由一个矩阵乘法表示,那么一个空间坐标系也可视作一个矩阵,而这个坐标系就可由这个矩阵的所有特征向量表示,用图来表示的话,可以想象就是一个空间张开的各个坐标角度,这一组向量可以完全表示一个矩阵表示的空间的“特征”,而他们的特征值就表示了各个角度上的能量(可以想象成从各个角度上伸出的长短,越长的轴就越可以代表这个空间,它的“特征”就越强,或者说显性,而短轴自然就成了隐性特征),因此,通过特征向量/值可以完全描述某一几何空间这一特点,使得特征向量与特征值在几何(特别是空间几何)及其应用中得以发挥。

---

案例学习:二维空间直角坐标系下,有一向量x=[1 1]',求通过变换矩阵A=[1 2;3 4]后的向量。

步骤1:题目中之所以强调直角坐标系,是因为想让大家清楚,日常生活中所默认的这种坐标系的变换矩阵为A0=[1 0; 0 1],其对应的2组特征值和特征向量为:横坐标即λ1=1,V1=[1 0]'; 纵坐标即λ2=1,V2=[0 1]'。V1和V2也可以称为二维空间的一组基。

你可以发现T(x)=A0x=[1 0; 0 1] *[1 1]'=[1 1]'。根据谱定理也有:T(x)=(V1.x)λ1V1+(V2.x)λ2V2=dot(V1,x)* λ1*V1+dot(V2,x)* λ2*V2=[1 1]'。

步骤2:下面看一下题目中的变换矩阵A=[1 2;3 4],其对应的特征值和特征向量为:λ1=-0.3723,V1=[-0.8246 0.5658]'; λ2=5.3723,V2=[-0.4160 -0.9094]'。如果不假思索直接得到T(x)=Ax=[3 7]',当然结果正确,但本案例旨在说明这个结果的意义和背后的故事。首先需要明白结果[3 3]'仍然是在直角坐标系下,即基为[1 0]'和[0 1]'。根据谱定理也有:T(x)=(V1.x)λ1V1+(V2.x)λ2V2=dot(V1,x)* λ1*V1+dot(V2,x)* λ2*V2=[2.8824 6.5294]'≈[3 7]'。将x变换前后的在直角坐标系中的向量图表示如下,图中得出:Ax的作用是旋转和缩放。


步骤3: 更换直角坐标系的基,由原来的[1 0]'和[0 1]'变为由A的特征向量[-0.8246 0.5658]'和[-0.4160 -0.9094]'组成的一对正交基。将x映射到此正交基构成的坐标系中,得到[-0.2588   -1.3254]'(变换前的x)和 [1.4867   -7.6136](变换后的x)。下图给出了坐标系变换前后的对比图,图中可得:更换正交基是对整个坐标系进行旋转和缩放。