特徵矢量

變換的主特徵矢量是模最大的特徵值對應的特徵矢量。 有限維矢量空間上的一個變換的譜是其所有特徵值的集合。 一個代數重次1的特徵值為“單特徵值”。

在數學上,特別是線性代數中,對於一個給定的線性變換,它的特徵矢量(本徵矢量或稱正規正交矢量)是這樣一個非零的矢量v:當v 經過這個線性變換[1]的作用之後,得到的新矢量(長度也許改變)仍然與原來的v 保持在同一條直線上。一個特徵矢量的長度在該線性變換下縮放的比例稱為其特徵值(本徵值)。如果特徵值為正,則表示v 在經過線性變換的作用後方向也不變;如果特徵值為負,說明方向會反轉;如果特徵值為0,則是表示縮回零點。但無論怎樣,仍在同一條直線上。圖1給出了一個以著名油畫《蒙娜麗莎》為題材的例子。在一定條件下(如矩陣形式為實對稱矩陣的線性變換),一個變換可以由其特徵值和特徵矢量完全表述。一個特徵空間是相同特徵值的特徵矢量的集合,可以表明該集合是一個線性子空間。
這些概念在純數學和套用數學的眾多領域中都有重要的套用。線上性代數和泛函分析之外,甚至在一些非線性的情況下,這些概念都是十分重要的。
“特徵”一詞來自德語的eigen,由希爾伯特在1904年首先在這個意義下使用(亥爾姆霍爾茲在更早的時候也在類似意義下使用過這一概念)。eigen一詞可翻譯為“自身的”,“特定於...的”,“有特徵的”或者“個體的”—這強調了特徵值對於定義特定的變換被認為是很重要的。

定義

給定一個矢量空間Ε,從EE自身的線性變換T是—個保持矢量加法標量乘法函式,例如旋轉反射、拉伸壓縮,或者這些變換的組合等等。一個線性變換可以通過它們在矢量上的作用來可視化。一般來說,一個矢量在經過映射之後可以變為任何可能的矢量,而特徵矢量具有更好的性質。
一個線性變換T:E→E特徵矢量v是在這個線性變換下簡單地乘以一個標量λ的非零矢量。也就是說λ 滿足:
T(v)=λ(v)其中的縮放因子稱為這個特徵矢量的特徵值,或者說是線性變換T的特徵值。反過來,一個實數λ是線性變換T的一個特徵值,若且唯若有一個非零矢量v滿足上面的式子 。
所有具有相同的特徵值λ的特徵矢量和零矢量一起,組成了一個矢量空間,稱為線性變換的一個特徵空間,一般記作Eλ(T)。這個特徵空間如果是有限維的,那么它的維數叫做λ 的幾何重數
變換的主特徵矢量最大的特徵值對應的特徵矢量。有限維矢量空間上的一個變換的是其所有特徵值的集合
特徵矢量也可以看作是關於係數λ的方程:
T(x)=λ(x的非零解。顯然只有在λ是變換T的特徵值之時,方程才有非零解。

性質

代數重次

A的一個特徵值λ的代數重數是λ作為A的特徵多項式的根的次數;換句話說,若r是一個該多項式的根,它是一次多項式因子(λ - r)在特徵多項式中在因式分解後中出現的次數。如果將代數重次計算在內的話,一個n×n矩陣有n個特徵值,因為其特徵多項式次數為n。
一個代數重次1的特徵值為“單特徵值”。
在關於矩陣理論的條目中,可能會遇到如下的表示方法:
"一個矩陣A的特徵值為4,4,3,3,3,2,2,1,"
表示4的代數重次為二,3的是三,2的是二,而1的是1。這樣寫是因為代數重次對於矩陣理論中的很多數學證明很重要而被大量使用。
和代數重數相對的是特徵值的幾何重數:特徵值相對應的特徵空間(也就是λI − A的零空間)的維數。代數重次也可以視為一種維數:它是相應廣義特徵空間的維數,也就是當自然數k足夠大的時候矩陣(λI − A)的零空間。也就是說,它是所有“廣義特徵矢量”組成的空間,其中一個廣義特徵矢量是任何一個如果λI − A作用連續作用足夠多次就“最終”會變0的矢量。任何特徵矢量都是一個廣義特徵矢量,以此任一個特徵空間都被包含於相應的廣義特徵空間。這給了一個幾何重次總是小於代數重次的簡單證明。
廣義特徵矢量可以用於計算一個矩陣的若爾當標準型(參看下面的討論)。若爾當塊通常不是對角化而是冪零的這個事實與特徵矢量和廣義特徵矢量之間的區別直接相關。

一般矩陣分解定理

如上所述,譜定理表明正方形矩陣可以對角化若且唯若它是正規的。對於更一般的未必正規的矩陣,我們有類似的結果。當然在一般的情況,有些要求必須放鬆,例如酉等價性或者最終的矩陣的對角性。 所有這些結果在一定程度上利用了特徵值和特徵矢量。下面列出了一些這樣的結果:
舒爾三角形式表明任何矩陣酉等價於一個上三角矩陣;
奇異值分解定理, A = UΣV 其中Σ為對角陣,而U,V為酉矩陣。A = UΣV 的對角線上的元素非負,而正的項稱為A的奇異值。這對非正方形矩陣也成立;
若爾當標準型,其中A = UΛU其中Λ不是對角陣,但是分塊對角陣,而U是酉矩陣。
若爾當塊的大小和個數由特徵值的幾何和代數重次決定。若爾當分解是一個基本的結果。從它可以立即得到一個正方形矩陣可以完全用它的特徵值包括重次來表述,最多只會相差一個酉等價。這表示數學上特徵值在矩陣的研究中有著極端重要的作用。
作為若爾當分解的直接結果,一個矩陣A可以“唯一”地寫作A = S + N其中S可以對角化,N是冪零的(也即,對於某個q,N=0),而S和N可交換(SN=NS)。
任何可逆矩陣A可以唯一地寫作A = SJ,其中S可對角化而J是么冪矩陣 (也即,使得特徵多項式是(λ-1)的冪,而S和J可交換)。

特徵值的一些另外的屬性

譜在相似變換不變:矩陣A和PAP有相同的特徵值,這對任何矩陣A和任何可逆矩陣P都成立。譜在轉置之下也不變:矩陣A和A有相同的特徵值。
因為有限維空間上的線性變換是雙射若且唯若它是單射,一個矩陣可逆若且唯若所有特徵值都不是0。
若爾當分解的一些更多的結果如下:
一個矩陣是對角矩陣若且唯若代數和幾何重次對於所有特徵值都相等。特別的有,一個n×n矩陣如果有n不同特徵值,則總是可以對角化的。矩陣作用的矢量空間可以視為其廣義特徵矢量所撐成的不變子空間的直和。對角線上的每個塊對應於該直和的一個子空間。若一個塊是對角化的,其不變子空間是一個特徵空間。否則它是一個廣義特徵空間,如上面所定義;因為,也就是矩陣主對角線元素之和,在酉等價下不變,若爾當標準型說明它等於所有特徵值之和;類似的有,因為三角矩陣的特徵值就是主對角線上的項,其行列式等於等於特徵值的乘積(按代數重次計算出現次數)。
正規矩陣的一些子類的譜的位置是:
一個埃爾米特矩陣(A = A)的所有特徵值是實數。進一步的有,所有正定矩陣(vAv > 0 for all vectors v)的所有特徵值是正數;所有斜埃爾米特矩陣(A = −A)的特徵值是純虛數;所有酉矩陣(A = A)的特徵值絕對值為1;
假設A是一個m×n矩陣,其中m ≤ n,而B是一個n×m矩陣。則BA有和AB相同的特徵值加上n − m個等於0的特徵值。
每個矩陣可以被賦予一個運算元範數。運算元範數是其特徵值的模的上確界,因而也是它的譜半徑。該範數直接和計算最大模的特徵值的冪法直接相關。當一個矩陣是正規的,其運算元範數是其特徵值的最大模,並且獨立於其定義域的範數。

係數為環中元素

在方矩陣A,其係數屬於一個的情況,λ稱為一個右特徵值如果存在一個列矢量x使得Ax=λx,或者稱為一個左特徵值如果存在非零行矢量y使得yA=yλ。
若環是可交換的,左特徵值和右特徵值相等,並簡稱為特徵值。否則,例如當環是四元數集合的時候,它們可能是不同的。

套用

分子軌域

量子力學中,特別是在原子物理和分子物理中,在Hartree-Fock理論下,原子軌域和分子軌域可以定義為Fock運算元的特徵矢量。相應的特徵值通過Koopmans定理可以解釋為電離勢能。在這個情況下,特徵矢量一詞可以用於更廣泛的意義,因為Fock運算元顯式地依賴於軌道和它們地特徵值。如果需要強調這個特點,可以稱它為隱特徵值方程。這樣地方程通常採用疊代程式求解,在這個情況下稱為自洽場方法。在量子化學中,經常會把Hartree-Fock方程通過非正交基集合來表達。這個特定地表達是一個廣義特徵值問題稱為Roothaan方程。

因子分析

因素分析中,一個協方差矩陣的特徵矢量對應於因素,而特徵值是因素負載。因素分析是一種統計學技術,用於社會科學市場分析產品管理、運籌規劃和其他處理大量數據的套用科學。其目標是用稱為因素的少量的不可觀測隨機變數來解釋在一些可觀測隨機變數中的變化。可觀測隨機變數用因素的線性組合來建模,再加上“殘差項。

振動分析

在對於多自由度機械結構作振動分析時,常常會遇到特徵值問題。經過仔細解析,求得的特徵值會給出振動的自然頻率,而特徵矢量則會給出振動模態的振動行為。由於特徵矢量的相互正交性質,允許對應的微分方程式能夠解耦合(decouple),整個系統可以表示為特徵矢量的線性總和。有限元分析是一種非常優良的方法,時常用來解析複雜結構的特徵值問題。

特徵臉

圖像處理中,部圖像的處理可以看作分量為每個像素灰度的矢量。該矢量空間的維數是像素的個數。一個標準化面部圖形的一個大型數據集合的協方差矩陣的特徵矢量稱為特徵臉。它們對於將任何面部圖像表達為它們的線性組合非常有用。特徵臉提供了一種用於識別目的的數據壓縮的方式。在這個套用中,一般只取最大那些特徵值所對應的特徵臉 。

相關詞條

相關搜尋

熱門詞條

聯絡我們