特徵向量

特徵向量

數學上,線性變換的特徵向量(本徵向量)是一個非退化的向量,其方向在該變換下不變。該向量在此變換下縮放的比例稱為其特徵值(本徵值)。一個線性變換通常可以由其特徵值和特徵向量完全描述。特徵空間是相同特徵值的特徵向量的集合。“特徵”一詞來自德語的eigen。1904年希爾伯特首先在這個意義下使用了這個詞,更早亥爾姆霍爾茲也在相關意義下使用過該詞。eigen一詞可翻譯為”自身的”、“特定於……的”、“有特徵的”、或者“個體的”。這顯示了特徵值對於定義特定的線性變換有多重要。

基本信息

例子

夏季最高、最低溫度特徵向量空間分布圖夏季最高、最低溫度特徵向量空間分布圖

隨著地球的自轉,除了在轉軸上的兩個箭頭,每個從地心往外指的箭頭都在鏇轉。

考慮地球在自轉一小時後的變換:地心指向地理南極的箭頭是這個變換的一個特徵向量,但是從地心指向赤道上任何一點的箭頭不會是一個特徵向量。又因為指向極點的箭頭沒有被地球的自轉拉伸,所以它的特徵值是1。

另一個例子是,薄金屬板關於一個固定點均勻伸展,使得板上每一個點到該固定點的距離翻倍。這個伸展是一個具有特徵值2的變換。從該固定點到板上任何一點的向量都是一個特徵向量,而相應的特徵空間是所有這些向量的集合。

但是,三維幾何空間不是唯一的向量空間。例如,考慮兩端固定的拉緊的繩子,就像弦樂器的振動弦那樣。振動弦的原子到它們在弦靜止時所處的位置的帶符號的那些距離視為一個空間中的一個向量的分量,那個空間的維數就是弦上原子的個數。

如果考慮繩子隨著時間流逝發生的變換,它的特徵向量,或者說特徵函式(如果將繩子假設為一個連續媒介),就是它的駐波—也就是那些通過空氣的傳播讓人們聽到弓弦和吉他的撥動聲的振動。駐波對應於弦的特定振動,它們使得弦的形狀隨著時間變化而伸縮一個因子(特徵值)。和弦相關的該向量的每個分量乘上了一個依賴於時間的因子。駐波的振幅(特徵值)在考慮到阻尼的情況下逐漸減小。因此可以將每個特徵向量對應於一個壽命,並將特徵向量的概念和共振的概念聯繫起來。

特徵向量

簡介

計算矩陣的特徵值和特徵向量

假設我們想要計算給定矩陣的特徵值。若矩陣很小,我們可以用特徵多項式進行符號演算。但是,對於大型矩陣這通常是不可行的,在這種情況我們必須採用數值方法。

符號演算

關於此話題更進一步的細節,見矩陣特徵值的符號演算。

求特徵值

描述正方形矩陣的特徵值的重要工具是特徵多項式,λ是A的特徵值等價於線性方程組(A – λI) v = 0 (其中I是單位矩陣)有非零解v (一個特徵向量),因此等價於行列式|A – λI|=0.

函式p(λ) = det(A – λI)是λ的多項式,因為行列式定義為一些乘積的和,這就是A的特徵多項式。矩陣的特徵值也就是其特徵多項式的零點。

一個矩陣A的特徵值可以通過求解方程pA(λ) = 0來得到。 若A是一個n×n矩陣,則pA為n次多項式,因而A最多有n個特徵值。 反過來,代數基本定理說這個方程剛好有n個根,如果重根也計算在內的話。所有奇數次的多項式必有一個實數根,因此對於奇數n,每個實矩陣至少有一個實特徵值。在實矩陣的情形,對於偶數或奇數的n,非實數特徵值成共軛對出現。

求特徵向量

一旦找到特徵值λ,相應的特徵向量可以通過求解方程(A – λI) v = 0 得到。

沒有實特徵值的一個矩陣的例子是順時針鏇轉90度。

數值計算

關於此話題更進一步的細節,見特徵值算法。

在實踐中,大型矩陣的特徵值無法通過特徵多項式計算,計算該多項式本身相當費資源,而精確的“符號式”的根對於高次的多項式來說很難計算和表達:阿貝爾-魯費尼定理顯示高次(5次或更高)多項式的根無法用n次方根來簡單表達。對於估算多項式的根的有效算法是有的,但特徵值的小誤差可以導致特徵向量的巨大誤差。求特徵多項式的零點,即特徵值的一般算法,是疊代法。最簡單的方法是冪法:取一個隨機向量v,然後計算一系列單位向量。

這個序列幾乎總是收斂於絕對值最大的特徵值所對應的特徵向量。這個算法很簡單,但是本身不是很有用。但是,象QR算法這樣的算法正是以此為基礎的。

分解定理

如上所述,譜定理表明正方形矩陣可以對角化若且唯若它是正規的。對於更一般的未必正規的矩陣,我們有類似的結果。當然在一般的情況,有些要求必須放鬆,例如酉等價性或者最終的矩陣的對角性。 所有這些結果在一定程度上利用了特徵值和特徵向量。下面列出了一些這樣的結果:

舒爾三角形式表明任何酉矩陣等價於一個上三角矩陣;

奇異值分解定理, A = UΣV * 其中Σ為對角陣,而U,V為酉矩陣。A = UΣV * 的對角線上的元素非負,而正的項稱為A的奇異值。這對非正方形矩陣也成立;

若當標準型,其中A = UΛU − 1 其中Λ不是對角陣,但是分塊對角陣,而U是酉矩陣。若當塊的大小和個數由特徵值的幾何和代數重次決定。若當分解是一個基本的結果。從它可以立即得到一個正方形矩陣可以完全用它的特徵值包括重次來表述,最多只會相差一個酉等價。這表示數學上特徵值在矩陣的研究中有著極端重要的作用。

作為若當分解的直接結果,一個矩陣A可以“唯一”地寫作A = S + N其中S可以對角化,N是冪零的(也即,對於某個q,Nq=0),而S和N可交換(SN=NS)。

任何可逆矩陣A可以唯一地寫作A = SJ,其中S可對角化而J是么冪矩陣(即使得特徵多項式是(λ-1)的冪,而S和J可交換)。

定理套用

薛丁格方程

一個變換用微分運算元代表的特徵值方程的例子是量子力學中的時不變薛丁格方程:HΨE = EΨE

其中H是哈密爾頓運算元,一個二階微分運算元而ΨE是波函式,對應於特徵值E的特徵函式,該值可以解釋為它的能量。

一個氫原子中的一個電子的束縛態所對應的波函式可以視為氫原子哈密爾頓運算元的一個特徵向量,也是角動量運算元的一個特徵向量。它們對應於可以解釋為它們的能量(遞增:n=1,2,3,...)和角動量(遞增:s, p, d,...)的特徵值。這裡畫出了波函式絕對值的平方。更亮區域對應於位置測度的更高機率密度。每幅圖的中心都是原子核,一個質子但是,在這個情況我們只尋找薛定鄂方程的束縛態解,就像在量子化學中常做的那樣,我們在平方可積的函式中尋找ΨE。因為這個空間是一個希爾伯特空間,有一個定義良好的標量積,我們可以引入一個基集合,在其中ΨE和H可以表示為一個一維數組和一個矩陣。這使得我們能夠用矩陣形式表達薛定鄂方程。

狄拉克記法經常在這個上下文中使用,以強調狀態的向量和它的表示,函式ΨE之間的區別。在這個情況下,薛定鄂方程寫作

並稱是H的一個本徵態(H有時候在入門級課本中寫作),H被看作是一個變換(參看觀測值)而不是一個它用微分運算元術語進行的特定表示。在上述方程中,理解為通過套用H到得到的一個向量。

分子軌道

在量子力學中,特別是在原子物理和分子物理中,在Hartree-Fock理論下,原子軌道和分子軌道可以定義為Fock運算元的特徵向量。相應的特徵值通過Koopmans定理可以解釋為電離勢能。在這個情況下,特徵向量一詞可以用於更廣泛的意義,因為Fock運算元顯式地依賴於軌道和它們地特徵值。如果需要強調這個特點,可以稱它為隱特徵值方程。這樣地方程通常採用疊代程式求解,在這個情況下稱為自洽場方法。在量子化學中,經常會把Hartree-Fock方程通過非正交基集合來表達。這個特定地表達是一個廣義特徵值問題稱為Roothaan方程。

因子分析

在因素分析中,一個協變矩陣的特徵向量對應於因素,而特徵值是因素負載。因素分析是一種統計學技術,用於社會科學和市場分析、產品管理、運籌規劃和其他處理大量數據的套用科學。其目標是用稱為因素的少量的不可觀測隨機變數來解釋在一些可觀測隨機變數中的變化。可觀測隨機變數用因素的線性組合來建模,再加上“殘差項。

特徵臉是特徵向量的例子

在圖像處理中,臉部圖像的處理可以看作分量為每個像素的輝度的向量。該向量空間的維數是像素的個數。一個標準化面部圖形的一個大型數據集合的協變矩陣的特徵向量稱為特徵臉。它們對於將任何面部圖像表達為它們的線性組合非常有用。特徵臉提供了一種用於識別目的的數據壓縮方式。在這個套用中,一般只取那些最大特徵值所對應的特徵臉。

慣量張量

在力學中,慣量的特徵向量定義了剛體的主軸。慣量是決定剛體圍繞質心轉動的關鍵數據。

應力張量

在固體力學中,應力張量是對稱的,因而可以分解為對角張量,其特徵值位於對角線上,而特徵向量可以作為基。因為它是對角陣,在這個定向中,應力張量沒有剪下分量;它只有主分量。

圖特徵值

在譜系圖論中,一個圖的特徵值定義為圖的鄰接矩陣A的特徵值,或者(更多的是)圖的拉普拉斯運算元矩陣I − T − 1 / 2AT − 1 / 2,其中T是對角陣表示每個頂點的度數,在T − 1 / 2中,0用於取代0 − 1 / 2。圖的主特徵向量用於測量其頂點的中心度。Google的PageRank算法就是一個例子。www圖的修正鄰接矩陣的主特徵向量的分量給出了頁面評分。

相關詞條

相關搜尋

熱門詞條

聯絡我們