pca技術

即主成分分析技術,又稱主分量分析。主成分分析也稱主分量分析,旨在利用降維的思想,把多指標轉化為少數幾個綜合指標。

基本信息

概述

PCA(principal components analysis)即主成分分析技術,又稱主分量分析。主成分分析也稱主分量分析,旨在利用降維的思想,把多指標轉化為少數幾個綜合指標。

在統計學中,主成分分析PCA是一種簡化數據集的技術。它是一個線性變換。這個變換把數據變換到一個新的坐標系統中,使得任何數據投影的第一大方差在第一個坐標(稱為第一主成分)上,第二大方差在第二個坐標(第二主成分)上,依次類推。主成分分析經常用減少數據集的維數,同時保持數據集的對方差貢獻最大的特徵。這是通過保留低階主成分,忽略高階主成分做到的。這樣低階成分往往能夠保留住數據的最重要方面。但是,這也不是一定的,要視具體套用而定。

變換的步驟

(1) 第一步計算矩陣 X 的樣本的協方差矩陣 S(此為不標準PCA,標準PCA計算相關係數矩陣C) :

(2) 第二步計算協方差矩陣S(或C)的特徵向量 e1, e2,…, eN和特徵值 , t = 1,2,…,N ;

pca技術 pca技術

(3)第三步投影數據到特徵向量張成的空間之中。利用公式,其中BV值是原樣本中對應維度的值。

PCA 的目標是尋找 r ( r<n )個新變數,使它們反映事物的主要特徵,壓縮原有數據矩陣的規模,將特徵向量的維數降低,挑選出最少的維數來概括最重要特徵。每個新變數是原有變數的線性組合,體現原有變數的綜合效果,具有一定的實際含義。這 r 個新變數稱為“主成分”,它們可以在很大程度上反映原來 n 個變數的影響,並且這些新變數是互不相關的,也是正交的。通過主成分分析,壓縮數據空間,將多元數據的特徵在低維空間裡直觀地表示出來。

相關詞條

相關搜尋

熱門詞條

聯絡我們