PCA 中的載荷與特徵向量:何時使用一個或另一個?
在主成分分析(PCA)中,我們得到特徵向量(單位向量)和特徵值。現在,讓我們將載荷定義為
我知道特徵向量只是方向,載荷(如上定義)還包括沿這些方向的方差。但為了更好地理解,我想知道我應該在哪裡使用載荷而不是特徵向量?一個例子將是完美的!
我通常只看到人們使用特徵向量,但他們偶爾會使用載荷(如上定義),然後我覺得我並不真正理解其中的區別。
在 PCA 中,您將協方差(或相關)矩陣拆分為比例部分(特徵值)和方向部分(特徵向量)。然後,您可以為特徵向量賦予比例:loadings。因此,載荷在量級上變得與觀察到的變量之間的協方差/相關性具有可比性,因為從變量的協變中提取的內容現在返回 - 以變量和主成分之間的協變的形式。實際上,載荷是原始變量和單位尺度分量之間的協方差/相關性。這個答案在幾何上顯示了負載是什麼,以及將組件與 PCA 或因子分析中的變量相關聯的係數是什麼。
裝載量:
- 幫助您解釋主成分或因素;因為它們是線性組合權重(係數),單位尺度的組件或因子藉此定義或“加載”變量。
(特徵向量只是正交變換或投影的係數,它的值內沒有“負載”。“負載”是(量的信息)方差,幅度。提取PC來解釋變量的方差。特徵值是(=解釋)PC的方差。當我們將特徵向量乘以特徵值的平方根時,我們“加載”裸係數乘以方差量。因此,我們使係數成為關聯的度量,co-變化性。) 2. 加載有時會在之後“旋轉”(例如 varimax)以促進可解釋性(另見); 3. 它是“恢復”原始協方差/相關矩陣的加載(另請參見討論 PCA 和 FA 在這方面的細微差別的線程); 4. 在 PCA 中,您可以從特徵向量和載荷中計算分量的值,而在因子分析中,您可以從載荷中計算因子得分。 5. 而且,最重要的是,加載矩陣是信息豐富的:它的垂直平方和是特徵值、分量的方差,它的水平平方和是變量方差的一部分,由分量“解釋”。 6. 重新調整或標準化的負載是負載除以變量的 st。偏差; 這是相關性。(如果您的 PCA 是基於相關性的 PCA,則加載等於重新調整後的 PCA,因為基於相關性的 PCA 是標準化變量的 PCA。)重新調整後的加載平方具有 pr 貢獻的含義。組成一個變量;如果它很高(接近 1),則該變量僅由該組件很好地定義。
在 PCA 和 FA 中完成的計算示例供您查看。
特徵向量是單位尺度的載荷;它們是變量正交變換(旋轉)到主成分或倒回的係數(餘弦)。因此很容易用它們計算組件的值(未標準化)。除此之外,它們的使用是有限的。特徵向量值平方的含義是變量對pr的貢獻。零件; 如果它很高(接近 1),則該分量僅由該變量很好地定義。
儘管特徵向量和載荷只是對錶示雙標圖上數據列(變量)的相同點的坐標進行歸一化的兩種不同方法,但混合這兩個術語並不是一個好主意。這個答案解釋了原因。另請參閱。