偏最小二乘法、降秩回歸和主成分回歸之間有什麼聯繫？

April 11, 2016

降秩回歸和主成分回歸只是偏最小二乘的特例嗎？

本教程（第 6 頁，“目標比較”）指出，當我們在不投影 X 或 Y 的情況下進行偏最小二乘法（即“不偏”）時，它相應地變為降秩回歸或主成分回歸。

在這個 SAS 文檔頁面，“降低秩回歸”和“方法之間的關係”部分也有類似的聲明。

一個更基本的後續問題是它們是否具有相似的潛在概率模型。

這是三種不同的方法，不能將它們視為另一種的特例。

形式上，如果和是居中的預測器（) 和響應 () 數據集，如果我們尋找第一對軸，為了和為了，那麼這些方法最大化以下數量：

（我在此列表中添加了典型相關分析 (CCA)。）

我懷疑這種混淆可能是因為在 SAS 中，所有三種方法似乎都是通過PROC PLS具有不同參數的相同函數實現的。因此，這三種方法似乎都是 PLS 的特殊情況，因為這就是 SAS 函數的命名方式。然而，這只是一個不幸的命名。實際上，PLS、RRR 和 PCR 是三種不同的方法，它們恰好在 SAS 中實現在一個函數中，由於某種原因被調用PLS。

您鏈接到的兩個教程實際上都非常清楚這一點。演示教程的第 6 頁說明了所有三種方法的目標，並且沒有說 PLS“變成”RRR 或 PCR，這與您在問題中聲稱的相反。同樣，SAS文檔解釋了三種不同的方法，給出了公式和直覺：

[P]主成分回歸選擇盡可能多地解釋預測變量變化的因素，降秩回歸選擇盡可能多解釋響應變量的因素，偏最小二乘法平衡兩個目標，尋找解釋響應變量和預測變量變化的因素.

SAS 文檔中甚至有一個圖顯示了一個很好的玩具示例，其中三種方法給出了不同的解決方案。在這個玩具示例中，有兩個預測器和和一個響應變量. 方向在最相關的恰好與最大方差的方向正交. 因此 PC1 與第一個 RRR 軸正交，PLS 軸介於兩者之間。

可以向 RRR 損失函數添加嶺懲罰，以獲得嶺降秩回歸或 RRRR。這會將回歸軸拉向 PC1 方向，有點類似於 PLS 正在做的事情。但是，RRRR 的成本函數不能寫成 PLS 形式，因此它們保持不同。

請注意，當只有一個預測變量時, CCA = RRR = 通常回歸。

引用自：https://stats.stackexchange.com/questions/206587

偏最小二乘法、降秩回歸和主成分回歸之間有什麼聯繫？

相關問答

如果使用所有 PC，PCA 是否提供優勢？

PCA 名稱中的“組件”一詞應該是單數還是複數？

當 PCA 不產生降維時，這意味著什麼？

結合 PCA、特徵縮放和交叉驗證，而不會洩露訓練測試數據

如何找到多邊形的協方差矩陣？

具有混合連續變量和二元變量的 t-SNE