Covariance

協方差矩陣和協方差矩陣的逆矩陣之間的幾何關係是什麼?

  • May 4, 2020

協方差矩陣表示數據點的離散度,而協方差矩陣的逆表示數據點的緊密度。離散度和緊密度如何在幾何上相關?

例如,協方差矩陣的行列式表示數據點的離散量。協方差矩陣的逆矩陣的行列式代表什麼?行列式與體積有關,但我不明白如何解釋協方差矩陣的逆體積(或信息矩陣的體積)。

同樣,跡線表示數據點的均方誤差,但是協方差矩陣的逆的跡線代表什麼?

我不太明白如何從幾何上解釋協方差矩陣的逆,或者它與協方差矩陣的關係。

在回答您的問題之前,請允許我分享一下我對協方差和精度矩陣的看法。

協方差矩陣具有特殊的結構:它們是半正定 (PSD),這意味著對於協方差矩陣 $ \Sigma $ 大小的 $ m\text{x}m $ , 有向量 $ x $ 大小的 $ m\text{x}1 $ 這樣 $ x^T\Sigma x\geq0 $ .

這樣的矩陣有一個很好的性質:它們可以分解為 $ \Sigma=R\Lambda R^T $ ,其中 R 是旋轉矩陣,並且 $ \Lambda $ 是對角矩陣。

現在我們已經有了定義,讓我們看看這意味著什麼 $ \Sigma $ 大小為 2x2(即我們的數據集有兩個變量)。在下圖中,我們在圖a中看到了一個恆等協方差矩陣,這意味著數據變量之間沒有相關性。這可以畫成一個圓圈。在圖像下方,我們看到一個單位協方差矩陣分解為 $ \Sigma=R\Lambda R^T $ 形式。

在圖b中,我們可以看到如果我們用兩個不同的因子縮放變量的方差,幾何會發生什麼。這些變量仍然不相關,但它們各自的方差現在分別為mn。現在我們如何在混合中引入相關性?我們在旋轉矩陣的幫助下旋轉橢圓,對於圖c ,它很簡單:

$ R = \begin{bmatrix} cos(\theta) & sin(\theta)\ -sin(\theta) & cos(\theta) \end{bmatrix} $

旋轉矩陣有一個很好的特性:它們是正交的並且 $ RR^T=1 \therefore R^T=R^{-1} $

離題之後,讓我們回到我們的協方差矩陣。為了 $ \Sigma $ : $ \Sigma = R\Lambda R^T = \begin{bmatrix} R_{11} & R_{12}\ R_{21} & R_{22} \end{bmatrix} \begin{bmatrix} \lambda_1 & 0\ 0 & \lambda_2 \end{bmatrix} \begin{bmatrix} R_{11} & R_{21}\ R_{12} & R_{22} \end{bmatrix} $

現在一些有趣的事實: $ det(\Sigma)=\prod_{i}\lambda_i=\lambda_1\lambda_2 $ 和 $ tr(\Sigma)=\sum_{i}\lambda_i=\lambda_1+\lambda_2 $ . 這是踢球者: $ R $ 實際上由特徵向量組成 $ \Sigma $ 和 $ \lambda_i $ 是特徵值。

最後,請注意 $ \Sigma^{-1} $ 也是具有以下分解的PSD: $ \Sigma^{-1} = (R\Lambda R^T)^{-1} = (\Lambda R^T)^{-1}(R)^{-1}=(R^T)^{-1}\Lambda^{-1}R^{-1}=R\Lambda^{-1}R^T $ ,在最後的簡化中,我們使用了 $ RR^T=1 $ .

此外: $ \Lambda^{-1} = \begin{bmatrix} \frac{1}{\lambda_1} & 0\ 0 & \frac{1}{\lambda_2} \end{bmatrix} $ ,也就是說,我們只是沿對角線取元素的逆!

有了這些信息,我們現在可以回答您的問題了!

在此處輸入圖像描述

離散度和緊密度如何在幾何上相關?

色散讓您感覺橢圓的面積與圓形的面積相比,緊密度是色散的倒數。色散告訴您單位圓發生了多少面積變化(具有不相關的變量和單位特徵向量),緊密度告訴您必須在橢圓中**撤消多少面積,因此它最終成為單位方差。

協方差矩陣的逆矩陣的行列式代表什麼?

自從 $ \Lambda^{-1} = \begin{bmatrix} \frac{1}{\lambda_1} & 0\ 0 & \frac{1}{\lambda_2} \end{bmatrix} $ , 精度矩陣的行列式 ( $ \frac{1}{\lambda_1\lambda_2} $ ) 告訴您必須在數據方差上撤消多少區域更改,因此您最終會得到單位方差。回想起那個 $ det(\Sigma)=\lambda_1\lambda_2 $ .

協方差矩陣的逆的跡代表什麼?

它等於 $ \lambda_1^{-1}+\lambda_2^{-1} $ . 幾何解釋 $ tr(\Sigma^{-1}) $ 不太清楚。

引用自:https://stats.stackexchange.com/questions/464387

comments powered by Disqus