Normal-Distribution

非正定協方差矩陣告訴我關於我的數據的什麼信息?

  • June 14, 2012

我有許多多變量觀察結果,並想評估所有變量的概率密度。假設數據是正態分佈的。在變量數量較少的情況下,一切都按我的預期工作,但移動到更大的數量會導致協方差矩陣變得非正定。

我已將 Matlab 中的問題簡化為:

load raw_data.mat; % matrix number-of-values x number of variables
Sigma = cov(data);
[R,err] = cholcov(Sigma, 0); % Test for pos-def done in mvnpdf.

如果 err>0 則 Sigma 不是正定的。

為了在更高維度上評估我的實驗數據,我能做些什麼嗎?它是否告訴我有關我的數據的任何有用信息?

我在這方面有點初學者,所以如果我錯過了一些明顯的東西,我深表歉意。

協方差矩陣不是正定的,因為它是奇異的。這意味著您的至少一個變量可以表示為其他變量的線性組合。您不需要所有變量,因為至少一個變量的值可以從其他變量的子集中確定。我建議按順序添加變量並在每一步檢查協方差矩陣。如果一個新變量創建了一個奇點,則將其丟棄並繼續下一個。最終,您應該有一個具有正定協方差矩陣的變量子集。

引用自:https://stats.stackexchange.com/questions/30465

comments powered by Disqus