樣本協方差矩陣是否總是對稱且正定的?
在計算樣本的協方差矩陣時,是否可以保證得到一個對稱的正定矩陣?
目前我的問題有 4600 個觀察向量和 24 個維度的樣本。
對於向量樣本 $ x_i=(x_{i1},\dots,x_{ik})^\top $ , 和 $ i=1,\dots,n $ ,樣本均值向量為 $$ \bar{x}=\frac{1}{n} \sum_{i=1}^n x_i , , $$樣本協方差矩陣為 $$ Q = \frac{1}{n} \sum_{i=1}^n (x_i-\bar{x})(x_i-\bar{x})^\top , . $$ 對於非零向量 $ y\in\mathbb{R}^k $ , 我們有 $$ y^\top Qy = y^\top\left(\frac{1}{n} \sum_{i=1}^n (x_i-\bar{x})(x_i-\bar{x})^\top\right) y $$ $$ = \frac{1}{n} \sum_{i=1}^n y^\top (x_i-\bar{x})(x_i-\bar{x})^\top y $$ $$ = \frac{1}{n} \sum_{i=1}^n \left( (x_i-\bar{x})^\top y \right)^2 \geq 0 , . \quad (*) $$ 所以, $ Q $ 總是半正定的。
附加條件 $ Q $ whuber在下面的評論中給出了肯定的結論。它如下。
定義 $ z_i=(x_i-\bar{x}) $ , 為了 $ i=1,\dots,n $ . 對於任何非零 $ y\in\mathbb{R}^k $ , $ (*) $ 為零當且僅當 $ z_i^\top y=0 $ , 對於每個 $ i=1,\dots,n $ . 假設集合 $ {z_1,\dots,z_n} $ 跨度 $ \mathbb{R}^k $ . 然後,有實數 $ \alpha_1,\dots,\alpha_n $ 這樣 $ y=\alpha_1 z_1 +\dots+\alpha_n z_n $ . 但是我們有 $ y^\top y=\alpha_1 z_1^\top y + \dots +\alpha_n z_n^\top y=0 $ , 產生 $ y=0 $ ,矛盾。因此,如果 $ z_i $ 的跨度 $ \mathbb{R}^k $ , 然後 $ Q $ 是肯定的。這個條件相當於 $ \mathrm{rank} [z_1 \dots z_n] = k $ .