Time-Series
關於樣本自協方差函數的問題
我正在閱讀時間序列分析書,書中將樣本自協方差的公式定義為:
和為了.是平均值。
有人可以直觀地解釋為什麼我們將總和除以而不是通過? 這本書解釋說,這是因為上面的公式是一個非負定函數,所以除以是首選,但這對我來說並不清楚。有人可以證明這一點或展示一個例子或其他東西嗎?
對我來說,一開始直觀的事情是除以. 這是自協方差的無偏估計還是有偏估計?
用於創建協方差矩陣:給定“次”, 它估計隨機向量的協方差(從當時的隨機場中獲得)是矩陣. 對於許多問題,例如預測,所有這些矩陣都是非奇異的至關重要。作為假定的協方差矩陣,顯然它們不能有任何負特徵值,因此它們都必須是正定的。
最簡單的情況其中兩個公式的區別
和
出現是什麼時候有長度; 說,. 為了和計算很簡單
這是單數,而
具有特徵值和,因此它是正定的。
類似的現象發生在, 在哪裡是正定的但是——當應用於時代, 說——退化成一個秩矩陣(它的條目在和)。
(這裡有一個模式:任何問題都會出現形式的.)
在大多數應用中,觀察系列太長了,對大多數人來說感興趣的——遠低於- 和…之間的不同和沒有任何後果。因此,在實踐中,這種區別沒什麼大不了的,理論上對正定性的需求大大超過了對無偏估計的任何可能的需求。