Correlation

相關性是否假設數據的平穩性?

  • February 18, 2011

市場間分析是一種通過尋找不同市場之間的關係來對市場行為進行建模的方法。通常,計算兩個市場之間的相關性,例如標準普爾 500 指數和 30 年期美國國債。這些計算往往基於價格數據,這對每個人來說都是顯而易見的,它不符合平穩時間序列的定義。

除了可能的解決方案(使用返回代替)之外,數據是非平穩的相關性計算甚至是有效的統計計算嗎?

你會說這樣的相關性計算有些不可靠,還是純屬胡說八道?

相關性衡量線性關係。在非正式的語境中,關係意味著某種穩定的東西。當我們計算固定變量的樣本相關性並增加可用數據點的數量時,該樣本相關性趨於真正的相關性。

可以證明,對於通常是隨機遊走的價格,樣本相關性趨於隨機變量。這意味著無論我們有多少數據,結果總是不同的。

注意我嘗試在沒有數學的情況下表達數學直覺。從數學的角度來看,解釋非常清楚:平穩過程的樣本矩以概率收斂到常數。隨機遊走的樣本矩收斂到作為隨機變量的布朗運動的積分。由於關係通常表示為數字而不是隨機變量,因此不計算非平穩變量的相關性的原因就很明顯了。

更新由於我們對兩個變量之間的相關性感興趣,首先假設它們來自平穩過程. 平穩性意味著和不依賴. 所以相關性

也不依賴於, 因為公式中的所有量都來自矩陣,不依賴於. 所以樣本相關性的計算

是有道理的,因為我們可能有合理的希望樣本相關性將估計. 事實證明,這種希望並非沒有根據,因為對於滿足某些條件的平穩過程,我們有, 作為在概率上。此外在分佈中,所以我們可以檢驗關於. 現在假設不是靜止的。然後可能取決於. 所以當我們觀察一個大小的樣本時我們可能需要估計不同的相關性. 這當然是不可行的,所以在最好的情況下,我們只能估計一些函數例如均值或方差。但結果可能沒有合理的解釋。

現在讓我們看看研究最多的非平穩過程隨機遊走的相關性會發生什麼。我們稱之為過程如果隨機遊走, 在哪裡是一個平穩的過程。為簡單起見,假設. 然後

為了進一步簡化問題,假設是白噪聲。這意味著所有相關性為零. 請注意,這並不限制為零。

然後

到目前為止一切都很好,儘管過程不是靜止的,但相關性是有意義的,儘管我們必須做出同樣的限制性假設。

現在要看看樣本相關性會發生什麼,我們需要使用以下關於隨機遊走的事實,稱為功能中心極限定理:

在分佈中,其中和是二元布朗運動(二維維納過程)。為方便介紹定義. 再次為簡單起見,讓我們將樣本相關性定義為

讓我們從方差開始。我們有

這會無窮大增加,所以我們遇到了第一個問題,樣本方差不收斂。另一方面, 連續映射定理與功能中心極限定理相結合給了我們

其中收斂是分佈收斂,如. 同樣我們得到

所以最後對於我們隨機遊走的樣本相關性,我們得到

在分佈為. 因此,儘管相關性已明確定義,但樣本相關性並沒有向它收斂,就像在靜止過程的情況下一樣。相反,它會收斂到某個隨機變量。

引用自:https://stats.stackexchange.com/questions/7376

comments powered by Disqus