Time-Series
主成分分析可以用於股票價格/非平穩數據嗎?
我正在閱讀《黑客機器學習》一書中給出的示例。我將首先詳細說明示例,然後談談我的問題。
示例:
獲取 10 年 25 股價格的數據集。對 25 個股票價格運行 PCA。將主成分與道瓊斯指數進行比較。觀察到 PC 和 DJI 非常相似!
據我了解,這個例子更像是一個玩具,可以幫助像我這樣的新手了解 PCA 工具的有效性!
*但是,從另一個來源*閱讀,我發現股價是非平穩的,對股價運行 PCA 是荒謬的。我讀到的資料完全嘲笑為股價計算協方差和 PCA 的想法。
問題:
- 這個例子如何運作得如此好?股價與大疆的主成分分析非常接近。並且數據是2002-2011年股價的真實數據。
- 有人可以指出一些很好的資源來閱讀固定/非固定數據嗎?我是電腦程序編制員。我有很好的數學背景。但我已經有 3 年沒有認真做數學了。我又開始閱讀諸如隨機遊走之類的東西了。
這篇文章部分回答了原始問題以及對@JonEgil 答案的評論中提出的一些問題。
財務(對數)回報**約為* (儘管通常存在一些條件異方差)——而價格大約是隨機遊走。在假設下觀察,主成分分析將直接從樣本推廣到總體(即樣本主成分將估計總體主成分),但這可能不適用於非觀察 - 看到這個線程。這就是為什麼在(對數)回報而不是價格上運行 PCA 是有意義的。
Ruey S. Tsay 主張對金融時間序列的計量經濟學模型的殘差運行 PCA,因為殘差通常被假設為我認為這個想法可能包含在他的“使用 R 和金融應用程序的多變量時間序列分析”教科書中的某個地方(他親自向我解釋了這個想法,所以我不確定它寫在哪裡)。
- 價格的對數回報定義為. 為方便起見,使用對數回報代替百分比回報. 對數回報的方便特點是你可以總結單個對數回報以獲得總對數回報期間,而這不適用於百分比回報。對於相對較小的百分比回報(這在金融中很常見),對數回報大約等於回報百分比,因為對數的單位斜率大約為 1。