Time-Series
為什麼在計算自相關時減去平均值?
自相關定義如下:
$$ \widehat{\rho}{k} = \frac{\sum{t=k+1}^{T}{\left(r_{t}-\overline{r}\right)\left(r_{t-k} - \overline{r}\right)}}{\left(\sum_{t=1}^{T}{r_{t} - \overline{r}}\right)^{2}} $$
為什麼需要從平均值中減去?
將值除以 $ k+1 $ 由值在 $ k $ 反而?
$$ \rho = \text{mean}\left(\frac{r_{k + 1}}{r_{k}}\right) $$
讓我們從基礎開始。方差告訴我們關於均值周圍的可變性
$$ \operatorname{Var}(X) = E[(X - E[X])^2] $$
您可以將此概念推廣到兩個變量,即協方差
$$ \operatorname{Cov}(X, Y) = E[(X - E[X]) (Y - E[Y])] $$
其中方差是它的一個特例
$$ \operatorname{Cov}(X, X) = E[(X - E[X])^2] $$
相關性只是一個歸一化的協方差,因此它的界限在 -1 和 1 之間,
$$ \operatorname{Corr}(X, Y) = \frac{\operatorname{Cov}(X, Y)}{\sigma_X \sigma_Y} $$
自相關只是相關的一種特殊情況。
是的,您可以計算兩個變量比率的期望值,在某些情況下,它可能是一個有意義的統計數據,但它不再衡量變量的“傳播”或“共同傳播”。
您可能有興趣閱讀如何向僅了解均值的人解釋協方差?線。