R

自由度可以是非整數嗎?

  • May 21, 2017

當我使用 GAM 時,它給了我剩餘的 DF 是(代碼中的最後一行)。這意味著什麼?超越 GAM 示例,一般來說,自由度的數量可以是非整數嗎?

> library(gam)
> summary(gam(mpg~lo(wt),data=mtcars))

Call: gam(formula = mpg ~ lo(wt), data = mtcars)
Deviance Residuals:
   Min      1Q  Median      3Q     Max 
-4.1470 -1.6217 -0.8971  1.2445  6.0516 

(Dispersion Parameter for gaussian family taken to be 6.6717)

   Null Deviance: 1126.047 on 31 degrees of freedom
Residual Deviance: 177.4662 on 26.6 degrees of freedom
AIC: 158.4294 

Number of Local Scoring Iterations: 2 

Anova for Parametric Effects
           Df Sum Sq Mean Sq F value    Pr(>F)    
lo(wt)     1.0 847.73  847.73  127.06 1.239e-11 ***
Residuals 26.6 177.47    6.67                      

在許多情況下,自由度都是非整數的。實際上,在某些情況下,您可以確定適合某些特定模型的數據的自由度必須介於某個值之間 $ k $ 和 $ k+1 $ .

我們通常將自由度視為自由參數的數量,但在某些情況下,參數不是完全自由的,因此很難計算。例如,在平滑/正則化時可能會發生這種情況。

局部加權回歸/核方法和平滑樣條曲線的例子就是這種情況的例子——自由參數的總數不是你可以通過添加預測變量輕易計算出來的,因此需要更一般的自由度概念。

在部分基於的廣義加法模型gam,Hastie 和 Tibshirani (1990) [1](實際上在許多其他參考資料中)對於我們可以編寫的一些模型 $ \hat y = Ay $ , 自由度有時被認為是 $ \operatorname{tr}(A) $ (他們還討論 $ \operatorname{tr}(AA^T) $ 或者 $ \operatorname{tr}(2A-AA^T) $ )。第一個與兩者都起作用的更常見的方法一致(例如,在回歸中,在正常情況下 $ \operatorname{tr}(A) $ 將是的列維度 $ X $ ), 但當 $ A $ 是對稱和冪等的,這三個公式都是一樣的。

[我手頭沒有這個參考資料來檢查足夠的細節;同一作者(加上弗里德曼)的另一個容易掌握的替代方法是統計學習元素[2];參見例如方程 5.16,它將平滑樣條的有效自由度定義為 $ \operatorname{tr}(A) $ (在我的符號中)]

更一般地說,Ye (1998) [3] 將廣義自由度定義為 $ \sum_i \frac{\partial \hat y_i}{\partial y_i} $ ,這是擬合值對其相應觀察值的敏感性之和。反過來,這與 $ \operatorname{tr}(A) $ 該定義適用的地方。要使用 Ye 的定義,您只需能夠計算 $ \hat y $ 並對數據進行少量擾動(為了計算 $ \frac{\partial \hat y_i}{\partial y_i} $ 數字)。這使得它的應用非常廣泛。

對於由 擬合的模型gam,這些各種度量通常不是整數。

(我強烈建議閱讀這些參考資料對這個問題的討論,儘管在某些情況下故事會變得相當複雜。參見,例如 [4])

[1] Hastie, T. 和 Tibshirani, R. (1990),倫敦

廣義加法模型

:Chapman 和 Hall。

[2] Hastie, T.、Tibshirani, R. 和 Friedman, J. (2009),

統計學習的要素:數據挖掘、推理和預測,第二版

Springer-Verlag。

https://statweb.stanford.edu/~tibs/ElemStatLearn/

[3] Ye, J. (1998),

“On Measurement and Correcting Effects of Data Mining and Model Selection”

美國統計學會雜誌,卷。93,第 441 號,第 120-131 頁

[4] Janson, L.、Fithian, W. 和 Hastie, T. (2013),

“有效的自由度:一個有缺陷的隱喻”

https://arxiv.org/abs/1312.7851

引用自:https://stats.stackexchange.com/questions/280851

comments powered by Disqus