R平方的條件期望
考慮簡單的線性模型:
在哪裡和 ,和包含一列常量。
我的問題是,鑑於,和, 是否有一個非平凡上界的公式*? (假設模型是由 OLS 估計的)。
*我假設,寫這個,得到本身是不可能的。
編輯1
使用由 Stéphane Laurent 得出的解決方案(見下文),我們可以得到一個不平凡的上限. 一些數值模擬(如下)表明,這個界限實際上非常嚴格。
Stéphane Laurent 得出以下結論: 在哪裡是具有非中心性參數的非中心 Beta 分佈和
所以
在哪裡是非中心的帶參數和自由程度。所以一個不平凡的上限是
它非常緊(比我預期的要緊得多):
例如,使用:
rho<-0.75 p<-10 n<-25*p Su<-matrix(rho,p-1,p-1) diag(Su)<-1 su<-1 set.seed(123) bet<-runif(p)
的平均值超過 1000 次模擬是
0.960819
. 上面的理論上限給出0.9609081
. 邊界似乎在許多值上同樣精確. 真是令人驚嘆!編輯2:
經過進一步研究,似乎上界近似的質量會變得更好增加(並且所有其他條件相同,隨著增加)。
可以編寫任何線性模型在哪裡有標準正態分佈和假設屬於線性子空間的. 在你的情況下.
讓是向量生成的一維線性子空間. 服用以下與經典的 Fisher 統計量高度相關
對於假設檢驗在哪裡是一個線性子空間,並表示為 的正交補在, 並表示和(然後和在你的情況下)。 的確,
因為定義是
明顯地和 .
什麼時候那麼是真的因此
有費舍爾分配。因此,根據 Fisher 分佈和 Beta 分佈之間的經典關係,. 在一般情況下我們必須處理什麼時候. 在這種一般情況下,有, 非中心分佈與自由度和非中心性參數, 接著 (非中心費舍爾分佈)。這是用於計算功率的經典結果-測試。
Fisher 分佈和 Beta 分佈之間的經典關係在非中心情況下也成立。最後具有“形狀參數”的非中心 beta 分佈和和非中心性參數. 我認為這些時刻可以在文獻中找到,但它們可能非常複雜。
最後讓我們寫下. 注意. 一個有什麼時候, 和. 因此這裡哪裡對於未知參數向量.