Estimation
James-Stein 估計器:Efron 和 Morris 是如何計算的𝜎2σ2sigma^2他們的棒球示例的收縮係數?
我在Bradley Efron 和 Carl Morris 的 1977 年《科學美國人》論文“Stein’s Paradox in Statistics”中對計算 James-Stein 收縮因子有疑問。
我收集了棒球運動員的數據,如下所示:
Name, avg45, avgSeason Clemente, 0.400, 0.346 Robinson, 0.378, 0.298 Howard, 0.356, 0.276 Johnstone, 0.333, 0.222 Berry, 0.311, 0.273 Spencer, 0.311, 0.270 Kessinger, 0.289, 0.263 Alvarado, 0.267, 0.210 Santo, 0.244, 0.269 Swoboda, 0.244, 0.230 Unser, 0.222, 0.264 Williams, 0.222, 0.256 Scott, 0.222, 0.303 Petrocelli, 0.222, 0.264 Rodriguez, 0.222, 0.226 Campaneris, 0.200, 0.285 Munson, 0.178, 0.316 Alvis, 0.156, 0.200
avg45
是之後的平均值在蝙蝠上,並表示為在文章中。avgSeason
是賽季末的平均值。平均值的 James-Stein 估計量 () 是(誰)給的
和收縮係數由(科學美國人 1977 年文章的第 5 頁)給出
在哪裡是未知手段的數量。這裡有 18 名玩家,所以. 我可以計算使用
avg45
價值觀。但是不知道怎麼計算. 作者說對於給定的數據集。我嘗試同時使用和為了但他們沒有給出正確的答案
誰能好心讓我知道如何計算對於這個數據集?
參數是向量分量的(未知)共同方差,我們假設每個分量都是正態分佈的。對於我們擁有的棒球數據,所以二項分佈的正態近似給出(取)
顯然,在這種情況下,方差不相等,但如果它們等於一個共同值,那麼我們可以使用合併估計量來估計它
在哪裡是大均值
看起來這就是埃夫隆和莫里斯所做的(在 1977 年的論文中)。 您可以使用以下 R 代碼進行檢查。以下是數據:
y <- c(0.4, 0.378, 0.356, 0.333, 0.311, 0.311, 0.289, 0.267, 0.244, 0.244, 0.222, 0.222, 0.222, 0.222, 0.222, 0.2, 0.178, 0.156)
這是估計:
s2 <- mean(y)*(1 - mean(y))/45
這是. 則紙中的收縮係數為
1 - 15*s2/(17*var(y))
這使. 請注意,在第二篇論文中,他們進行了轉換以迴避方差問題(正如@Wolfgang 所說)。還要注意他們在 1975 年使用的論文而在 1977 年的論文中,他們使用.