Estimation

James-Stein 估計器:Efron 和 Morris 是如何計算的𝜎2σ2sigma^2他們的棒球示例的收縮係數?

  • December 24, 2010

我在Bradley Efron 和 Carl Morris 的 1977 年《科學美國人》論文“Stein’s Paradox in Statistics”中對計算 James-Stein 收縮因子有疑問。

我收集了棒球運動員的數據,如下所示:

Name, avg45, avgSeason    
Clemente, 0.400, 0.346    
Robinson, 0.378, 0.298    
Howard, 0.356, 0.276    
Johnstone, 0.333, 0.222    
Berry, 0.311, 0.273    
Spencer, 0.311, 0.270    
Kessinger, 0.289, 0.263    
Alvarado, 0.267, 0.210    
Santo, 0.244, 0.269    
Swoboda, 0.244, 0.230    
Unser, 0.222, 0.264    
Williams, 0.222, 0.256    
Scott, 0.222, 0.303    
Petrocelli, 0.222, 0.264    
Rodriguez, 0.222, 0.226    
Campaneris, 0.200, 0.285    
Munson, 0.178, 0.316    
Alvis, 0.156, 0.200

avg45是之後的平均值在蝙蝠上,並表示為在文章中。avgSeason是賽季末的平均值。

平均值的 James-Stein 估計量 () 是(誰)給的

和收縮係數由(科學美國人 1977 年文章的第 5 頁)給出

在哪裡是未知手段的數量。這裡有 18 名玩家,所以. 我可以計算使用avg45價值觀。但是不知道怎麼計算. 作者說對於給定的數據集。

我嘗試同時使用和為了但他們沒有給出正確的答案

誰能好心讓我知道如何計算對於這個數據集?

參數是向量分量的(未知)共同方差,我們假設每個分量都是正態分佈的。對於我們擁有的棒球數據,所以二項分佈的正態近似給出(取)

顯然,在這種情況下,方差不相等,但如果它們等於一個共同值,那麼我們可以使用合併估計量來估計它

在哪裡是大均值

看起來這就是埃夫隆和莫里斯所做的(在 1977 年的論文中)。 您可以使用以下 R 代碼進行檢查。以下是數據:

y <- c(0.4, 0.378, 0.356, 0.333, 0.311, 0.311, 0.289, 0.267, 0.244, 0.244, 0.222, 0.222, 0.222, 0.222, 0.222, 0.2, 0.178, 0.156)

這是估計:

s2 <- mean(y)*(1 - mean(y))/45

這是. 則紙中的收縮係數為

1 - 15*s2/(17*var(y))

這使. 請注意,在第二篇論文中,他們進行了轉換以迴避方差問題(正如@Wolfgang 所說)。還要注意他們在 1975 年使用的論文而在 1977 年的論文中,他們使用.

引用自:https://stats.stackexchange.com/questions/5727

comments powered by Disqus