Sample-Size

對於給定的估計技術和參數,樣本應該有多大?

  • July 20, 2010

是否有經驗法則或什至有任何方法可以判斷樣本應該有多大才能估計具有給定參數數量的模型?

因此,例如,如果我想用 5 個參數估計最小二乘回歸,那麼樣本應該有多大?

您使用什麼估計技術(例如最大似然、最小二乘、GMM),或者您將執行多少或什麼測試是否重要?在做出決定時是否應考慮樣本的可變性?

簡單的答案是更多的數據總是比更少的數據更受歡迎。

小樣本的問題很明顯。從技術上講,在線性回歸 (OLS) 中,您可以擬合諸如 OLS 之類的模型,其中 n = k+1,但您會從中得到垃圾,即非常大的標準誤差。Arthur Goldberger 關於這個主題有一篇很棒的論文,叫做 Micronumerocity,在他的《計量經濟學課程》一書的第 23 章中進行了總結。

一個常見的啟發式方法是,對於要估計的每個參數,您應該有 20 個觀察值。它始終是標準誤差大小(以及顯著性檢驗)和样本大小之間的權衡。這是我們中的一些人討厭顯著性檢驗的原因之一,因為您可以通過大量樣本得到非常小的(相對)標準誤差,因此在簡單檢驗(例如回歸係數是否為零)中發現毫無意義的統計顯著性。

雖然樣本量很重要,但您的樣本質量更重要,例如樣本是否可推廣到總體,它是簡單隨機樣本還是其他適當的抽樣方法(並且在分析過程中已考慮到這一點),是否存在測量誤差、反應偏差、選擇偏差等。

引用自:https://stats.stackexchange.com/questions/276

comments powered by Disqus