References

應該引用哪些參考資料來支持使用 30 作為足夠大的樣本量?

  • September 10, 2010

我多次閱讀/聽說至少 30 個單位的樣本量被視為“大樣本”(由於 CLT,平均值的正態性假設通常近似成立,…)。因此,在我的實驗中,我通常會生成 30 個單位的樣本。您能否給我一些在使用樣本量 30 時應該引用的參考資料?

選擇n = 30 作為小樣本和大樣本之間的邊界只是一個經驗法則。有大量書籍引用(圍繞)這個值,例如,Hogg 和 Tanis 的概率和統計推斷(7e) 說“大於 25 或 30”。

也就是說,告訴我的故事是 30 被認為是一個好的邊界的唯一原因是因為它使教科書背面的漂亮學生t表很好地適合一頁。無論如何,從 df = 30 到 df = 無窮大,臨界值(Student’s t和 Normal 之間)僅相差大約 0.25。對於手工計算,差異並不重要。

如今,很容易將各種事物的臨界值計算到小數點後 15 位。最重要的是,我們有重採樣和排列方法,我們甚至不限於參數人口分佈。

在實踐中,我從不依賴n = 30。繪製數據。如果您願意,可以疊加正態分佈。直觀地評估正態近似值是否合適(並詢問是否真的需要近似值)。如果生成用於研究的樣本和近似值是強制性的,則生成足夠的樣本量以使近似值盡可能接近(或盡可能接近計算上可行)。

引用自:https://stats.stackexchange.com/questions/2541

comments powered by Disqus