Standard-Deviation

通過隨機樣本獲得的數據的準確性如何?

  • October 8, 2010

我是統計新手,所以如果我在這裡做出任何錯誤的假設,請告訴我。

N一群人。(例如N可以是 1,000,000。)有些人是紅發女郎。我抽取了一個n人樣本(比如 10 個),發現其中j的人是紅發女郎。

關於人口中紅發的總體比例,我能說些什麼?我的意思是,我的最佳近似值可能是j/n,但該近似值的標準偏差是多少?

順便說一句,這個被接受的術語是什麼?

您可以將其視為二項式試驗——您的試驗是對“紅發”或“非讀頭”進行​​抽樣。在這種情況下,您可以為樣本比例建立置信區間 () 如維基百科上所述:

95% 的置信區間基本上是說,使用相同的抽樣算法,如果你重複這 100 次,真實比例將位於規定的區間內 95 次。

更新順便說一句,我認為您正在尋找的術語可能是標準誤差,即採樣比例的標準偏差。在這種情況下,它是在哪裡是你估計的比例。請注意,作為增加,標準誤減小。

引用自:https://stats.stackexchange.com/questions/3402

comments powered by Disqus