Standard-Deviation
範圍和標準差之間的關係
在一篇文章中,我找到了樣本量標準差的公式
在哪裡是子樣本的平均範圍(大小) 來自主要樣本。怎麼數是計算出來的?這是正確的數字嗎?
在一個樣本中的分佈中的獨立值帶PDF, 極值聯合分佈的 pdf和正比於
(比例常數是多項式係數的倒數. 直觀地說,這個聯合 PDF 表示在該範圍內找到最小值的機會, 範圍內的最大值, 和中間它們之間的值在範圍內. 什麼時候是連續的,我們可以用,從而只忽略“無窮小”的概率。相關的概率,在微分中的一階,是 和分別,現在很明顯公式的來源。)
取範圍的期望給對於任何具有標準偏差的正態分佈和. 預期範圍為的倍數取決於樣本量:
這些值是通過數值積分計算得出的超過, 和設置為標準 Normal CDF,並除以標準差(這只是)。
預期範圍和標準偏差之間的類似乘法關係將適用於任何位置尺度的分佈族,因為它是單獨的分佈*形狀的屬性。*例如,這是均勻分佈的可比較圖:
和指數分佈:
前面兩個圖中的值是通過精確積分而不是數值積分獲得的,這可能是由於相對簡單的代數形式和在每種情況下。對於均勻分佈,它們相等對於指數分佈,它們是在哪裡是歐拉常數並且是“多伽瑪”函數,歐拉伽瑪函數的對數導數。
儘管它們不同(因為這些分佈顯示出廣泛的形狀),但三者大致一致,表明乘數不嚴重依賴於形狀,因此當小子樣本的範圍已知時,可以作為標準偏差的綜合穩健評估。(確實,尾巴很重的學生三自由度分佈仍然有一個乘數為了, 一點都不遠.)