統計學家如何確定適合不同統計檢驗的分佈？

September 23, 2013

例如，為 ANOVA 檢驗計算的檢驗統計量與 F 分佈進行比較，而 t 檢驗比較手段將檢驗統計量與 t 分佈進行比較。

您問題的完整答案將是一整學期的數學理論統計課程（如果您真的感興趣，這對您來說是個好主意）。

但一組簡短且部分的答案是：

通常我們從正態分佈開始，它被發現是許多現實世界情況的合理近似值，並且中心極限定理（和其他）告訴我們，在查看簡單隨機樣本的平均值時，它是一個更好的近似值（更大的樣本量可以更好地逼近法線）。因此，如果沒有理由相信正態分佈不是合理的近似值，那麼正態分佈通常是要考慮的默認分佈。儘管使用現代計算機，現在使用非參數或其他工具更容易，而且我們不需要過多地依賴法線（但歷史/慣性等讓我們使用基於法線的方法）。

如果您對來自標準正態分佈的變量進行平方，則它遵循卡方分佈。如果將卡方中的變量加在一起，則會得到另一個卡方（自由度變化），這意味著方差（縮放）遵循卡方。

如果空值為真且其他假設成立，則還得出似然比函數漸近地遵循卡方分佈。

標準正態除以卡方（和一些縮放參數）的平方根遵循 t 分佈，因此常見的 t 統計量（在零假設下）遵循 t。

2 個卡方的比率（除以自由度和其他考慮因素）遵循 F 分佈。方差分析 F 檢驗基於相同方差的 2 個估計值的比率（在零值下），並且由於方差遵循卡方，因此比率遵循 F（在零值和假設成立的情況下）。

聰明的人制定了這些規則，以便我們其他人可以應用它們。完整的數學/統計課程將提供更多的歷史和推導（可能還有更多的替代方案），這只是為了快速概述更常見的測試和分佈。

引用自：https://stats.stackexchange.com/questions/70820

統計學家如何確定適合不同統計檢驗的分佈？

相關問答

對於所有類型的分佈，均值的 CDF 是否始終為 0.5？

泊松分佈的原始推導是什麼？

的分佈X4(X1−X3)+X5(X2−X1)X4(X1−X3)+X5(X2−X1)x_4(x_1-x_3)+x_5(x_2-x_1)獨立同居X一世∼N(0,1)X一世∼ñ(0,1)x_i sim N(0,1)

指數分佈的隨機變量的指數分佈？

貝比露絲的說法有意義嗎？

beta 分佈隨機變量的 argmax 分佈