Hypothesis-Testing
統計學家如何確定適合不同統計檢驗的分佈?
例如,為 ANOVA 檢驗計算的檢驗統計量與 F 分佈進行比較,而 t 檢驗比較手段將檢驗統計量與 t 分佈進行比較。
您問題的完整答案將是一整學期的數學理論統計課程(如果您真的感興趣,這對您來說是個好主意)。
但一組簡短且部分的答案是:
通常我們從正態分佈開始,它被發現是許多現實世界情況的合理近似值,並且中心極限定理(和其他)告訴我們,在查看簡單隨機樣本的平均值時,它是一個更好的近似值(更大的樣本量可以更好地逼近法線)。因此,如果沒有理由相信正態分佈不是合理的近似值,那麼正態分佈通常是要考慮的默認分佈。儘管使用現代計算機,現在使用非參數或其他工具更容易,而且我們不需要過多地依賴法線(但歷史/慣性等讓我們使用基於法線的方法)。
如果您對來自標準正態分佈的變量進行平方,則它遵循卡方分佈。如果將卡方中的變量加在一起,則會得到另一個卡方(自由度變化),這意味著方差(縮放)遵循卡方。
如果空值為真且其他假設成立,則還得出似然比函數漸近地遵循卡方分佈。
標準正態除以卡方(和一些縮放參數)的平方根遵循 t 分佈,因此常見的 t 統計量(在零假設下)遵循 t。
2 個卡方的比率(除以自由度和其他考慮因素)遵循 F 分佈。方差分析 F 檢驗基於相同方差的 2 個估計值的比率(在零值下),並且由於方差遵循卡方,因此比率遵循 F(在零值和假設成立的情況下)。
聰明的人制定了這些規則,以便我們其他人可以應用它們。完整的數學/統計課程將提供更多的歷史和推導(可能還有更多的替代方案),這只是為了快速概述更常見的測試和分佈。