Regression
為什麼 T 分佈用於假設檢驗線性回歸係數?
在實踐中,使用標準 T 檢驗來檢查線性回歸係數的顯著性是常見的做法。計算的機制對我來說很有意義。
為什麼 T 分佈可用於對線性回歸假設檢驗中使用的標準檢驗統計量進行建模?我在這裡指的標準測試統計量:
要了解我們為什麼使用 t 分佈,您需要知道和殘差平方和 () 因為這兩個放在一起會給你 t 分佈。
更容易的部分是分佈這是一個正態分佈 - 看到這個注意=所以它是一個線性函數在哪裡. 因此它也是正態分佈的,- 讓我知道您是否需要幫助來推導.
此外,, 在哪裡是觀察次數和是回歸中使用的參數數量。這個證明有點複雜,但也很容易推導(見證明為什麼 RSS 分佈卡方乘以 np?)。
到目前為止,我已經考慮了矩陣/向量表示法中的所有內容,但為了簡單起見,讓我們使用並使用它的正態分佈,這將給我們:
此外,從卡方分佈我們有:
這只是第一個卡方表達式的重新排列,並且獨立於. 此外,我們定義,這是一個無偏估計量. 根據定義將正態分佈除以獨立卡方(在其自由度上)的定義給出了 t 分佈(證明參見:正態除以給你一個t分佈——證明)你得到了:
在哪裡.
讓我知道這是否有意義。