了解線性回歸的 t 檢驗
我正在嘗試研究如何對線性回歸進行一些假設檢驗(零假設沒有相關性)。我遇到的關於該主題的每個指南和頁面似乎都在使用 t 檢驗。但我不明白線性回歸的 t 檢驗實際上意味著什麼。除非我有完全錯誤的理解或心智模型,否則 t 檢驗用於比較兩個群體。但是regressor 和regressand 不是相似群體的樣本,甚至可能不是同一個單位,因此比較它們沒有意義。
那麼,當對線性回歸使用 t 檢驗時,我們實際上在做什麼?
您可能正在考慮這兩個樣本測試,因為這通常是第一個分佈出現。但真的都是檢驗均值是檢驗統計量的參考分佈是分配。如果和和和獨立,那麼
根據定義。我寫這篇文章是為了強調分佈只是這個比率的分佈的一個名稱,因為它經常出現,這種形式的任何東西都會有一個分配。對於兩個樣本 t 檢驗,出現此比率是因為在零值下,均值的差異是零均值高斯,並且獨立高斯的方差估計是獨立的(獨立性可以通過巴蘇定理顯示,該定理使用高斯樣本中的標準方差估計是總體均值的輔助,而樣本均值對於相同數量是完整且足夠的)。 使用線性回歸,我們基本上得到了同樣的結果。以矢量形式,. 讓並假設預測變量是非隨機的。如果我們知道我們會有
在零下所以我們實際上會有一個 Z 測試。但是一旦我們估計我們最終得到一個隨機變量,在我們的正態假設下,結果與我們的統計數據無關然後我們得到一個分配。
這是詳細信息:假設. 讓是我們有的帽子矩陣
是冪等的,所以我們得到了非常好的結果
具有非中心性參數, 所以實際上這是一個中心和自由度(這是科克倫定理的一個特例)。我正在使用來表示的列數,所以如果一列給出攔截然後我們會有非截距預測器。一些作者使用是非截距預測器的數量,所以有時你可能會看到類似的東西在那裡的自由度,但都是一樣的。 這樣做的結果是, 所以非常適合作為估算器.
這意味著
是標準高斯與卡方的比率除以其自由度。為了完成這個,我們需要表現出獨立性,我們可以使用以下結果: **結果:**對於和矩陣和在和分別,和是獨立的當且僅當(這是邵君的《數理統計》第一章的練習 58(b) )。
我們有和在哪裡. 這意味著
所以,因此. 結果是我們現在知道
根據需要(在所有上述假設下)。
這是該結果的證明。讓成為堆疊形成的矩陣在之上. 然後
在哪裡
是一個多元高斯分佈並且眾所周知的結果是多元高斯分佈的兩個分量是獨立的當且僅當它們不相關時,所以條件結果完全等同於組件和在不相關。