與 nlme/lme4 關聯的“t 值”
我理解在多層次模型中確定自由度的問題;因此,Doug Bates 等人的決定。不要將 p 值報告為 R 中 lme4 包的一部分。更不用說一般來說存在過多的問題,並且過度關注 p 值。
但是,我想澄清在 nlme 或 lme4 中的多級模型的摘要輸出中報告的“t 值”的性質。
從包含相關數據的數據集中報告的 nlme/lme4 中的 t 值實際上不是來自 t 分佈嗎?(不管我們是否知道自由度)。
lme4 中的“t 值”是否可能具有誤導性。
基本上只是, 在哪裡是回歸參數。如果您將此值視為此比率或“標準化”參數,則該值沒有任何誤導性。如果你看看貝茨最初反對的論點-lme4 中的值,他主要寫的是有問題的自由度,而不是的值本身(另見r-sig-mixed-models FAQ)。請注意,不同的統計軟件可以有不同的命名約定,例如SPSS將參數稱為的和標準化參數為’s –lme4 遵循
lm
約定來調用它們Estimate
和t value
.Pinheiro 和 Bates 描述了-值在“S 和 S-PLUS 中的混合效應模型”中,因此很難在本書中尋找反對它們的論據。Bates 在“lme4: Mixed-effects modeling with R” 中也討論了這些比率,與和固定效應模型的值,例如(第 70 頁):
在固定效應模型中,原始比例中的輪廓軌跡將始終是直線。對於混合模型,這些軌跡可能不是線性的,正如我們在這裡看到的,這與普遍認為的線性混合模型中的固定效應參數推斷相矛盾,基於要么具有適當調整的自由度的分佈將是完全準確的。偏差輪廓的實際模式比這更複雜。
是什麼使它們在某種程度上相似,但並不完全適合我們期望它們用於適當的假設檢驗。
另請注意,其他作者並不總是認為 df 問題是有問題的,例如“使用 R 的線性混合效應模型”中的 Gałecki 和 Burzykowski只是假設自由度並將它們的分佈視為近似,例如(第 84 頁):
的零分佈-test 統計量是-分佈與自由程度。
和(第 140 頁):
參數向量各個分量的置信區間 可以基於一個構建-distribution 用作檢驗統計量的近似分佈
所以似乎主要的理由是,雖然- 值可能會因為不明確的零分佈而產生誤導,值仍然有用,至少作為標準化參數。您也可以將它們用於假設檢驗,但您需要對它們的分佈做出一些假設並通過查看剖面圖來驗證它們。貝茨似乎在說的是,您使用它們需要您自擔風險。