Mixed-Model

線性混合模型的陷阱

  • December 12, 2010

使用線性混合效應模型有哪些主要缺陷?在評估模型的適當性時,需要測試/注意的最重要的事情是什麼?在比較同一數據集的模型時,最重要的是要尋找什麼?

這是一個很好的問題。

以下是一些常見的陷阱:

  1. 使用標準似然理論,我們可以推導出一個檢驗來比較兩個嵌套假設,和,通過計算似然比檢驗統計量。該檢驗統計量的零分佈近似為卡方,其自由度等於兩個參數空間維度的差異。不幸的是,這個測試只是近似的,需要幾個假設。一個關鍵的假設是空值下的參數不在參數空間的邊界上。因為我們經常有興趣測試關於採取以下形式的隨機效應的假設:

這是一個真正的擔憂。解決這個問題的方法是使用 REML。但是,p 值往往會比應有的更大。這意味著,如果您使用 χ2 近似值觀察到顯著效應,您可以相當確信它實際上是顯著的。小但不顯著的 p 值可能會促使人們使用更準確但更耗時的引導方法。 2. 比較固定效應:如果您打算使用似然比檢驗來比較兩個僅在固定效應上有所不同的嵌套模型,則不能使用 REML 估計方法。原因是 REML 通過考慮消除固定效應的數據的線性組合來估計隨機效應。如果這些固定效應發生變化,兩個模型的可能性將無法直接比較。 3. P 值:固定效應的似然比檢驗生成的 p 值是近似值,不幸的是往往太小,因此有時會誇大某些效應的重要性。我們可以使用非參數引導方法為似然比檢驗找到更準確的 p 值。 4. [Doug Bates 博士 此處]強調了關於固定效應檢驗的 p 值的其他問題。

我相信論壇的其他成員會有更好的答案。

資料來源:用 R 擴展線性模型——Julain Faraway 博士。

引用自:https://stats.stackexchange.com/questions/5414

comments powered by Disqus