R

嵌套隨機效應項的數學表示

  • June 11, 2018

假設一個因變量在嵌套在類型單位內的單位級別(級別 1)測量(等級),以及類型的單位嵌套在類型的級別內(等級).

假設我符合以下公式:

y ~ "FIXED EFFECTS [my syntax]" + (1 + x | B/A)

在哪裡是某個級別的預測器.

我的理解是這樣一個公式的數學表示如下。這是正確的嗎?


在接下來的內容中,是的輸出單位中的第一個數據點的嵌套在單元中的. 這個數據點有一個對應的預測器.

在哪裡

那是,是一個標準差項,隨級別變化. 另一方面,給定任何, 水平單位, 和, 一個包含在 level 中的單位,那麼標準差項為是. 那是,對於任何級別都是恆定的單位。


這是正確的嗎(我通過從線性混合模型第 136 頁上的相關演示中推斷出這個推理:使用統計軟件的實用指南)?如果這是正確的,那麼有什麼辦法可以使取決於哪個級別的單位數據點所屬。

我認為您的公式中缺少隨機效應。回复取決於固定效應 + 5 個分量的誤差項。

按順序,從左到右,這些組件具有以下解釋:

  1. 純粹的錯誤(個人對每個觀察)
  2. 由於同一 B 級別內的不同 A 級別而導致的變化
  3. 因 B 級別不同而有所差異
  4. A 如何影響斜率關係給定的共同級別 B
  5. B級如何影響斜率

你不能允許隨 A 的水平而變化,因為模型將不再是可識別的(太多的參數都在做同樣的工作)。除非,變化取決於已知的權重(如組數)——在這種情況下,您仍然會有相同數量的參數。請記住,我們不知道 A(或 B)的水平值,但我們在固定方差的假設下估計它們。我們需要在這裡假設某種規律性。

編輯:@Amoeba 對此提出質疑,我可能誤解了觀察值方差的不同值的可能性。實際上,我誤讀了OP的問題。我在想隱藏的影響,而不是個別觀察的純粹錯誤。由於 A 和 B 水平是隨機的,因此方差也應該被認為是隨機效應,這意味著在估計它們時應該應用某種正則化,就像 A 和 B 水平本身的隨機效應一樣。

它變得更糟。混合效應模型的價值在於它允許您為未經測試的情況(模型中不包括 A 和 B 的水平)形成置信區間,因此您肯定需要對方差進行分佈並相應地調整置信區間. 聽起來很醜陋。

當然,您將需要大量數據才能使其正常工作,因為我們正在討論估計方差和均值。

至於 Welch 檢驗,這基本上是適用於過去稱為 Behrens-Fisher 問題的問題 - 當方差不相等時測試兩個均值差異的問題。如果有記憶,問題是您沒有足夠的固定維度統計數據。

對我來說,問題是為什麼這個問題甚至應該承認一個有意義的解決方案。當方差不相等時,比較均值實際上意味著什麼?想像一下兩種型號的汽車。A 型汽車每年的維修次數通常有限且可預測。B型車有時是檸檬,有時是一流的。在這種情況下比較平均擁有成本意味著什麼?但這就是我們在允許級別的差異發生變化時所談論的內容。當方差允許變化時,比較均值到底有多大意義?它表明您正在比較蘋果和橙子。

參考。由於您似乎為此使用 R,因此您可能想閱讀 Bates 和 Pinheiro 的書《S-plus 中的混合效果模型》,因為他們為 R 的 nlme 和 lme4 包編寫了代碼。那本書介紹了您可能需要的所有細節。它們確實允許具有共同水平的觀察之間的相關性。

引用自:https://stats.stackexchange.com/questions/350750

comments powered by Disqus