Mixed-Model

當所有可能性都包含在混合效應模型中時,固定效應與隨機效應

  • October 21, 2014

在混合效應模型中,如果包括所有可能的水平(例如,男性和女性),建議使用固定效應來估計參數。如果所包含的水平只是來自總體的隨機樣本(從可能的患者範圍中納入的患者)並且您想要估計總體均值和方差而不是均值,則進一步建議使用隨機效應來解釋變量的個體因素水平。

我想知道您是否在邏輯上必須始終以這種方式使用固定效果。考慮一項關於腳/鞋子尺寸如何隨著發育而變化以及與身高、體重和年齡有關的研究。 顯然必須以某種方式包含在模型中,以說明多年來的測量值嵌套在給定的腳內而不是獨立的事實。而且,左右都是可以存在的可能性。此外,對於給定的參與者來說,他們的右腳比左腳大(或小)是非常真實的。然而,儘管所有人的腳之間的腳尺寸確實有所不同,但沒有理由相信平均而言右腳會比左腳大。如果他們在您的樣本中,這可能是由於您樣本中的人的遺傳因素,而不是右腳固有的因素。最後,看起來像一個討厭的參數,而不是你真正關心的東西。

讓我注意我做了這個例子。它可能沒有任何好處;這只是為了傳達這個想法。據我所知,在舊石器時代,右腳大而左腳小是生存所必需的。

在這種情況下,合併是否有意義(更多/更少/任何)在模型中作為隨機效應?在這裡使用固定效應與隨機效應的優缺點是什麼?

“固定”和“隨機”效果的一般問題是它們沒有以一致的方式定義。Andrew Gelman 引用了其中的幾個:

(1) 固定效應在個體之間是恆定的,而隨機效應是不同的。例如,在增長研究中,具有隨機截距的模型 和固定坡度對應於不同個體的平行線, 或模型. 因此,Kreft 和 De Leeuw (1998) 區分了固定係數和隨機係數。

(2) 如果它們本身感興趣,則效果是固定的;如果對基礎人群感興趣,則效果是隨機的。Searle、Casella 和 McCulloch(1992,第 1.4 節)深入探討了這種區別。

(3)“當一個樣本耗盡總體時,對應的變量是固定的;當樣本是總體的一小部分(即可以忽略不計)時,相應的變量是隨機的。” (格林和圖基,1960)

(4) “如果一個效應被假定為一個隨機變量的實現值,它被稱為隨機效應。” (拉莫特,1983 年)

(5) 使用最小二乘法(或更一般地說,最大似然法)估計固定效應,使用收縮估計隨機效應(Robinson,1991 年的術語中的“線性無偏預測”)。這個定義在多層次建模文獻(例如,參見 Snijders 和 Bosker,1999,第 4.2 節)和計量經濟學中是標準的。

並註意到它們不一致。在他的《使用回歸和多級/分層模型的數據分析》一書中,他通常避免使用這些術語,在他們的工作中,他專注於組截距和斜率之間的固定或變化,因為

固定效應可以看作是隨機效應的特殊情況,其中更高層次的方差(在模型(1.1)中,這將是 ) 設定為或者. 因此,在我們的框架中,所有回歸參數都是“隨機的”,而“多級”一詞是包羅萬象的。

貝葉斯框架尤其如此——通常用於混合模型——所有的影響本身都是隨機的。如果您正在考慮貝葉斯,您並不真正關心“固定”效應和點估計,並且將所有效應視為隨機的沒有問題。

我對這個主題閱讀得越多,我就越相信這是關於我們可以(或應該)估計什麼以及我們只能預測什麼的意識形態討論(這裡我也可以參考你自己的答案)。如果您有可能結果的隨機樣本,則使用隨機效應,因此您不關心個人估計,而是關心人口效應,然後是個人。因此,您的問題的答案還取決於您是否想要可以估計給定數據的固定效應。如果所有可能的級別都包含在您的數據中,您可以估計固定效應 - 同樣,就像在你的例子中一樣,水平的數量可能很小,這通常不利於估計隨機效應,並且對此有一些最低要求

最佳案例場景論證

假設您擁有無限量的數據和無限的計算能力。在這種情況下,您可以想像將每個效果估計為固定的,因為固定效果為您提供了更大的靈活性(使我們能夠比較各個效果)。然而,即使在這種情況下,我們大多數人也不願意對所有事情都使用固定效果。

例如,假設您想對某個地區的學校的考試成績進行建模,並且您擁有該地區所有 100 所學校的數據。在這種情況下,您可以威脅學校是固定的——因為您擁有所有級別的數據——但實際上您可能更願意將它們視為隨機的。這是為什麼?

  1. 一個原因是,在這種情況下,您通常對個別學校的影響不感興趣(而且很難比較所有學校),而是對學校之間的普遍差異感興趣。
  2. 這裡的另一個論點是模型簡約。通常,您對“所有可能的影響”模型不感興趣,因此在您的模型中,您包含一些您想要測試和控制其他可能的可變性來源的固定效應。這使得混合效應模型適合考慮統計建模的一般方式,您可以在其中估計某些事物並控制其他事物。對於復雜的(多級或分層的)數據,您需要包含許多影響,因此您威脅一些是“固定的”和一些是“隨機的”,以便控制它們。
  3. 在這種情況下,您也不會認為每所學校對結果都有自己獨特的影響,而是認為學校總體上有一些影響。所以這個論點是我們認為估計個別學校的獨特影響是不可能的,所以我們威脅他們作為可能的學校影響的隨機樣本。

混合效應模型介於“一切固定”和“一切隨機”場景之間。我們遇到的數據使我們降低了將所有事物都估計為固定效應的期望,因此我們決定要比較哪些效應以及我們想要控制哪些效應,或者對它們的影響有一般感覺。這不僅關乎數據是什麼,還關乎我們在建模時如何看待數據。

引用自:https://stats.stackexchange.com/questions/120964

comments powered by Disqus