基於精度(即逆方差)的加權是薈萃分析的組成部分嗎?
基於精度的加權是薈萃分析的核心嗎?博倫斯坦等人。(2009) 寫道,要使薈萃分析成為可能,所有必要的條件是:
- 研究報告了可以表示為單個數字的點估計。
- 可以為該點估計計算方差。
我不清楚為什麼(2)是絕對必要的。但是,事實上,所有被廣泛接受的薈萃分析方法都依賴於基於精度(即逆方差)的加權方案,這確實需要對每項研究的影響大小的方差進行估計。請注意,雖然 Hedges 方法 (Hedges & Olkin, 1985; Hedges & Vevea, 1998) 和 Hunter and Schmidt 方法 (Hunter & Schmidt, 2004) 基本上都使用樣本大小加權,但這些方法僅適用於歸一化均值差,因此需要其他地方的標準差。有意義的是,與每項研究中的方差成反比的權重將使整體效應大小估計量的方差最小化,那麼這種加權方案是所有方法的必要特徵嗎?
是否可以在不獲取每個效應大小的方差的情況下進行系統評價,並且仍然將結果稱為薈萃分析?當方差不可用時,樣本量似乎有可能作為精度的代表。例如,可以在效應大小被定義為原始平均差的研究中使用樣本大小加權嗎?這將如何影響所產生的平均效應大小的一致性和效率?
這個問題很難回答,因為它表明了許多元分析文獻中的普遍混亂和混亂的事態(這裡不怪 OP——它是文獻和方法的描述,模型和假設通常是一團糟)。
但長話短說:不,如果你想結合一堆估計(量化某種效果、某種程度的關聯或其他被認為相關的結果),那麼結合這些數字是明智的,那麼你可以取他們的(未加權的)平均值,那會很好。這並沒有錯,根據我們在進行元分析時通常假設的模型,這甚至可以為您提供無偏估計(假設估計本身是無偏的)。所以,不,您不需要抽樣方差來組合估計值。
那麼為什麼逆方差加權幾乎與實際進行薈萃分析同義呢?這與我們認為大型研究(具有較小的抽樣方差)比小型研究(具有較大的抽樣方差)更具可信度的一般思想有關。事實上,在通常模型的假設下,使用逆方差加權會導致一致的最小方差無偏估計(UMVUE)——好吧,有點,再次假設無偏估計並忽略抽樣方差實際上通常不完全知道的事實,但它們本身是估計的,在隨機效應模型中,我們還必須估計異質性的方差分量,但是我們只是把它當作一個已知的常數,這也不完全正確……但是,是的,如果我們只是非常努力地瞇著眼睛並忽略其中一些,我們就會得到 UMVUE,如果我們使用逆方差加權問題。
因此,這里關鍵的是估計器的效率,而不是無偏性本身。但是,即使是未加權平均通常也不會比使用反方差加權平均效率低很多,尤其是在隨機效應模型中以及當異質性很大時(在這種情況下,通常的加權方案會導致幾乎統一的權重反正!)。但即使在固定效應模型或幾乎沒有異質性的情況下,差異通常也不是壓倒性的。
正如你所提到的,人們也可以很容易地考慮其他加權方案,例如按樣本大小或其某些函數加權,但這只是試圖獲得接近逆方差權重的東西(因為抽樣方差是,很大程度上取決於研究的樣本量)。
但實際上,人們可以而且應該將權重和方差的問題完全“解耦”。它們實際上是一個必須考慮的兩個獨立部分。但這並不是文獻中通常呈現的方式。
但是,這裡的重點是您確實需要考慮兩者。是的,您可以將未加權平均值作為您的組合估計值,這本質上是一種元分析,但是一旦您想開始基於該組合估計值進行推斷(例如,進行假設檢驗,構建置信區間),您需要知道抽樣方差(以及異質性的量)。這樣想:如果你結合一堆小型(和/或非常異質)的研究,你的點估計將比你結合相同數量的非常大(和/或同質)的研究精確得多研究——不管你在計算綜合價值時如何加權你的估計。
實際上,當我們開始進行推論統計時,甚至有一些方法可以不知道抽樣方差(和異質性的數量)。可以考慮基於重採樣的方法(例如,自舉測試、置換測試)或即使我們錯誤指定模型的某些部分,也可以為組合估計產生一致的標準誤差的方法——但是這些方法的工作效果需要仔細評估就事論事。