Post-Hoc

Benjamini & Hochberg (1995) 和 Benjamini & Yekutieli (2001) 錯誤發現率程序之間的實際區別是什麼?

  • July 5, 2013

我的統計程序實現了 Benjamini & Hochberg (1995) 和 Benjamini & Yekutieli (2001) 錯誤發現率 (FDR) 程序。我已盡力通讀後面的論文,但它在數學上相當密集,我不能合理地確定我理解這些程序之間的區別。我可以從我的統計程序中的底層代碼中看到它們確實是不同的,並且後者包括一個我見過的關於 FDR 的數量 q,但也不太了解。

是否有任何理由更喜歡 Benjamini & Hochberg (1995) 程序而不是 Benjamini & Yekutieli (2001) 程序?他們有不同的假設嗎?這些方法之間的實際區別是什麼?

Benjamini, Y. 和 Hochberg, Y. (1995)。控制錯誤發現率:一種實用且強大的多重測試方法。皇家統計學會雜誌 B 系列,57,289–300。

Benjamini, Y. 和 Yekutieli, D. (2001)。依賴關係下多次測試中錯誤發現率的控制。統計年鑑 29, 1165–1188。

以下評論中引用了 1999 年的論文:Yekutieli, D., & Benjamini, Y. (1999)。基於重採樣的錯誤發現率控制相關測試統計的多個測試過程。統計規劃與推理雜誌,82(1),171-196。

Benjamini and Hochberg (1995) 介紹了錯誤發現率。Benjamini and Yekutieli (2001) 證明了估計量在某些形式的依賴下是有效的。依賴可以如下產生。考慮 t 檢驗中使用的連續變量和與之相關的另一個變量;例如,測試兩組的 BMI 是否不同,以及這兩組的腰圍是否不同。因為這些變量是相關的,所以得到的 p 值也將是相關的。Yekutieli 和 Benjamini (1999) 開發了另一種 FDR 控製程序,可以通過重新採樣零分佈在一般依賴下使用。因為比較是針對零排列分佈的,所以隨著真陽性總數的增加,該方法變得更加保守。事實證明,隨著真陽性數量的增加,BH 1995 也是保守的。為了改進這一點,Benjamini 和 Hochberg (2000) 引入了自適應 FDR 程序。這需要估計一個參數,即空比例,該參數也用於 Storey 的 pFDR 估計器。Storey 進行了比較,並認為他的方法更強大,並強調了 1995 程序的保守性。Storey 也有依賴的結果和模擬。

上述所有測試在獨立下都是有效的。問題是這些估計可以處理什麼樣的偏離獨立性。

我目前的想法是,如果你不期望有太多的真陽性,那麼 BY (1999) 程序會很好,因為它結合了分佈特徵和依賴性。但是,我不知道實施。Storey 的方法是為許多具有一定依賴性的真陽性而設計的。BH 1995 提供了家庭錯誤率的替代方案,它仍然是保守的。

本傑明尼,Y 和 Y 霍赫伯格。關於具有獨立統計的多重測試中錯誤發現率的自適應控制。教育與行為統計雜誌,2000 年。

引用自:https://stats.stackexchange.com/questions/63441

comments powered by Disqus