Multiple-Comparisons

重複測試累積數據時出現總體 I 型錯誤

  • March 2, 2011

我有一個關於組順序方法的問題。

根據維基百科:

在具有兩個治療組的隨機試驗中,以下列方式使用經典的組序貫測試:如果每組中有 n 名受試者,則對 2n 名受試者進行中期分析。進行統計分析以比較兩組,如果接受備擇假設,則終止試驗。否則,對另外 2n 名受試者繼續試驗,每組 n 名受試者。對 4n 個受試者再次進行統計分析。如果接受替代方案,則終止試驗。否則,它會繼續進行定期評估,直到有 2n 個主題的 N 組可用。至此,進行最後一次統計檢驗,終止試驗

但是通過以這種方式反複測試累積數據,第一類錯誤級別被誇大了……

如果樣本彼此獨立,則總體 I 型錯誤,, 將是

在哪裡是每個測試的級別,並且是臨時看的次數。

但是樣本不是獨立的,因為它們重疊。假設以相同的信息增量進行中期分析,可以發現(幻燈片 6)

在此處輸入圖像描述

你能解釋一下這個表是如何獲得的嗎?

下面的幻燈片,通過 14,解釋了這個想法。正如您所注意到的,關鍵是統計數據的順序是相關的。

上下文是具有已知標準偏差的 z 檢驗。第一次檢驗統計,適當標準化,具有正態 (0,1) 分佈與 cdf. 第二個統計也是如此, 但是——因為第一個使用了用於第二個的數據的子集——這兩個統計量與相關係數相關. 所以具有雙正態分佈。I 類錯誤的概率(在原假設下)等於 (a) I 類錯誤在第一次測試中發生或 (b) I 類錯誤在第一次測試中沒有發生但在第一次測試中發生的概率第二次測試。讓是臨界值(對於標稱尺寸的兩側測試= 0.05)。那麼在兩次分析後出現 I 類錯誤的機會等於或者和. 數值積分給出了這個概率的值 0.0831178,與表格一致。表中的後續值是通過類似的推理(以及更複雜的積分)獲得的。

該圖描繪了副法線 pdf 和積分區域(固體表面)。 雙正態 PDF,3D 曲面圖

引用自:https://stats.stackexchange.com/questions/7780

comments powered by Disqus