Equivalence

對等價性 TOST 和 UMP 測試之間差異的直觀解釋

  • April 29, 2014

等價假設檢驗不同於更常見的差異假設檢驗。

在差異檢驗中,原假設是某種形式的“單獨的數量是相同的”,並且足夠極端的證據促使拒絕支持“單獨的數量不同”的結論。

在等價性檢驗中,原假設是某種形式的“單獨的數量至少相差 $ \Delta $ ” 並且足夠極端的證據促使拒絕支持“單獨的數量在由 $ \Delta $ 。”

**專業提示:**將差異測試的推論與等效岩石的測試相結合,因為它將功率和相關效應大小置於測試框架內。繼 Reagle & Vinod (2003) 之後,我採用了命名法 $ \text{H}^{+}{0} $ 指與差異檢驗相關的實證主義零假設,以及 $ \text{H}^{-}{0} $ 指與等價檢驗相關的否定主義零假設:

從差異和等價測試組合推斷

我很熟悉兩種單邊測試(TOST;參見 Hauck and Anderson, 1984 或 Schuirmann, 1987)的等效性測試方法(即 $ \text{H}^{-}{0}\text{: }\left|\theta\right| \ge \Delta $ 將測試轉化為單面測試 $ \text{H}^{-}{01}\text{: }\theta \ge \Delta $ 要么 $ \text{H}^{-}{02}\text{: }\theta \le -\Delta $ ,並且拒絕這兩個意味著 $ \text{H}{\text{A}}\text{: }-\Delta < \theta <\Delta $ )。但是,我仍在為等效性的統一最強大(UMP) 測試進行陡峭的學習曲線。

直觀地說:

UMP 等效性檢驗的動機是什麼?我收集到區間假設 $ \text{H}^{-}_{0} $ 通過非中心分佈改變拒絕概率。但我不明白這在一般意義上是如何工作的。

除了對 TOST 的監管偏好之外,還有哪些考慮會導致對 TOST 與 UMP 等效性測試的偏好?我喜歡 TOST 的一件事是,等價項可以很容易地以測量變量的單位或測試統計量的分佈單位來表達和交流,並且這些量很容易來迴轉換。我不太清楚 UMP 等價測試中等價項的單位。

參考

Reagle, DP 和 Vinod, HD (2003)。使用數值計算的拒絕區域推斷否定主義理論。計算統計與數據分析,42(3):491-512。

Hauck, WW 和 Anderson, S. (1984)。在兩組比較生物利用度試驗中測試等效性的新統計程序。藥代動力學和藥效學雜誌,12(1):83-91。

舒爾曼,DA(1987 年)。比較兩種單側測試程序和評估平均生物利用度等效性的功效方法。藥理學,15(6):657-680。

第一個問題:UMP 是,名副其實的,最強大的。如果樣本量和等價區域都很小,則 TOST 可能會發生置信區間幾乎不會適合等價區域的情況。這導致幾乎為零的功率。此外,TOST 通常是保守的(即使有 $ 1-2\alpha $ 置信區間)。只要 UMP 存在,它就永遠擁有權力 $ > \alpha $ .

第二個問題:有時 UMP 不存在。正是這種嚴格的 3 階總正性必須保持密度,請參見 Wellek 關於等效性和非劣性檢驗的教科書的附錄。直觀地說,這個條件保證了各個點假設檢驗的功效曲線恰好有一個最大值。那麼臨界值就是這個功率曲線有水平的點 $ \alpha $ . 這就是為什麼你用這個找到他們 $ F_{1,n-1,\psi^2} $ -這個問題的分佈:獲取-UMP 的值等效性檢驗

此外,如果您的等價假設未標準化,即 $ \mu \in ]-\epsilon, \epsilon[ $ 代替 $ \mu \in ]-\frac{\epsilon}{\sigma}, \frac{\epsilon}{\sigma}[ $ ,那麼即使對於正態分佈的數據,UMP 在 $ (\hat{\mu},\hat{\sigma}^2) $ -空間。以Brown、Hwang 和 Munk (1997)為例。

正如您所提到的,最重要的是,觀察尺度上的置信區間比 $ p $ -價值觀。因此 ICH 指南需要置信區間。這會自動導致 TOST,因為如果您提供置信區間 $ p $ -UMP 值、置信區間和 $ p $ -value 可能相互矛盾。UMP 可能顯著,但置信區間仍觸及假設空間。這是不希望的。

總之,如果您在“內部”使用等價測試,即不用於直接的科學報告,而僅作為某些數據挖掘算法的一部分,例如,如果存在 UMP 可能更可取。否則採取 TOST。

引用自:https://stats.stackexchange.com/questions/95667

comments powered by Disqus