Hypothesis-Testing

在原假設下,可交換樣本背後的直覺是什麼?

  • November 13, 2013

t-test排列測試(也稱為隨機化測試、重新隨機化測試或精確測試)非常有用,並且在不滿足例如所要求的正態分佈假設以及通過排序來轉換值時派上用場非參數測試Mann-Whitney-U-test會導致更多信息丟失。然而,在使用這種檢驗時,一個且唯一的一個假設是在原假設下樣本可交換性的假設。還值得注意的是,當有兩個以上的樣本時,也可以應用這種方法,例如在coinR 包中實現的樣本。

你能用一些比喻性的語言或簡單的英語概念直覺來說明這個假設嗎?這對於澄清像我這樣的非統計學家中被忽視的問題非常有用。

注意:

如果在相同的假設下應用置換測試不成立或無效,這將非常有幫助。

更新:

假設我從我所在地區的當地診所隨機收集了 50 名受試者。他們以 1:1 的比例隨機分配接受藥物或安慰劑。它們都Par1在 V1(基線)、V2(3 個月後)和 V3(1 年後)測量參數 1。所有 50 個科目可以根據特徵 A 分為 2 個組;A 正 = 20 和 A 負 = 30。它們也可以根據特徵 B 分為另外 2 個組;B 陽性 = 15 和 B 陰性 = 35。

現在,我Par1在所有訪問中都有來自所有主題的值。在可交換性的假設下,Par1如果我願意,我是否可以在使用置換檢驗的水平之間進行比較:

  • 將服用藥物的受試者與接受安慰劑的受試者在 V2 進行比較?

  • 在 V2 中比較具有特徵 A 的科目和具有特徵 B 的科目?

  • 比較在 V2 時具有特徵 A 的受試者與在 V3 時具有特徵 A 的受試者?

  • 在何種情況下,這種比較是無效的並且會違反可交換性的假設?

一、非形象化的描述:可交換性是指聯合分佈對於聯合分佈中各變量值的排列是不變的(即, $ f_{XYZ}(x = 1, y=3, z=2)=f_{XYZ}(x=3,y=2,z=1) $ , 等等)。如果不是這種情況,那麼計算排列不是檢驗零假設的有效方法,因為每個排列將具有不同的權重(概率/密度)。置換檢驗取決於將給定的一組數值分配給具有相同密度/概率的變量的每次分配。

一個沒有可交換性的具體例子:你有 N 個罐子,每個罐子裡裝著 100 張編號的票。前 M 個罐子的票只有 1-200 的奇數(每個數字 1 個票),其餘 NM 的票只有 1-200 之間的偶數票。如果您從每個罐子中隨機選擇一張票,您將獲得聯名樣本結果的分佈。在這種情況下, $ f(X_1=1,X_2=2,X_3=3…X_N=N)\neq f(X_1=N,X_2=N-1,X_3=N-2…X_N=1) $

所以你不能只計算值 1 到 N 的排列。一般來說,當你的樣本可以分成子組時,可交換性就會失敗(就像我對罐子所做的那樣)。如果您不是從 N 個罐子中抽取 1 個樣本,而是從 1 個罐子中抽取 N 個樣本,那麼可交換性將會恢復。然後,聯合分佈對排列是不變的。

引用自:https://stats.stackexchange.com/questions/76442

comments powered by Disqus