如何比較數據符合指數分佈的兩個樣本的平均值
我有兩個數據樣本,一個基線樣本和一個治療樣本。
假設是治療樣本的平均值高於基線樣本。
兩個樣本的形狀都是指數的。由於數據相當大,我只有在運行測試時每個樣本的平均值和元素數量。
我怎樣才能檢驗這個假設?我猜這非常簡單,而且我遇到過一些關於使用 F-Test 的參考資料,但我不確定參數是如何映射的。
您可以使用似然比檢驗(LR 檢驗)檢驗均值參數的相等性與均值參數不相等的替代方案。(但是,如果平均參數確實不同並且分佈是指數的,那麼這是一個尺度偏移,而不是位置偏移。)
對於單尾測試(但僅在兩尾情況下漸近),我認為 LR 測試結果等同於以下情況(以表明這實際上與單尾的 LR 測試相同案例一需要表明 LR 統計量是單調的 $ \bar x/\bar y $ ):
假設我們參數化 $ i $ 第一個指數中的第一個觀察值具有 pdf $ 1/\mu_x \exp(-x_i/\mu_x) $ 和 $ j $ 第二個樣本中的觀察結果為 pdf $ 1/\mu_y \exp(-y_j/\mu_y) $ (在觀察和參數的明顯域上)。
(需要說明的是,我們在這裡使用的是平均形式而不是比率形式;這不會影響計算的結果。)
由於分佈 $ X_i $ 是伽馬的一個特例, $ \Gamma(1,\mu_x) $ , 總和的分佈 $ X $ 的, $ S_x=\sum_i X_i $ 是分佈式的 $ \Gamma(n_x,\mu_x) $ ; 同樣,對於總和 $ Y $ 年代, $ S_y $ 是 $ \Gamma(n_y,\mu_y) $ .
由於伽馬分佈和卡方分佈之間的關係,事實證明 $ 2/\mu_x S_x $ 是分佈式的 $ \chi^2_{2n_x} $ . 兩個卡方在其自由度上的比率是 F。因此比率, $ \frac{\mu_y}{\mu_x}\frac{S_x/n_x}{S_y/n_y} \sim F_{2n_x,2n_y} $ .
那麼,在均值相等的原假設下, $ \bar x/\bar y \sim F_{2n_x,2n_y} $ ,並且在雙邊替代方案下,這些值可能往往小於或大於零分佈中的值,因此您需要一個雙尾檢驗。
模擬檢查我們沒有在代數中犯一些簡單的錯誤:
在這裡,我模擬了 1000 個大小為 30 的樣本 $ X $ 和 20 $ Y $ 從具有相同均值的指數分佈,併計算上述均值比率統計量。
下面是結果分佈的直方圖以及顯示 $ F $ 我們在 null 下計算的分佈:
例如,討論雙尾 p 值的計算:
為了說明計算,這裡有兩個來自指數分佈的小樣本。X 樣本具有來自均值為 10 的總體的 14 個觀測值,Y 樣本具有來自均值為 15 的總體的 17 個觀測值:
x: 12.173 3.148 33.873 0.160 3.054 11.579 13.491 7.048 48.836 16.478 3.323 3.520 7.113 5.358 y: 7.635 1.508 29.987 13.636 8.709 13.132 12.141 5.280 23.447 18.687 13.055 47.747 0.334 7.745 26.287 34.390 9.596
樣本均值分別為 12.082 和 16.077。均值比為 0.7515
左側的區域很簡單,因為它位於尾部下方(R 中的計算):
> pf(r,28,34) [1] 0.2210767
我們需要另一條尾巴的概率。如果分佈是反向對稱的,那麼這樣做很簡單。
方差比 F 檢驗(類似地是雙尾)的一個常見約定是簡單地將單尾 p 值加倍(實際上是這裡發生的事情;這也是 R 中似乎要做的事情,例如); 在這種情況下,它給出的 p 值為 0.44。
但是,如果您使用正式的拒絕規則來執行此操作,則通過放置一個區域 $ \alpha/2 $ 在每條尾巴中,您將獲得此處所述的臨界值。那麼 p 值是最大的 $ \alpha $ 這將導致拒絕,這相當於將上面的一個尾 p 值添加到另一尾中的單尾 p 值中,以交換自由度。在上面的示例中,p 值為 0.43。
[這些規則在小樣本中都不是“最優的”]