如何比較數據符合指數分佈的兩個樣本的平均值

November 15, 2013

我有兩個數據樣本，一個基線樣本和一個治療樣本。

假設是治療樣本的平均值高於基線樣本。

兩個樣本的形狀都是指數的。由於數據相當大，我只有在運行測試時每個樣本的平均值和元素數量。

我怎樣才能檢驗這個假設？我猜這非常簡單，而且我遇到過一些關於使用 F-Test 的參考資料，但我不確定參數是如何映射的。

您可以使用似然比檢驗（LR 檢驗）檢驗均值參數的相等性與均值參數不相等的替代方案。（但是，如果平均參數確實不同並且分佈是指數的，那麼這是一個尺度偏移，而不是位置偏移。）

對於單尾測試（但僅在兩尾情況下漸近），我認為 LR 測試結果等同於以下情況（以表明這實際上與單尾的 LR 測試相同案例一需要表明 LR 統計量是單調的 $ \bar x/\bar y $ ):

假設我們參數化 $ i $ 第一個指數中的第一個觀察值具有 pdf $ 1/\mu_x \exp(-x_i/\mu_x) $ 和 $ j $ 第二個樣本中的觀察結果為 pdf $ 1/\mu_y \exp(-y_j/\mu_y) $ （在觀察和參數的明顯域上）。

（需要說明的是，我們在這裡使用的是平均形式而不是比率形式；這不會影響計算的結果。）

由於分佈 $ X_i $ 是伽馬的一個特例， $ \Gamma(1,\mu_x) $ , 總和的分佈 $ X $ 的， $ S_x=\sum_i X_i $ 是分佈式的 $ \Gamma(n_x,\mu_x) $ ; 同樣，對於總和 $ Y $ 年代， $ S_y $ 是 $ \Gamma(n_y,\mu_y) $ .

由於伽馬分佈和卡方分佈之間的關係，事實證明 $ 2/\mu_x S_x $ 是分佈式的 $ \chi^2_{2n_x} $ . 兩個卡方在其自由度上的比率是 F。因此比率， $ \frac{\mu_y}{\mu_x}\frac{S_x/n_x}{S_y/n_y} \sim F_{2n_x,2n_y} $ .

那麼，在均值相等的原假設下， $ \bar x/\bar y \sim F_{2n_x,2n_y} $ ，並且在雙邊替代方案下，這些值可能往往小於或大於零分佈中的值，因此您需要一個雙尾檢驗。

模擬檢查我們沒有在代數中犯一些簡單的錯誤：

在這裡，我模擬了 1000 個大小為 30 的樣本 $ X $ 和 20 $ Y $ 從具有相同均值的指數分佈，併計算上述均值比率統計量。

下面是結果分佈的直方圖以及顯示 $ F $ 我們在 null 下計算的分佈：

例如，討論雙尾 p 值的計算：

為了說明計算，這裡有兩個來自指數分佈的小樣本。X 樣本具有來自均值為 10 的總體的 14 個觀測值，Y 樣本具有來自均值為 15 的總體的 17 個觀測值：
x: 12.173  3.148 33.873  0.160  3.054 11.579 13.491  7.048 48.836 
  16.478  3.323  3.520  7.113  5.358

y:  7.635  1.508 29.987 13.636  8.709 13.132 12.141  5.280 23.447 
  18.687 13.055 47.747  0.334  7.745 26.287 34.390  9.596
樣本均值分別為 12.082 和 16.077。均值比為 0.7515

左側的區域很簡單，因為它位於尾部下方（R 中的計算）：
> pf(r,28,34) 
[1] 0.2210767
我們需要另一條尾巴的概率。如果分佈是反向對稱的，那麼這樣做很簡單。

方差比 F 檢驗（類似地是雙尾）的一個常見約定是簡單地將單尾 p 值加倍（實際上是這裡發生的事情；這也是 R 中似乎要做的事情，例如); 在這種情況下，它給出的 p 值為 0.44。

但是，如果您使用正式的拒絕規則來執行此操作，則通過放置一個區域 $ \alpha/2 $ 在每條尾巴中，您將獲得此處所述的臨界值。那麼 p 值是最大的 $ \alpha $ 這將導致拒絕，這相當於將上面的一個尾 p 值添加到另一尾中的單尾 p 值中，以交換自由度。在上面的示例中，p 值為 0.43。

[這些規則在小樣本中都不是“最優的”]

引用自：https://stats.stackexchange.com/questions/76689

comments powered by Disqus

如何比較數據符合指數分佈的兩個樣本的平均值

相關問答

指數分佈的隨機變量的指數分佈？

為什麼機器學習中的參數未經測試？

具有二分變量的兩組的顯著性檢驗

在給定的最小值和最大值下生成服從指數分佈的隨機樣本

拋硬幣 n 次的假設檢驗

從指數分佈的矩生成函數計算方差