有沒有使用的測試|μ一種−μ乙|≤δ|μ一種−μ乙|≤d|{mu_A}-{mu_B}|le delta作為零假設？

October 26, 2020

在通常的 t 檢驗中，原假設是“兩組均值之差為零”。

我的問題：

是否有使用“兩組均值之差小於某個值”作為原假設的檢驗？

“兩組均值之差小於某個值”，表示A組和B組均值滿足 $$ |{\mu_A}-{\mu_B}|\le \delta . $$ 所以， $$ H_0: |{\mu_A}-{\mu_B}|\le \delta $$和 $$ H_1: |{\mu_A}-{\mu_B}|> \delta $$

這裡， $ {\mu_A} $ 和 $ {\mu}_{B} $ 分別是A 組和 B 組的總體平均值， $ \delta >0 $ 是一個預定的實數。

可以假設總體和样本總體滿足與 t 檢驗相同的要求。如有必要，您可以使用以下設置；

A組和B組的人口均服從正態分佈。

根據觀察數據計算的 A 組的平均無偏 SD 樣本大小為： $ m_A , s_A, n_A $

根據觀察數據計算的 B 組的平均無偏 SD 樣本大小為： $ m_B , s_B, n_B $

這　 $ t_{obs} $ 表示根據觀測數據計算的 t 值。

此外，如有必要，可以認為兩組的總體方差相等。那麼池化的sd如下。 $$ {s^*}=\sqrt{\frac{({n_A}-1){s_A}+({n_B}-1){s_B}}{{n_A}+{n_B}-2}} $$

這 $ \tau_{\phi ,\mu} $ 表示具有非中心性參數的累積非中心 t 分佈 $ \mu $ 和自由度。

這 $ \tau_{\phi ,\mu}(t) $ 　是通過對從 -∞ 到 t 的區間內的非中心分佈進行定積分獲得的值。

您可以使用置信區間和假設檢驗之間的等價性：我們可以通過抽樣而不是原假設產生置信區間來拒絕原假設嗎？然後，您將計算均值差異的置信區間，並在兩者之間沒有任何值時拒絕原假設 $ \pm \delta $ 在區間內。

但是使用這種方法，您拒絕零假設的頻率低於目標顯著性水平。之所以出現這種差異，是因為置信區間與點假設有關，而您的情況並非如此。

樣本分佈的圖形視圖 $ \bar{x}-\bar{y} $ 和 $ \hat{\sigma} $

在下圖中，圖像描繪了 t 檢驗的兩種情況

當我們比較兩個具有相同大小和方差的樣本時，原假設是$$ H_0: \mu_y-\mu_x = 0 $$然後我們看一下與似然比有關的 t 統計量的值。$$ t = \frac{1}{\sqrt{2/n}} \frac{d}{s_p} $$

當我們改用原假設時$$ H_0: \vert \mu_y-\mu_x \vert \leq \delta $$ 那麼似然比檢驗的結果將與 t 統計量相似，但現在它向左和向右移動。

在下圖中，繪製了 95% 顯著性檢驗的 t 值的邊界。將這些邊界與大小為 5 的樣本的標準偏差和均值差的樣本分佈進行比較。 $ X $ 和 $ Y $ 正態分佈，方差和均值均等，但在下方圖像中均值相差 $ \mu_y-\mu_X = 0.5 $ .

似然比檢驗，帶有移位邊界的 T 檢驗，不理想

在第一張圖片中，您看到 5% 的樣本導致拒絕假設（按照將水平設置為 95% 的設計）。但是，在下圖中，拒絕率較低且不等於 5%（因為邊界較寬，由於移位 $ \delta $ ).

所以可能人們可以選擇把邊界畫得更窄。但對於大 $ s_p $ 你越來越接近當前的邊界（直覺上你可以說 $ \delta $ 當變量的方差很大時，變得不那麼重要，相對較小）。

原因是我們不一定需要使用似然比檢驗，因為我們不是在處理簡單的假設。根據Neyman-Pearson引理，似然比檢驗是最有力的檢驗。但是，只有當假設是簡單的假設（比如 $ H_0: \mu_y-\mu_x = 0 $ ），我們有一個複合假設（如 $ H_0: -\delta \leq \mu_y-\mu_x \leq \delta $ ）。對於復合假設，似然比檢驗可能並不總是給出指定的顯著性水平（我們根據最壞情況選擇似然比的邊界）。

所以我們可以做出比似然比檢驗更清晰的邊界。但是，沒有唯一的方法可以做到這一點。

圖像的 R 代碼：
nsim <- 10^4
nsmp <- 5

rowDevs <- function(x) {
 n <- length(x[1,])
 sqrt((rowMeans(x^2)-rowMeans(x)^2)*n/(n-1))
}

### simulations
set.seed(1)
x <- matrix(rnorm(nsim*nsmp),nsim)
y <- matrix(rnorm(nsim*nsmp),nsim)

### statistics of difference and variance
d <- rowMeans(y)-rowMeans(x)
v <- (0.5*rowDevs(x)+0.5*rowDevs(y))

## colouring 5% points with t-values above/below qt(0.975, df = 18)
dv_slope <- qt(0.975, df = 18)*sqrt(2/nsmp)
col <- (d/v > dv_slope)+(d/v < -dv_slope)

### plot points
plot(d,v, xlim = c(-4,4), ylim = c(0,1.5),
    pch = 21, col = rgb(col,0,0,0.1), bg = rgb(col,0,0,0.1), cex = 0.5,
    xlab = expression(d == bar(y)-bar(x)),
    ylab = expression(s[p] == sqrt(0.5*s[x]+0.5*s[y])),
    xaxs = "i", yaxs = "i",
    main = expression(H[0] : mu[y]-mu[x]==0))

lines(c(0,10),c(0,10)/dv_slope, col = 1, lty = 2)
lines(-c(0,10),c(0,10)/dv_slope, col = 1, lty = 2)



## colouring 5% points with t-values above/below qt(0.975, df = 18)
dlt <- 0.5
## colouring 5% points with t-values above/below qt(0.975, df = 18)
dv_slope <- qt(0.975, df = 18)*sqrt(2/nsmp)
col <- ((d-2*dlt)/v > dv_slope)+((d)/v < -dv_slope)

### plot points
plot(d-dlt,v, xlim = c(-4,4), ylim = c(0,1.5),
    pch = 21, col = rgb(col,0,0,0.1), bg = rgb(col,0,0,0.1), cex = 0.5,
    xlab = expression(d == bar(y)-bar(x)),
    ylab = expression(s[p] == sqrt(0.5*s[x]+0.5*s[y])),
    xaxs = "i", yaxs = "i",
    main = expression(H[0] :  "|" * mu[x]-mu[y] * "|" <= delta))

lines(c(0,10)+dlt,c(0,10)/dv_slope, col = 1, lty = 2)
lines(-c(0,10)-dlt,c(0,10)/dv_slope, col = 1, lty = 2)
為什麼 t 檢驗適用於點假設， $ H_0 : \mu = 0 $ ，但不適用於復合假設 $ H_0: \sigma \leq \mu \leq \sigma $ ?

在下圖中，我們繪製了上面的情況，但是現在我們更改了標準差 $ \sigma $ 我們從中抽取樣本的總體。現在圖像包含兩個單獨的雲。在一種情況下 $ \sigma = 1 $ 像以前一樣。在另一種情況下 $ \sigma = 0.2 $ ，這會產生額外的更小的點雲。

對角線是似然比某個臨界水平的邊界。第一種情況（上圖）是零假設 $ H_0 : \mu = 0 $ , 第二種情況是複合假設 $ H_0: \sigma \leq \mu \leq \sigma $ （在這個特定的圖像中 $ \sigma = 0.15 $ ).

當我們考慮拒絕原假設的概率時（第一類錯誤），那麼這個概率將取決於參數 $ \mu $ 和 $ \sigma $ （在零假設內可能不同）。

依賴於 $ \mu $ ：什麼時候 $ \mu $ 更接近於 $ \pm \delta $ 代替 $ 0 $ 那麼可能直觀的是，零假設更有可能被拒絕，並且我們不能進行測試，使得類型 1 錯誤對於任何值都是相同的 $ \mu $ 對應於原假設。

依賴於 $ \sigma $ ：拒絕概率也取決於 $ \sigma $ .

在第一種情況/圖像（點假設）中，然後獨立於 $ \sigma $ I 型錯誤將是恆定的。如果我們改變 $ \sigma $ 那麼這涉及在垂直和水平方向上縮放樣本分佈（由圖像中的點雲表示），並且對角線邊界線將相交相同的比例。

在第二種情況/圖像（複合假設）中，類型 I 錯誤將取決於 $ \sigma $ . 邊界線被移動並且不通過縮放變換的中心，因此對於 I 型錯誤，縮放將不再是不變的變換。

雖然這些邊界與某些臨界似然比相關，但這是基於復合假設中特定案例的比率，對於其他案例可能**不是最佳的。（在點假設的情況下，沒有“其他情況”，或者在“點假設”的情況下 $ \mu_a - \mu_b = 0 $ ，這並不是一個真正的點假設，因為 $ \sigma $ 沒有在假設中指定，它恰好可以解決，因為似然比獨立於 $ \sigma $ ).

引用自：https://stats.stackexchange.com/questions/493614

comments powered by Disqus

有沒有使用的測試|μ一種−μ乙|≤δ|μ一種−μ乙|≤d|{mu_A}-{mu_B}|le delta作為零假設？

樣本分佈的圖形視圖 $ \bar{x}-\bar{y} $ 和 $ \hat{\sigma} $

似然比檢驗，帶有移位邊界的 T 檢驗，不理想

為什麼 t 檢驗適用於點假設， $ H_0 : \mu = 0 $ ，但不適用於復合假設 $ H_0: \sigma \leq \mu \leq \sigma $ ?

相關問答

這是p-hacking嗎？

t.test 和 prop.test 的 p 值差異很大

為什麼當平均值看起來真的不同時，t.test() 的 p 值在統計上不顯著

具有二分變量的兩組的顯著性檢驗

韋爾奇檢驗似乎比等方差 t 檢驗差得多

CDF的置信區間