有沒有使用的測試|μ一種−μ乙|≤δ|μ一種−μ乙|≤d|{mu_A}-{mu_B}|le delta作為零假設?
在通常的 t 檢驗中,原假設是“兩組均值之差為零”。
我的問題:
是否有使用“兩組均值之差小於某個值”作為原假設的檢驗?
“兩組均值之差小於某個值”,表示A組和B組均值滿足 $$ |{\mu_A}-{\mu_B}|\le \delta . $$ 所以, $$ H_0: |{\mu_A}-{\mu_B}|\le \delta $$和 $$ H_1: |{\mu_A}-{\mu_B}|> \delta $$
這裡, $ {\mu_A} $ 和 $ {\mu}_{B} $ 分別是A 組和 B 組 的總體平均值, $ \delta >0 $ 是一個預定的實數。
可以假設總體和样本總體滿足與 t 檢驗相同的要求。如有必要,您可以使用以下設置;
- A組和B組的人口均服從正態分佈。
- 根據觀察數據計算的 A 組的平均無偏 SD 樣本大小為: $ m_A , s_A, n_A $
- 根據觀察數據計算的 B 組的平均無偏 SD 樣本大小為: $ m_B , s_B, n_B $
- 這 $ t_{obs} $ 表示根據觀測數據計算的 t 值。
此外,如有必要,可以認為兩組的總體方差相等。那麼池化的sd如下。 $$ {s^*}=\sqrt{\frac{({n_A}-1){s_A}+({n_B}-1){s_B}}{{n_A}+{n_B}-2}} $$
這 $ \tau_{\phi ,\mu} $ 表示具有非中心性參數的累積非中心 t 分佈 $ \mu $ 和自由度。
這 $ \tau_{\phi ,\mu}(t) $ 是通過對從 -∞ 到 t 的區間內的非中心分佈進行定積分獲得的值。
您可以使用置信區間和假設檢驗之間的等價性:我們可以通過抽樣而不是原假設產生置信區間來拒絕原假設嗎?然後,您將計算均值差異的置信區間,並在兩者之間沒有任何值時拒絕原假設 $ \pm \delta $ 在區間內。
但是使用這種方法,您拒絕零假設的頻率低於目標顯著性水平。之所以出現這種差異,是因為置信區間與點假設有關,而您的情況並非如此。
樣本分佈的圖形視圖 $ \bar{x}-\bar{y} $ 和 $ \hat{\sigma} $
在下圖中,圖像描繪了 t 檢驗的兩種情況
- 當我們比較兩個具有相同大小和方差的樣本時,原假設是$$ H_0: \mu_y-\mu_x = 0 $$然後我們看一下與似然比有關的 t 統計量的值。$$ t = \frac{1}{\sqrt{2/n}} \frac{d}{s_p} $$
- 當我們改用原假設時$$ H_0: \vert \mu_y-\mu_x \vert \leq \delta $$ 那麼似然比檢驗的結果將與 t 統計量相似,但現在它向左和向右移動。
在下圖中,繪製了 95% 顯著性檢驗的 t 值的邊界。將這些邊界與大小為 5 的樣本的標準偏差和均值差的樣本分佈進行比較。 $ X $ 和 $ Y $ 正態分佈,方差和均值均等,但在下方圖像中均值相差 $ \mu_y-\mu_X = 0.5 $ .
似然比檢驗,帶有移位邊界的 T 檢驗,不理想
在第一張圖片中,您看到 5% 的樣本導致拒絕假設(按照將水平設置為 95% 的設計)。但是,在下圖中,拒絕率較低且不等於 5%(因為邊界較寬,由於移位 $ \delta $ ).
所以可能人們可以選擇把邊界畫得更窄。但對於大 $ s_p $ 你越來越接近當前的邊界(直覺上你可以說 $ \delta $ 當變量的方差很大時,變得不那麼重要,相對較小)。
原因是我們不一定需要使用似然比檢驗,因為我們不是在處理簡單的假設。根據Neyman-Pearson引理,似然比檢驗是最有力的檢驗。但是,只有當假設是簡單的假設(比如 $ H_0: \mu_y-\mu_x = 0 $ ),我們有一個複合假設(如 $ H_0: -\delta \leq \mu_y-\mu_x \leq \delta $ )。對於復合假設,似然比檢驗可能並不總是給出指定的顯著性水平(我們根據最壞情況選擇似然比的邊界)。
所以我們可以做出比似然比檢驗更清晰的邊界。但是,沒有唯一的方法可以做到這一點。
圖像的 R 代碼:
nsim <- 10^4 nsmp <- 5 rowDevs <- function(x) { n <- length(x[1,]) sqrt((rowMeans(x^2)-rowMeans(x)^2)*n/(n-1)) } ### simulations set.seed(1) x <- matrix(rnorm(nsim*nsmp),nsim) y <- matrix(rnorm(nsim*nsmp),nsim) ### statistics of difference and variance d <- rowMeans(y)-rowMeans(x) v <- (0.5*rowDevs(x)+0.5*rowDevs(y)) ## colouring 5% points with t-values above/below qt(0.975, df = 18) dv_slope <- qt(0.975, df = 18)*sqrt(2/nsmp) col <- (d/v > dv_slope)+(d/v < -dv_slope) ### plot points plot(d,v, xlim = c(-4,4), ylim = c(0,1.5), pch = 21, col = rgb(col,0,0,0.1), bg = rgb(col,0,0,0.1), cex = 0.5, xlab = expression(d == bar(y)-bar(x)), ylab = expression(s[p] == sqrt(0.5*s[x]+0.5*s[y])), xaxs = "i", yaxs = "i", main = expression(H[0] : mu[y]-mu[x]==0)) lines(c(0,10),c(0,10)/dv_slope, col = 1, lty = 2) lines(-c(0,10),c(0,10)/dv_slope, col = 1, lty = 2) ## colouring 5% points with t-values above/below qt(0.975, df = 18) dlt <- 0.5 ## colouring 5% points with t-values above/below qt(0.975, df = 18) dv_slope <- qt(0.975, df = 18)*sqrt(2/nsmp) col <- ((d-2*dlt)/v > dv_slope)+((d)/v < -dv_slope) ### plot points plot(d-dlt,v, xlim = c(-4,4), ylim = c(0,1.5), pch = 21, col = rgb(col,0,0,0.1), bg = rgb(col,0,0,0.1), cex = 0.5, xlab = expression(d == bar(y)-bar(x)), ylab = expression(s[p] == sqrt(0.5*s[x]+0.5*s[y])), xaxs = "i", yaxs = "i", main = expression(H[0] : "|" * mu[x]-mu[y] * "|" <= delta)) lines(c(0,10)+dlt,c(0,10)/dv_slope, col = 1, lty = 2) lines(-c(0,10)-dlt,c(0,10)/dv_slope, col = 1, lty = 2)
為什麼 t 檢驗適用於點假設, $ H_0 : \mu = 0 $ ,但不適用於復合假設 $ H_0: \sigma \leq \mu \leq \sigma $ ?
在下圖中,我們繪製了上面的情況,但是現在我們更改了標準差 $ \sigma $ 我們從中抽取樣本的總體。現在圖像包含兩個單獨的雲。在一種情況下 $ \sigma = 1 $ 像以前一樣。在另一種情況下 $ \sigma = 0.2 $ ,這會產生額外的更小的點雲。
對角線是似然比某個臨界水平的邊界。第一種情況(上圖)是零假設 $ H_0 : \mu = 0 $ , 第二種情況是複合假設 $ H_0: \sigma \leq \mu \leq \sigma $ (在這個特定的圖像中 $ \sigma = 0.15 $ ).
當我們考慮拒絕原假設的概率時(第一類錯誤),那麼這個概率將取決於參數 $ \mu $ 和 $ \sigma $ (在零假設內可能不同)。
依賴於 $ \mu $ : 什麼時候 $ \mu $ 更接近於 $ \pm \delta $ 代替 $ 0 $ 那麼可能直觀的是,零假設更有可能被拒絕,並且我們不能進行測試,使得類型 1 錯誤對於任何值都是相同的 $ \mu $ 對應於原假設。
依賴於 $ \sigma $ :拒絕概率也取決於 $ \sigma $ .
- 在第一種情況/圖像(點假設)中,然後獨立於 $ \sigma $ I 型錯誤將是恆定的。如果我們改變 $ \sigma $ 那麼這涉及在垂直和水平方向上縮放樣本分佈(由圖像中的點雲表示),並且對角線邊界線將相交相同的比例。
- 在第二種情況/圖像(複合假設)中,類型 I 錯誤將取決於 $ \sigma $ . 邊界線被移動並且不通過縮放變換的中心,因此對於 I 型錯誤,縮放將不再是不變的變換。
雖然這些邊界與某些臨界似然比相關,但這是基於復合假設中特定案例的比率,對於其他案例可能**不是最佳的。(在點假設的情況下,沒有“其他情況”,或者在“點假設”的情況下 $ \mu_a - \mu_b = 0 $ ,這並不是一個真正的點假設,因為 $ \sigma $ 沒有在假設中指定,它恰好可以解決,因為似然比獨立於 $ \sigma $ ).