Hypothesis-Testing

有沒有使用的測試|μ一種−μ乙|≤δ|μ一種−μ乙|≤d|{mu_A}-{mu_B}|le delta作為零假設?

  • October 26, 2020

在通常的 t 檢驗中,原假設是“兩組均值之差為零”。

我的問題:

是否有使用“兩組均值之差小於某個值”作為原假設的檢驗?

“兩組均值之差小於某個值”,表示A組和B組均值滿足 |μAμB|δ.

所以, H0:|μAμB|δ
H1:|μAμB|>δ

這裡, μAμB 分別是A 組和 B 組 的總體平均值, δ>0 是一個預定的實數。

可以假設總體和样本總體滿足與 t 檢驗相同的要求。如有必要,您可以使用以下設置;

  • A組和B組的人口均服從正態分佈。
  • 根據觀察數據計算的 A 組的平均無偏 SD 樣本大小為: mA,sA,nA
  • 根據觀察數據計算的 B 組的平均無偏 SD 樣本大小為: mB,sB,nB
  • 這  tobs 表示根據觀測數據計算的 t 值。

此外,如有必要,可以認為兩組的總體方差相等。那麼池化的sd如下。 s=(nA1)sA+(nB1)sBnA+nB2

τϕ,μ 表示具有非中心性參數的累積非中心 t 分佈 μ 和自由度。

τϕ,μ(t)  是通過對從 -∞ 到 t 的區間內的非中心分佈進行定積分獲得的值。

您可以使用置信區間和假設檢驗之間的等價性:我們可以通過抽樣而不是原假設產生置信區間來拒絕原假設嗎?然後,您將計算均值差異的置信區間,並在兩者之間沒有任何值時拒絕原假設 ±δ 在區間內。

但是使用這種方法,您拒絕零假設的頻率低於目標顯著性水平。之所以出現這種差異,是因為置信區間與點假設有關,而您的情況並非如此。

樣本分佈的圖形視圖 ˉxˉyˆσ

在下圖中,圖像描繪了 t 檢驗的兩種情況

在下圖中,繪製了 95% 顯著性檢驗的 t 值的邊界。將這些邊界與大小為 5 的樣本的標準偏差和均值差的樣本分佈進行比較。 XY 正態分佈,方差和均值均等,但在下方圖像中均值相差 μyμX=0.5 .

例子

似然比檢驗,帶有移位邊界的 T 檢驗,不理想

在第一張圖片中,您看到 5% 的樣本導致拒絕假設(按照將水平設置為 95% 的設計)。但是,在下圖中,拒絕率較低且不等於 5%(因為邊界較寬,由於移位 δ ).

所以可能人們可以選擇把邊界畫得更窄。但對於大 sp 你越來越接近當前的邊界(直覺上你可以說 δ 當變量的方差很大時,變得不那麼重要,相對較小)。

原因是我們不一定需要使用似然比檢驗,因為我們不是在處理簡單的假設。根據Neyman-Pearson引理,似然比檢驗是最有力的檢驗。但是,只有當假設是簡單的假設(比如 H0:μyμx=0 ),我們有一個複合假設(如 H0:δμyμxδ )。對於復合假設,似然比檢驗可能並不總是給出指定的顯著性水平(我們根據最壞情況選擇似然比的邊界)。

所以我們可以做出比似然比檢驗更清晰的邊界。但是,沒有唯一的方法可以做到這一點。

圖像的 R 代碼:

nsim <- 10^4
nsmp <- 5

rowDevs <- function(x) {
 n <- length(x[1,])
 sqrt((rowMeans(x^2)-rowMeans(x)^2)*n/(n-1))
}

### simulations
set.seed(1)
x <- matrix(rnorm(nsim*nsmp),nsim)
y <- matrix(rnorm(nsim*nsmp),nsim)

### statistics of difference and variance
d <- rowMeans(y)-rowMeans(x)
v <- (0.5*rowDevs(x)+0.5*rowDevs(y))

## colouring 5% points with t-values above/below qt(0.975, df = 18)
dv_slope <- qt(0.975, df = 18)*sqrt(2/nsmp)
col <- (d/v > dv_slope)+(d/v < -dv_slope)

### plot points
plot(d,v, xlim = c(-4,4), ylim = c(0,1.5),
    pch = 21, col = rgb(col,0,0,0.1), bg = rgb(col,0,0,0.1), cex = 0.5,
    xlab = expression(d == bar(y)-bar(x)),
    ylab = expression(s[p] == sqrt(0.5*s[x]+0.5*s[y])),
    xaxs = "i", yaxs = "i",
    main = expression(H[0] : mu[y]-mu[x]==0))

lines(c(0,10),c(0,10)/dv_slope, col = 1, lty = 2)
lines(-c(0,10),c(0,10)/dv_slope, col = 1, lty = 2)



## colouring 5% points with t-values above/below qt(0.975, df = 18)
dlt <- 0.5
## colouring 5% points with t-values above/below qt(0.975, df = 18)
dv_slope <- qt(0.975, df = 18)*sqrt(2/nsmp)
col <- ((d-2*dlt)/v > dv_slope)+((d)/v < -dv_slope)

### plot points
plot(d-dlt,v, xlim = c(-4,4), ylim = c(0,1.5),
    pch = 21, col = rgb(col,0,0,0.1), bg = rgb(col,0,0,0.1), cex = 0.5,
    xlab = expression(d == bar(y)-bar(x)),
    ylab = expression(s[p] == sqrt(0.5*s[x]+0.5*s[y])),
    xaxs = "i", yaxs = "i",
    main = expression(H[0] :  "|" * mu[x]-mu[y] * "|" <= delta))

lines(c(0,10)+dlt,c(0,10)/dv_slope, col = 1, lty = 2)
lines(-c(0,10)-dlt,c(0,10)/dv_slope, col = 1, lty = 2)

為什麼 t 檢驗適用於點假設, H0:μ=0 ,但不適用於復合假設 H0:σμσ ?

在下圖中,我們繪製了上面的情況,但是現在我們更改了標準差 σ 我們從中抽取樣本的總體。現在圖像包含兩個單獨的雲。在一種情況下 σ=1 像以前一樣。在另一種情況下 σ=0.2 ,這會產生額外的更小的點雲。

對角線是似然比某個臨界水平的邊界。第一種情況(上圖)是零假設 H0:μ=0 , 第二種情況是複合假設 H0:σμσ (在這個特定的圖像中 σ=0.15 ).

當我們考慮拒絕原假設的概率時(第一類錯誤),那麼這個概率將取決於參數 μσ (在零假設內可能不同)。

  • 依賴於 μ : 什麼時候 μ 更接近於 ±δ 代替 0 那麼可能直觀的是,零假設更有可能被拒絕,並且我們不能進行測試,使得類型 1 錯誤對於任何值都是相同的 μ 對應於原假設。

  • 依賴於 σ :拒絕概率也取決於 σ .

    • 在第一種情況/圖像(點假設)中,然後獨立於 σ I 型錯誤將是恆定的。如果我們改變 σ 那麼這涉及在垂直和水平方向上縮放樣本分佈(由圖像中的點雲表示),並且對角線邊界線將相交相同的比例。
    • 在第二種情況/圖像(複合假設)中,類型 I 錯誤將取決於 σ . 邊界線被移動並且不通過縮放變換的中心,因此對於 I 型錯誤,縮放將不再是不變的變換。

雖然這些邊界與某些臨界似然比相關,但這是基於復合假設中特定案例的比率,對於其他案例可能**不是最佳的。(在點假設的情況下,沒有“其他情況”,或者在“點假設”的情況下 μaμb=0 ,這並不是一個真正的點假設,因為 σ 沒有在假設中指定,它恰好可以解決,因為似然比獨立於 σ ).

具有不同 sigma 的示例

引用自:https://stats.stackexchange.com/questions/493614