Confidence-Interval
兩個比例之比的置信區間
我有兩個比例(例如,控制佈局中鏈接的點擊率(CTR) 和實驗佈局中鏈接的點擊率),我想圍繞這些比例的比例計算 95% 的置信區間。
我該怎麼做呢?我知道我可以使用 delta 方法來計算這個比率的方差,但我不知道除此之外還能做什麼。我應該使用什麼作為置信區間的中點(我觀察到的比率,或不同的預期比率),我應該在這個比率周圍取多少標準偏差?
我應該使用 delta 方法方差嗎?(我並不真正關心方差,只是一個置信區間。)我應該使用Fieller’s Theorem,使用案例 1(因為我在做比例,我想我滿足正態分佈要求)?我應該只計算一個引導樣本嗎?
在流行病學中執行此操作的標準方法(比例的比率通常稱為風險比)是首先對比率進行對數變換,使用 delta 方法計算對數尺度上的置信區間並假設正態分佈,然後變回來。這在中等樣本量下比在未轉換的尺度上使用 delta 方法效果更好,儘管如果任一組中的事件數量非常少,它仍然會表現不佳,並且如果任一組中都沒有事件則完全失敗。
如果有和兩組總成績和,那麼對比例的明顯估計是
使用 delta 方法並假設兩組是獨立的並且成功是二項式分佈的,您可以證明
取它的平方根給出標準誤差. 假如說是正態分佈的,95% 的置信區間是 將其取冪給出比例比率的 95% 置信區間作為