我可以對產生 2 個不同最小 n 的不等大小組進行 t 檢驗功效分析嗎?
Power Analysis
計算α 通常很簡單minimum sample size
,尤其是在我首選的統計計算環境R中。但是,我被要求進行與我所做的任何事情或我可以在網上找到的參考資料略有不同的功率分析。我想知道我被要求的內容是否可能/有效。
該項目基本上有兩種
unequal groups
狀態,假設這兩組在結果變量(即給客戶打電話的持續時間)方面存在顯著差異。“控制”組由 40 個州組成,產生了大約 2,500 個觀測值。“測試”組有大約 10 個狀態和 500 個觀察值。最初,我找到了 group
means
+pooled standard deviation
,我用它來計算Effect Size
. 然後我使用了一個名為pwr
in的包R
,發現在給定 0.05 顯著性和 0.8 功效的情況下,我需要每組大約 135 個觀察值的最小樣本量。然而,他們拒絕了我的回答,因為他們希望一個群體比另一個群體像現在這樣大得多,並且他們期望每組有兩個不同的最小觀察數量,或者就州數量而言,至少佔人口的百分比或必須進入他們的“測試”組的觀察。
我看到兩個樣本 t 檢驗(即 R 函數
pwr.t2n.test
)的 Power Analyses,但我必須指定至少一個樣本量,而他們希望我告訴他們兩組的最小樣本量(作為數字或百分比),並且此函數不反映兩組標準差的差異。這是可能的還是我只是告訴他們這不是它的工作原理(即我能做的最好的事情就是告訴他們給定樣本大小和匯總標準偏差,第二組必須至少有一定的大小)?
您可以對不相等的樣本量進行樣本量計算。
例如,您可以確定 n 的比例(例如可能與人口的比例)。
然後可以進行功率計算(至少您可以模擬以獲得任何特定情況下的功率,無論您是否能夠進行代數)。
問題在於,與相同樣本量的相同觀察總數相比,它在發現差異方面效率相對較低。
想像一下,你有一個總樣本,總體方差相等且樣本方差接近相等,並且您的選擇是在 50-50 拆分和 90-10 拆分之間(對比)。
兩樣本 t 統計量為:
樣本量的影響在於術語.
如果你有 50-50 的分割,那就像有一個小 40% 的標準偏差;在給定的您可以通過均勻拆分獲得更小的效果。
如果組合樣本量不是一個有效的約束條件,那麼這種計算可能毫無意義。在每個觀察都帶有相同邊際成本的情況下,這很重要,這並不總是相關的。