Hypothesis-Testing

基於排列的 p 值所需的排列數

  • December 18, 2013

如果我需要計算基於排列的 $ p $ -具有顯著性水平的值 $ \alpha $ ,我需要多少排列?

來自文章“研究分類器性能的排列測試”,第 5 頁:

在實踐中,上限 $ 1/(2\sqrt{k}) $ 通常用於確定達到所需測試精度所需的樣本數量。

… 在哪裡 $ k $ 是排列的數量。

如何從此公式計算所需的排列數?

我承認,這一段可能令人困惑。

在執行置換檢驗時,您確實估計了一個 p 值。問題是,p 值的估計本身有一個誤差,計算為. 如果誤差太大,則 p 值不可靠。

那麼需要多少個排列 k 才能得到一個可靠的估計呢?

首先定義您的最大允許誤差,即精度。讓它成為. 然後估計的 p 值應在區間內(因為 p近似正態分佈

使用上限

該論文的引用段落建議使用作為誤差的上限估計,而不是. 這對應於 p=0.5 的未知 p 值(對於固定 k,在所有 ps 中誤差最大)。

所以:你想知道k在哪裡.

<=>

但由於引用的公式代表一個上限,因此這種方法非常粗糙。

在顯著性水平上使用誤差

另一種方法使用所需的顯著性水平作為 p 來計算所需的精度。這是正確的,因為如果我們接近決策閾值(即顯著性水平),估計 p 的誤差更重要。

在這種情況下,人們想知道 k 在哪裡.

<=>

請注意,如果真正的未知 p 值明顯大於,那麼誤差實際上更大,所以 p in不再持有。

擴展置信區間

這種方法對應於置信區間的中心正好在決策閾值處。為了強制估計 p 的置信區間的上限低於決策閾值(更正確),需要…

<=>

其中 l 對應(再次參見圖形

| l | confidence interval |
| 1 | ~68 % |
| 2 | ~95 % |
| 3 | ~99 % |

示例: 假設所需的精度 P 為 0.005。

然後使用粗略的上限得到.

使用 P 在並要求得到一個 95% 的置信區間.

對於 P = 0.01 在95% 的置信區間得到 k>=396。

最後:我強烈建議深入研究蒙特卡羅模擬。維基百科提供了一個開始。

引用自:https://stats.stackexchange.com/questions/80025

comments powered by Disqus