Self-Study

的二樣本 CDF 是多少D+D+D^{+}和D−D−D^{-}來自單方面的 Kolmogorov-Smirnov 測試?

  • July 13, 2014

我試圖了解如何獲得- 單邊Kolmogorov- Smirnov檢驗的值,並且正在努力尋找 CDF和在兩個樣本的情況下。以下在一些地方被引用為 CDF在一個樣本的情況下:

此外,whuber sez 這個單樣本 CDF 的公式略有不同(我用為了在他的引用中與我的符號保持一致):

使用概率積分變換,Donald Knuth推導出它們在 p 上的(公共)分佈。57 和TAoCP第 2 卷的練習 17。我引用:

這將適用於單樣本情況下的片面假設,例如:H, 在哪裡是經驗 CDF, 和是一些 CDF。

認為_在這種情況下是值在一個人的樣本中,那是最大的整數. (那正確嗎?)

但是 CDF 有什麼用(要么) 當一個有兩個樣本時?例如,當 H對於經驗 CDF和? 如何獲得?

好的,我將對此進行嘗試。歡迎提出批判性見解。

在第 192 頁 Gibbons 和 Chakraborti (1992),引用 Hodges,1958,從一個小樣本(確切的?)CDF 開始進行雙邊測試(我正在交換他們的 $ m,n $ 和 $ d $ 符號為 $ n_{1},n_{2} $ 和 $ x $ , 分別):

$$ \text{P}{\left(D_{n_{1},n_{2}}\ge x\right)} = 1 - \text{P}\left(D_{n_{1},n_{2}} \leq x\right)=1-\frac{A\left(n_{1},n_{2}\right)}{\binom{n_{1}+n_{2}}{n_{1}}} $$

在哪裡 $ A\left(n_{1},n_{2}\right) $ 是通過枚舉路徑產生的(在 $ n_{1} $ 和 $ n_{2} $ ) 從原點到點 $ \left(n_{1},n_{2}\right) $ 通過一個圖——代入 $ S_{m}(x) $ 為了 $ F_{n_{1}}(x) $ — x軸和y軸的值是 $ n_{1}F_{1}\left(x\right) $ 和 $ n_{2}F_{2}\left(x\right) $ . 路徑必須進一步遵守留在邊界內的約束(其中 $ x $ 是 Kolmogorov-Smirnov 檢驗統計量的值):

$$ \frac{n_{2}}{n_{1}} \pm \frac{\left(n_{1}+n_{2}\right)x}{\binom{n_{1}+n_{2}}{n_{1}}} $$

下面是他們的圖像圖 3.2提供了一個示例 $ A(3,4) $ ,有 12 條這樣的路徑:

圖 3.2 來自 Gibbons 和 Chakraborti (1992) 非參數統計推斷的第 193 頁。

Gibbons 和 Chakaborti 繼續說,片面的 $ p $ -值是使用相同的圖形方法獲得的,但只有下限 $ D^{+}{n{1},n_{2}} $ ,並且只有上 $ D^{-}{n{1},n_{2}} $ .

這些小樣本方法需要路徑枚舉算法和/或遞歸關係,這無疑使漸近計算成為可取的。Gibbons 和 Chakraborti 也注意到限制性 CDF 為 $ n_{1} $ 和 $ n_{2} $ 接近無窮大,的 $ D_{n_{1},n_{2}} $ :

$$ \lim_{n_{1},n_{2}\to \infty}\text{P}\left(\sqrt{\frac{n_{1}n_{2}}{n_{1}+n_{2}}}D_{n_{1},n_{2}} \le x\right) = 1 - 2\sum_{i=1}^{\infty}{\left(-1\right)^{i-1}e^{-2i^{2}x^{2}}} $$

他們給出了限制 CDF $ D^{+}{n{1},n_{2}} $ (要么 $ D^{-}{n{1},n_{2}} $ ) 作為:

$$ \lim_{n_{1},n_{2}\to \infty}\text{P}\left(\sqrt{\frac{n_{1}n_{2}}{n_{1}+n_{2}}}D^{+}{n{1},n_{2}} \le x\right) = 1 - e^{-2x^{2}} $$

因為 $ D^{+} $ 和 $ D^{-} $ 是嚴格非負的,CDF 只能取非零值 $ [0,\infty) $ :

<span class= 的 CDF(要么 $ D^{-} $ )" />

參考文獻

Gibbons, JD 和 Chakraborti, S. (1992)。非參數統計推斷。Marcel Decker, Inc.,第 3 版,修訂和擴展版。 霍奇斯,JL(1958 年)。Smirnov 二樣本檢驗的顯著性概率。Arkiv for matematik。3(5):469-486。

引用自:https://stats.stackexchange.com/questions/107805

comments powered by Disqus