的二樣本 CDF 是多少D+D+D^{+}和D−D−D^{-}來自單方面的 Kolmogorov-Smirnov 測試？

July 13, 2014

我試圖了解如何獲得- 單邊Kolmogorov- Smirnov檢驗的值，並且正在努力尋找 CDF和在兩個樣本的情況下。以下在一些地方被引用為 CDF在一個樣本的情況下：

此外，whuber sez 這個單樣本 CDF 的公式略有不同（我用為了在他的引用中與我的符號保持一致）：

使用概率積分變換，Donald Knuth推導出它們在 p 上的（公共）分佈。57 和TAoCP第 2 卷的練習 17。我引用：

這將適用於單樣本情況下的片面假設，例如：H，在哪裡是經驗 CDF，和是一些 CDF。

我認為_在這種情況下是值在一個人的樣本中，那是最大的整數. （那正確嗎？）

但是 CDF 有什麼用（要么) 當一個有兩個樣本時？例如，當 H對於經驗 CDF和? 如何獲得?

好的，我將對此進行嘗試。歡迎提出批判性見解。

在第 192 頁 Gibbons 和 Chakraborti (1992)，引用 Hodges，1958，從一個小樣本（確切的？）CDF 開始進行雙邊測試（我正在交換他們的 $ m,n $ 和 $ d $ 符號為 $ n_{1},n_{2} $ 和 $ x $ ，分別）：

$$ \text{P}{\left(D_{n_{1},n_{2}}\ge x\right)} = 1 - \text{P}\left(D_{n_{1},n_{2}} \leq x\right)=1-\frac{A\left(n_{1},n_{2}\right)}{\binom{n_{1}+n_{2}}{n_{1}}} $$

在哪裡 $ A\left(n_{1},n_{2}\right) $ 是通過枚舉路徑產生的（在 $ n_{1} $ 和 $ n_{2} $ ) 從原點到點 $ \left(n_{1},n_{2}\right) $ 通過一個圖——代入 $ S_{m}(x) $ 為了 $ F_{n_{1}}(x) $ — x軸和y軸的值是 $ n_{1}F_{1}\left(x\right) $ 和 $ n_{2}F_{2}\left(x\right) $ . 路徑必須進一步遵守留在邊界內的約束（其中 $ x $ 是 Kolmogorov-Smirnov 檢驗統計量的值）：

$$ \frac{n_{2}}{n_{1}} \pm \frac{\left(n_{1}+n_{2}\right)x}{\binom{n_{1}+n_{2}}{n_{1}}} $$

下面是他們的圖像圖 3.2提供了一個示例 $ A(3,4) $ ，有 12 條這樣的路徑：

Gibbons 和 Chakaborti 繼續說，片面的 $ p $ -值是使用相同的圖形方法獲得的，但只有下限 $ D^{+}{n{1},n_{2}} $ ，並且只有上 $ D^{-}{n{1},n_{2}} $ .

這些小樣本方法需要路徑枚舉算法和/或遞歸關係，這無疑使漸近計算成為可取的。Gibbons 和 Chakraborti 也注意到限制性 CDF 為 $ n_{1} $ 和 $ n_{2} $ 接近無窮大，的 $ D_{n_{1},n_{2}} $ :

$$ \lim_{n_{1},n_{2}\to \infty}\text{P}\left(\sqrt{\frac{n_{1}n_{2}}{n_{1}+n_{2}}}D_{n_{1},n_{2}} \le x\right) = 1 - 2\sum_{i=1}^{\infty}{\left(-1\right)^{i-1}e^{-2i^{2}x^{2}}} $$

他們給出了限制 CDF $ D^{+}{n{1},n_{2}} $ （要么 $ D^{-}{n{1},n_{2}} $ ）作為：

$$ \lim_{n_{1},n_{2}\to \infty}\text{P}\left(\sqrt{\frac{n_{1}n_{2}}{n_{1}+n_{2}}}D^{+}{n{1},n_{2}} \le x\right) = 1 - e^{-2x^{2}} $$

因為 $ D^{+} $ 和 $ D^{-} $ 是嚴格非負的，CDF 只能取非零值 $ [0,\infty) $ :

（要么 $ D^{-} $ )" />

參考文獻

Gibbons, JD 和 Chakraborti, S. (1992)。非參數統計推斷。Marcel Decker, Inc.，第 3 版，修訂和擴展版。霍奇斯，JL（1958 年）。Smirnov 二樣本檢驗的顯著性概率。Arkiv for matematik。3（5）：469-486。

引用自：https://stats.stackexchange.com/questions/107805

comments powered by Disqus

的二樣本 CDF 是多少D+D+D^{+}和D−D−D^{-}來自單方面的 Kolmogorov-Smirnov 測試？

相關問答

對於所有類型的分佈，均值的 CDF 是否始終為 0.5？

逆變換採樣 - CDF 不可逆

Kolmogorov Smirnov檢驗的直觀解釋

正態分佈隨機變量的最大值分佈

如果樣本量很大，Kolmogorov-Smirnov-Test 是否過於嚴格？

為什麼兩個隨機變量之和是卷積？