Self-Study

的二樣本 CDF 是多少D+D+D^{+}和D−D−D^{-}來自單方面的 Kolmogorov-Smirnov 測試?

  • July 13, 2014

我試圖了解如何獲得- 單邊Kolmogorov- Smirnov檢驗的值,並且正在努力尋找 CDF和在兩個樣本的情況下。以下在一些地方被引用為 CDF在一個樣本的情況下:

此外,whuber sez 這個單樣本 CDF 的公式略有不同(我用為了在他的引用中與我的符號保持一致):

使用概率積分變換,Donald Knuth推導出它們在 p 上的(公共)分佈。57 和TAoCP第 2 卷的練習 17。我引用:

這將適用於單樣本情況下的片面假設,例如:H, 在哪裡是經驗 CDF, 和是一些 CDF。

認為_在這種情況下是值在一個人的樣本中,那是最大的整數. (那正確嗎?)

但是 CDF 有什麼用(要么) 當一個有兩個樣本時?例如,當 H對於經驗 CDF和? 如何獲得?

好的,我將對此進行嘗試。歡迎提出批判性見解。

在第 192 頁 Gibbons 和 Chakraborti (1992),引用 Hodges,1958,從一個小樣本(確切的?)CDF 開始進行雙邊測試(我正在交換他們的 m,nd 符號為 n1,n2x , 分別):

P(Dn1,n2x)=1P(Dn1,n2x)=1A(n1,n2)(n1+n2n1)

在哪裡 A(n1,n2) 是通過枚舉路徑產生的(在 n1n2 ) 從原點到點 (n1,n2) 通過一個圖——代入 Sm(x) 為了 Fn1(x)x軸和y軸的值是 n1F1(x)n2F2(x) . 路徑必須進一步遵守留在邊界內的約束(其中 x 是 Kolmogorov-Smirnov 檢驗統計量的值):

n2n1±(n1+n2)x(n1+n2n1)

下面是他們的圖像圖 3.2提供了一個示例 A(3,4) ,有 12 條這樣的路徑:

圖 3.2 來自 Gibbons 和 Chakraborti (1992) 非參數統計推斷的第 193 頁。

Gibbons 和 Chakaborti 繼續說,片面的 p -值是使用相同的圖形方法獲得的,但只有下限 $ D^{+}{n{1},n_{2}} D^{-}{n{1},n_{2}} $ .

這些小樣本方法需要路徑枚舉算法和/或遞歸關係,這無疑使漸近計算成為可取的。Gibbons 和 Chakraborti 也注意到限制性 CDF 為 n1n2 接近無窮大,的 Dn1,n2 :

limn1,n2P(n1n2n1+n2Dn1,n2x)=12i=1(1)i1e2i2x2

他們給出了限制 CDF $ D^{+}{n{1},n_{2}} D^{-}{n{1},n_{2}} $ ) 作為:

$$ \lim_{n_{1},n_{2}\to \infty}\text{P}\left(\sqrt{\frac{n_{1}n_{2}}{n_{1}+n_{2}}}D^{+}{n{1},n_{2}} \le x\right) = 1 - e^{-2x^{2}} $$

因為 D+D 是嚴格非負的,CDF 只能取非零值 [0,) :

<span class= 的 CDF(要么 D )" />

參考文獻

Gibbons, JD 和 Chakraborti, S. (1992)。非參數統計推斷。Marcel Decker, Inc.,第 3 版,修訂和擴展版。 霍奇斯,JL(1958 年)。Smirnov 二樣本檢驗的顯著性概率。Arkiv for matematik。3(5):469-486。

引用自:https://stats.stackexchange.com/questions/107805