的二樣本 CDF 是多少D+D+D^{+}和D−D−D^{-}來自單方面的 Kolmogorov-Smirnov 測試?
我試圖了解如何獲得- 單邊Kolmogorov- Smirnov檢驗的值,並且正在努力尋找 CDF和在兩個樣本的情況下。以下在一些地方被引用為 CDF在一個樣本的情況下:
此外,whuber sez 這個單樣本 CDF 的公式略有不同(我用為了在他的引用中與我的符號保持一致):
使用概率積分變換,Donald Knuth推導出它們在 p 上的(公共)分佈。57 和TAoCP第 2 卷的練習 17。我引用:
這將適用於單樣本情況下的片面假設,例如:H, 在哪裡是經驗 CDF, 和是一些 CDF。
我認為_在這種情況下是值在一個人的樣本中,那是最大的整數. (那正確嗎?)
但是 CDF 有什麼用(要么) 當一個有兩個樣本時?例如,當 H對於經驗 CDF和? 如何獲得?
好的,我將對此進行嘗試。歡迎提出批判性見解。
在第 192 頁 Gibbons 和 Chakraborti (1992),引用 Hodges,1958,從一個小樣本(確切的?)CDF 開始進行雙邊測試(我正在交換他們的 m,n 和 d 符號為 n1,n2 和 x , 分別):
P(Dn1,n2≥x)=1−P(Dn1,n2≤x)=1−A(n1,n2)(n1+n2n1)
在哪裡 A(n1,n2) 是通過枚舉路徑產生的(在 n1 和 n2 ) 從原點到點 (n1,n2) 通過一個圖——代入 Sm(x) 為了 Fn1(x) — x軸和y軸的值是 n1F1(x) 和 n2F2(x) . 路徑必須進一步遵守留在邊界內的約束(其中 x 是 Kolmogorov-Smirnov 檢驗統計量的值):
n2n1±(n1+n2)x(n1+n2n1)
下面是他們的圖像圖 3.2提供了一個示例 A(3,4) ,有 12 條這樣的路徑:
Gibbons 和 Chakaborti 繼續說,片面的 p -值是使用相同的圖形方法獲得的,但只有下限 $ D^{+}{n{1},n_{2}} ,並且只有上 D^{-}{n{1},n_{2}} $ .
這些小樣本方法需要路徑枚舉算法和/或遞歸關係,這無疑使漸近計算成為可取的。Gibbons 和 Chakraborti 也注意到限制性 CDF 為 n1 和 n2 接近無窮大,的 Dn1,n2 :
limn1,n2→∞P(√n1n2n1+n2Dn1,n2≤x)=1−2∞∑i=1(−1)i−1e−2i2x2
他們給出了限制 CDF $ D^{+}{n{1},n_{2}} (要么 D^{-}{n{1},n_{2}} $ ) 作為:
$$ \lim_{n_{1},n_{2}\to \infty}\text{P}\left(\sqrt{\frac{n_{1}n_{2}}{n_{1}+n_{2}}}D^{+}{n{1},n_{2}} \le x\right) = 1 - e^{-2x^{2}} $$
因為 D+ 和 D− 是嚴格非負的,CDF 只能取非零值 [0,∞) :
(要么 D− )" />
參考文獻
Gibbons, JD 和 Chakraborti, S. (1992)。非參數統計推斷。Marcel Decker, Inc.,第 3 版,修訂和擴展版。 霍奇斯,JL(1958 年)。Smirnov 二樣本檢驗的顯著性概率。Arkiv for matematik。3(5):469-486。