Kolmogorov-Smirnov-Test
為什麼不能將 Kolmogorov-Smirnov 檢驗推廣到 2 維或更多維?
這個問題說明了一切。我已經讀過不能將 KS 推廣到等於或大於等於 2 的維度,並且像Numerical Recipes中這樣的著名實現是完全錯誤的。你能解釋一下為什麼會這樣嗎?
我認為引用相關段落的相關部分是合法的:
- KS測試不能應用於二維或更多維度。天文學家通常擁有點分佈在平面或更高維度上的數據集,而不是沿線分佈。天文學文獻中的幾篇論文聲稱提出了二維 KS 測試,其中一篇在著名的數字食譜卷中被轉載。但是,不能在二維或更高維度上應用基於 EDF 的測試(包括 KS、AD 和相關測試),因為沒有唯一的方法來對點進行排序,以便可以計算明確定義的 EDF 之間的距離。可以基於某種排序過程構建統計量,然後計算兩個數據集(或一個數據集和一條曲線)之間的上確界距離。但所得統計量的臨界值並非無分佈。
如前所述,這似乎太強大了。
1)二元分佈函數,即是一張來自的地圖到. 也就是說,該函數採用介於 0 和 1 之間的單變量實數值。這些值 - 作為概率 - 肯定已經“有序”了 - 而這個(函數的值)是我們需要對基於 ECDF 的測試進行比較的東西. 同樣,ecdf,在雙變量情況下定義得很好。
我認為沒有必要嘗試將其轉換為文本所暗示的單變量組合變量的某些函數。您只需計算和在每個所需的組合併計算差異。
2)但是,關於它是否免費分發的問題,他們有一點:
a) 顯然,這樣的測試統計量不會因邊距轉換的變化而改變,也就是說,如果構建為雙變量獨立制服的測試,,那麼它作為獨立的測試同樣有效在哪裡. 從這個意義上說,它是無分配的(我們可以說“無保證金”)。
b) 然而,在更廣泛的意義上,有一個更普遍的基本觀點,即 KS 統計數據的幼稚版本(例如我剛剛描述的)不是更普遍地免費分發;我們不能簡單地改造任意.
在我回答的早期版本中,我說:
沒有困難,沒有問題
那是錯誤的。正如剛才提到的,如果不僅僅是雙變量獨立制服的邊距發生變化,那麼確實存在問題。然而,在許多論文中以多種方式考慮了這些困難,這些論文產生了不存在該問題的 Kolmogorov-Smirnov 統計的雙變量/多變量版本。
一旦時間允許,我可能會回來添加其中一些參考資料並討論它們如何工作。