Chi-Squared-Test

基於數據的 bin 邊界對卡方擬合優度測試的影響?

  • October 4, 2013

撇開在這種情況下卡方的低功效這一明顯問題不談,想像一下通過對數據進行分箱,對具有未指定參數的某些密度進行卡方優度檢驗。

具體而言,假設一個指數分佈,均值未知,樣本量為 100。

為了在每個 bin 中獲得合理數量的預期觀測值,需要對數據進行一些考慮(例如,如果我們選擇將 6 個 bin 放在平均值以下,4 個放在平均值之上,那仍將使用基於數據的 bin 邊界) .

但是這種基於查看數據的箱的使用可能會影響測試統計量在零值下的分佈。

我已經看到很多關於以下事實的討論 -如果參數是通過分箱數據的最大似然估計的 - 每個估計參數會損失 1 df(這個問題可以追溯到 Fisher vs Karl Pearson) - 但我不記得了閱讀有關根據數據自行查找 bin 邊界的任何內容。(如果您從未合併的數據中估計它們,那麼使用bins 檢驗統計量的分佈介於 a和一個.)

這種基於數據的分類選擇是否會對顯著性水平或功效產生實質性影響?是否有一些方法比其他方法更重要?如果有很大的影響,它是否會在大樣本中消失?

如果它確實有實質性的影響,這似乎會使在參數未知的情況下使用卡方檢驗在許多情況下幾乎無用(儘管仍然在相當多的文本中被提倡),除非你有一個很好的-參數的先驗估計。

討論問題或指向參考文獻(最好提及他們的結論)將是有用的。


編輯,除了主要問題之外:

我突然想到,對於指數 * 的特定情況(以及統一想到它)有潛在的解決方案,但我仍然對影響選擇 bin 邊界的更普遍問題感興趣。

  • 例如,對於指數,可以使用最小的觀察值(比如說它等於) 以獲得一個非常粗略的關於放置垃圾箱的位置的想法(因為最小的觀察值與平均值呈指數關係),然後測試剩餘的差異() 為指數。當然,這可能會產生非常差的估計,因此糟糕的 bin 選擇,儘管我想人們可能會遞歸地使用該論點,以便從最低的兩個或三個觀察值中選擇合理的 bin,然後測試剩余觀察值的差異高於那些最小順序統計中最大的指數)

卡方擬合優度檢驗的基本結果可以分層理解

0 級。經典 Pearson 卡方檢驗統計量,用於針對固定概率向量測試多項式樣本是

在哪裡表示結果的數量尺寸樣本中的第 th 個細胞. 這可以有效地視為向量的平方範數在哪裡其中,根據多元中心極限定理,分佈收斂為

由此我們看到自從是秩冪等的. 1 級。在層次結構的下一層,我們考慮具有多項樣本的複合假設。由於確切在原假設下,感興趣的是未知的,我們必須對其進行估計。如果原假設是複合的並且由維數的線性子空間組成,然後是最大似然估計(或其他有效估計)可以用作“插件”估計器。那麼,統計

在原假設下。 2 級。考慮一個參數模型的擬合優度測試的情況,其中細胞是固定的並且是預先知道的:例如,我們有一個來自指數分佈的樣本,其速率為並由此我們通過合併產生一個多項式樣本如果我們僅使用觀察到的頻率對 bin 概率本身進行有效估計(例如 MLE),則上述結果仍然成立。

如果分佈的參數數量為(例如,在指數情況下),然後

這裡哪裡可以看作是與給定感興趣分佈相對應的固定已知小區的小區概率的 MLE。 3 級。可是等等!如果我們有樣品, 為什麼我們不應該估計首先有效,然後對我們固定的已知單元格使用卡方統計量?好吧,我們可以,但通常我們不再得到相應卡方統計量的卡方分佈。事實上,Chernoff 和 Lehmann (1954) 表明,使用 MLE 估計參數,然後將它們重新插入以估計單元概率,通常會導致非卡方分佈。在合適的規律性條件下,分佈(隨機地)在和一個隨機變量,其分佈取決於參數。

不直觀地,這意味著是.

我們甚至還沒有談到隨機單元邊界,而且我們已經處於一個緊張的境地!有兩種方法:一種是退回到第 2 級,或者至少使用底層參數的有效估計器(如 MLE). 第二種方法是嘗試撤消以恢復卡方分佈的方式。

有幾種方法可以走後一條路線。它們基本上相當於預乘由“右”矩陣. 那麼,二次型

在哪裡是細胞的數量。 例如Rao-Robson-Nikulin 統計量Dzhaparidze-Nikulin 統計量

4 級。隨機細胞。在隨機細胞的情況下,在一定的規律性條件下,如果我們採取修改 Pearson 卡方統計量的路線,我們最終會遇到與 Level 3 相同的情況。特別是位置規模的家庭表現得非常好。一種常見的方法是採取我們的每個細胞都有概率,名義上。所以,我們的隨機單元格是形式的間隔在哪裡. 該結果已進一步擴展到隨機單元數隨樣本量增長的情況。

參考

  1. A W. van der Vaart (1998),漸近統計,劍橋大學出版社。第 17 章卡方檢驗
  2. H. Chernoff 和 EL Lehmann (1954),最大似然估計的使用測試擬合優度安。數學。統計學家。, 卷。25,沒有。3, 579–586。
  3. FC Drost (1989),當類別數趨於無窮時,位置尺度模型的廣義卡方擬合優度檢驗Ann。統計,卷。17,沒有。3, 1285–1300。
  4. MS Nikulin, MS (1973),帶位移和尺度參數的連續分佈的卡方檢驗概率論及其應用,卷。19,沒有。3, 559–568。
  5. KO Dzaparidze 和 MS Nikulin (1973),關於 Pearson 標準統計的修改,概率論及其應用,第一卷。19,沒有。4, 851–853。
  6. KC Rao 和 DS Robson (1974),指數族內擬合優度檢驗的卡方統計量Comm。統計學家。,第 3 卷,沒有。12, 1139–1153。
  7. N. Balakrishnan、V. Voinov 和 MS Nikulin (2013),應用卡方擬合優度檢驗,學術出版社。

引用自:https://stats.stackexchange.com/questions/71871

comments powered by Disqus