Density-Function

核密度估計所需的最小數據點數是多少?

  • November 19, 2013

核密度估計需要多少數據點才能被認為是非誤導性/可接受/充分的?

是否有一些基於數據分散程度的規則?

例如,如果四分位間距“足夠小”,與四分位間距“更大”相比,您需要的分數是否更少?

或者,您可能遇到過特定大小的數據集“足夠”或“不夠”的情況,並且可以分享 KDE 在該特定情況下工作/不工作的原因?

評估準確性的標準:如果您有來自同一總體的兩個樣本,並且您對每個樣本進行 KDE,那麼得到的兩個密度非常相似。

在“統計和數據分析的密度估計,Bernard. W. Silverman, CRC ,1986”一書中,有一章“給定精度所需的樣本量”,其中給出了所需的樣本量,以使相對 MSE 為零而不是更大那0.1。我附上那裡的表格。在此處輸入圖像描述

引用自:https://stats.stackexchange.com/questions/76948

comments powered by Disqus