Density-Function
核密度估計所需的最小數據點數是多少?
核密度估計需要多少數據點才能被認為是非誤導性/可接受/充分的?
是否有一些基於數據分散程度的規則?
例如,如果四分位間距“足夠小”,與四分位間距“更大”相比,您需要的分數是否更少?
或者,您可能遇到過特定大小的數據集“足夠”或“不夠”的情況,並且可以分享 KDE 在該特定情況下工作/不工作的原因?
評估準確性的標準:如果您有來自同一總體的兩個樣本,並且您對每個樣本進行 KDE,那麼得到的兩個密度非常相似。
在“統計和數據分析的密度估計,Bernard. W. Silverman, CRC ,1986”一書中,有一章“給定精度所需的樣本量”,其中給出了所需的樣本量,以使相對 MSE 為零而不是更大那0.1。我附上那裡的表格。