Density-Function

如何使用前 k 個(經驗)矩擬合近似 PDF(即:密度估計)?

  • October 3, 2015

我有一種情況,我可以估計(第一個)數據集的矩,並想用它來產生密度函數的估計。

我已經遇到過Pearson 分佈,但意識到它僅依賴於前 4 個時刻(對可能的時刻組合有一些限制)。

我也明白,當不使用更多假設時,任何有限的矩集都不足以“確定”特定的分佈。但是,我仍然想要更通用的分佈類別(除了 Pearson 分佈系列)。查看其他問題,我找不到這樣的分佈(請參閱:herehereherehereherehere)。

是否有一些(“簡單”)廣義分佈族可以為任何一組定義時刻?(可能是一組可以採用標準正態分佈的變換並對其進行變換,直到它與所有一組時刻)

(我不在乎我們是否假設另一個時刻是否為0)

謝謝。

ps:我會很高興有一個擴展的例子。最好帶有 R 代碼示例。

方法一:高階皮爾遜系統

按照慣例,Pearson 系統被視為解決方案系列到微分方程:

其中四個 Pearson 參數可以用總體的前四個矩來表示。

而不是將皮爾遜系統基於二次,可以考慮使用高階多項式作為基石。因此,例如,可以考慮基於三次多項式的 Pearson 式系統。這將是解決方案系列到微分方程:

這產生了解決方案:

在此處輸入圖像描述

前段時間我為了好玩而解決了這個問題(與 OP 有相同的思路):推導和解決方案在我們書的第 5 章中給出;如果有興趣,可以在這裡免費下載:

http://www.mathstatica.com/book/bookcontents.html

請注意,雖然二階(二次)皮爾遜族可以用前 4 個矩表示,但三階(三次)皮爾遜式族需要前 6 個矩。

方法 2:Gram-Charlier 展開式

Gram-Charlier 展開式也在同一章第 5 章(參見第 5.4 節)中進行了討論……並且還允許構建一個擬合密度,基於任意大時刻。正如 OP 所建議的那樣,Gram-Charlier 展開將擬合的 pdf 表示為標準正態 pdf 的一系列導數的函數,稱為 Hermite 多項式。Gram-Charlier 係數被求解為種群矩的函數……並且擴展越大,所需的矩越多。您可能還希望查看相關的御劍擴展。

人口時刻或樣本時刻?

對於 Pearson 式系統:如果總體的矩是已知的,那麼使用更高的矩應該明確地產生更好的擬合。然而,如果觀察到的數據是從總體中抽取的隨機樣本,則需要權衡:高階多項式意味著需要高階矩,而後者的估計可能不可靠(具有高方差),除非樣本量“大”。換句話說,給定樣本數據,使用更高的矩進行擬合可能會變得“不穩定”並產生較差的結果。Gram-Charlier 展開式也是如此:添加一個額外的項實際上會產生更差的擬合,因此需要注意。

引用自:https://stats.stackexchange.com/questions/175323

comments powered by Disqus