Distributions

從核密度估計模擬(經驗 PDF)

  • June 4, 2015

我有一個觀察向量X,該向量N=900最好由全局帶寬內核密度估計器建模(參數模型,包括動態混合模型,結果不適合):

在此處輸入圖像描述

現在,我想從這個 KDE 中進行模擬。我知道這可以通過引導來實現。

在 R 中,這一切都歸結為這行簡單的代碼(幾乎是偽代碼):x.sim = mean(X) + { sample(X, replace = TRUE) - mean(X) + bw * rnorm(N) } / sqrt{ 1 + bw^2 * varkern/var(X) }其中實現了帶有方差校正的平滑引導,並且varkern是所選內核函數的方差(例如,1 表示高斯內核)。

我們重複 500 次得到的結果如下:

在此處輸入圖像描述

它有效,但我很難理解洗牌觀察(帶有一些額外的噪音)與從概率分佈模擬是一樣的嗎?(這裡的分佈是 KDE),就像標準的蒙特卡洛一樣。此外,引導是從 KDE 模擬的唯一方法嗎?

**編輯:**有關具有方差校正的平滑引導的更多信息,請參閱下面的答案。

這是一個從任意混合物中採樣的算法:

  • 選擇一個混合組件均勻隨機。
  • 樣品來自.

應該清楚的是,這會產生一個精確的樣本。

高斯核密度估計是一種混合. 所以你可以取一個大小的樣本通過挑選一堆s 並添加均值和方差為零的正態噪聲給它。

您的代碼片段正在選擇一堆s,但後來它做了一些稍微不同的事情:

  • 改變到
  • 添加具有方差的零均值正態噪聲, 調和平均值和.

我們可以看到根據這個過程的樣本的期望值是

自從. 不過,我不認為抽樣分佈是相同的。

引用自:https://stats.stackexchange.com/questions/155488

comments powered by Disqus