Distributions
從核密度估計模擬(經驗 PDF)
我有一個觀察向量
X
,該向量N=900
最好由全局帶寬內核密度估計器建模(參數模型,包括動態混合模型,結果不適合):現在,我想從這個 KDE 中進行模擬。我知道這可以通過引導來實現。
在 R 中,這一切都歸結為這行簡單的代碼(幾乎是偽代碼):
x.sim = mean(X) + { sample(X, replace = TRUE) - mean(X) + bw * rnorm(N) } / sqrt{ 1 + bw^2 * varkern/var(X) }
其中實現了帶有方差校正的平滑引導,並且varkern
是所選內核函數的方差(例如,1 表示高斯內核)。我們重複 500 次得到的結果如下:
它有效,但我很難理解洗牌觀察(帶有一些額外的噪音)與從概率分佈模擬是一樣的嗎?(這裡的分佈是 KDE),就像標準的蒙特卡洛一樣。此外,引導是從 KDE 模擬的唯一方法嗎?
**編輯:**有關具有方差校正的平滑引導的更多信息,請參閱下面的答案。
這是一個從任意混合物中採樣的算法:
- 選擇一個混合組件均勻隨機。
- 樣品來自.
應該清楚的是,這會產生一個精確的樣本。
高斯核密度估計是一種混合. 所以你可以取一個大小的樣本通過挑選一堆s 並添加均值和方差為零的正態噪聲給它。
您的代碼片段正在選擇一堆s,但後來它做了一些稍微不同的事情:
- 改變到
- 添加具有方差的零均值正態噪聲, 調和平均值和.
我們可以看到根據這個過程的樣本的期望值是
自從. 不過,我不認為抽樣分佈是相同的。