從不適當的混合物中精確取樣
假設我想從連續分佈中採樣. 如果我有一個表達在表格中
在哪裡, 和是可以很容易地從中採樣的分佈,那麼我可以很容易地從中生成樣本經過:
- 採樣標籤有概率
- 採樣
如果偶爾是陰性的?我懷疑我已經在某處看到過這種情況——可能是在一本書中,可能是針對 Kolmogorov 發行版的——所以我很樂意接受參考作為答案。
如果一個具體的玩具示例有幫助,假設我想從
那我就拿出於技術上的原因,這在宏觀上應該不太重要。 原則上,我可以將其擴展為以下總和:
這然後,總和內的項可以作為 Gamma 隨機變量獨立採樣。我的問題顯然是係數“偶爾”為負。
編輯1:我澄清我正在尋求從,而不是計算期望值. 對於那些感興趣的人,評論中提到了一些這樣做的程序。
編輯 2 :我在Devroye 的 ‘Non-Uniform Random Variate Generation’中找到了包含解決此問題的特定方法的參考資料。該算法來自Bignami 和 de Matteis 的“A Note on Sampling from Combinations of Distributions”。該方法有效地通過總和的正項從上面限制密度,然後使用基於此包絡的拒絕採樣。這對應於@Xi’an的答案中描述的方法。
我對這個問題感到困惑,但從未提出令人滿意的解決方案。
一個可能使用的屬性是,如果密度寫
在哪裡是一個密度,使得, 模擬自並以概率拒絕這些模擬提供模擬. 在目前的情況下,是正權分量的歸一化版本
和是餘數
這確實在 Devroye 的模擬聖經,非均勻隨機變量生成,第 II.7.4 節中找到,但遵循簡單的接受 - 拒絕推理。 這種方法的第一個計算缺點是,儘管首先從選定的組件進行模擬, 兩者的總和和必須為拒絕步驟計算。如果總和是無限的,沒有封閉形式的版本,這使得接受-拒絕方法無法實現。
第二個困難是,因為兩個權重之和的順序相同
拒絕率沒有上限。實際上***,如果與的不是絕對收斂的,接受概率為零!***在這種情況下無法實施該方法。 在混合表示的情況下,如果可以寫成
可以先選擇組件,然後再選擇應用於該組件的方法。但這可能很難實現,識別對適合從可能無限的總和不一定可行。 我認為更有效的解決方案可能來自系列表示本身。Devroye,非均勻隨機變量生成,第 IV.5 節,包含大量系列方法。例如,以下算法用於目標的替代系列表示
當。。。的時候的收斂到零和是密度: 最近在對 MCMC 的有偏估計量進行去偏的背景下考慮了這個問題,例如在*Glynn-Rhee 方法*中。還有俄羅斯輪盤賭估計器(與伯努利工廠問題有關)。以及無偏見的 MCMC 方法論。但是符號問題無法逃脫……這使得它在估計密度時具有挑戰性,如在偽邊際方法中。
經過進一步思考,我的結論是,沒有通用的方法可以從這個系列中產生一個實際的模擬[而不是 混合,結果證明是用詞不當],而不是對系列的元素施加進一步的 > 結構,就像在上述算法來自Devroye 的聖經。事實上,由於大多數(?)密度允許上述類型的系列擴展,否則這將意味著存在一種通用模擬機……