獨立對數正態隨機變量的總和出現對數正態?
我試圖理解為什麼隨著觀察次數的增加,兩個(或更多)對數正態隨機變量的總和接近對數正態分佈。我在網上查了一下,沒有找到任何與此相關的結果。
顯然,如果和是獨立的對數正態變量,然後通過指數和高斯隨機變量的屬性,也是對數正態的。但是,沒有理由建議也是對數正態的。
然而
如果您生成兩個獨立的對數正態隨機變量和, 然後讓,並重複這個過程很多次,分佈出現對數正態。隨著觀察次數的增加,它甚至似乎更接近對數正態分佈。
例如:生成100萬對後,Z的自然對數分佈如下直方圖所示。這很明顯類似於正態分佈,表明確實是對數正態的。
是否有人對可能有助於理解這一點的文本有任何見解或參考?
這種對數正態和的近似對數正態性是眾所周知的經驗法則。它在許多論文中以及在現場的許多帖子中都提到過。
通過匹配前兩個矩的對數正態總和的對數正態近似有時稱為 Fenton-Wilkinson 近似。
您可能會發現 Dufresne 的這份文檔很有用(可在此處或此處獲得)。
我過去有時也會向人們指出米切爾的論文
Mitchell, RL (1968),
“對數正態分佈的持久性”。
J. 美國光學學會。58:1267-1272。
但這現在已包含在 Dufresne 的參考資料中。
但是,雖然它適用於相當廣泛的不太偏斜的情況,但它一般不適用,即使對於 iid 對數正態,也不適用 $ n $ 變得相當大。
這是 1000 個模擬值的直方圖,每個值都是5 萬個獨立同分佈對數正態之和的對數:
如您所見…日誌非常偏斜,因此總和不是很接近對數正態。
事實上,這個例子也可以算作一個有用的例子,讓人們認為(由於中心極限定理)一些 $ n $ 在數百或數千將給出非常接近正常平均值; 這個偏斜以至於它的對數相當偏斜,但是中心極限定理仍然適用於此;一個 $ n $ 在它開始看起來接近對稱之前,需要數百萬*。
*我沒有試圖弄清楚有多少,但是由於總和(相當於平均值)的偏態行為方式,幾百萬顯然是不夠的
由於註釋中要求提供更多詳細信息,因此您可以使用以下代碼獲得與示例類似的結果,該代碼生成 50,000 個具有比例參數的對數正態隨機變量之和的 1000 次重複 $ \mu=0 $ 和形狀參數 $ \sigma=4 $ :
res <- replicate(1000,sum(rlnorm(50000,0,4))) hist(log(res),n=100)
(我已經嘗試過 $ n=10^6 $ . 它的日誌仍然嚴重向右傾斜)