Estimation

我可以從樣本均值和中位數中獲取對數正態分佈的參數嗎?

  • September 28, 2015

我有從對數正態分佈中抽取的樣本的平均值和中值。請注意,這不是變量對數的均值和中值,儘管我當然可以計算均值和中值的對數。從這些信息中是否存在 μ 和 σ 的封閉形式解決方案?如果只有一個數字解決方案,你能告訴我如何找到它,最好是用 R 嗎?

我注意到這個問題已經回答了從樣本均值和样本方差推導 μ 和 σ,這裡: 如何從樣本均值和样本方差估計對數正態分佈的參數 但是,我沒有樣本方差,只有均值和中位數。

如果沒有封閉形式或直接的數值解決方案,我想知道使用樣本均值和中值的對數,或者它們的某種變換,是否可以為大樣本(數億)。

這取決於您所說的“獲取”是什麼意思。通常,您無法從樣本信息中獲取總體數量。但是,您通常可以獲得估算值,儘管在這種情況下估算值可能不是很好。

如果你有它們,你可以很容易地從總體平均值和中位數計算參數;如果是人口中位數和是人口平均數嗎和.

您可以類似地嘗試在某種人口數量估計器中使用樣本均值和样本中位數。

如果您唯一擁有的是對數正態的樣本均值和中位數(和分別)那麼你至少可以使用用樣本替換人口數量的明顯策略*,結合矩量法和分位數法……和.

我相信這些估計器將是一致的。但是,在小樣本中,這些肯定是有偏差的,並且可能不是很有效,但是如果沒有大量分析,您可能沒有很多選擇。

當然,實際上,您並不真正知道您的數據是從對數正態分佈中提取的——這幾乎是一種猜測。然而,在實踐中,這可能是一個非常有用的假設。

理想情況下,可以從對數正態中計算出樣本均值和中位數的聯合分佈,然後嘗試最大化該二元分佈參數的似然性;這應該做得盡可能好,但這更像是一個體面的研究問題(如果以前沒有做過,那麼值得一篇論文)而不是幾段答案的問題。

可以對樣本均值和中位數的聯合分佈的性質進行一些模擬研究。例如,考慮到均值與中值之比的分佈應該是無標度的——一個函數 只要。即使我們不能用代數計算它,我們也可以看看這個比率(例如)是如何表現的變化。然後,人們可能會選擇大約最大化獲得您觀察到的比率的機會(可以通過多種方式進行估計,但顯而易見的方式——如前所述的中位數的對數——並不可怕)。


  • 警告:樣本中位數完全有可能超過樣本均值。在這種情況下,上面建議的簡單估計器沒有幫助,因為它依賴於高於中位數的平均值(它會對正參數給出負估計)。

引用自:https://stats.stackexchange.com/questions/174449

comments powered by Disqus