Distributions

斷棍最大碎片的分佈(間距)

  • July 21, 2015

讓一根長度為 1 的棍子被折斷隨機均勻地碎片。最長片段的長度分佈是怎樣的?

更正式地,讓成為 IID, 然後讓是相關的訂單統計,我們簡單地以這樣的方式對樣本進行排序. 讓.

我對分佈感興趣. 矩、漸近結果或近似值也很有趣。

通過@Glen_b 提供的信息,我可以找到答案。使用與問題相同的符號

在哪裡如果和否則。我還給出了 Gumbel( NB不是Beta)分佈的期望和漸近收斂

證明材料取自參考文獻中鏈接的若干出版物。它們有些冗長,但直截了當。

1. 確切分佈的證明

讓是區間內的 IID 均勻隨機變量. 通過訂購它們,我們獲得訂單統計表示 . 均勻間距定義為, 和和. 有序間距是對應的有序統計. 感興趣的變量是.

對於固定,我們定義指標變量. 通過對稱性,隨機向量是可交換的,所以大小子集的聯合分佈與第一個的聯合分佈相同. 通過擴大產品,我們得到

我們現在將證明,這將建立上面給出的分佈。我們證明了這一點,因為類似地證明了一般情況。

如果, 這斷點在區間內. 條件是在這個事件上,斷點還是可以交換的,所以第二個和第一個斷點的距離大於的概率與第一個斷點和左屏障之間的距離(在位置) 大於. 所以

2. 期望

對於具有有限支持的分佈,我們有

整合分佈, 我們獲得

最後一個等式是調和數的經典表示,我們在下面演示。

隨著變量的變化並擴大產品,我們得到

3. 均勻間距的替代構造

為了獲得最大片段的漸近分佈,我們需要展示一個經典的均勻間距構造,即指數變量除以它們的總和。關聯訂單統計的概率密度 是

如果我們表示均勻間距, 和, 我們獲得

通過定義,因此我們得到

現在,讓是均值為 1 的 IID 指數隨機變量,並讓. 通過簡單的變量變化,我們可以看到

定義, 這樣通過變量的變化我們得到

積分這個密度相對於,因此我們得到

所以聯合分佈區間上的均勻間距與聯合分佈相同指數隨機變量除以它們的總和。我們得出以下等價分佈

4. 漸近分佈

使用上面的等式,我們得到

在哪裡. 這個變量在概率上消失是因為和. 漸近地,分佈與. 因為是 IID,我們有

5. 圖形概覽

下圖顯示了不同值的最大片段的分佈. 為了,我還覆蓋了漸近 Gumbel 分佈(細線)。Gumbel 對於較小的值是一個非常糟糕的近似值所以我省略了它們以不使圖片超載。Gumbel 近似值很好.

Distribution of the largest fragment of a broken stick

6. 參考文獻

上述證明取自參考文獻 2 和 3。引用的文獻包含更多結果,例如任何等級的有序間距分佈、它們的極限分佈以及有序均勻間距的一些替代構造。關鍵參考文獻不易獲取,因此我還提供了全文鏈接。

  1. 拜拉莫夫等人。(2010)有序均勻間距的限制結果,統計論文,51:1,第 227-240 頁
  2. Holst (1980)關於隨意折斷的棍子的長度,J. Appl。概率,17,第 623-634 頁
  3. Pyke (1965)間距, JRSS (B) 27:3,第 395-449 頁
  4. Renyi (1953) On theory of order statistics , Acta math Hung, 4, pp 191-231

引用自:https://stats.stackexchange.com/questions/162560

comments powered by Disqus