Probability

從離散均勻分佈中抽取的未替換樣本之間的最大間隙

  • December 31, 2016

這個問題和我實驗室在機器人覆蓋方面的研究有關:

隨機抽取集合中的數字無需替換,並按升序對數字進行排序。 .

從這個排序的數字列表中,生成連續數和邊界之間的差:. 這給差距。

最大差距的分佈是什麼?

這可以使用訂單統計來構建:

請參閱鏈接了解差距的分佈,但這個問題詢問最大差距的分佈。

我會對平均值感到滿意,.

如果所有間隙的大小都是 1。如果有一個大小的差距, 和可能的位置。最大間隙尺寸為,並且這個間隙可以放置在任何一個之前或之後 數字,總共可能的職位。最小的最大間隙尺寸為. 定義任何給定組合的概率.

我已經部分解決了概率質量函數為

當前工作(1): 第一個間隙的方程,很簡單:

期望值有一個簡單的值: . 通過對稱,我期望所有有這種分佈的差距。也許可以通過從此分佈中找到解決方案次。 *當前工作(2):*運行蒙特卡羅模擬很容易。

simMaxGap[m_, n_] := Max[Differences[Sort[Join[RandomSample[Range[m], n], {0, m+1}]]]];
m = 1000; n = 1; trials = 100000;
SmoothHistogram[Table[simMaxGap[m, n], {trials}], Filling -> Axis,
Frame -> {True, True, False, False},
FrameLabel -> {"k (Max gap)", "Probability"},
PlotLabel -> StringForm["m=``,n=``,smooth histogram of maximum map for `` trials", m, n, trials]][![enter image description here][1]][1]

讓是最小的機會,, 等於; 也就是說,樣本由和-子集. 有這樣的子集同樣可能的子集,從哪裡來

添加對於所有可能的值比…更棒產生生存函數

讓是由最大間隙給出的隨機變量:

(這回應了最初提出的問題,在它被修改為包括之間的差距之前和.) 我們將計算它的生存函數

從中得到整個分佈很容易推導出來。該方法是一個動態程序,以, 顯然

對於較大的, 注意事件是事件的不相交並集

第一個差距超過, 和單獨的事件

第一個間隙等於並且差距大於稍後出現在樣本中。總概率定律斷言這些事件的概率相加,因此

定影並佈置一個由索引的雙向數組和,我們可以計算通過使用填寫第一行和使用填充每個連續的行每行的操作。因此,該表可以在操作和所有表通過可以建造在操作。

數字

這些圖顯示了生存函數為了. 作為增加,圖表向左移動,對應於較大差距的機會減少。

封閉式可以在許多特殊情況下獲得,尤其是對於大型,但我無法獲得適用於所有人的封閉公式. 通過將這個問題替換為連續均勻變量的類似問題,可以很容易地獲得良好的近似值。

最後,期待通過求和它的生存函數得到:

圖 2:期望的等高線圖

這個期望的等高線圖顯示了等高線,從黑暗到光明。

引用自:https://stats.stackexchange.com/questions/253990

comments powered by Disqus