您必須多久擲一次 6 面骰子才能獲得每個數字至少一次?
我剛剛和我的孩子們玩了一個遊戲,基本上可以歸結為:在 6 面骰子上至少擲出每個數字一次的人獲勝。
最終我贏了,其他人在 1-2 回合後完成。現在我想知道:對遊戲長度的期望是多少?
我知道在您達到特定數字之前的滾動數的期望是 $ \sum_{n=1}^\infty n\frac{1}{6}(\frac{5}{6})^{n-1}=6 $ .
但是,我有兩個問題:
- 你必須擲多少次六面骰子才能得到每個數字至少一次?
- 在四個獨立試驗中(即有四個玩家),所需的最大擲骰數的期望是多少?[注意:這是最大的,而不是最小的,因為在他們這個年紀,更重要的是完成而不是為我的孩子們先到達那裡]
我可以模擬結果,但我想知道如何進行分析計算。
這是 Matlab 中的蒙特卡洛模擬
mx=zeros(1000000,1); for i=1:1000000, %# assume it's never going to take us >100 rolls r=randi(6,100,1); %# since R2013a, unique returns the first occurrence %# for earlier versions, take the minimum of x %# and subtract it from the total array length [~,x]=unique(r); mx(i,1)=max(x); end %# make sure we haven't violated an assumption assert(numel(x)==6) %# find the expected value for the coupon collector problem expectationForOneRun = mean(mx) %# find the expected number of rolls as a maximum of four independent players maxExpectationForFourRuns = mean( max( reshape( mx, 4, []), [], 1) ) expectationForOneRun = 14.7014 (SEM 0.006) maxExpectationForFourRuns = 21.4815 (SEM 0.01)
因為已經要求“完全分析方法”,所以這裡有一個精確的解決方案。 它還提供了一種替代方法來解決概率問題,即在具有混合替換條件的一組黑白球中繪製一個黑球。
遊戲中的移動次數, $ X $ , 可以建模為 Geometric 的六個獨立實現的總和 $ (p) $ 有概率的變量 $ p=1, 5/6, 4/6, 3/6, 2/6, 1/6 $ , 他們每個人都移動了 $ 1 $ (因為幾何變量只計算成功之前的擲骰,我們還必須計算觀察到成功的擲骰)。通過計算幾何分佈,我們將因此得到答案 $ 6 $ 小於所需的,因此必須確保添加 $ 6 $ 回到最後。
這種帶參數的幾何變量的概率生成函數(pgf) $ p $ 是
$$ f(z, p) = \frac{p}{1-(1-p)z}. $$
因此,這六個變量之和的 pgf 是
$$ g(z) = \prod_{i=1}^6 f(z, i/6) = 6^{-z-4} \left(-5\ 2^{z+5}+10\ 3^{z+4}-5\ 4^{z+4}+5^{z+4}+5\right). $$
(乘積可以通過部分分數分成五個項,以這種封閉形式計算。)
累積分佈函數 (CDF) 是從 $ g $ (作為冪級數 $ z $ ),相當於對幾何級數求和,由下式給出
$$ F(z) = 6^{-z-4} \left(-(1)\ 1^{z+4} + (5)\ 2^{z+4}-(10)
3^{z+4}+(10)\ 4^{z+4}-(5)\ 5^{z+4}+(1)\ 6^{z+4}\right). $$(我用一種形式寫了這個表達式,暗示了通過包含-排除原理的替代推導。)
由此我們得到遊戲中的預期移動數(回答第一個問題)為
$$ \mathbb{E}(6+X) = 6+\sum_{i=1}^\infty \left(1-F(i)\right) = \frac{147}{10}. $$
最大的 CDF $ m $ 的獨立版本 $ X $ 是 $ F(z)^m $ (從這個原則上,我們可以回答關於我們喜歡的最大值的任何概率問題,例如它的方差是多少,它的第 99 個百分位數是多少,等等)。和 $ m=4 $ 我們得到一個期望
$$ 6+\sum_{i=1}^\infty \left(1-F(i)^4\right) \approx 21.4820363\ldots. $$
(該值是一個有理分數,以簡化形式具有 71 位分母。)標準差為 $ 6.77108\ldots. $ 這是四個玩家的最大值的概率質量函數圖(它已被移動 $ 6 $ 已經):
正如人們所預料的那樣,它是正向傾斜的。模式在 $ 18 $ 勞斯萊斯。最後一個完成的人花費的時間很少超過 $ 50 $ 卷(大約是 $ 0.3% $ )。