一個公平的骰子被擲出 1,000 次。連續滾動相同數字 5 次的概率是多少？

October 14, 2020

一個公平的骰子被擲出 1,000 次。連續滾動相同數字 5 次的概率是多少？對於可變的投擲次數和重複次數，您如何解決此類問題？

下面我們用四種方式計算概率：
Computation with Markov Chain          0.473981098314993
Computation with generating function   0.473981098314988
Estimation false method                0.536438013618686
Estimation correct method              0.473304632462677
前兩種是精確的方法，只有一點點不同（可能是一些錯誤），第三種方法是一種天真的估計，沒有給出正確的數字，第四種方法更好，給出的結果非常接近精確方法。

計算上：

馬爾可夫鏈

您可以使用轉換矩陣對此進行計算建模

說列向量 $ X_{k,j} = \lbrace x_1,x_2,x_3,x_4,x_5 \rbrace_{j} $ 是有的概率 $ k $ 在同一行中的相同數字 $ j $ -擲骰子。然後（假設一個 6 面骰子）

$$ X_{k,j} = M \cdot X_{k,j-1} $$和

$$ M = \begin{bmatrix} \frac{5}{6} & \frac{5}{6} & \frac{5}{6} & \frac{5}{6} & 0 \ \frac{1}{6} & 0& 0 & 0 & 0 \ 0& \frac{1}{6} & 0& 0 & 0 \ 0 & 0& \frac{1}{6} & 0& 0 \ 0&0 & 0& \frac{1}{6} & 1 \ \end{bmatrix} $$

最後一個條目在哪裡 $ M_{5,5} = 1 $ 與連續 5 個相同的狀態相關，這是我們“停止”實驗的吸收狀態。

在第一次滾動之後，您肯定會處於狀態 1（肯定只有 1 個相同數字連續）。

$$ X_{k,1} = \lbrace 1,0,0,0,0 \rbrace $$

之後 $ j $ -th roll 這將乘以 $ M $ 一個 $ j-1 $ 次

$$ X_{k,j} = M^{j-1} \lbrace 1,0,0,0,0 \rbrace $$

R-代碼：
library(matrixcalc) ### allows us to use matrix.power

M <- matrix(c(5/6, 5/6, 5/6, 5/6, 0,
             1/6, 0  , 0  , 0  , 0,
             0,   1/6, 0  , 0  , 0,
             0,   0  , 1/6, 0  , 0,
             0,   0  , 0  , 1/6, 1),
           5, byrow = TRUE)

start <- c(1,0,0,0,0)
matrix.power(M,999) %*% start
結果是$$ X_{k,1000} = \begin{bmatrix} 0.438631855\ 0.073152468\ 0.012199943\ 0.002034635\ \color{red}{0.473981098}\end{bmatrix} $$

最後一個條目 0.473981098 是在 1000 次滾動中連續滾動 5 次相同數字的概率。

生成函數

我們的問題是：

如何計算至少滾動任何數字的概率 $ k $ 連續幾次，出 $ n $ 嘗試？

這相當於問題

如何計算至少滾動數字 6的概率 $ k-1 $ 連續幾次，出 $ n-1 $ 嘗試？

您可以將其視為跟踪骰子是否滾動 $ m $ 與擲骰子的數字相同 $ m-1 $ （概率為 1/6）。這需要發生 $ k-1 $ 連續幾次（在我們的例子中是 4 次）。

在這個問答中，替代問題作為一個組合問題來解決：我們可以用多少種方式擲骰子 $ n $ 沒有出現數字“6”的次數 $ k $ 或連續多次。

這是通過找到我們可以將字符串“x”、“x6”、“x66”、“x666”（其中“x”是任意數字 1、2、3、4、5）組合成一串長度 $ n+1 $ ( $ n+1 $ 代替 $ n $ 因為在這種構造字符串的方式中，第一個字母總是 $ x $ 這裡）。通過這種方式，我們計算了製作長度字符串的所有可能性 $ n $ 但只有 1、2 或 3 次連續出現 6（而不是 4 次或更多次）。

這些組合可以通過使用等效多項式來找到。這與我們擴展冪時與係數相關的二項式係數非常相似 $ (x+y)^n $ ，但它也涉及到一個組合。

多項式是

$$ \begin{array}{rcl} P(x) &=& \sum_{k=0}^\infty (5x+5x^2+5x^3+5x^4)^k\ &=& \frac{1}{1-(5x+5x^2+5x^3+5x^4)} \ &=& \frac{1}{1-5\frac{x-x^5}{1-x}}\ &=& \frac{1-x}{1-6x+5x^5} \end{array} $$

的係數 $ x^n $ 與將數字 1,2,3,4,5,6 排列在長度字符串中的方式的數量有關 $ n-1 $ 連續沒有 4 個或更多的 6。這個係數可以通過遞歸關係找到。$$ P(x) (1-6x+5x^5) = 1-x $$這意味著係數遵循關係

$$ a_n - 6a_{n-1} + 5 a_{n-5} = 0 $$

第一個係數可以手動計算

$$ a_1,a_2,a_3,a_4,a_5,a_6,a_7 = 5,30,180,1080,6475,38825,232800 $$

有了這個，你可以計算 $ a_{1000} $ 和 $ 1-a_{1000}/6^{999} $ 將是在第 5 行中滾動相同數字 5 次的概率。

在下面的 R 代碼中，我們計算了這個（我們在遞歸中包含了除以 6，因為數字 $ a_{1000} $ 和 $ 6^{999} $ 太大而無法直接計算）。結果是 $ 0.473981098314988 $ ，與馬爾可夫鏈的計算相同。
x <- 6/5*c(5/6,30/6^2,180/6^3,1080/6^4,6475/6^5,38825/6^6,232800/6^7)
for (i in 1:1000) {
 t <- tail(x,5)
 x <- c(x,(6/6*t[5]-5/6^5*t[1]))   ### this adds a new number to the back of the vector x
}
1-x[1000]
分析/估計

方法一：錯

你可能會想，在任何一組 5 個相鄰骰子中，有 5 個相同數字的概率是 $ \frac{1}{6^4} = \frac{1}{1296} $ ，並且由於有 996 組 5 個相鄰骰子，因此在這些組中至少有一組 5 個相同骰子的概率為：

$$ 1-(1-\frac{1}{6^4})^{996} \approx 0.536 $$

但這是錯誤的。原因是996個集合是重疊的，不是獨立的。

方法二：正確

更好的方法是近似我們上面計算的馬爾可夫鏈。一段時間後你會發現，1、2、3、4個連續相同數量的州的佔領或多或少是穩定的，比例大約是 $ 1/6,1/6^2,1/6^3,1/6^4 $ (*)。因此，我們連續 4 次的時間分數是：

$$ \text{frequency 4 in a row} = \frac{1/6^4}{1/6+1/6^2+1/6^3+1/6^4} $$

如果我們連續有這 4 個，那麼我們有 1/6 的概率完成遊戲。所以完成遊戲的頻率是

$$ \text{finish-rate} = \frac{1}{6} \text{frequency 4 in a row} = \frac{1}{1554} $$

以及之後完成的概率 $ k $ 步驟大約是

$$ P_k \approx 1-(1-\frac{1}{1554})^{k-4} \underbrace{\approx 0.47330}_{\text{if $k=1000$}} $$

更接近精確的計算。

() 州內職業 $ k $ 在滾動期間 $ j $ 將與州內的職業有關 $ k-1 $ 在滾動期間 $ j-1 $ . 我們將有 $ x_{k,j} = \frac{1}{6} x_{k-1,j-1} \approx \frac{1}{6} x_{k-1,j} $ . 請注意，這要求您擁有 $ x_{k-1,j} \approx x_{k-1,j-1} $ ，當完成率很小時會發生這種情況。如果不是這種情況，那麼您可以應用一個因子來補償，但相對穩定比率的假設也是錯誤的。*

相關問題

與計數相關的極限分佈（非平凡的組合問題）

檢查硬幣是否公平

在 n 次擲骰後擲骰子所有面的概率是多少

引用自：https://stats.stackexchange.com/questions/492000

comments powered by Disqus

一個公平的骰子被擲出 1,000 次。連續滾動相同數字 5 次的概率是多少？

計算上：

馬爾可夫鏈

生成函數

分析/估計

方法一：錯

方法二：正確

相關問題

相關問答

是否有 20 分之一或 400 分之一的機會在 d20 擲骰結果發生之前猜到它的結果？

頭數超過骰子總和的概率

擲 6 和 6 面骰子得到 6 的機會有多大？

預期擲骰子將每個數字擲出奇數次

Sampler、MonteCarlo、Metropolis-Hasting 方法、MCMC 方法和 Fisher 形式的區別

為什麼細化在貝葉斯推理中起作用？