Binomial-Distribution

為什麼在 (0, 255) 上均勻生成 8 個隨機位?

  • January 16, 2017

我正在生成 8 個隨機位(0 或 1)並將它們連接在一起形成一個 8 位數字。一個簡單的 Python 模擬在離散集 [0, 255] 上產生均勻分佈。

我試圖證明為什麼這在我的腦海中是有道理的。如果我將此與翻轉 8 個硬幣進行比較,那麼預期值不是大約 4 個正面/4 個反面嗎?所以對我來說,我的結果應該反映範圍中間的峰值是有道理的。換句話說,為什麼 8 個 0 或 8 個 1 的序列似乎與 4 和 4 或 5 和 3 等的序列一樣可能?我在這裡想念什麼?

TL;DR: 比特和硬幣之間的鮮明對比是,在硬幣的情況下,你忽略了結果的順序。HHHHTTTT 被視為與 TTTTHHHH 相同(都有 4 個頭和 4 個尾)。但是在位中,您關心順序(因為您必須為位位置賦予“權重”才能獲得 256 個結果),因此 11110000 與 00001111 不同。


更長的解釋: 如果我們在框架問題上更正式一點,這些概念可以更精確地統一。將實驗視為具有二分結果的八次試驗序列,“成功”概率為 0.5,“失敗”概率為 0.5,並且這些試驗是獨立的。一般來說,我會稱之為成功,總試驗和失敗和成功的概率是.

  • 在硬幣示例中,結果“頭,tails”忽略了試驗的順序(無論出現的順序如何,4 個正面都是 4 個正面),這導致您觀察到 4 個正面比 0 或 8 個正面更有可能。四個正面更常見,因為有很多製作四個頭的方法(TTHHTTHH 或 HHTTHHTT 等)比其他一些數字(8 個頭只有一個序列)。二項式定理給出了製作這些不同配置的方法的數量。
  • 相比之下,順序對位很重要,因為每個位置都有一個關聯的“權重”或“位置值”。二項式係數的一個性質是,也就是說,如果我們計算所有不同的有序序列,我們得到. 這直接連接了有多少種不同的製作方法的想法進入對不同字節序列的數量進行二項式試驗。
  • 此外,我們可以通過獨立性證明這 256 個結果的可能性相同。先前的試驗對下一次試驗沒有影響,因此特定排序的概率通常為(因為獨立事件的聯合概率是它們概率的乘積)。因為審判是公平的,,這個表達式簡化為. 因為所有排序具有相同的概率,所以我們對這些結果有一個均勻分佈(通過二進制編碼可以表示為整數).
  • 最後,我們可以把這個完整的循環帶回到拋硬幣和二項分佈。我們知道 0 個正面出現的概率與 4 個正面出現的概率不同,這是因為對 4 個正面的出現有不同的排序方式,並且這種排序的數量由二項式定理給出。所以必須以某種方式加權,特別是它必須由二項式係數加權。所以這給了我們二項分佈的 PMF,. 這個表達式是一個 PMF 可能令人驚訝,特別是因為它的總和為 1 並不是很明顯。為了驗證,我們必須檢查,但這只是二項式係數的問題:.

引用自:https://stats.stackexchange.com/questions/256563

comments powered by Disqus