沒有放回的獨立隨機樣本交集的基數分佈是什麼?
是一些設置元素,和是小於或等於的固定正整數.
隨著元素同樣可能,樣品分別獨立地從無需更換,其大小為, 分別。
樣本交集的基數一般來說,支持等於,但它遵循哪種分佈?
這是另一種方法,不涉及遞歸。不過,它仍然使用長度取決於參數的總和和乘積。我先給出表達式,然後解釋。
我們有
**編輯:**在寫完所有這些時,我意識到我們可以通過將二項式係數組合成超幾何概率和三項式係數來稍微鞏固上面的表達式。對於它的價值,修改後的表達式是
這裡是一個超幾何隨機變量,其中抽籤取自一定規模的人口有成功狀態。
推導
讓我們獲得一些符號以使組合參數更容易跟踪(希望如此)。在整個過程中,我們認為和固定的。我們將使用表示有序的集合-元組, 其中每個, 滿足
- ; 和
- .
我們還將使用對於一個相同的集合,除了我們需要而不是平等。
一個關鍵的觀察結果是算起來比較容易。這是因為條件相當於對所有人,所以從某種意義上說,這消除了不同之間的相互作用價值觀。對於每個, 的數量滿足要求是,因為我們可以構造這樣一個通過選擇一個子集大小的然後與. 它遵循
現在我們的原始概率可以通過如下:
我們可以馬上在這裡做兩個簡化。首先,分母是一樣的
其次,置換論證表明只取決於通過基數. 既然有的子集有基數, 它遵循
在哪裡是任意的、固定的子集有基數. 退後一步,我們現在將問題簡化為表明
讓是不同的子集通過將一個元素添加到. 然後
(這只是說如果, 然後包含但也不包含任何額外的元素。)我們現在已經改變了-計數問題- 計數問題,我們更了解如何處理。更具體地說,我們有
我們可以應用包含-排除來處理上述聯合表達式的大小。這裡的關鍵關係是,對於任何非空,
這是因為如果包含一些,那麼它也包含它們的並集。我們還注意到集合有大小. 所以
(我們可以限制這裡的值,因為二項式係數的乘積為零,除非對所有人, IE.)
最後,將最後的表達式代入等式上面並合併總和,我們得到
如聲稱的那樣。