Estimation

估計優惠券收集者問題中的 n

  • February 22, 2014

優惠券收集問題的變體中,您不知道優惠券的數量,必鬚根據數據確定。我將此稱為幸運餅乾問題:

給定未知數量的不同幸運餅乾消息, 估計通過一次取樣一個餅乾併計算每個幸運出現的次數。還要確定在此估計值上獲得所需置信區間所需的樣本數。

基本上我需要一個算法來採樣足夠的數據以達到給定的置信區間,比如說和信心。為簡單起見,我們可以假設所有命運都以相同的概率/頻率出現,但對於更普遍的問題而言,情況並非如此,並且也歡迎對此的解決方案。

這似乎類似於德國坦克問題,但在這種情況下,幸運餅乾沒有按順序標記,因此沒有順序。

對於等概率/頻率的情況,這種方法可能適合您。

讓為總樣本量,是觀察到的不同項目的數量,是恰好看到一次的項目數,是恰好看到兩次的項目數,和

然後是總人口規模的大約 95% 的置信區間 是(誰)給的

實施時,您可能需要根據您的數據調整這些。

該方法歸功於Good和Turing。置信區間的參考是 Esty, Warren W. (1983), “A Normal Limit Law for a Nonparametric Estimator of a Coverage of a Random Sample” , Ann。統計學家。,第 11 卷,第 3 期,905-912。

對於更普遍的問題,邦吉製作了可以產生若干估計的免費軟件。用他的名字和單詞CatchAll 搜索

引用自:https://stats.stackexchange.com/questions/87494

comments powered by Disqus