估計優惠券收集者問題中的 n

February 22, 2014

在優惠券收集問題的變體中，您不知道優惠券的數量，必鬚根據數據確定。我將此稱為幸運餅乾問題：

給定未知數量的不同幸運餅乾消息，估計通過一次取樣一個餅乾併計算每個幸運出現的次數。還要確定在此估計值上獲得所需置信區間所需的樣本數。

基本上我需要一個算法來採樣足夠的數據以達到給定的置信區間，比如說和信心。為簡單起見，我們可以假設所有命運都以相同的概率/頻率出現，但對於更普遍的問題而言，情況並非如此，並且也歡迎對此的解決方案。

這似乎類似於德國坦克問題，但在這種情況下，幸運餅乾沒有按順序標記，因此沒有順序。

對於等概率/頻率的情況，這種方法可能適合您。

讓為總樣本量，是觀察到的不同項目的數量，是恰好看到一次的項目數，是恰好看到兩次的項目數，和

然後是總人口規模的大約 95% 的置信區間是（誰）給的

實施時，您可能需要根據您的數據調整這些。

該方法歸功於Good和Turing。置信區間的參考是 Esty, Warren W. (1983), “A Normal Limit Law for a Nonparametric Estimator of a Coverage of a Random Sample” , Ann。統計學家。，第 11 卷，第 3 期，905-912。

對於更普遍的問題，邦吉製作了可以產生若干估計的免費軟件。用他的名字和單詞CatchAll 搜索。

引用自：https://stats.stackexchange.com/questions/87494

comments powered by Disqus

相關問答

擲骰子的預期次數，直到每邊出現 3 次

May 11, 2016

我需要多少張貼紙才能完成我的 FIFA 帕尼尼專輯？

June 5, 2014

您必須多久擲一次 6 面骰子才能獲得每個數字至少一次？

January 24, 2013