Probability
比較 0/10 和 0/20
在討論任務完成率時,有沒有辦法表明 20 次嘗試中的 0 次嘗試比 10 次嘗試中的 0 次“差”?
假設我們知道一次嘗試成功的概率。在這種情況下,我們計算 0 出 10 和 0 出 20 的概率。
但是,在這種情況下,我們反其道而行之。我們不知道概率,我們有數據並嘗試估計概率。
我們擁有的案例越多,我們就越能確定結果。如果我拋硬幣,結果是正面的,你不會很確定它是雙頭的。如果我把它扔 1000 次,它都是正面的,它不太可能是平衡的。
設計了一些方法,以便在給出估計時考慮路徑的數量。其中之一是上面@abukaj 評論的附加平滑。在加法平滑中,我們考慮了額外的偽樣本。在我們的例子中,我們在我們看到的軌跡上添加了另外兩個 - 一個成功,一個失敗。
- 在第一種情況下,平滑概率將是=~ 8.3%
- 在第二種情況下,我們將得到=~ 4.5%
請注意,加法平滑只是一種估計方法。你會用不同的方法得到不同的結果。即使使用附加平滑本身,如果添加 4 個偽樣本,您也會得到不同的結果。
另一種方法是使用@mdewey 建議的置信區間。我們擁有的樣本越多,置信區間就越短。置信區間的大小與樣本的平方根成正比 -. 因此,將樣本數量增加一倍將導致置信區間較短。
兩種情況的平均值均為 0。我們採用 90% 的置信水平 (z=1.645)
- 在第一種情況下,我們將得到 0 +~ 52%
- 在第二種情況下,我們將得到 0 +~ 36%
如果數據缺失,則存在不確定性。您所做的假設和您將使用的外部數據將改變您將獲得的結果。