Confidence-Interval
為什麼 20,000 次投擲中有 10,000 次正面朝上的統計論證表明數據無效
假設我們反复拋硬幣,我們知道正面和反面的數量應該大致相等。當我們看到 10 次正面和 10 次反面總共 20 次拋擲的結果時,我們相信結果並傾向於相信硬幣是公平的。
好吧,當您看到總共 20000 次拋擲的 10000 個正面和 10000 個反面的結果時,我實際上會質疑結果的有效性(實驗者是否偽造了數據),因為我知道這比說結果更不可能10093 頭和 9907 尾。
我的直覺背後的統計論據是什麼?
假設一個公平的硬幣,10000 個正面和 10000 個反面的結果實際上比 10093 個正面和 9907 個反面的結果更有可能。
但是,當您說真正的實驗者不太可能獲得相同數量的正面和反面時,您是在隱含地援引貝葉斯定理。您對真實實驗的先前信念是 Prob(20000 次投擲中的正面數 = 10000 | 鑑於實驗者沒有偽造)接近於 0。因此,當您看到“正面數 = 10000”的實際結果時,您的Prob 的後驗(實驗者沒有偽造 | 觀察到的 10000 個正面結果)也接近於 0。因此,您得出結論,實驗者正在偽造數據。