Hypothesis-Testing

為什麼用於貝葉斯因子和 p 值的截止值如此不同?

  • April 25, 2019

我想了解貝葉斯因子(BF)。我相信它們就像兩個假設的似然比。因此,如果 BF 為 5,則意味著 H1 的可能性是 H0 的 5 倍。並且值 3-10 表示中等證據,而>10 表示強證據。

然而,對於 P 值,傳統上將 0.05 作為截止值。在此 P 值下,H1/H0 似然比應約為 95/5 或 19。

那麼為什麼 BF 的截止值 >3 而 P 值的截止值 >19 呢?這些值也不是很接近。

一些東西:

BF 為您提供支持假設的證據,而常客假設檢驗為您提供反對(零)假設的證據。所以它有點像“蘋果到橘子”。

這兩個程序儘管有不同的解釋,但可能會導致不同的決定。例如,BF 可能會拒絕,而常客假設檢驗不會,反之亦然。這個問題通常被稱為Jeffreys-Lindley 悖論。這個網站上有很多關於這個的帖子;參見例如這里這裡

“在這個 P 值下,H1/H0 的可能性應該是 95/5 或 19。” 不,這不是真的,因為,大致 $ p(y \mid H_1) \neq 1- p(y \mid H_0) $ . 計算 p 值和執行頻率測試,至少,不需要你有任何想法 $ p(y \mid H_1) $ . 此外,p 值通常是密度/pmfs 的積分/總和,而 BF 不會在數據樣本空間上積分。

引用自:https://stats.stackexchange.com/questions/404933

comments powered by Disqus