Likelihood

為什麼人們使用 p 值而不是計算模型給定數據的概率?

  • December 17, 2010

粗略地說,p 值給出了給定假設(模型)的實驗觀察結果的概率。有了這個概率(p 值),我們想要判斷我們的假設(它的可能性有多大)。但是根據觀察到的結果計算假設的概率不是更自然嗎?

在更多細節。我們有一枚硬幣。我們將它翻轉 20 次,得到 14 個正面(20 個中有 14 個是我所說的“實驗結果”)。現在,我們的假設是硬幣是公平的(正面和反面的概率彼此相等)。現在我們計算 p 值,它等於在 20 次拋硬幣中出現 14 個或更多正面的概率。好的,現在我們有了這個概率(0.058),我們想用這個概率來判斷我們的模型(我們有多少可能有一個公平的硬幣)。

但是如果我們要估計模型的概率,為什麼不計算給定實驗的模型的概率呢?為什麼我們要計算給定模型(p 值)的實驗概率?

計算假設正確的概率並不能很好地符合頻率定義的概率(長期頻率),該定義被採用以避免貝葉斯概率定義的假定主觀性。特定假設的真實性不是隨機變量,它要么是真實的,要么不是真實的,並且沒有長期運行頻率。對假設的真實概率感興趣確實更自然,這就是恕我直言,為什麼 p 值經常被誤解為原假設為真的概率。部分困難在於,根據貝葉斯規則,我們知道要計算假設為真的後驗概率,您需要從假設為真的先驗概率開始。

給定數據(和他/她的先前信念),貝葉斯計算假設為真的概率。

本質上,在常客和貝葉斯方法之間做出決定時,需要選擇貝葉斯方法的所謂主觀性是否比常客方法通常不能直接回答您實際想問的問題這一事實更令人憎惡 - 但仍有空間兩個都。

在詢問硬幣是否公平的情況下,即正面的概率等於反面的概率,我們還有一個假設的例子,我們知道在現實世界中從一開始就幾乎肯定是錯誤的。硬幣的兩側是不對稱的,所以我們應該預料到正面和反面的概率會有輕微的不對稱,所以如果硬幣“通過”測試,這只是意味著我們沒有足夠的觀察結果能夠得出我們已經知道的事實——硬幣有非常輕微的偏差!

引用自:https://stats.stackexchange.com/questions/5591

comments powered by Disqus