Hypothesis-Testing

使用 p 值計算假設為真的概率;還需要什麼?

  • April 24, 2017

題:

對 p 值的一個常見誤解是它們表示原假設為真的概率。我知道這是不正確的,並且我知道 p 值僅代表*找到像這樣極端的樣本的概率,假設原假設為真。*然而,直覺上,人們應該能夠從後者中推導出第一個。沒有人這樣做一定是有原因的。我們遺漏了哪些限制我們從 p 值和相關數據推導出假設為真的概率的信息?


例子:

我們的假設是“維生素 D 影響情緒”(零假設是“沒有影響”)。假設我們對 1000 人進行了適當的統計研究,發現情緒和維生素水平之間存在相關性。在所有其他條件相同的情況下,0.01 的 p 值表示真假設的可能性高於 0.05 的 p 值。假設我們得到 0.05 的 p 值。為什麼我們不能計算我們的假設為真的實際概率?我們缺少什麼信息?


常客統計學家的替代術語:

如果您接受我的問題的前提,您可以在此處停止閱讀。以下內容適用於拒絕接受假設可以具有概率解釋的人。讓我們暫時忘記術語。反而…

假設您正在和您的朋友下注。你的朋友向你展示了一千項關於不相關主題的統計研究。對於每項研究,您只能查看樣本的 p 值、樣本量和標準差。對於每項研究,您的朋友都會為您提供一些賠率,讓您打賭研究中提出的假設是正確的。您可以選擇接受或不接受投注。在您為所有 1000 項研究下注後,一個神諭會出現在您身上並告訴您哪個假設是正確的。此信息可讓您結算投注。我的主張是這個遊戲存在一個最優策略. 在我的世界觀中,這相當於知道假設為真的概率,但如果我們不同意這一點,那也沒關係。在這種情況下,我們可以簡單地討論使用 p 值來最大化投注期望的方法。

**其他答案都是哲學的,但我不明白為什麼這裡需要它。**讓我們考慮一下您的示例:

我們的假設是“維生素 D 影響情緒”(零假設是“沒有影響”)。假設我們對 1000 人進行了適當的統計研究,發現情緒和維生素水平之間存在相關性。在所有其他條件相同的情況下,0.01 的 p 值表示真假設的可能性高於 0.05 的 p 值。假設我們得到 0.05 的 p 值。為什麼我們不能計算我們的假設為真的實際概率?我們缺少什麼信息?

為了, 得到對應樣本相關係數. 原假設是. 備擇假設是.

p 值為

我們可以根據樣本分佈來計算它在空值下;不需要其他任何東西。 你想計算

為此,您需要一大堆額外的成分。實際上,通過應用貝葉斯定理,我們可以將其重寫如下:

因此,要計算空值的後驗概率,您需要另外兩件事:

  1. 在原假設為真之前:.
  2. 關於如何的假設如果備擇假設為真,則分佈。這是計算學期。

如果你願意假設— 即使我個人不確定為什麼這應該是一個有意義的假設,— 你仍然需要假設在替代之下。在這種情況下,您將能夠計算稱為貝葉斯因子的東西:

如您所見,貝葉斯因子不依賴於空值的先驗概率,但它確實依賴於(在替代方案下)。

[請注意,貝葉斯因子中的提名者不是 p 值,因為等式而不是不等號。所以當計算貝葉斯因子或我們根本沒有使用 p 值本身。但是我們當然是使用抽樣分佈.]

引用自:https://stats.stackexchange.com/questions/275527

comments powered by Disqus