缺乏證據並不是不存在的證據:貝葉斯概率對此有何看法?
宇宙學家馬丁·里斯()的一句著名格言是“沒有證據不是沒有證據”*。另一方面,引用維基百科:
在精心設計的科學實驗中,即使是無效的結果也可能是缺席的證據。例如,如果沒有根據經驗發現重要的預測觀察結果,則假設可能會被證偽。(在這一點上,基本假設可能會被拒絕或修改,有時甚至可能需要額外的臨時解釋。)科學界是否會接受無效結果作為不存在的證據取決於許多因素,包括檢測能力應用方法、推理的置信度以及社區內的確認偏差。
因此,為了科學的進步,我們最終接受了證據的缺失作為缺失的證據。這也是兩個非常著名的類比的核心,即羅素的茶壺和卡爾薩根的車庫裡的龍。
**我的問題是:**根據貝葉斯概率論,我們如何正式證明缺乏證據可以合法地用作不存在的證據?在什麼條件下是真的?(答案預計取決於問題的具體細節,例如我們假設的模型、給定模型的觀察提供的信息增益或所涉及的競爭假設的先驗概率)。
(*) 格言的起源似乎要古老得多,參見例如this。
不看就看不到任何 X 和看卻看不到任何 X之間是有區別的。後者是“證據”,前者不是。
因此,正在測試的假設是“山後的那塊土地上有一隻獨角獸”。愛麗絲呆在原地,不看。如果場上有獨角獸,愛麗絲看不到獨角獸。如果田野裡沒有獨角獸,愛麗絲就看不到獨角獸。P(沒有看到獨角獸|是獨角獸)= P(沒有看到獨角獸|沒有獨角獸)= 1。當假設對觀察沒有影響時,觀察對假設的信念貢獻的“證據”為零。
鮑勃爬到山頂,俯視場地,並沒有看到獨角獸。如果該領域有獨角獸,鮑勃會看到它。如果該領域沒有獨角獸,鮑勃將看不到獨角獸。P(看不到獨角獸|是獨角獸) $ \neq $ P(看不到獨角獸|沒有獨角獸)。當假設的真假改變了觀察的概率時,就提供了證據。觀察和看到該領域沒有獨角獸是該領域沒有獨角獸的積極證據。
我們可以使用貝葉斯概率來量化證據。
$$ P(H_1|O)={P(O|H_1)P(H_1)\over P(O)} $$
$$ P(H_2|O)={P(O|H_2)P(H_2)\over P(O)} $$
在哪裡 $ H_1 $ 是“那個領域沒有獨角獸”。 $ H_2 $ 是“那個領域有獨角獸”,並且 $ O $ 是“我沒有看到獨角獸”。一個除一個:
$$ {P(H_1|O)\over P(H_2|O)}={P(O|H_1)\over P(O|H_2)}{P(H_1)\over P(H_2)} $$
取對數使乘法相加:
$$ \mathrm{log}{P(H_1|O)\over P(H_2|O)}=\mathrm{log}{P(O|H_1)\over P(O|H_2)}+\mathrm{log}{P(H_1)\over P(H_2)} $$
我們將其解釋為貝葉斯信念支持 $ H_1 $ 超過 $ H_2 $ 後觀察等於證據支持 $ H_1 $ 超過 $ H_2 $ 源於觀察加上貝葉斯信念支持 $ H_1 $ 超過 $ H_2 $ 觀察*前。*實驗產生的附加證據量化為:
$$ \mathrm{log}{P(O|H_1)\over P(O|H_2)} $$
愛麗絲沒有看,沒有證據。 $ \mathrm{log}(1/1)=0 $ . 鮑勃,通過看和不看,做到了。 $ \mathrm{log}(1/0)=\infty $ , 表示絕對確定。(當然,如果有 10% 的可能性在該領域有一隻看不見的獨角獸,那麼 Bob 的證據是 $ \mathrm{log}(1/0.1)=1 $ ,如果我們使用以 10 為底的對數。這使用一個稱為hartley的單位來表達信息。)
里斯的格言是基於人們聲稱宇宙中沒有獨角獸這樣的事情,因為他們只看了一小部分而沒有看到。嚴格來說,有非零證據由此產生,但接近於零,與搜索的時空體積除以宇宙體積的對數有關。
關於零假設實驗的問題,這裡的問題是,在給定一個開放的替代假設的情況下,我們通常無法量化觀察的概率。如果我們目前的理解是錯誤的並且某些未知的物理理論是正確的,那麼看到反應的概率是多少?
所以我們設置 $ H_2 $ 作為一個零假設,我們打算證偽,這樣在給定零的情況下觀察的概率非常低。我們假設 $ H_1 $ 限於未知的替代理論,在這些理論中觀察是合理可能的。
$$ \mathrm{log}{P(H_{alt}|O)\over P(H_{null}|O)}=\mathrm{log}{P(H_{alt}|O)\over 0.05}=\mathrm{log}(20\times P(H_{alt}|O))\approx \mathrm{log}20 $$
它需要對合理替代方案的存在做出一些明智的假設,但從貝葉斯的角度來看,與任何其他類型的證據都沒有任何不同。