Bayesian

頻率統計中的主觀性

  • July 13, 2014

我經常聽到這樣的說法,即貝葉斯統計可能是高度主觀的。主要論點是推理取決於先驗的選擇(即使可以使用無差異原則或最大熵來選擇先驗)。相比之下,常客的統計數據通常更客觀。這句話有多少真實性?

此外,這讓我想知道:

  1. 頻率統計(如果有的話)有哪些具體元素可能特別主觀,在貝葉斯統計中不存在或不那麼重要?
  2. 貝葉斯統計中的主觀性是否比頻率統計中更普遍?

我經常聽到這樣的說法,即貝葉斯統計可能是高度主觀的。

我也是。但請注意,將某些事物稱為主觀存在很大的歧義。

主觀性(兩種感覺)

主觀可以意味著(至少)其中之一

  1. 取決於研究人員的特質
  2. 明確關注個人的知識狀況

貝葉斯主義在第二種意義上是主觀的,因為它總是提供一種通過以信息為條件來更新由概率分佈表示的信念的方法。(請注意,這些信念是某個主體實際擁有的信念還是只是一個主體可能擁有的信念與決定它是否是“主觀的”無關。)

主要論點是推理取決於先驗的選擇

實際上,如果先驗代表了您對某事的個人信念,那麼您幾乎可以肯定沒有選擇它,就像您選擇了大多數信念一樣。如果它代表了某人的信念,那麼它可以或多或少準確地代表這些信念,因此具有諷刺意味的是,它會在多大程度上代表它們,這將是一個相當“客觀”的事實。

(即使可以使用無差異原則或最大熵來選擇先驗)。

可以,儘管這並不傾向於非常順利地推廣到連續域。此外,可以說不可能同時在所有參數化中保持平坦或“冷漠”(儘管我一直不太確定您為什麼要這樣做)。

相比之下,常客的統計數據通常更客觀。這句話有多少真實性?

那麼我們如何評估這種說法呢?

我建議在第二種主觀意義上:它基本上是正確的。在第一個主觀意義上:它可能是錯誤的。

作為主觀的頻率論(第二種意義)

一些歷史細節有助於映射問題

對於 Neyman 和 Pearson 來說,只有歸納行為而不是歸納推理,並且所有統計評估都適用於估計器的長期採樣特性。(因此是 alpha 和功率分析,但不是 p 值)。這在兩種意義上都非常不主觀。

事實上,有可能,而且我認為非常合理,按照這些思路爭論頻率論實際上根本不是一個推理框架,而是所有可能的推理過程的評估標準的集合,強調它們在重複應用中的行為。簡單的例子是一致性、公正性等。這使得它在意義 2 上顯然是不主觀的。但是,當我們必須決定當這些條件不適用時該怎麼做時(例如,當沒有有一個無偏的估計量)或當它們適用但相互矛盾時。

費舍爾提供了一種不那麼客觀的頻率論,這很有趣。對於費舍爾來說,有一種叫做歸納推理的東西,從某種意義上說,一個主題,科學家,在數據分析的基礎上做出推理,由統計學家完成。(因此是 p 值,但不是 alpha 和功率分析)。然而,關於如何表現、是否繼續研究等的決定是由科學家根據她對領域理論的理解做出的,而不是由應用推理範式的統計學家做出的。由於這種費雪式的分工,主觀性(意義 2)和個體主體(意義 1)都位於科學方面,而不是統計方面。

從法律上講,費雪頻率論主觀的。只是主觀的主體不是統計學家。

有各種可用的這些合成方法,既可以在應用統計教科書中找到這兩者的幾乎連貫的組合,也可以在更細微的版本中找到,例如 Deborah Mayo 推動的“錯誤統計”。後者在意義 2 上是相當不主觀的,但在意義 1 上是高度主觀的,因為研究人員必須使用科學判斷 - Fisher 風格 - 來確定哪些錯誤概率很重要並且應該進行測試。

作為主觀的頻率主義(第一感覺)

那麼,頻率主義在第一種意義上是不是不太主觀?這取決於。任何推理過程都可能充滿實際應用的特質。所以也許問頻率主義是否鼓勵一種不那麼主觀(第一感覺)的方法更有用?我對此表示懷疑——我認為主觀(第二感覺)方法的自我意識應用會導致主觀(第一感覺)結果的減少,但無論哪種方式都可以爭論。

暫時假設主觀性(第一感覺)通過“選擇”潛入分析。貝葉斯主義似乎確實涉及更多的“選擇”。在最簡單的情況下,選擇總計為:一組用於頻率論的潛在特殊假設(似然函數或等效函數)和兩組貝葉斯假設(似然和對未知數的先驗)。

然而,貝葉斯主義者知道他們對所有這些選擇都是主觀的(在第二種意義上),因此他們對應該導致更少主觀性(在第一種意義上)的影響更有自我意識。

相比之下,如果一個人在一大本測試書中查找測試,那麼人們可能會覺得結果不那麼主觀(第一感覺),但可以說這是用其他人對問題的理解代替自己的結果. 目前尚不清楚人們是否以這種方式變得不那麼主觀,但可能會有這種感覺。我想大多數人都會同意這是無益的。

引用自:https://stats.stackexchange.com/questions/107817

comments powered by Disqus