Distributions

抽樣分佈是否合法進行推理?

  • January 30, 2014

一些貝葉斯主義者攻擊頻率論推斷,稱“沒有唯一的抽樣分佈”,因為它取決於研究人員的意圖(Kruschke、Aguinis 和 Joo,2012,第 733 頁)。

例如,假設一名研究人員開始收集數據,但在 40 名參與者之後,他的資金意外中斷。在這裡如何定義抽樣分佈(以及後續的 CI 和 p 值)?我們是否只是假設每個組成樣本都有 N = 40?或者它是否由具有不同 N 的樣本組成,每個樣本的大小由他的資金可能被削減的其他隨機時間決定?

教科書中的 t、F、卡方(等)、零分佈都假設 N 對於所有組成樣本都是固定且恆定的,但在實踐中可能並非如此。對於每個不同的停止程序(例如,在某個時間間隔之後或直到我的助手累了),似乎都有不同的採樣分佈,並且使用這些“經過驗證的真實”固定 N 分佈是不合適的。

這種批評對常客 CI 和 p 值的合法性有多大破壞性?有理論上的反駁嗎?似乎通過攻擊抽樣分佈的概念,頻率論推理的整個大廈是脆弱的。

非常感謝任何學術參考。

通常,您會根據實際樣本量進行推斷,因為它是感興趣的參數的輔助;即它不包含有關其真實值的信息,只會影響您可以測量它們的精度。Cox (1958),“與統計推斷相關的一些問題”,Ann。數學。統計學家。 29 , 2通常被引用為首先解釋有時被稱為條件性原則的東西,儘管它在更早的工作中是隱含的,讓人回想起費舍爾的“相關子集”的想法。

如果您的研究人員的資金因迄今為止的結果令人失望而被切斷,那麼當然不是輔助的。也許最簡單的問題說明是從二項式(固定試驗次數)或負二項式(固定次數)抽樣方案估計伯努利概率。兩者的充分統計量相同,但分佈不同。你將如何分析一個你不知道遵循哪個實驗的實驗?Berger & Wolpert (1988),似然原則討論了這個和其他停止規則對推理的影響。

您可能想考慮如果不考慮任何抽樣分佈會發生什麼。Armitage (1961), “Comment on ‘Consistency in Statistical Inference and Decision’ by Smith”, JRSS B, 23 ,1指出,如果你抽樣從正態分佈直到, 檢驗均值的似然比對比是,因此研究人員可以通過適當選擇. 只有頻繁分析才能考慮在這種看似不公平的抽樣方案下的似然比分佈。參見Kerridge (1963) 的回應,“誤導性貝葉斯推論的頻率界限”,Ann。數學。統計。, 34 , Cornfield (1966), “順序試驗、順序分析和似然原理”, The American Statistician , 20 , 2 , & Kadane (1996), “推理已成定局”, JASA , 91 , 435

指出頻率論推理對研究人員意圖的依賴是對那些對貝葉斯推理的“主觀性”大發雷霆的人(如果還有的話)進行方便的挖掘。就個人而言,我可以忍受它;一個程序在一系列重複中的執行總是或多或少是概念性的,這並沒有減損它是一個值得考慮的有用的東西(“可能性的校準”是 Cox 描述 p 值的方式)。從參考文獻的日期開始,您可能已經註意到這些問題並不是很新;通過先驗論證來解決它們的嘗試在很大程度上已經消失(除了在互聯網上,除了在瑣碎的事情上總是落後於時代)&

PS:想為 Berger & Wolpert 添加一個平衡點,我偶然發現了Cox & Mayo (2010),“Objectivity and Conditionality inFrequentist Inference” in Error and Inference。在我斷言辯論已經平息時,很可能存在一廂情願的想法,但令人驚訝的是,在半個世紀左右之後,關於這個問題幾乎沒有什麼新的說法。(儘管如此,這是對常客思想的簡潔而雄辯的辯護。)

引用自:https://stats.stackexchange.com/questions/83934

comments powered by Disqus