Hypothesis-Testing

是否有任何具有非常低功效的“深奧”統計檢驗?

  • February 16, 2019

背景

在計算機科學、數學,有時在其他領域,“深奧”的例子不僅有趣,而且有助於說明某些概念,例如:

我目前正在準備一些關於使用假設檢驗的教學,並認為進行具有非常低功效(但沒有其他缺陷)的檢驗將有助於說明統計功效的概念。(當然,我仍然需要自己決定一個給定的例子是對我的聽眾有教育意義還是只是令人困惑。)

實際問題

是否有任何故意低功率的統計測試,更具體地說:

  • 該檢驗符合假設檢驗的一般框架,即它適用於零假設,有要求,並返回一個(正確的)p 值。
  • 它不打算/建議用於嚴肅的應用。
  • 它的功效非常低(由於故意的設計缺陷,而不是由於樣本或效應量低)。

如果您可以從根本上爭辯說這樣的測試不存在,我也會認為這是對我的問題的有效答案。另一方面,如果存在大量此類測試,我對最具教學效率的測試感興趣,即它應該易於訪問並具有顯著的效果。

請注意,我並不是要求對統計錯誤(櫻桃採摘等)或類似錯誤進行一般選擇。

到目前為止我發現了什麼

互聯網搜索對我沒有任何回報。

每次構建這樣的東西的嘗試都以一些(有用的)現有測試結束,或者格式不是常規測試的格式。例如,我想測試一個總體是否具有正中位數,如果所有樣本都是正數,則僅返回是;但該測試不返回p 值,因此不適合通常的測試框架。如果我只是將正負號算作檢驗統計量(並相應地計算p 值),我最終會得到符號 test,這是一個合理的檢驗。

(與@Scortchi 的評論有關)

認為 $ X \sim N(\mu, 1) $ 我們想檢驗這個假設

$$ \begin{align*} H_0&: \mu = 0 \ H_1&: \mu \neq 0 \end{align*} $$

為了 estoricism,讓我們用一個獨立的“硬幣翻轉”來擴充我們的數據 $ Z \sim Bernoulli(p) $ 在哪裡 $ p $ 已知且不小於顯著性水平 $ \alpha $ (IE $ p \in [\alpha, 1] $ )。考慮以下形式的拒絕區域:

$$ R = \left{(X, Z) \ | \ z = 1 \ \wedge |x| > \Phi^{-1}\left(\frac{\alpha}{2p}\right) \right} $$

通過構造,這是對大小的有效測試 $ \alpha $ .

$$ \begin{align*} P(X\in R \ | \ \mu=0) &= P\left(Z=1 \ , \ |X| > \Phi^{-1}\left(\frac{\alpha}{2p}\right)\right) \ &= P(Z=1)P\left(|X| > \Phi^{-1}\left(\frac{\alpha}{2p}\right)\right) \ &= p\frac{\alpha}{p} = \alpha \end{align*} $$

然而,這個測試的​​力量永遠不會超過 $ p $ . 例如,假設我們觀察到的數據是 $ (x, z) = (1000000, 0) $ . 顯然應該拒絕原假設,但由於我們的硬幣“顯示尾巴”,我們無法拒絕原假設。環境 $ p=\alpha $ 導致一個更愚蠢的例子,其中拒絕區域不依賴於 $ X $ 完全沒有,但仍然是一個有效的拒絕區域,大小 $ \alpha $ .

通過將拒絕區域中的交集更改為並集,可以將類似的問題作為作業給出。這個區域的力量都比沒有的區域弱 $ Z $ ,但在冪沒有上限的意義上更合理。

引用自:https://stats.stackexchange.com/questions/392800

comments powered by Disqus