Hypothesis-Testing

夏皮羅威爾克檢驗 W 是效應量嗎?

  • July 6, 2017

我想避免濫用正態性檢驗,因為足夠大的樣本量會突出任何輕微的非正態性。我想說一個分佈“足夠正常”。

當總體為非正態時,Shapiro-Wilk 檢驗的 p 值隨著樣本量的增加而趨於 0。p 值無助於確定分佈是否“足夠正常”。

我認為一個解決方案是測量非正態性的影響大小並拒絕任何比閾值更非正態的東西。

Shapiro Wilk 檢驗產生檢驗統計量. 這是衡量非正態性影響大小的一種方法嗎?

我通過對從均勻分佈中抽取的樣本進行 shapiro wilk 測試在 R 中對此進行了測試。樣本數量從 10 到 5000 不等,結果如下圖所示。W 的值確實收斂到一個常數,它不趨向於. 我不確定是否對小樣本有偏差,對於小樣本量似乎很低。如果是對效果大小的有偏估計,如果我想接受以下任何內容,這可能是一個問題作為“足夠正常”。

我的兩個問題是:

  1. 是衡量非正態性的影響大小?
  2. 是偏向於小樣本量?

陰謀

如你所知,是一個檢驗統計量。在大多數情況下(所有一致的測試),測試統計量不是合適的效果估計量,因為統計量反映了樣本量,而效果估計量應獨立於它。試想一下在中心極限定理下檢驗零均值的漸近檢驗:近似分佈對於所有,因此檢驗統計量甚至包含有關樣本量的所有信息。這使得檢驗統計量不適合作為效果估計器。

為了,它是相似的(儘管近似分佈也取決於樣本量)。下限為是, 在哪裡取決於是對最小階統計量的期望。

所以不,它根本不是合適的效果估計器。

事實上,我認為你還不確定你在尋找什麼,因為術語“效果”比一維參數的通常參數世界更難一些。在這裡,非正態分佈的原始效果是無限維的:可以有與正態分佈模型不同的概率。對於一維效果,您需要以某種方式對其進行加權,並了解各種權重對您的預期應用的影響。通過這種方式,您將決定例如具有高斯尾的某個雙峰分佈是否比具有重尾的某個單峰分佈更正常。事實上,將尾部行為與非尾部行為進行交易可能是發明合適效果的最相關問題。

然後,如果找到這個特定效果的估計器會容易得多。

引用自:https://stats.stackexchange.com/questions/289136

comments powered by Disqus