Hypothesis-Testing

什麼是夏皮羅-威爾克的 CDFWWW統計?

  • August 21, 2018

我試圖了解 Shapiro-Wilk 測試的功能。到目前為止,我遇到了以下鏈接:

夏皮羅威爾克體重表中的值是如何計算的?

它解釋瞭如何計算 shapiro-wilk 測試中的係數。然後:

夏皮羅-威爾克檢驗:正態性檢驗

它解釋了計算檢驗統計量的例程,並提供了一個用於計算 p 值的腳本。在我看來,我將測試與標準 t 測試進行比較,其中測試統計量具有一定的 CDF,它可以幫助我們計算 p 值。在夏皮羅-威爾克測試的情況下,我無法弄清楚這一點。

有許多正常性測試。其中一些基於數據的 QQ 圖(正態概率圖),根據各種標準測量 QQ 圖的“接近線性”程度。

**Shapiro-Wilk 測試的直觀視圖。**在 QQ 圖的目視檢查中,真正正常樣本的極值似乎會過度偏離直線。這是三個正常大小樣本的 QQ 圖 對於每個隨機樣本情節的中心部分似乎非常接近線性,但尾巴看起來“有點搖擺不定”。

在此處輸入圖像描述

(這些不是精心挑選的例子,它們是set.seed根據今天日期在 R 中的陳述產生的前三個大小為 500 的正常樣本。)夏皮羅-威爾克檢驗的一個特點是它傾向於“降低”觀察值在兩條尾巴。三個 P 值shapiro.test分別為 0.3218225、0.7221126 和 0.8429852(均高於 0.05);所以所有三個樣本都與正常人群的抽樣一致。

set.seed(822)
shapiro.test(rnorm(500))$p.value
[1] 0.3218225
shapiro.test(rnorm(500))$p.value
[1] 0.7221126
shapiro.test(rnorm(500))$p.value
[1] 0.8429852

您可以在此站點上以及更普遍的在線上查看有關計算 Shapiro-Wilk 檢驗統計量的技術細節的討論。但是出於您的目的,也許這個直觀的描述將是一個有用的開始。

**夏皮羅-威爾克檢驗的力量。**正如NIST 手冊(及其參考文獻)中所述,與其他正態性測試相比,Shapiro-Wilk 測試以其對各種替代方案的高功效而聞名。

為了理解權力,您必須牢記特定的顯著性水平和非正態分佈。學生的 t 分佈自由度(重尾對稱,和分佈 (右偏,形狀有點接近正常,如下圖所示。

在此處輸入圖像描述

我的印像是,特定情況下的功率通常是通過模擬獲得的。R中的以下模擬顯示了Shapiro-Wilk正態性檢驗在5%水平上針對大小樣本的這兩種替代分佈中的每一種的近似功效當數據來自替代分佈時,冪是拒絕的概率。各自的功率值約為 65% 99% 以上[和迭代可以預期大約兩位精度。]

set.seed(818);  m = 10^5;  n = 500
p.val = replicate(m, shapiro.test(rt(n, 10))$p.val)
mean(p.val < 0.05)
[1] 0.65474

set.seed(2018);  m = 10^5;  n = 500
p.val = replicate(m, shapiro.test(rgamma(n, 10, 10))$p.val)
mean(p.val < 0.05)
[1] 0.99978

**附錄:P 值。**傳統上,Shapiro-Wilk 檢驗的顯著性是使用檢驗統計量的表值確定的現代軟件程序中使用的 P 值似乎主要歸功於 Patrick Royston 在Applied Statistics: (1982) Vol. 上發表的工作。31, 115-124 和 176-180, 和 (1995) Vol. 44, 547-551。[參見R 文檔中的參考資料shapiro.test。] 1982 年的第二篇論文擴展了 P 值的算法以適應一般的方法是找到一個可用的變換來做檢驗統計大約正常。目前,R 接受具有大小的數據集 但是,不能保證上述 P 值的最佳精度

模擬可以提供一個關於零分佈的直觀概念對於一個特定的在 R 中,代碼set.seed(1234); rnorm(500)生成大小的標準正態樣本R給出的具有 p 值

模擬分佈為了我們使用下面的程序:

set.seed(1234); x = rnorm(500);  w.obs=shapiro.test(x)$stat
set.seed(2018);  m = 10^5;  n = 500
w = replicate(m, shapiro.test(rnorm(n))$stat)
mean(w < w.obs)
[1] 0.28396

下面的直方圖顯示了模擬的分佈連同觀測值對於我們的樣本,P 值約為 0.2848。

在此處輸入圖像描述

來自具有連續檢驗統計量的檢驗的精確 P 值的零分佈是如果我們運行與上述類似的模擬,但捕獲 P 值(而不是測試統計數據),我們可以看到 Shapiro-Wilk P 值與這種均勻分佈有多接近。因為我們的 P 值不是基於連續測試統計並且不完全正確,所以我們並不完全適合製服。[最左邊的 P 值欄(拒絕)大約有面積]

在此處輸入圖像描述

引用自:https://stats.stackexchange.com/questions/363285

comments powered by Disqus