Spss

峰度定義的差異及其解釋

  • June 14, 2013

我最近意識到 SPSS 和 Stata 提供的峰度值存在差異。

http://www.ats.ucla.edu/stat/mult_pkg/faq/general/kurtosis.htm

我的理解是,因此對相同的解釋會有所不同。

關於如何處理這個問題的任何建議?

三個公式

不同程序通常使用三個峰度公式。我將說明所有三個公式(,和) 和使用它們的程序。

許多教科書中使用的第一個公式和典型定義是(這是您提供的鏈接中的第二個公式)

在哪裡表示樣本矩

有時,在該公式中添加了 -3 的校正項,因此正態分佈的峰度為 0。項為 -3 的峰度公式稱為超峰度(您提供的鏈接中的第一個公式)。

第二個公式是(由 SAS、SPSS 和 MS Excel 使用;這是您提供的鏈接中的第三個公式)

在哪裡是第一個公式中定義的峰度。

第三個公式是(MINITAB 和 BMDP 使用)

在哪裡是無偏樣本方差

R峰度可以使用包中的kurtosis函數計算e1071(鏈接在這裡)。該選項type確定三個公式中的哪一個用於計算(1 =, 2=, 3=).

這兩篇論文討論並比較了所有三個公式:第一第二

公式之間的差異總結

  1. 使用,正態分佈的峰度值為 3,而在涉及校正項 -3 的公式中(即和),正態分佈的超峰度為 0。
  2. 是**對正常樣本產生****無偏估計**的唯一公式(即正常情況下為零,或).
  3. 對於**大樣本,**公式之間的差異可以忽略不計,選擇並不重要。
  4. 對於**來自正態分佈的小樣本,**三個公式在均方誤差 (MSE)方面的關係為:. 所以有最小和最大的(雖然只有是公正的)。那是因為三個公式中方差最大的:.
  5. 對於非正態分佈的小樣本,三個公式在偏差方面的關係為:. 就均方誤差而言:. 所以三個公式中均方誤差最小,偏差最小。具有最大的均方誤差和偏差。
  6. 對於大樣本() 從非正態分佈中,三個公式在偏差方面的關係為:. 就均方誤差而言:.

另請參閱有關峰態的Wikipedia 頁面MathWorld 頁面。

引用自:https://stats.stackexchange.com/questions/61740

comments powered by Disqus