Spss
峰度定義的差異及其解釋
我最近意識到 SPSS 和 Stata 提供的峰度值存在差異。
見http://www.ats.ucla.edu/stat/mult_pkg/faq/general/kurtosis.htm
我的理解是,因此對相同的解釋會有所不同。
關於如何處理這個問題的任何建議?
三個公式
不同程序通常使用三個峰度公式。我將說明所有三個公式(,和) 和使用它們的程序。
許多教科書中使用的第一個公式和典型定義是(這是您提供的鏈接中的第二個公式)
在哪裡表示樣本矩:
有時,在該公式中添加了 -3 的校正項,因此正態分佈的峰度為 0。項為 -3 的峰度公式稱為超峰度(您提供的鏈接中的第一個公式)。
第二個公式是(由 SAS、SPSS 和 MS Excel 使用;這是您提供的鏈接中的第三個公式)
在哪裡是第一個公式中定義的峰度。
第三個公式是(MINITAB 和 BMDP 使用)
在哪裡是無偏樣本方差:
R
峰度可以使用包中的kurtosis
函數計算e1071
(鏈接在這裡)。該選項type
確定三個公式中的哪一個用於計算(1 =, 2=, 3=).公式之間的差異總結
- 使用,正態分佈的峰度值為 3,而在涉及校正項 -3 的公式中(即和),正態分佈的超峰度為 0。
- 是**對正常樣本產生****無偏估計**的唯一公式(即正常情況下為零,或).
- 對於**大樣本,**公式之間的差異可以忽略不計,選擇並不重要。
- 對於**來自正態分佈的小樣本,**三個公式在均方誤差 (MSE)方面的關係為:. 所以有最小和最大的(雖然只有是公正的)。那是因為三個公式中方差最大的:.
- 對於非正態分佈的小樣本,三個公式在偏差方面的關係為:. 就均方誤差而言:. 所以三個公式中均方誤差最小,偏差最小。具有最大的均方誤差和偏差。
- 對於大樣本() 從非正態分佈中,三個公式在偏差方面的關係為:. 就均方誤差而言:.
另請參閱有關峰態的Wikipedia 頁面和MathWorld 頁面。