偏度和峰度公式的證明/推導

August 12, 2014

誰能向我解釋偏度或峰度公式的來源？（我的意思是它的推導。）它背後的邏輯是什麼？誰證明了？

你不應該期待證據，因為偏度和峰度是有些模糊的概念。

對稱性在數學上是精確的，但相比之下，偏度卻出奇的滑。峰度也許更是如此。

已經有相當多的嘗試給出與這些概念相對應的措施，但這些經常有用的措施有時會令人驚訝地違反直覺。例如，當分佈不對稱時，基於矩的偏度可能為零（與閱讀討論偏度的基本文本時經常會發現的斷言相矛盾）。

誰能向我解釋偏度或峰度公式的來源？

偏度和峰度都是一些模糊的術語，有幾種不同的度量。

如今，人們主要指的是基於矩的度量，分別基於標準化的第三和第四矩。

一些歷史

應用於概率分佈的術語“偏度”從最初的外觀似乎起源於 Karl Pearson，1895. 他首先談到不對稱。

應用於概率分佈的術語“峰度”似乎也起源於 Karl Pearson，1905.

Pearson 有矩峰度和矩偏度平方的公式 (和) 在他 1895 年的論文中，它們在某種意義上被用來幫助描述形狀，儘管峰度的概念在那裡並沒有特別發展。

然而，比第二個更高（標準化）的時刻可以被認為是某種形狀的度量或至少是偏離常態的想法似乎比這更早。

請特別注意尼克考克斯文章中包含的歷史信息,這裡, 這表明我們應該優先考慮 Thiele (1889).

但是，除了基於矩的量之外，還有其他度量。例如，在偏度的情況下，有Pearson 的第一和第二偏度係數，它們基於分別縮放均值和眾數與均值和中值之間差異的簡單概念。（我認為這些也可以追溯到 1895 年的論文，但我沒有檢查過。）

這些與同一基本概念相關的不同度量可以暗示完全不同的事物（甚至符號相反）。例如看這裡。可以在這裡看到對過度解釋矩峰度保持謹慎的原因

編輯：附加信息——

似乎米勒等人在最早已知的一些數學詞的使用中關於**偏度和峰度的條目。同意我的觀點，它們似乎分別起源於 1895 年和 1905 年的卡爾·皮爾遜。

很高興得到某種程度的確認。

我的意思是，為什麼偏度被定義為第三個中心矩，而不是第五個或任何其他數字？其背後的邏輯是什麼？

好的，所以我們專門處理矩偏度。

首先，為什麼第三個時刻是有道理的。讓我們首先以某種直觀的方式考慮偏度，而不是依賴正式的定義，看看它可能意味著什麼。

回想起那個代表一種“典型”的觀測值與平均值的距離，並考慮當我們採用對稱分佈並使其更右偏時會發生什麼（同時試圖保持該區域，和持續的）：

在這裡，我們將軸分為四個區域 - 大致位於低於平均值一個標準差、低於平均值一個標準差、低於平均值一個標準差和高於平均值一個標準差 - 部分到分別。

對於偏度的輕微增加，我們傾向於在均值左側看到相對更多的概率（區域) 遠高於平均值 (區域)，而在均值上方看到的較少（區域）和遠低於（地區）。

事實上，如果我們試圖保持面積不變，如果我們抬起遠尾（右端)，我們被迫在其他地方有更少的可能性。但是，如果我們想保持均值不變，我們必須在更低的某個地方有更多的概率。如果我們將補償概率代入“"（降低和) 我們可以保持面積和均值不變，但我們最終會得到一個對稱的變化（實際上，我們會增加方差，而不是使其更偏斜）。

我們舉不起來因為同時舉起和將平均值向上移動。

所以如果我們抬起右尾巴（)，在保持面積、均值和標準差不變的情況下，我們可以提升概率以及，並減少其他兩個 - 如果我們在這些區域內獲得相對數量和位置。保持幾乎恆定的約束我們所做的比我真正描述的要多（圖表有點不准確，如圖所示，）。

因此，為了使它看起來更正確一點，我們傾向於按照大致在這些區域中描述的方式進行移動。

但是，如果我們嘗試構建一個簡單的基於矩的度量，這意味著什麼？請注意，使用第三個中心矩，在要么會傾向於減少它，而更多的區域要么會傾向於增加它（其他條件相同），但正如我們所見，我們不能在不把它帶走的情況下增加面積。將 1 以上的東西拉出比 1 以下的立方體可以“拉入”更多，所以如果我們添加同時帶走，三階矩仍會增加。同樣，如果我們添加同時帶走，第三時刻將再次趨於增加。也就是說，我們剛剛得出的粗略的“偏度增加”似乎與第三時刻非常吻合。

現在這個討論根本不排除第五個和更高的時刻 - 實際上，第三個時刻的增加也會傾向於增加第五個（除非你確實非常小心地這樣做），但是（標準化的）第三個時刻將是最簡單的使用基於矩的度量來捕獲偏度概念的方法；而第五個時刻更複雜，並且可以以無法像第三個時刻那樣捕捉我們的偏斜感的方式移動。

第三個標準化時刻並不完全符合我們的偏斜感，但它是一個非常好的、簡單的度量，大部分都符合它。

我發現的唯一解釋是，由於均值是數據的中心，將其提高到奇次冪會取消該項，如果數據分佈是對稱的，最終答案將為零，如果不是對稱的，則最終答案將為零。這是真的？

1）儘管在基本處理中很容易找到這樣的評論**，但嚴格來說，就概率分佈而言，這兩個部分實際上都不是真的。

a) 分佈可能是對稱的，但三階矩不為零。一個簡單的反例是具有 3 個或更少自由度的任何 t 分佈。然而，在樣本中，對稱性意味著零三次矩——但樣本幾乎從來都不是完全對稱的，所以在那裡也沒有多大用處。

b) 非對稱分佈的三階矩可能為零。

所以對稱並不一定意味著零三階矩，零三階矩不一定意味著對稱。

2）在任何情況下，這都不能解釋“為什麼是第三次而不是第五次”，因為五次方和三次方一樣奇怪。

**（確實，因為經常有人問我是否會推荐一本書，第二部分（即聲稱暗示對稱性）是我在評估一本初級書籍是否值得更仔細研究時使用的幾個“快速測試”之一——如果一篇文章偶然發現了兩個或多個我傾向於看到的常見基本錯誤，我不會浪費更多時間尋找。）

參考

[1]: Pearson, K. (1895),

“Contributions to the Mathematical Theory of Evolution, II: Skew Variation in Homogeneous Material,”

Philosophical Transactions of the Royal Society , Series A, 186, 343-414

[版權所有。在這裡免費提供]

[2]: Pearson, K. (1905),

“Das Fehlergesetz und Seine Verallgemeinerungen Durch Fechner und Pearson.”, a rejoinder (Skew variation, a rejoinder),

Biometrika , 4 (1905), pp. 169–212。

[雖然這也完全不受版權保護（例如，我可以找到 3 年後的 Biometrika 的副本），但我找不到可以鏈接到的副本。Oxford Journals 想要在一天內收取 38 美元的費用，以獲取長期不受版權保護的內容。如果您沒有機構訪問提供訪問權限的地方之一，那麼您可能在這個地方不走運。]

[3]: Cox, NJ (2010),

“Speaking Stata: The limits of sample skewness and kurtosis”,

The Stata Journal , 10 , Number 3, pp. 482–495（可在此處在線獲取）

[4]: Thiele, TN (1889),

Forlæsinger over Almindelig Iagttagelseslære: Sandsynlighedsregning og Mindste Kvadraters Methode，

哥本哈根：CA Reitzel。[出於版權。有英文翻譯 - 請參閱 [3] 中的 Thiele 參考資料。]

[5]：米勒，傑夫；等人，（2014 年 8 月 16 日訪問），

一些數學詞彙的最早已知用途，

請參見此處

引用自：https://stats.stackexchange.com/questions/111596

comments powered by Disqus

偏度和峰度公式的證明/推導

相關問答

泊松分佈的原始推導是什麼？

Westfall 說，“峰度的比例由中央決定μ±σμ±σmupmsigma範圍通常很小”但反過來是真的嗎？

參考：誰引入波浪號“~”表示“有概率分佈……”？

支持向量機是作為一種有效訓練神經網絡的方法而開發的嗎？

術語“逆概率”究竟是什麼意思？

與標準高斯隨機變量相比，重尾分佈是否具有更高的峰度？