Distributions

在左偏數據中,均值和中位數之間的關係是什麼?

  • March 9, 2014

我認為中位數意思是。

是這樣嗎?

這是一個不平凡的問題(肯定不像提出這個問題的人認為的那樣微不足道)。

困難最終是由於我們並不真正知道“偏度”是什麼意思——很多時候它是顯而易見的,但有時它真的不是。鑑於在不平凡的情況下很難確定我們所說的“位置”和“分佈”的含義(例如,當我們談論位置時,平均值並不總是我們的意思),更微妙的像偏度這樣的概念至少是一樣滑的。因此,這導致我們嘗試各種代數定義來解釋我們的意思,但它們並不總是相互一致。

  1. 如果您通過第二個 Pearson 偏度係數來測量偏度,則均值 ( $ \mu $ ) 將小於中位數 ( $ \stackrel{\sim}{\mu} $ - 即在這種情況下你有它倒退)。

(人口)第二個皮爾遜偏度是$$ \frac{3(\mu-\stackrel{\sim}{\mu})}{\sigma},, $$並且將是負數(“左偏”) $ \mu<\stackrel{\sim}{\mu} $ .

這些統計數據的樣本版本的工作方式類似。

在這種情況下,平均值和中位數之間存在必要關係的原因是因為這就是定義偏度度量的方式。

這是一個左偏密度(通過第二個 Pearson 度量和下面 (2) 中更常見的度量):

在此處輸入圖像描述

中位數以綠色標記在下邊緣,平均值以紅色標記。

所以我希望他們希望你給出的答案是平均值小於中位數。對於我們傾向於命名的各種分佈,通常就是這種情況。

(但請繼續閱讀,看看為什麼作為一般性陳述實際上並不正確。)


  1. 如果您通過更常見的標準化三次矩來測量它,那麼通常但並非總是如此,平均值將小於中位數。

也就是說,可以構建相反的情況,或者一個偏度度量為零而另一個不為零的示例。

也就是說,均值、中位數和矩偏度的位置之間沒有必然的關係。

例如,考慮以下示例(相同的示例可以構造為離散概率分佈):

 2.7 15.0 15.0 15.0 30.0 30.0

mean: 17.95
median: 15

均值大於中值,但第三矩偏度係數為負(即,根據它的燈光,我們有左偏數據),因為與均值的偏差的立方和為負。

所以從這個意義上說,左偏,但均值>中值。

(另一方面,如果將上面示例中的 2.7 更改為 3,那麼您有一個矩偏度為零的示例,但平均值超過中位數。如果您將其設為 3.3,則矩偏度為正, 並且平均值超過中位數 - 即最終處於“預期”方向。)

如果您使用第一個 Pearson 偏度而不是上述任何一個定義,您會遇到與這種情況類似的問題 - 偏度的方向通常不會確定平均值和中位數之間的關係。


編輯:回答評論中的問題 - 平均值和中位數相等但矩偏度為負的示例。考慮以下數據(如前所述,它也算作離散總體的示例;考慮將數字寫在骰子的表面上)。

1  5  6  6  8 10

均值和中位數均為 6,但偏離均值的立方和為負,因此三階矩偏度為負。

引用自:https://stats.stackexchange.com/questions/89382

comments powered by Disqus