Quantiles

我們可以說 50% 的數據將在 25-75% 之間嗎?

  • July 31, 2018

假設我們有以下數據框:

      TY_MAX
141  1.004622
142  1.004645
143  1.004660
144  1.004672
145  1.004773
146  1.004820
147  1.004814
148  1.004807
149  1.004773
150  1.004820
151  1.004814
152  1.004834
153  1.005117
154  1.005023
155  1.004928
156  1.004834
157  1.004827
158  1.005023
159  1.005248
160  1.005355

25th: 1.0031185409705132
50th: 1.004634349800723
75th: 1.0046683578907745
Calculated 50th: 1.003893449430644

我在這裡有點困惑。如果我們得到第 75 個百分位,則 75% 的數據應該低於該百分位。如果我們可以達到第 25 個百分位,那麼 25% 的數據應該低於第 25 個。現在我在想 50% 的數據應該在 25 到 50 之間。而且第 50 個百分位數給了我不同的價值。很公平,這意味著 50% 的數據應該低於這個值。但我的問題是我的方法是否正確?

編輯:我們也可以說 98% 的數據將在百分位的第 1-99 位之間嗎?

是的。

  • 75% 的數據低於第 75 個百分位。
  • 25% 的數據低於第 25 個百分位。
  • 因此,50% (=75%-25%) 的數據介於兩者之間,即介於第 25 和第 75 個百分位數之間。
  • 完全類似,98% 的數據位於第 1 和第 99 個百分位數之間。
  • 數據的下半部分,同樣是 50%,低於第 50 個百分位。

這些數字可能並不完全正確,尤其是在您的數據數量較少的情況下。另請注意,關於如何實際計算分位數和百分位數有不同的約定

引用自:https://stats.stackexchange.com/questions/359992

comments powered by Disqus