Quantiles
我們可以說 50% 的數據將在 25-75% 之間嗎?
假設我們有以下數據框:
TY_MAX 141 1.004622 142 1.004645 143 1.004660 144 1.004672 145 1.004773 146 1.004820 147 1.004814 148 1.004807 149 1.004773 150 1.004820 151 1.004814 152 1.004834 153 1.005117 154 1.005023 155 1.004928 156 1.004834 157 1.004827 158 1.005023 159 1.005248 160 1.005355 25th: 1.0031185409705132 50th: 1.004634349800723 75th: 1.0046683578907745 Calculated 50th: 1.003893449430644
我在這裡有點困惑。如果我們得到第 75 個百分位,則 75% 的數據應該低於該百分位。如果我們可以達到第 25 個百分位,那麼 25% 的數據應該低於第 25 個。現在我在想 50% 的數據應該在 25 到 50 之間。而且第 50 個百分位數給了我不同的價值。很公平,這意味著 50% 的數據應該低於這個值。但我的問題是我的方法是否正確?
編輯:我們也可以說 98% 的數據將在百分位的第 1-99 位之間嗎?
是的。
- 75% 的數據低於第 75 個百分位。
- 25% 的數據低於第 25 個百分位。
- 因此,50% (=75%-25%) 的數據介於兩者之間,即介於第 25 和第 75 個百分位數之間。
- 完全類似,98% 的數據位於第 1 和第 99 個百分位數之間。
- 數據的下半部分,同樣是 50%,低於第 50 個百分位。
這些數字可能並不完全正確,尤其是在您的數據數量較少的情況下。另請注意,關於如何實際計算分位數和百分位數有不同的約定。