Terminology

有 99 個百分位數還是 100 個百分位數?它們是一組數字,還是指向單個數字的分隔符或指針?

  • October 7, 2019

有 99 個百分位數還是 100 個百分位數?它們是一組數字,還是分隔線,還是指向單個數字的指針?

我想同樣的問題也適用於四分位數或任何分位數。

我已經讀過,給定 n 個項目,特定百分位數(p)處的數字的索引是 i = (p / 100) * n

這對我來說意味著有 100 個百分位……因為假設你有 100 個數字(i=1 到 i=100),那麼每個數字都會有一個索引(1 到 100)。

如果你有 200 個數字,就會有 100 個百分位數,但每個百分位數都是指一組兩個數字。或者 100 個分隔符,不包括最左邊或最右邊的分隔符 ‘cos,否則你會得到 101 個分隔符。或指向單個數字的指針,因此第一個百分位數將引用第二個數字,(1/100)*200=2 而百分位數將引用第 200 個數字 (100/100)*200=200

不過,我有時聽說有 99 個百分位數。

谷歌展示了牛津詞典,其中提到了百分位數——“根據特定變量的值的分佈,可以將人口分成的 100 個相等的組中的每一個”。和“將頻率分佈劃分為 100 個這樣的組的隨機變量的 99 個中間值中的每一個”。

維基百科說“第 20 個百分位是可以找到 20% 的觀察值以下的值”但它實際上是否意味著“低於或等於該值,可以找到 20% 的觀察值”即“20% 的觀察值” % 的值對它來說是 <= 的”。如果它只是 < 而不是 <=,那麼根據這種推理,第 100 個百分位數將是可以找到 100% 值的值。我聽說不能有 100% 的論據,因為你不能有一個低於 100% 的數字。但我認為也許你不能有第 100 個百分位的論點是不正確的,並且是基於一個錯誤,即百分位的定義涉及 <= 而不是 <。(或 >= 不 >)。所以百分位數將是最終數字,並且將是 >

百分位數四分位數等這兩種含義都被廣泛使用。 用四分位數最容易說明差異:

  1. “除法器”的含義——有 3 個四分位數,它們是將分佈(或樣本)分成 4 個相等部分的值:
  1   2   3
---|---|---|---

(有時這與包括最大值和最小值一起使用,因此有 5 個四分位數編號為 0-4;請注意,這與上面的編號不衝突,它只是擴展它。) 2. “bin”意義:有 4 個四分位數,這 3 個值將分佈(或樣本)劃分成的子集

1   2   3   4
---|---|---|---

這兩種用法都不能被合理地稱為“錯誤”:許多有經驗的從業者都在使用它們,並且都出現在大量權威來源(教科書、技術詞典等)中。

對於四分位數,所使用的含義通常從上下文中很清楚:談到第三個四分位數中的值只能是“bin”含義,而談到低於第三個四分位數的所有值最有可能意味著“分隔符”含義。對於百分位數,這種區別通常不太清楚,但對於大多數用途來說也不是那麼重要,因為分佈的 1% 是如此之小——窄條大約是一條線。說到*80% 以上的每個人,*可能意味著前 20% 或前 19%,但在非正式的環境中,這並不是主要的區別,在嚴謹的工作中,所需的含義大概應該由上下文的其餘部分來闡明。

(此答案的部分內容改編自https://math.stackexchange.com/questions/1419609/are-there-3-or-4-quartiles-99-or-100-percentiles,其中還提供了引用+參考。)

引用自:https://stats.stackexchange.com/questions/430391

comments powered by Disqus