Quantiles

為什麼 1 個中位數低於另一個中位數這一事實並不意味著第 1 組中的大多數人小於第 2 組中的大多數人?

  • September 10, 2017

我相信下面的箱線圖可以解釋為“大多數男性比大多數女性快”(在這個數據集中),主要是因為男性時間中位數低於女性時間中位數。但是關於 R 和統計的 EdX 課程的測驗告訴我這是不正確的。請幫助我理解為什麼我的直覺不正確。

這是問題:

讓我們考慮 2002 年紐約市馬拉鬆比賽的完賽者的隨機樣本。這個數據集可以在 UsingR 包中找到。加載庫,然後加載 nym.2002 數據集。

library(dplyr)
data(nym.2002, package="UsingR")

使用箱線圖和直方圖比較男性和女性的完成時間。以下哪項最能描述這種差異?

  1. 男性和女性的分佈相同。
  2. 大多數男性比大多數女性快。
  3. 男性和女性具有相似的右偏分佈,前者向左移動 20 分鐘。
  4. 兩種分佈均呈正態分佈,平均相差約 30 分鐘。

以下是男性和女性的紐約馬拉鬆比賽時間,如分位數、直方圖和箱線圖:

# Men's time quantile
     0%      25%      50%      75%     100% 
147.3333 226.1333 256.0167 290.6375 508.0833

# Women's time quantile
     0%      25%      50%      75%     100% 
175.5333 250.8208 277.7250 309.4625 566.7833

男性和女性時間 - 直方圖

男女時代——箱線圖

我認為您被標記為不正確的原因與其說是您對多項選擇題的回答是錯誤的,不如說是選項 3“男性和女性與前者俱有相似的右偏分佈,向左移動了 20 分鐘”本來是一個更好的選擇,因為它根據所提供的信息提供了更多信息。

引用自:https://stats.stackexchange.com/questions/302347

comments powered by Disqus