R

QQ 圖中使用的 qqline 的正式定義

  • August 18, 2018

我正在做一些分佈擬合工作,我正在研究 QQ 圖以及如何在視覺上使用它們來解釋擬合優度。

我的數據是重尾的,所以我最初關注的是 Weibull、對數正態、帕累托和對數邏輯分佈。

對於 Weibull 分佈,我了解 QQ 圖上的點是如何構造的(使用觀察數據的分位數與估計的 Weibull 分佈的分位數)。我不清楚的是如何計算/構造QQ圖中使用的線。

qqplot() 函數的R 文檔提供了以下描述:

qqnorm 是一個通用函數,其默認方法生成 y 中值的正常 QQ 圖。qqline 將一條線添加到“理論”,默認情況下是正常的分位數 - 分位數圖,它通過概率分位數,默認情況下是第一和第三四分位數。

Cross Validated 上的另一篇文章似乎表明,這條線本質上是一條由理論(估計)分佈的參數構成的線。這是一個真實的陳述和正確的解釋嗎?

如果可以提供正式定義的鏈接,我將非常感激。

有點“兩者” - 該線取決於觀察到的分位數(定義 QQ 圖的 y 軸)和預期/理論/參考分位數(定義 x 軸)。文檔(您引用的)應始終作為規範參考:

‘qqline’ 將一條線添加到“理論”,默認情況下是正常的分位數 - 分位數圖,它通過 ‘probs’ 分位數,默認情況下是第一和第三四分位數。

如果有疑問,USTL(“使用源代碼,盧克”),可以在這裡找到:這裡有一個稍微刪節和註釋的版本

## quantiles (.25 and 0.75 by default) of data
y <- quantile(y, probs, names=FALSE, type=qtype, na.rm = TRUE)
## quantiles of reference/theoretical distribution
x <- distribution(probs)
## ...
slope <- diff(y)/diff(x)  ## observed slope between quantiles
int <- y[1L]-slope*x[1L]  ## intercept
abline(int, slope, ...)   ## draw the line

對於它的價值,我相信使用這種方法(連接中心分位數的線)是因為它滿足以下探索/診斷方法的標準:

  • 快速(例如無需進行線性回歸,只需找到分位數並畫一條直線)
  • 健壯(它只取決於分佈中心部分的行為,不會被奇怪的尾巴甩掉)

引用自:https://stats.stackexchange.com/questions/362840

comments powered by Disqus