R

如何解讀QQ圖

  • June 5, 2014

我正在使用一個小數據集(21 個觀察值),並且在 R 中有以下正常的 QQ 圖:

在此處輸入圖像描述

看到該圖不支持正態性,我可以推斷出基本分佈嗎?在我看來,更偏向右側的分佈會更合適,對嗎?此外,我們還能從數據中得出什麼其他結論?

如果這些值沿著一條線分佈,則分佈具有與我們假設的理論分佈相同的形狀(直至位置和比例)。

局部行為:當查看 y 軸上的排序樣本值和 x 軸上的(近似)預期分位數時,我們可以通過查看是否值或多或少比理論分佈在該圖的該部分中假設的集中:

四個QQ地塊中的部分

正如我們所看到的,較不集中的點增加越來越多,集中點的增加速度比整體線性關係所暗示的要慢,並且在極端情況下對應於樣本密度的差距(顯示為接近垂直的跳躍)或常量值的峰值(水平對齊的值)。這使我們能夠發現重尾或輕尾,因此偏度大於或小於理論分佈,依此類推。

整體外觀:

這是 QQ 圖的平均樣子(對於特定的分佈選擇):

在此處輸入圖像描述

但是隨機性往往會使事情變得模糊,尤其是對於小樣本:

在此處輸入圖像描述

請注意,在 $ n=21 $ 結果可能比那裡顯示的要多變——我生成了幾組這樣的六個圖,並選擇了一個“不錯”的集合,您可以在其中同時看到所有六個圖中的形狀。有時直的關係看起來是彎曲的,彎曲的關係看起來是直的,重尾看起來是歪斜的,等等——對於這麼小的樣本,情況通常可能不太清楚:

在此處輸入圖像描述

可以識別出比那些特徵更多的特徵(例如離散性,例如),但是 $ n=21 $ ,即使是這樣的基本特徵也可能很難被發現;我們不應該試圖“過度解釋”每一個小小的擺動。隨著樣本量變大,一般來說,圖“穩定”並且特徵變得更清晰可解釋而不是表示噪聲。[對於一些非常重的分佈,即使在相當大的樣本量下,罕見的大異常值也可能會阻止圖片很好地穩定。]

當您嘗試決定您應該擔心多少曲率或擺動時,您可能還會發現此處的建議很有用。

一般而言,更適合解釋的指南還包括以更小和更大的樣本大小顯示。

引用自:https://stats.stackexchange.com/questions/101274

comments powered by Disqus