Variance
從箱線圖中推斷方差
我想知道如何使用箱線圖推斷變量的方差。觀察它們的箱線圖是否至少可以推斷出兩個變量是否具有相同的方差?
不是沒有很多嚴格的假設,沒有。如果你假設答案是肯定的(而不是問,我為你鼓掌),我敢打賭我可以用這個(反)例子來欺騙你:
set.seed(1);boxplot(rnorm(10000),c(-3,-2.65,rep((-2:2)*.674,5),2.65,3))
看起來很相似,對吧?然而 $ \sigma^2_1=1,\sigma^2_2=1.96 $ !
如果從代碼中不清楚,人口
2
是:-3.000 -2.650 -1.348 -0.674 0.000 0.674 1.348 -1.348 -0.674 0.000 0.674 1.348 -1.348 -0.674 0.000 0.674 1.348 -1.348 -0.674 0.000 0.674 1.348 -1.348 -0.674 0.000 0.674 1.348 2.650 3.000
不,你不能僅僅因為它完全對稱就推斷出這個人口是正常的。這是人口的QQ圖
2
:
在我看來當然不正常。
編輯 - 回复您的評論:
方差是一個數字統計量。如果兩個分佈的方差實際上是相等的,那麼這幾乎就是您要說的所有內容。如果兩個分佈完全是正態分佈,那麼它們都會有一個數學定義。如果兩個分佈不完全正態或方差不相等,則不應另說。如果您想說它們大致相等或正常,您可能應該以適合您的目的的方式定義“足夠近似”,您沒有在此處指定。在通常激發像您這樣的問題的分析中,對分佈差異的敏感性差異很大。例如,一個參數 $ t $ -test 假設具有相等方差的正態分佈(儘管在給定相同樣本量的情況下,它對違反後者相當穩健),因此我不建議將該測試用於比較我的總體
2
與總體1
(正態分佈)。