Data-Visualization
小提琴情節解讀
我正在使用小提琴圖比較不同組的分佈,但是我發現的大多數在線資源都與如何製作圖和結果的非常基本的解釋有關(中值變化,數據是否聚集)。
我正在尋找可以遵循的詳細示例,作為正確解釋小提琴圖的指導方針。
小提琴圖只是一個直方圖(或者更常見的是一個平滑的變體,如核密度),它被翻轉並鏡像。任何教你如何解釋直方圖的教科書都應該給你你所尋求的直覺。 根據 Nick Cox 的建議進行編輯: Freedman、Pisani、Purves、Statistics涵蓋直方圖。
就以更正式的方式解釋它們而言,繪製分佈圖的重點是查看統計測試可能會被愚弄的東西。
我喜歡用小提琴圖做的一件事是為中位數、平均值等添加線條。有時我會疊加一個箱線圖,這樣我就可以看到更多的匯總統計信息。
至少,您應該能夠在最初的幾分鐘(均值、離散度、偏度、峰度)以及雙峰和異常值中找出任何嚴重偏差。