Anova
閱讀盒須圖:可以收集組間的顯著差異嗎?
假設我們正在查看這個盒須圖:
在星期四和星期五之間,我認為大多數人都會同意睡眠時間似乎存在顯著差異。不過,這是一個在統計上有效的猜想嗎?由於週四和周五的內四分位範圍都沒有重疊,我們能否辨別出顯著差異?星期四和星期五的上下鬍鬚分別重疊的事實呢?這會影響我們的分析嗎?
通常伴隨這樣的圖表會是某種方差分析,但我只是好奇我們可以通過查看 boxplot來說明組之間的差異。
不,你不能。如果您有樣本量和大量經驗,您可能能夠猜測 - 您猜測的準確性將取決於(除了效應量之外)樣本量。如果每組 N = 1,000,000,則意義重大。如果每組 N = 10,則不是那麼多。每組 100 個,很難猜到。
我認為這是一件好事。與箱線圖有關的事情不是試圖猜測統計顯著性,而是查看正在發生的事情並嘗試對其進行推理。唔。週末多睡覺。這很有趣,但並不令人驚訝。我們可以將睡眠時間建模為周末與否的函數。或者我們可以嘗試看看這種模式是否有所不同。也許退休的人沒有這種模式?輪班工人呢?週末上班的人?每週工作 7 天的人?
正如我最喜歡的研究生院教授(赫爾曼弗里德曼)曾經說過的:“停止研究!”