Effect-Size
什麼是效果大小……為什麼它甚至有用?
我有入門級的研究生水平的統計學背景(假設我在本科階段就知道數理統計和概率(例如,Wackerly 等人,Ross 的概率),並且有一些測度論知識)。
我最近開始從事教育統計方面的實驗設計和統計報告工作,並被分配到一個項目中,我基本上是在評估學校的問責制指標,並且必須分析數據,提出更改等。請注意,我是唯一的我係的一位具有數理統計背景的人。
在我看來,人們強烈建議使用效果大小來衡量項目的有效性。我唯一一次聽說過效應量是從我的朋友那裡聽說的,他學習心理學。我的印像是
**與傳統的假設檢驗相比,這個指標有什麼用處,我為什麼要關心它?**對我來說,它看起來只不過是兩個樣本的檢驗統計量-測試。除了可能把所有東西都放在同一個尺度上(這就是為什麼有人真正“規範化”任何東西)之外,我根本不認為這很有用,但我認為測試統計數據(這對我來說是效果大小)已經過時了, 和- 值是首選。
這是衡量效果大小的一種方法,但還有許多其他方法。這當然不是檢驗統計量。您對效應大小的測量通常稱為 Cohen 的(嚴格來說,只有當 SD 是通過 MLE 估計時才是正確的——即,沒有Bessel 的校正);更一般地說,它被稱為“標準化平均差”。也許這會更清楚地表明:
那就是 ”“在標準化平均差的公式中缺失。 更一般地說,從值中提取樣本量可以提供真實的信息。假設真實效果並不完全 到無限小數位,你可以達到你可能喜歡的任何程度的重要性. 這-value 提供了有關我們在拒絕原假設方面的信心程度的信息,但通過將影響的大小與您擁有的數據量相結合來做到這一點。很高興知道我們是否應該拒絕零假設,但也很高興知道您的教育干預的效果是否為學童帶來了巨大的收益,或者是微不足道的,並且只是由於大.