Normality-Assumption
我可以對偏斜和非正態數據使用 Z 分數嗎?[關閉]
我一直在處理一些流程週期時間數據並使用標準 z 分數進行縮放,以便在整個週期時間的各個部分之間進行比較。
由於數據嚴重右偏/非正態,我應該使用其他轉換嗎?(“異常值”永遠不會花費負時間,並且通常需要比“平均”更長的時間)
使用 z 分數似乎仍然“有效”……
############### # R code ############### mydata <- rweibull(1000,1,1.5) hist(mydata) hist(scale(mydata))
如果 X 高度偏斜,則 Z 統計量將不會呈正態分佈(如果必須估計標準偏差,則為 t。因此 Z 的百分位數將不是標準正態。所以從這個意義上說它不起作用。