Nonparametric
可以使用 bootstrap 代替非參數測試嗎?
我對統計相當陌生。自舉的概念讓我感到困惑。
我知道使用某些測試(例如 t 檢驗)需要抽樣分佈的正態性。在數據不是正態分佈的情況下,通過在 SPSS 的 t 檢驗中請求“引導”,這會規避非正態性問題嗎?如果是這樣,輸出中報告的 t 統計量是否基於自舉抽樣分佈?
此外,在我有非正態數據的情況下,與使用 Mann-Whitney 或 Kruskal-Wallis 等非參數測試相比,這會是一個更好的測試嗎?在數據不正常且我使用引導程序的情況下,我不會報告 t 統計量:對嗎?
bootstrap 無需像正態性這樣的假設即可工作,但當樣本量較小且總體不正常時,它可能會發生很大變化。因此,在假設成立的意義上,它可能會更好,但並不是在所有方面都更好。
帶替換的引導樣本,不帶替換的置換測試樣本。Mann-Whitney 和其他非參數檢驗實際上是置換檢驗的特例。我實際上更喜歡這裡的置換檢驗,因為您可以指定一個有意義的檢驗統計量。
使用哪種測試的決定應基於所回答的問題和有關導致數據的科學的知識。中心極限定理告訴我們,即使總體不正常,我們仍然可以從 t 檢驗中獲得非常好的近似值。近似值的好壞取決於總體分佈(而不是樣本)的形狀和样本量。在許多情況下,對於較小的樣本,t 檢驗仍然是合理的(在某些情況下,在非常大的樣本中它不夠好)。