解釋回歸模型的方差
這可能是一個簡單的解釋(無論如何我希望如此)。
我使用回歸工具箱在 Matlab 中做了一些回歸分析。但是,我遇到了一項研究,該研究表明:
“使用回歸分析,可以建立一個預測模型,只使用四個聲音特徵來解釋 60% 的方差”
如果需要,文章的鏈接在這裡: 文章
我不是 100% 確定這意味著什麼,但我希望它是簡單的。還有60%是好事嗎?我試圖搜索這個,但因為在“方差”這個詞之前總是有一個百分比,所以很難找到答案。
我將嘗試用簡單的術語來解釋這一點。
回歸模型側重於因變量和一組自變量之間的關係。因變量是您嘗試使用一個或多個自變量來預測的結果。
假設您有這樣的模型:
Weight_i = 3.0 + 35 * Height_i + ε
現在一個明顯的問題是:這個模型的效果如何?換句話說,一個人的身高在多大程度上準確地預測或解釋了該人的體重?
在回答這個問題之前,我們首先需要了解我們觀察到的人們體重的波動有多大。這很重要,因為我們在這裡試圖做的是通過使用他們的身高來解釋不同人體重的波動(變化)。如果人們的身高能夠解釋這種體重變化,那麼我們就有了一個很好的模型。
方差是用於此目的的一個很好的指標,因為它衡量一組數字分散的距離(從它們的平均值開始)。
這有助於我們重新表述我們最初的問題:一個人的體重有多少變化可以用他/她的身高來解釋?
這就是“解釋百分比方差”的來源。順便說一句,對於回歸分析,它等於相關係數R-squared。
對於上面的模型,我們或許可以做出這樣的陳述:使用回歸分析,可以建立一個預測模型,使用一個人的身高來解釋60% 的體重變化”。
現在,60% 有多好?對此很難做出客觀的判斷。但是,如果您有其他競爭模型(例如,另一個使用一個人的年齡來預測他/她的體重的回歸模型),您可以根據它們解釋的差異程度來比較不同的模型,並決定哪個模型更好。(對此有一些警告,請參閱“解釋和使用回歸”——Christopher H. Achen http://www.sagepub.in/books/Book450/authors)