Regression

線性回歸過時了嗎?[關閉]

  • September 26, 2017

我目前正在上線性回歸課程,但我無法擺脫這樣一種感覺,即我所學的內容與現代統計學或機器學習不再相關。當如今這麼多有趣的數據集經常違反線性回歸的許多不切實際的假設時,為什麼要花這麼多時間對簡單或多元線性回歸進行推理?為什麼不使用支持向量機或高斯過程在更靈活、更現代的工具上教授推理?雖然比在空間中尋找超平面更複雜,但這不會為學生提供更好的背景來解決現代問題嗎?

確實,線性回歸的假設是不現實的。然而,這適用於所有統計模型。“所有模型都是錯誤的,但有些模型是有用的。”

我猜您的印像是,當您可以使用更複雜的模型時,沒有理由使用線性回歸。這不是真的,因為一般來說,更複雜的模型更容易受到過度擬合的影響,並且它們使用更多的計算資源,這在您嘗試在嵌入式處理器或 Web 服務器上進行統計時很重要。更簡單的模型也更容易理解和解釋;相比之下,神經網絡等複雜的機器學習模型往往或多或少地成為黑匣子。

即使有一天線性回歸不再實用(在可預見的未來這似乎極不可能),它在理論上仍然很重要,因為更複雜的模型往往以線性回歸為基礎。例如,為了理解正則化混合效應邏輯回歸,您需要先了解普通的舊線性回歸。

這並不是說更複雜、更新和更閃亮的模型沒有用或不重要。他們中的許多人都是。但更簡單的模型適用範圍更廣,因此更重要,如果您要展示各種模型,那麼首先展示顯然是有意義的。這些天來,自稱“數據科學家”之類的人進行了很多糟糕的數據分析,但他們甚至不知道基本的東西,比如置信區間到底是什麼。不要做統計!

引用自:https://stats.stackexchange.com/questions/305116

comments powered by Disqus