Regression

以幾何方式理解 Lasso 回歸的稀疏性

  • June 24, 2019

每當有人寫有關 Lasso 和 Ridge 回歸的文章時,您都可以用圓圈或菱形繪製此圖。

在此處輸入圖像描述

在菱形(Lasso 回歸)的情況下,總是說明 Lasso 將係數之一強制為 0。因此它引入了稀疏性。我以某種方式理解它,但是每當我看到圖表時,我的疑慮就會回來。為什麼不能這樣畫:

在此處輸入圖像描述

顯然,在這種情況下,沒有一個係數被強制為零。兩者都可以取-1和1之間的數字。我錯過了什麼?我的畫一定是錯的,但我不明白為什麼他們總是畫這樣它就會擊中 $ \beta_1=0 $

編輯:

剛剛找到這個報價:

但是,套索約束在每個軸上都有角,因此橢圓通常會在軸上與約束區域相交

是這樣嗎?它會經常與約束區域相交,但不是必須的?不能把我的頭繞過去。我只能想像,在更高維度的情況下,撞到角落變得更有可能甚至不可避免。

圍繞你的點的每個圓圈 $ \beta $ 實際上是第 3 維的等值線,即向上,並且這條線上的每個點都具有相同的損失函數值。你可以畫出無數條這樣的線,因為這些線是對應該是表面的東西的視覺簡化。

回答你的問題:再畫一條額外的等值線,你會得到一個與你的正方形頂點相交的等值線。

套索強制參數立即為零是不正確的……正確的是套索導致參數作為函數的函數漸近地收斂到零 $ \alpha $ 套索係數。

這是此類圖表上參數的實際路徑的圖片:取自Lasso 回歸特徵選擇

在此處輸入圖像描述

這是一個不同的可視化,取自:Graphical path Coordinate Descent in case of semi-differentiable functions,例如3D中的 Lasso

在此處輸入圖像描述

引用自:https://stats.stackexchange.com/questions/414491

comments powered by Disqus