Regression
以幾何方式理解 Lasso 回歸的稀疏性
每當有人寫有關 Lasso 和 Ridge 回歸的文章時,您都可以用圓圈或菱形繪製此圖。
在菱形(Lasso 回歸)的情況下,總是說明 Lasso 將係數之一強制為 0。因此它引入了稀疏性。我以某種方式理解它,但是每當我看到圖表時,我的疑慮就會回來。為什麼不能這樣畫:
顯然,在這種情況下,沒有一個係數被強制為零。兩者都可以取-1和1之間的數字。我錯過了什麼?我的畫一定是錯的,但我不明白為什麼他們總是畫這樣它就會擊中 $ \beta_1=0 $
編輯:
剛剛找到這個報價:
但是,套索約束在每個軸上都有角,因此橢圓通常會在軸上與約束區域相交
是這樣嗎?它會經常與約束區域相交,但不是必須的?不能把我的頭繞過去。我只能想像,在更高維度的情況下,撞到角落變得更有可能甚至不可避免。
圍繞你的點的每個圓圈 $ \beta $ 實際上是第 3 維的等值線,即向上,並且這條線上的每個點都具有相同的損失函數值。你可以畫出無數條這樣的線,因為這些線是對應該是表面的東西的視覺簡化。
回答你的問題:再畫一條額外的等值線,你會得到一個與你的正方形頂點相交的等值線。
套索強制參數立即為零是不正確的……正確的是套索導致參數作為函數的函數漸近地收斂到零 $ \alpha $ 套索係數。
這是此類圖表上參數的實際路徑的圖片:取自Lasso 回歸特徵選擇
這是一個不同的可視化,取自:Graphical path Coordinate Descent in case of semi-differentiable functions,例如3D中的 Lasso