P-Value
LASSO 回歸 - p 值和係數
我已經在 R 中使用
cv.glmnet
. 我想為選擇的係數生成 p 值。我發現 boot.lass.proj 可以生成引導 p 值 https://rdrr.io/rforge/hdi/man/boot.lasso.proj.html
雖然該
boot.lasso.proj
程序產生了 p 值,但我認為它正在做自己的套索 - 但我沒有看到獲得係數的方法。將 p 值
hdi
用於由 產生的係數是否安全cv.glmnet
?
為了擴展 Ben Bolker 在對另一個答案的評論中指出的內容,頻率論者p值對 LASSO 中的回歸係數意味著什麼的問題一點也不簡單。您測試係數值的實際零假設是什麼?您如何考慮 LASSO 對來自同一群體的多個樣本執行的這一事實可能會返回完全不同的預測變量集,尤其是在實踐中經常看到的相關預測變量類型?您如何考慮您已將結果值用作模型構建過程的一部分,例如在交叉驗證或您用於選擇懲罰水平以及保留預測變量數量的其他方法中?
這些問題在本網站上進行了討論。此頁面是一個很好的起點,其中包含指向
hdi
您提到的 R 包的鏈接以及指向該selectiveInference
包的鏈接,這也在此頁面上進行了討論。稀疏的統計學習在第 6 章中介紹了 LASSO 的推理,並參考了幾年前的文獻。請不要簡單地將這些或任何其他 LASSO 方法返回的p值用作簡單的即插即用結果。重要的是要考慮為什麼/是否需要p值以及它們在 LASSO 中的真正含義。如果你的主要興趣是預測而不是推理,那麼預測性能的衡量標準對你和你的聽眾來說會更有用。