Model-Selection
使用 LASSO 進行變量選擇,然後使用 Logit
我知道這會混淆統計推斷,但我真的只關心盡可能接近準確的模型。
我有一個二分結果變量,其中包含大量二分預測變量。我想我想嘗試使用 LASSO 來選擇我應該在我的模型中包含哪些變量,然後將這些選定的變量輸入到 Logit 回歸中。
當談到這種方法的實用性時,我是否忽略了什麼?
R 中有一個名為 glmnet 的包,可以為您擬合 LASSO 邏輯模型!這將比您正在考慮的方法更直接。更準確地說,glmnet 是 LASSO 和 Ridge 回歸之間的混合體,但您可以設置一個參數做一個純LASSO模型。由於您對邏輯回歸感興趣,您將設置 family=“binomial”。
你可以在這裡閱讀更多:http ://web.stanford.edu/~hastie/glmnet/glmnet_alpha.html#intro