Categorical-Data
有序協變量的編碼
我正在執行序數回歸,我有 5 個響應類別和幾個連續和分類的預測變量。我想添加一個分類但有序的預測器(1、2、3、4)。我認為對無序分類預測變量應用通常的虛擬編碼是不合適的,但是當我搜索如何編碼時,我沒有找到太多信息。在Steyerberg (2009)中提到了“線性編碼”或“假設預測效應的線性”,但沒有進一步的細節。這是否意味著我只是按原樣使用我的有序值,即將它們用作連續變量?
您可以查看Gertheiss 和 Tutz,使用 Ordinal Predictors 進行懲罰回歸,以及他們的 R 包ordPens。他們說:-
我們建議在估計過程中懲罰相鄰類別係數之間的差異,而不是通過簡單的最大似然方法來估計參數。背後的理由如下:響應假設自變量的兩個相鄰類別之間變化緩慢。換句話說,我們盡量避免跳高,更喜歡更平滑的係數向量。