Regression

在線性回歸中使用循環預測器

  • April 26, 2015

我正在嘗試使用風數據 (0, 359) 和一天中的時間 (0, 23) 來擬合模型,但我擔心它們無法很好地擬合線性回歸,因為它們本身不是線性參數。我想使用 Python 轉換它們。我已經看到有人提到通過取度數的 sin 和 cos 來計算向量平均值,至少在風的情況下,但不是很多。

是否有可能有用的 Python 庫或相關方法?

風向(這里以度為單位,大概是從北方順時針方向的指南針方向)是一個循環變量。測試是音階的常規開頭與結尾相同,即. 當被視為預測變量時,它可能最好映射到正弦和余弦。無論您的軟件是什麼,它都可能期望以弧度為單位測量角度,因此轉換將相當於

鑑於弧度. 類似地,從午夜開始以小時為單位測量的時間可以映射到正弦和余弦,使用

或者

具體取決於時間的記錄方式或應如何解釋。

有時自然或社會是有義務的,並且對循環變量的依賴表現為某個方向對於響應是最佳的,而相反的方向(半個圓)是最壞的。在這種情況下,一個正弦和余弦項就足夠了;對於更複雜的模式,您可能需要其他術語。有關循環、傅立葉、週期性、三角回歸技術的更多詳細信息,可以在此處找到,並提供更多參考資料。好消息是,一旦您創建了正弦和余弦項,它們只是回歸中的額外預測變量。

有大量關於循環統計的文獻,其本身被視為方向統計的一部分。奇怪的是,這種技術通常沒有被提及,因為該文獻中的重點通常是循環響應變量。通過向量方法總結循環變量是一種標準的描述方法,但對於回歸不是必需的或直接有幫助的。

關於術語的一些細節風向和一天中的時間是統計術語變量,而不是參數,無論您在科學分支中使用什麼。

線性回歸由參數的線性定義,即對於向量預測它是參數的向量,而不是預測變量矩陣,這更關鍵。因此,在這種情況下,正弦和余弦等預測變量是在圓形尺度上測量的,並且也僅限於對它們出現在線性回歸中沒有障礙。

附帶評論對於諸如粒子濃度之類的響應變量,我希望使用具有對數鏈接的廣義線性模型來確保積極的預測。

引用自:https://stats.stackexchange.com/questions/148380

comments powered by Disqus