Regression

Facebook 的 Prophet 與線性回歸有什麼不同嗎?

  • July 12, 2019

所以我讀到的關於Facebook 先知的內容是,它基本上將時間序列分解為趨勢和季節性。例如,一個加法模型可以寫成:

$$ y(t) = g(t) + s(t) + h(t) + e_t $$

  • $ t $ 時間
  • $ g(t) $ 趨勢(可能是線性的或邏輯的)
  • $ s(t) $ 季節性(每天,每週,每年……)
  • $ h(t) $ 假期
  • $ e_t $ 錯誤

我的問題是:不能用簡單的線性回歸來完成嗎?如果我們比較它們,結果會有什麼不同,為什麼?

這裡的問題是得到一個方程,將觀察到的數據解析為信號和噪聲。如果您的數據很簡單,那麼您的回歸方法可能會奏效。應該注意理解他們對 Prophet 所做的一些假設。您應該更好地了解 Prophet 所做的事情,因為它不僅適合簡單的模型,而且還嘗試添加一些結構。

例如,我在閱讀了他們寫得很好的介紹後所做的一些思考可能會對您的評估有所幫助。如果我誤解了他們的方法,我提前道歉,如果是這樣,我希望得到糾正。

  1. 他們的主要例子有兩個趨勢斷點,但他們只捕捉到了最明顯的一個。

2)他們忽略任何和所有反映省略的隨機序列的ARIMA結構或使用Y的歷史值來指導預測的價值。

3)他們忽略了用戶建議的隨機和確定性序列的任何可能的動態(領先和滯後效應)。Prophet 的因果回歸效應只是同時代的。

  1. 沒有嘗試識別系列或季節性脈衝中的階躍/電平變化,例如由於某些未知的外部事件導致的星期一效應中途的變化。Prophet 假設“簡單的線性增長”,而不是通過檢查替代可能性來驗證它。有關這方面的一個可能示例,請參閱使用 Facebook Prophet 和 R 預測在線訂閱業務的重複訂單

  2. 正弦和余弦是一種處理季節性的不透明方式,而季節性影響,如星期幾、月份中的星期幾、月份中的星期、一年中的月份等在處理人為(處理人類!)影響時更有效/信息豐富。

建議年度模式的頻率為 365.25 幾乎沒有意義,因為我們不會在與去年完全相同的同一天執行相同的操作,而月度活動更加持久,但 Prophet 似乎沒有提供 11 個月度指標選項。每週 52 的頻率沒有什麼意義,因為我們每年都沒有 52 週。

6)沒有嘗試驗證錯誤過程是高斯的,因此可以進行有意義的顯著性測試。

  1. 不擔心模型誤差方差是均勻的,即,在特定時間點不會發生確定性變化,表明加權最小二乘。無需擔心找到最佳功率變換來處理與期望值成正比的誤差方差何時(以及為什麼)應該記錄(數字)分佈的對數?.

  2. 用戶必須預先指定事件/假期前後所有可能的領先和滯後影響。例如,每日銷售額通常在 11 月下旬開始增加,這反映了聖誕節的長期影響。

  3. 不用擔心由此產生的錯誤沒有結構,建議通過充分性診斷檢查來改進模型的方法。

10)顯然不關心通過刪除不重要的結構來改進模型。

  1. 沒有工具來獲得一系列模擬預測,其中置信限不一定是對稱的,通過引導模型的錯誤並允許可能的異常。

  2. 讓用戶對趨勢做出假設(趨勢斷點數和實際斷點數)允許在面對大規模分析時不需要/不可用的靈活性,其名稱是為免提大規模應用程序設計的。

引用自:https://stats.stackexchange.com/questions/417144

comments powered by Disqus