Time-Series
facebook 先知如何處理丟失的數據?
Prophet 論文(SJ Taylor 於 2017 年進行的大規模預測)對缺失數據說如下:
與 ARIMA 模型不同,測量值不需要有規律地間隔,我們不需要插入缺失值,例如去除異常值
但我想知道如果先知沒有插入缺失值,它會做什麼呢?它如何處理丟失的數據?
像 ARIMA 這樣的模型是根據滯後變量定義的,因此您需要後續點。Prophet ( Taylor and Letham, 2017 ) 是根據類回歸模型定義的
$$ y(t) =g(t) +s(t) +h(t) + \varepsilon_t $$
在哪裡
$ g(t) $ 是模擬時間序列值的非週期性變化的趨勢函數, $ s(t) $ 表示週期性變化(例如,每周和每年的季節性),以及 $ h(t) $ 表示在一天或多天可能不定期發生的假期的影響。誤差項 $ \varepsilon_t $ 表示模型不適應的任何特殊變化;稍後我們將做參數假設 $ \varepsilon_t $ 是正態分佈的。
趨勢函數 $ g(t) $ 是根據分段回歸、季節性 $ s(t) $ 使用傅里葉項和假日效應 $ s(t) $ 只是假人。沒有一個特徵需要你擁有所有的點,因為如果缺乏信息,它不會用它來估計任何東西,而只會在已知點之間進行插值。換一種說法,如果你有積分 $ a < b < c $ , 但 $ b $ 是未知的,那麼您仍然可以將直線(或曲線)擬合到 $ a $ 和 $ c $ 並插值 $ b $ . Prophet 所做的只是擬合許多不同的線(趨勢)、曲線(季節性)和常數(假人)並將它們組合在一起。