Time-Series

預測泊松、準確度和預測區間

  • March 24, 2016

我正在嘗試根據組預測Poisson數據,分為1-26 months of data組。匯集的數據65% has a value of 025% a value of 1. 我找不到任何趨勢或季節性,所以我開始測試幾個不同的固定模型。Moving average (3), Moving Average (6),和. Simple Exponential Smoothing_Naïve``Simple Mean

我需要提前 1-6 個月預測並使用MADMSERMSE測試模型的準確性。看起來最準確的是 Simple Mean,帶有 anRMSE of 1和 an MAD of 0,638。我認為這真的很高,但我不知道該怎麼做。

有沒有我沒想到的預測方法會更好?我在看什麼嗎?

關於預測區間,我唯一能找到的是F+ts和作為預測,作為 t 分佈和作為標準差。它認為它不是一個真正值得信賴的來源,但由於我找不到其他任何東西,我不確定如何設置這些預測間隔。這個方法對嗎?F-ts``F``t``alfa (n-2)``s

我沒有 R 可以使用。我需要自己做。

您有所謂的間歇性需求,即以“許多”零為特徵的需求時間序列。(如果您的時間序列本身不是需求,那麼下面的大部分內容仍然適用。)因此,在網絡上搜索“預測間歇性需求”已經很有幫助。Teunter 和 Duncan (2009, JORS)概述了間歇性需求預測方法。

預測間歇性需求的標準方法是 Croston 方法。分別對需求間間隔和非零需求規模使用指數平滑。那麼點預測是平滑的非零需求與平滑的需求間間隔的比率。Syntetos 和 Boylan (2001, IJPE)注意到 Croston 有點偏頗並提出了修改,但這通常不會在實踐中產生太大的影響。

另一種方法是整數自回歸移動平均模型 (INARMA),它修改了標準 ARIMA 時間序列模型。Maryam Mohammadipour 就這些問題寫了一篇論文

我個人對這種預期點預測的有用性有很大的懷疑。每隔一個時間段有 1 個需求的時間序列的期望值為 0.5……每四個時間段有 2 個需求的時間序列也是如此……依此類推——當然,這些是越來越少的 Poisson-y . 我認為了解需求的整個未來(和預測性)分佈更有用。所以我為你尋找預測區間鼓掌!

然而您發現的公式僅適用於連續數據的單指數平滑,通過 ARIMA 模型 SES 是最佳的。所以不適合統計數據。我寧願建議你接受你的點預測並使用帶參數的泊松分佈的分位數. 這仍然忽略了參數估計的不確定性(以及模型選擇的不確定性等),但這是一種簡單的可能性,並且可能比您擁有的公式更好。

Shenstone 和 Hyndman (2005, JoF)指出,沒有一致的隨機模型可以使 Croston 的方法是最優的 - 所有候選模型都是 (1) 連續的,而不是離散的,並且 (2) 可以產生負值。然而,對於那些候選模型,Shenstone 和 Hyndman 提供了預測區間。

最後,提醒一句:不要使用 MAD 來評估計數數據預測的準確性,尤其是對於間歇性需求。預期的 MAD 會被您未來分佈的中位數(而不是其均值)最小化,如果您寫出 65% 的數據為零,那麼中位數為零……這意味著您可能會得到最低的 MAD零預測,這是嚴重的偏見,可能無用。這是我在去年的國際預測研討會上就這個問題發表的演講。或者看看Morlidge (2015, Foresight)

最後一段無恥的自我推銷:我在 IJF(Kolassa,2016 年)上發表了一篇文章,著眼於預測低容量數據(主要是間歇性的),採用不同的準確度度量和不同的預測方法,包括各種 Poisson 模型。這可能對您有用。

引用自:https://stats.stackexchange.com/questions/203446

comments powered by Disqus