Forecasting

Covid-19 的預測效果如何?

  • December 15, 2021

我希望這個問題在 CrossValidated 的範圍內(我認為是這樣,因為它最終是關於統計分析和機器學習的,我不是在尋找個人意見,而是在尋找評論或調查,例如基於預先註冊的預測):

背景

由於眾所周知的原因,例如行為變化或政策干預(這會導致與時間相關的繁殖率)或人群內的異質性(亞群之間的繁殖率不同),對像 Covid-19 這樣的流行病進行建模是很困難的。

鑑於這些挑戰以及提供準確預測的相關性,許多研究人員試圖提供運行良好的模型,以告知公眾和政策制定者未來 Covid-19 病例、住院和死亡的時間和規模。

問題

在經歷了近兩年的大流行之後:是否有科學共識對 Covid-19 病例的預測效果如何(例如,基於預先登記的預測)?如果某些類別的模型比其他模型工作得更好,有什麼實現嗎?

一些進一步的信息

International Journal of Forecasting中有一篇經常被引用的文章,標題*為“COVID-19 的預測失敗”*

流行病預測的記錄可疑,而 COVID-19 的失敗更加突出。數據輸入不佳、建模假設錯誤、估計的高度敏感性、缺乏流行病學特徵的結合、過去關於可用乾預措施效果的證據不足、缺乏透明度、錯誤、缺乏確定性、僅考慮問題的一個或幾個方面目前,缺乏關鍵學科的專業知識、群體思維和潮流效應以及選擇性報告是這些失敗的一些原因。

然而,至少有一位作者似乎在社區中受到爭議。因此,我不知道這篇文章是否反映了該領域的主流觀點。特別是因為似乎還有其他更積極的文章(至少關於短期預測):

結論 多模型預測的集合可以通過評估未來的資源需求和發病率和死亡率的預期人口影響,為應對 Covid-19 大流行的政策提供信息。

首先,很難評估在快速發展的領域是否存在共識。來自一個工作組的任何出版物或結果都可能(並且將、應該)受到其他研究人員的批評。Ioannidis 已經把踩到人們的腳趾變成了一種愛好,這一事實增加了這種效果(也使劇院變得更好)。

我個人非常重視約阿尼迪斯。從統計上看,他2005 年的首發步法並非火箭科學,而是以一種偉大的、公認的令人討厭的方式表達了統計應用中長期存在的主要問題。我不知道如果沒有他,心理學的可複制性危機是否會發生。

然而,他並不擅長於預測。再說一次,你引用的另一篇論文的作者也不是。這裡的線索很少。(此外,您鏈接的另一篇論文針對不變空模型測試他們的模型。這絕對是一個有用的基準,但還有其他簡單的基準會更有說服力。)

請注意,Taleb 等人對 Ioannidis 論文有明確的回答。(印刷中,IJF。塔勒布確實有更多的預測能力,他的主要觀點是評估在大流行病等情況下的預測表現有多麼*困難。*再加上你注意到的所有因素,比如預測之間的反饋循環、政治干預、人們的行為,這一切都變得非常困難。

您可能想看看最近的國際預測研討會。在2021 年會議上,有多個關於預測 COVID-19 的演講(以及其他關於在 COVID-19 的背景下進行預測的演講)。摘要聽起來像這樣:

Laura Coroneo,“測試 COVID-19 預測的預測準確性”

首先,在短期內(提前 1 週),沒有預測團隊的表現優於簡單的時間序列基準。其次,在更長的時間範圍內(提前 3 周和 4 週),預測者會更成功,有時甚至會超過基準。第三,表現最好的預測之一是整體預測,它使用統一的權重組合所有可用的預測。鑑於這些結果,收集廣泛的預測並將它們組合成一個整體預測對於衛生當局來說可能是一種更安全的方法,而不是依賴於少量的預測。

集成改進預測是預測者同意的少數幾件事之一。

Christos Emmanouilides,“預測 COVID-19:替代模型的大規模比較”

該研究提供了大量證據,表明在大約一個月的滾動窗口中估計的非參數回歸模型的預測總體上比其他模型的點預測更準確。

回想一下 Taleb 關於在存在肥尾的情況下從點預測中學習任何東西的困難的觀點。

我個人的看法是,到目前為止,關於哪種模型效果最好還沒有達成共識,而且專家越多,他們就越認識到即使提出和回答這個問題也非常困難。

引用自:https://stats.stackexchange.com/questions/556192

comments powered by Disqus