統計模型中非線性的標準和決策是什麼?
我希望以下一般性問題是有意義的。請記住,出於這個特定問題的目的,我對引入非線性的理論(學科領域)原因不感興趣。因此,我將製定完整的問題如下:
出於理論(學科領域)以外的原因,將非線性引入統計模型的邏輯框架(標準,如果可能,還有決策過程)是什麼? 與往常一樣,也歡迎相關資源和參考資料。
模型構建過程涉及模型構建者做出許多決策。其中一項決定涉及在不同類別的模型中進行選擇以進行探索。可以考慮多種類型的模型;例如,ARIMA 模型、ARDL 模型、多源錯誤狀態空間模型、LSTAR 模型、Min-Max 模型等等。當然,某些模型類別比其他模型更廣泛,並且發現某些模型類別是其他模型的子類別並不常見。
鑑於問題的性質,我們可以主要關注兩類模型;線性模型和非線性模型。
考慮到上述情況,我將開始從統計和方法論的角度解決 OPs 問題,即何時採用非線性模型是有用的,以及是否有這樣做的邏輯框架。
首先要注意的是線性模型是非線性模型的一個小子類。換句話說,線性模型是非線性模型的特例。該聲明有一些例外,但就目前的目的而言,我們不會因為接受它以簡化問題而損失太多。
通常,模型構建者將選擇一類模型,然後通過採用某種方法從該特定類中選擇一個模型。一個簡單的例子是當一個人決定將時間序列建模為 ARIMA 過程,然後按照 Box-Jenkins 方法從 ARIMA 模型類中選擇一個模型。以這種方式工作,使用與模型族相關的方法,是一個實際需要的問題。
決定建立非線性模型的一個結果是,與從較小的線性模型集中進行選擇相比,模型選擇問題變得更大(必須考慮更多的模型並面臨更多的決策),因此有一個真實的手頭的實際問題。此外,甚至可能沒有完全開發的方法(已知、接受、理解、易於溝通)來使用,以便從一些非線性模型系列中進行選擇。此外,構建非線性模型的另一個缺點是線性模型更易於使用,並且它們的概率屬性更廣為人知(Teräsvirta、Tjøstheim 和 Granger (2010))。
也就是說,OP 要求指導決策的統計依據,而不是實際或領域理論依據,所以我必須繼續。
在考慮如何處理選擇使用哪些非線性模型之前,必須首先決定是使用線性模型還是非線性模型。*決定!*如何做出這個選擇?
通過訴諸Granger 和 Terasvirta (1993),我採用以下論點,對以下兩個問題的回答主要有兩點。
*問:建立非線性模型什麼時候有用?*簡而言之,當線性模型的類別已經被考慮並且被認為不足以表徵所檢查的關係時,建立非線性模型可能是有用的。這種非線性建模過程(決策過程)可以說是從簡單到一般,從線性到非線性。
*問:是否有統計依據可用於證明建立非線性模型的合理性?*如果一個人決定根據線性測試的結果建立一個非線性模型,我會說,是的,有。如果線性測試表明關係中沒有明顯的非線性,則不建議建立非線性模型;測試應該在決定構建之前。
我將通過直接參考 Granger 和 Terasvirta (1993) 來充實這些觀點:
在建立非線性模型之前,最好先確定線性模型是否能夠充分錶徵所分析的[經濟]關係。如果是這種情況,那麼建立合理模型的統計理論將比非線性模型更合適。此外,如果模型是線性的,那麼獲得未來多個時期的最佳預測會簡單得多。至少在時間序列很短的情況下,儘管變量之間的真實關係是線性的,但調查人員可能會成功估計非線性模型。因此,不必要地使模型構建複雜化的危險是真實存在的,但可以通過線性測試來減少。
在最近的一本書 Teräsvirta、Tjøstheim 和 Granger (2010) 中,給出了同樣的建議,我現在引用:
從實踐的角度來看,[因此]在嘗試估計更複雜的非線性模型之前測試線性是有用的。在許多情況下,從統計的角度來看,測試甚至是必要的。許多流行的非線性模型未在線性下識別。如果生成數據的真實模型是線性的,而人們感興趣的非線性模型嵌套了該線性模型,則非線性模型的參數無法一致地估計。因此,線性測試必須先於任何非線性建模和估計。
讓我以一個例子結束。
在商業周期建模的背景下,使用統計依據來證明構建非線性模型的實際示例可能如下。由於線性單變量或向量自回歸模型無法生成不對稱的周期性時間序列,因此可以考慮處理數據中的不對稱性的非線性建模方法。關於數據可逆性的這個例子的擴展版本可以在Tong (1993)中找到。
如果我過於關注時間序列模型,請道歉。但是,我確信其中一些想法也適用於其他環境。