Time-Series
術語“時間序列分析”和“縱向數據分析”有什麼區別
在談到縱向數據時,我們可能會反復引用從同一受試者/研究單位隨時間收集的數據,因此同一受試者內的觀察結果存在相關性,即受試者內相似性。
當談到時間序列數據時,我們也指的是在一系列時間收集的數據,它似乎與上面提到的縱向設置非常相似。
我想知道是否有人可以在這兩個術語之間提供明確的說明,有什麼關係以及有什麼區別?
我懷疑是否有廣泛的數據分析師同意的嚴格、正式的定義。
然而,一般而言,時間序列意味著在很長一段時間內定期觀察到的單個研究單元。一個典型的例子是一個國家幾十年甚至一百多年的年 GDP 增長。對於為私營公司工作的分析師來說,這可能是公司整個生命週期內的每月銷售收入。因為有很多觀察結果,所以對數據進行了非常詳細的分析,尋找不同時期的季節性(例如,每月:在人們獲得報酬後的月初銷售量增加;每年:11 月和12 月,當人們在聖誕節購物時),以及可能的政權更迭。正如@StephanKolassa 所說,預測通常非常重要。
縱向通常是指在大量研究單元上進行較少的測量。一個典型的例子可能是藥物試驗,其中有數百名患者在基線(治療前)測量,接下來的 3 個月每月測量一次。在本例中,每個單元只有 4 個觀察值,無法嘗試檢測時間序列分析人員感興趣的特徵類型。另一方面,患者可能隨機分為治療組和對照組,因果關係可以推斷一次不獨立問題已得到解決。正如這表明的那樣,不獨立通常被認為幾乎是一種麻煩,而不是主要的興趣特徵。