Time-Series
自舉殘差:我做對了嗎?
首先: 據我了解,引導殘差的工作原理如下:
- 將模型擬合到數據
- 計算殘差
- 對殘差重新採樣並將它們加到 1。
- 將模型擬合到 3 中的新數據集。
- 重複
n
次數,但始終將重新採樣的殘差添加到從 1 開始的擬合中。到目前為止是正確的嗎?
我想做的是略有不同:
我想為估計一些環境變量的算法估計參數和預測不確定性。
我所擁有的是該變量 的無錯誤時間序列(來自模擬),
x_true
我在其中添加了一些噪聲 ,x_noise
以生成合成數據集x
。然後,我嘗試通過將平方和sum((x_estimate - x_true)^2)
(!不是x_estimate - x
!)作為目標函數擬合我的算法來找到最佳參數。為了查看我的算法如何執行並創建參數分佈的樣本,我想重新採樣x_noise
,將其添加到x_true
,再次擬合我的模型,沖洗並重複。這是評估參數不確定性的有效方法嗎?我可以將自舉數據集的擬合解釋為預測不確定性,還是必須遵循我上面發布的程序?/edit:我想我還沒有真正弄清楚我的模型是做什麼的。把它想像成一種去噪方法。它不是一個預測模型,它是一種算法,它試圖從環境數據的嘈雜時間序列中提取潛在信號。
/edit^2:對於那裡的 MATLAB 用戶,我寫了一些快速而骯髒的線性回歸示例來說明我的意思。
這就是我認為殘差的“普通”引導(如果我錯了,請糾正我): http: //pastebin.com/C0CJp3d1
這就是我想做的:http: //pastebin.com/mbapsz4c
這是更詳細的通用(半參數引導)算法:
= 引導數
該模型:
讓成為殘差
- 運行回歸併獲得估計量和殘差.
- 對殘差進行替換重採樣,得到自舉殘差向量.
- 通過將 (1) 中的估計量與原始回歸量相乘並添加自舉殘差來獲得自舉因變量:.
- 使用自舉因變量和原始回歸量運行回歸,這給出自舉估計量,即回歸在,這給出.
- 重複該過程 - 回到 (2) 次。