使用樣條、平滑樣條和高斯過程仿真器有哪些優點/缺點?
我有興趣學習(和實施)多項式插值的替代方法。
但是,我很難很好地描述這些方法的工作原理、它們之間的關係以及它們的比較方式。
我希望您能就這些方法或替代方法有用的優點/缺點/條件提供意見,但對文本、幻燈片或播客的一些好的參考就足夠了。
基本 OLS 回歸是將函數擬合到一組數據的非常好的技術。但是,簡單回歸僅擬合在整個可能範圍內恆定的直線. 這可能不適用於特定情況。例如,數據有時會顯示出曲線關係。這可以通過回歸來解決轉變為,. 不同的變換是可能的。在相互關係的情況下和是單調的,但不斷變細,可以使用對數變換。另一種流行的選擇是使用多項式,其中通過提高形成新項一系列權力(例如,,, 等等。)。該策略易於實施,您可以將擬合解釋為告訴您數據中存在多少“彎曲”(其中彎曲的數量等於所需的最高功率減去 1)。
然而,基於對數或協變量指數的回歸只有當這是真實關係的確切性質時才會最佳擬合。可以想像,兩者之間存在曲線關係是很合理的和這與這些轉換提供的可能性不同。因此,我們提出了另外兩種策略。第一種方法是loess,這是在移動窗口上計算的一系列加權線性回歸。這種方法較舊,更適合探索性數據分析。
另一種方法是使用樣條。簡而言之,樣條曲線是一個新術語,僅適用於. 例如,範圍可能從 0 到 1,而樣條項的範圍可能僅從 0.7 到 1。在這種情況下,0.7 是節。一個簡單的線性樣條項可以這樣計算:
並將添加到您的模型中,除了原始的學期。擬合模型將顯示在 0.7 處的急劇中斷,直線從 0 到 0.7,並且該直線以從 0.7 到 1 的不同斜率繼續。但是,樣條項不必是線性的。具體來說,已經確定三次樣條特別有用(即,)。尖銳的休息也不需要在那裡。已經開發了約束擬合參數的算法,使得一階和二階導數在節點處匹配,這使得節點無法在輸出中檢測到。所有這一切的最終結果是,在選擇的位置(軟件可以為您確定)只需幾個結(通常 3-5 個)就可以復制幾乎任何曲線。此外,自由度計算正確,因此您可以相信結果,但當您首先查看數據然後決定擬合平方項時,這是不正確的,因為您看到了彎曲。此外,所有這些只是基本線性模型的另一個(儘管更複雜)版本。因此,我們使用線性模型獲得的所有東西(例如,預測、殘差、置信帶、測試等)都是如此。這些都是巨大的優勢。 我所知道的對這些主題的最簡單介紹是:
- 福克斯,J. (2000)。非參數簡單回歸:平滑散點圖,Sage。