如何構造分段三次樣條基?
來自第 119 頁的“統計學習要素”中的話:
不難證明,下面的基代表一個有結點的三次樣條曲線和:
那麼我的問題是,根據數值分析,分段三次多項式試圖擬合區域中的函數多項式在 3 階,所以我認為基礎應該是
- .
最多有4個基,所以我錯在哪裡?
**看一個更簡單的問題:**為分段常數函數的空間構造一個基,這些函數的值允許在節點處斷開。有兩個結,就是三個間隔。一個基礎將包括 (a) 等於的函數對於所有小於或等於的參數否則是, (b) 函數等於對於來自的所有論點通過否則是, 和 (c) 函數等於對於所有大於但除此之外. 然而,還有另一種方式。這個想法是讓基礎元素對結處發生的跳躍進行編碼。因此,第一個基元素是一個常數函數,比如說,不管結。第二個基元素編碼跳躍. 取它相等很方便對於小於或等於的值並等於對於更大的值。讓我們調用這個函數. 第三個基本元素可以被認為是.
例如,從到然後到在節和可以寫成:在這種形式中,它明確地顯示為一個跳躍在接著是一個跳躍在,從基線值開始後.
這是一個有兩個結的分段常數樣條。它由它的三個級別決定,或者等效地,由一個“基線”級別和兩個跳躍決定。
應該清楚,雖然常數函數的空間有維數,分段常數函數的空間結有尺寸:一個用於“基線”常量加更多維度,每個可能的跳躍都有一個維度。
三次樣條是通過對分段常數函數進行三次積分獲得的。 這引入了三個積分常數。我們可以將它們吸收到常數函數的積分中。這給出了一個跨越的“基線”立方,,, 和. 對這些積分常數取模,積分是: 它的三階導數跳躍在價值否則為常數(等於至左側和在 - 的右邊)。引用中命名的基礎僅通過以下方式重新調整這些函數.
這是前面分段常數函數的第三個積分。請注意,沒有三次多項式可能以這種方式表現(它不能有兩個平坦或接近平坦的部分)。樣條曲線本質上比相同次數的多項式更靈活;它們跨越了更高維的函數空間。
現在應該很明顯如何將此公式擴展到任意數量的結和任意程度的樣條。當您需要針對特定問題的非標準樣條曲線時,了解該過程會很有用。例如,我最近不得不為涉及角度自變量(平面模中的方向)的回歸開發圓形二次樣條度)。