Regression

自然三次樣條回歸的定義

  • September 3, 2016

我正在從 Hastie 等人的《統計學習數據挖掘、推理和預測的要素》一書中學習樣條曲線。我在第 145 頁發現自然三次樣條曲線在邊界結之外是線性的。有結,在樣條中,以下是關於書中的這種樣條的。在此處輸入圖像描述

問題一: 4個自由度是如何釋放的?我不明白這部分。

問題2:在定義中什麼時候然後. 作者想在這個公式中做什麼?這如何幫助確保樣條線在邊界結之外是線性的?

  1. 讓我們從考慮普通的三次樣條開始。它們在每對結之間是立方的,在邊界結之外是立方的。我們從第一個三次(第一個邊界結左側)的 4df 開始,每個結增加一個新參數(因為三次樣條和導數和二階導數的連續性增加了三個約束,留下一個自由參數),總共參數為結。

自然三次樣條在兩端都是線性的。這將那裡的三次和二次部分限制為 0,每個將 df 減少 1。在曲線的兩端各減少 2 df,減少到.

想像一下,您決定可以花費一定數量的自由度(,比如說)在你的非參數曲線估計上。由於施加自然樣條比普通三次樣條使用的自由度少 4(對於相同的結數),因此參數你可以有 4 個以上的結(因此還有 4 個以上的參數)來模擬邊界結之間的曲線。 2. 請注意,對於是為了(因為有所有的基函數)。所以該列表中的最後一個基函數,. 所以最高需要定義是為了. (也就是說,我們不需要試圖弄清楚一些可能會,因為我們不使用它。)

引用自:https://stats.stackexchange.com/questions/233232

comments powered by Disqus