Estimation

插值的統計依據是什麼?

  • October 4, 2011

假設我們有兩個點(下圖:黑色圓圈),我們想為它們之間的第三個點(十字)找到一個值。事實上,我們將根據我們的實驗結果,即黑點來估計它。最簡單的情況是畫一條線,然後求值(即線性插值)。如果我們有支持點,例如,作為兩邊的棕色點,我們更願意從它們中受益並擬合非線性曲線(綠色曲線)。

問題是,將紅十字標記為解決方案的統計推理是什麼?為什麼其他十字架(例如黃色的十字架)不是它們可能的答案?什麼樣的推論或(?)促使我們接受紅色的?

我將根據這個非常簡單的問題得到的答案來開發我的原始問題。

在此處輸入圖像描述

任何形式的函數擬合,即使是非參數擬合(通常對所涉及的曲線的平滑度做出假設),都涉及假設,因此是一種信念的飛躍。

線性插值的古老解決方案是當您擁有的數據“足夠”細粒度時“才有效”(如果您看一個足夠近的圓,它看起來也很平坦 - 問問哥倫布),甚至是可行的在計算機時代之前(許多現代樣條解決方案並非如此)。假設函數將在兩點之間“在相同(即線性)物質中繼續存在”這一信念是有道理的,但對此沒有先驗原因(除非了解手頭的概念)。

當您有三個(或更多)非共線點(例如添加上面的棕色點時)時,很快就會清楚,每個點之間的線性插值很快就會涉及每個點中的尖角,這通常是不需要的。這就是其他選項跳入的地方。

但是,如果沒有進一步的領域知識,就無法肯定地說明一種解決方案比另一種更好(為此,您必須知道其他點的值是什麼,從而違背了將函數擬合到第一名)。

從好的方面來說,也許與您的問題更相關,在“規律性條件”下(閱讀:假設:如果我們知道該函數是平滑的),線性插值和其他流行的解決方案都可以被證明是“合理的”近似值。仍然:它需要假設,對於這些,我們通常沒有統計數據。

引用自:https://stats.stackexchange.com/questions/16489

comments powered by Disqus