Regression

薄板平滑樣條的概率解釋

  • March 8, 2018

TLDR:薄板回歸樣條是否具有概率/貝葉斯解釋?

給定輸入輸出對,; 我想估計一個函數如下

在哪裡是一個核函數並且是大小的特徵向量. 係數和可以通過求解找到

其中的行由並且,由於符號的一些濫用,‘核矩陣的第是. 這給

假如說是一個正定核函數,這個解可以看作是以下貝葉斯模型的最佳線性無偏預測器:

在哪裡和表示高斯過程。參見例如https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2665800/ 我的問題如下。假設我讓和,即薄板樣條回歸。現在,不是半正定函數,上述解釋不起作用。上述模型及其解決方案是否仍然具有概率解釋?是半正定的嗎?

讓問題的模型寫成 Yi=ϕ(xi)β+h(xi)+εi

在哪裡 h(x) 是一個未觀察到的具有索引的 GP xRdεi 是具有方差的正態噪聲項 σ2 . 通常假設 GP 是居中的、固定的和非確定性的。請注意,該術語 ϕ(x)β 可以看作是一個帶有內核的(確定性的)GP ϕ(x)B,ϕ(x) 在哪裡 B 是一個“無限值”協方差矩陣。確實,通過採取 B:=ρ,Iρ 我們得到了問題的克里金方程。這通常被稱為擴散 先驗 β . 一個適當的後驗 β 僅當矩陣 Φ 有滿級。所以模型寫得很好 Yi=ζ(xi)+εi
在哪裡 ζ(x) 是全科醫生。相同的貝葉斯解釋可以在有限制的情況下使用 ζ(x) 不再是 GP,而是內在隨機函數(IRF)。推導可以在 G. Wahba 的書中找到。IRF 概念的可讀介紹例如在 N. Cressie 的書和下面引用的 Mardia 等人的文章中。IRF 類似於離散時間上下文中眾所周知的集成過程(例如 ARIMA):通過一種差分運算將 IRF 轉換為經典 GP。

這是 IRF 的兩個示例 d=1 . 首先,考慮一個維納過程 ζ(x) 以其初始條件 ζ(0)=0 替換為擴散初始條件: ζ(0) 是正常的,具有無限的方差。一旦一個值 ζ(x) 已知,IRF 可以像 Wiener GP 一樣被預測。其次,考慮由等式給出的集成維納過程d2ζ(x)/dx2=dW(x)/dx

在哪裡 W(x) 是維納過程。要獲得 GP,我們現在需要兩個標量參數:兩個值 ζ(x)ζ(x) 為了 xx , 或值 ζ(x)dζ(x)/dx 在某些選擇 x . 我們可以認為這兩個額外的參數是聯合高斯的,具有無限 2×2 協方差矩陣。在這兩個例子中,只要有合適的有限觀測集可用,IRF 就幾乎可以作為 GP 來處理。此外,我們使用了微分算子: L:=d/dxL:=d2/dx2 分別。零空間是線性空間 F 功能 ϕ(x) 這樣 Lϕ=0 . 它包含常量函數 ϕ1(x)=1 在第一種情況下和功能 ϕ1(x)=1ϕ2(x)=x 在第二種情況下。請注意,在第一個示例中 ζ(x)ζ(x+δ) 是任何固定的 GP δ 在第一個例子中和類似地 ζ(xδ)2ζ(x)+ζ(x+δ) 在第二種情況下是全科醫生。

對於一般尺寸 d , 考慮一個線性空間 F 定義的函數 Rd . 我們稱 對於 F 有限的集合 s 地點 $ \mathbf{x}i \in \mathbb{R}^d s \nu_i $
\sum
{i=1}^s , \nu_i ,\phi(\mathbf{x}i) = 0 \text{ for all } \phi \in \mathcal{F}. $$ 考慮 F 作為我們示例的零空間。對於第一個例子,我們可以舉個例子 s=2x1x2 任意和 [1,,1] . 對於第二個例子,我們可以採取 s=3 等距 xiν=[1,,2,,1] . IRF的定義涉及函數空間 F 和一個函數 g(x,,x) 這是有條件的積極的 F , 意思就是 $$ \sum{i=1}^s \sum_{j=1}^s \nu_i \nu_j , g(\mathbf{x}_i, , \mathbf{x}'_j) \geq 0 $$ 盡快舉行 $ [\nu_i,,\mathbf{x}i]{i=1}^s wrt \mathcal{F} . \mathcal{F} g(\mathbf{x},,\mathbf{x}') MardiaGP L \mathcal{F} ;IRF L \zeta = $ 高斯噪聲。

IRF 預測的計算與問題中的幾乎相同,其中 k(x,,x) 取而代之 g(x,,x) ,但隨著 ϕi(x) 現在形成了一個基礎 F . 額外的約束 Φα=0 必須添加到優化問題中,這將授予 αKα0 . 我們仍然可以添加更多不在的基函數 F 如果需要的話; 這將具有添加確定性 GP 的效果,例如 ψ(x)γ 到 IRF ζ(x) 在 (2) 中。

薄板樣條取決於一個整數 m 這樣 2m>d , 空間 F 包含低階多項式,有維數 p(m) 根據 md . 可以證明,如果 E(r) 是以下功能 r0 E(r):={(1)m+1+d/2,r2mdlogrd even, r2mdd odd,

然後 g(x,,x):=E(|xx|) 定義了一個有條件的積極 wrt F . 該結構涉及微分算子 L . 事實證明,對於 d=1m=2 薄板樣條只不過是通常的自然三次樣條,它與上面的集成維納示例有關,具有 g(x,,x)=|xx|3 . 所以(2)只不過是通常的平滑樣條模型。什麼時候 d=2m=2 零空間有維度 p(m)=3 並由函數生成 1 , x1x2 .

空間數據的Cressie N統計。威利 1993.

Mardia KV、Kent JT、Goodall CR 和 Little JA。帶有衍生信息的克里金法和样條曲線。Biometrika (1996), 83,1, pp. 207-221。

用於觀測數據的Wahba G樣條模型。暹羅 1990。

王,Y平滑樣條,方法和應用。查普曼和霍爾,2011 年。

引用自:https://stats.stackexchange.com/questions/332356