Spatial

克里金插值法是如何工作的?

  • June 18, 2015

我正在解決一個問題,我需要使用克里金法根據一些周圍的變量來預測一些變量的值。我想自己實現它的代碼。所以,我瀏覽了太多文檔來了解它是如何工作的,但我很困惑。一般來說,我理解它是一個加權平均值,但我無法完全理解計算權重然後預測變量值的過程。

誰能簡單地向我解釋一下這種插值方法的數學方面以及它是如何工作的?

這個答案包括我最近為一篇描述“通用克里金法”(英國)的(適度)時空擴展的論文寫的介紹性部分,它本身就是“普通克里金法”的適度概括。它包含三個子部分:理論給出了一個統計模型和假設;估計簡要回顧了最小二乘參數估計;和預測顯示克里金法如何適應廣義最小二乘 (GLS) 框架。我已努力採用統計學家(尤其是本網站的訪問者)熟悉的符號,並使用此處已得到充分解釋的概念。

總而言之,克里金法是隨機場的最佳線性無偏預測 (BLUP)。 這意味著任何未採樣位置的預測值都是作為在採樣位置觀察到的值和協變量的線性組合獲得的。那裡的(未知,隨機)值與樣本值具有假定的相關性(並且樣本值彼此相關)。這種相關性信息很容易轉化為預測的方差。人們選擇線性組合中的係數(“克里金權重”),使該方差盡可能小,但要滿足預測中零偏差的條件。詳情如下。


理論

英國包括兩個程序——一個是估計,另一個是預測——在研究區域的 GLS 模型的背景下執行。GLS 模型假設樣本數據是圍繞趨勢的隨機偏差的結果,並且這些偏差是相關的。一般意義上的趨勢是指可以通過線性組合確定的值未知係數(參數). (在這篇文章中,主要表示矩陣轉置,所有向量都被認為是列向量。)

在研究區域內的任何位置,都有一組數字屬性可用稱為“自變量”或“協變量”。(通常是一個“常數項”,和可能是空間坐標,而附加的可以表示空間信息以及研究區域內所有位置可用的其他輔助信息,例如含水層的孔隙度或到抽水井的距離。)在每個數據位置, 除了它的協變量,相關的觀察被認為是隨機變量的實現. 相比之下,被認為是由觀察所代表的點或小區域確定或表徵的值(數據“支持”)。這不被認為是隨機變量的實現,並且被要求與任何隨機變量的屬性無關.

線性組合

表示期望值在參數方面,這是位置趨勢的值. 估計過程使用數據來查找值表示未知參數,而預測過程使用位置的數據計算未採樣位置的值,此處索引為. 估計的目標是固定的(非隨機的)參數,而預測的目標是隨機的,因為值包括圍繞其趨勢的隨機波動. 通常,通過改變位置使用相同的數據對多個位置進行預測. 例如,通常進行預測以沿著適合輪廓的規則點網格繪製表面。

估計

經典克里金假設隨機波動期望值為零,並且它們的協方差是已知的。寫出之間的協方差和作為. 使用此協方差,使用 GLS 執行估計。其解決方案如下:

在哪裡是個-觀察向量,(“設計矩陣”)是經過行是向量的矩陣, 和是個-經過-假定為可逆的協方差矩陣(Draper & Smith (1981),第 2.11 節)。這經過矩陣, 投影數據參數估計,稱為“帽子矩陣”。的製定 因為帽子矩陣對數據的應用明確顯示了參數估計如何線性依賴於數據。協方差經典地使用變差函數計算,該變差函數根據數據位置給出協方差,儘管實際計算協方差的方式無關緊要。

預言

英國同樣預測通過數據的線性組合

這被稱為“克里金權重”,用於預測. 英國實現了這一預測通過滿足兩個標準。首先,預測應該是無偏的,這表示為要求隨機變量的線性組合等於一般:

這個期望被接管了聯合- 變量分佈和. 期望的線性連同趨勢假設 (1) 意味著:

無論也許。情況將如此,前提是

在這個欠定方程組的所有可能解中,UK 選擇最小化預測誤差的方差. 從這個意義上說,英國是所有無偏線性預測器中“最好的”。因為最後一個關係意味著預測誤差平均為零,所以方差只是預測誤差平方的期望:

在哪裡是之間的協方差向量和, 和是方差. 為了最小化方差,區分關於並引入一個向量拉格朗日乘數納入約束. 這產生了一個系統線性方程組,以塊矩陣形式寫成

在哪裡代表一個經過零矩陣。寫作為了經過單位矩陣,唯一的解決方案是(誰)給的

(熟悉多元回歸的讀者可能會發現將此解與普通最小二乘正態方程的基於協方差的解進行比較很有啟發性,後者看起來幾乎完全相同,但沒有拉格朗日乘數項。)

這種關係表示克里金權重,,作為僅取決於帽子矩陣和預測位置的協變量的項的總和,加上一個取決於數據和預測變量之間協方差的項,. 將其代入方差方程的右側,得到克里金預測方差,可用於構建周圍的預測限.

引用自:https://stats.stackexchange.com/questions/157543

comments powered by Disqus