Spatial

為什麼在克里金法時必須提供變異函數模型?

  • August 13, 2014

我對空間統計很陌生,看了很多教程,

但是我真的不明白為什麼在克里格時必須提供變異函數模型。

我在 R 中使用 gstat 包,這是他們給出的示例:

library(sp)
data(meuse)
coordinates(meuse) = ~x+y
data(meuse.grid)
str(meuse.grid)
gridded(meuse.grid) = ~x+y
m <- vgm(.59, "Sph", 874, .04)
print(m)
# ordinary kriging:
x <- krige(log(zinc)~1, meuse, meuse.grid, model = m)

有人能用幾行解釋為什麼你首先必須提供 vgm 嗎?以及如何設置參數?

先感謝您!卡斯帕

介紹與總結

托布勒地理定律斷言

一切都與其他一切相關,但近處的事物比遠處的事物更相關。

克里金采用了這些關係的模型,其中

  • “事物”是地球表面(或空間)上位置的數值​​,通常表示為歐幾里得平面。
  • 這些數值被假定為隨機變量的實現。
  • “相關”用這些隨機變量的均值和協方差來表示。

(與空間中的點相關的隨機變量的集合稱為“隨機過程”。)變異函數提供了計算這些協方差所需的信息。

什麼是克里金法

克里金法特別是在尚未觀察到的地方對事物進行預測。為了使預測過程在數學上易於處理,克里金將可能的公式限制為觀測值的線性函數。這使得問題成為確定係數應該是什麼的有限問題。這些可以通過要求預測過程具有某些屬性來找到。直觀地說,一個極好的特性是預測變量與真實(但未知)值之間的差異應該趨於小:也就是說,預測變量應該是精確的。另一個被高度吹捧但更值得懷疑的屬性是,平均而言,預測變量應該等於真實值:它應該是準確的。

(堅持完美準確的原因是有問題的 - 但不一定是壞事 - 是它通常會使任何統計程序不那麼精確:也就是說,更多變數。當射擊目標時,您是否希望將命中均勻地分散在目標周圍?邊緣並且很少擊中中心,或者您是否會接受僅關注中心附近但不完全在中心的結果?前者準確但不精確,而後者不准確但精確。)

這些假設和標準——均值和協方差是量化相關性的適當方法,線性預測將起作用,預測變量應盡可能精確,但要完全準確——導致方程組具有如果協方差以一致的方式指定,則為唯一解。由此產生的預測器被稱為“BLUP”:最佳線性無偏預測器。

變異函數的來源

找到這些方程需要操作剛剛描述的程序。這是通過寫下預測變量和被認為是隨機變量的觀察之間的協方差來完成的。協方差代數導致觀測值之間 的協方差也進入克里金方程。

在這一點上,我們走到了死胡同,因為這些協方差幾乎總是未知的。畢竟,在大多數應用中,我們只觀察到每個隨機變量的一種實現方式:即我們的數據集,它在每個不同的位置僅構成*一個數字。*輸入變異函數:這個數學函數告訴我們任何兩個值之間的協方差應該是多少。必須確保這些協方差是“一致的”(從某種意義上說,它永遠不會給出一組數學上不可能的協方差:並非所有“相關性”的數值度量集合都會形成實際的協方差矩陣)。這就是為什麼變異函數對克里金法至關重要。

參考

因為直接的問題已經回答了,我就停在這裡。感興趣的讀者可以通過查閱諸如 Journel & Huijbregts 的Mining Geostatistics (1978) 或 Isaaks & Srivastava 的Applied Geostatistics (1989) 等優秀文章來了解如何估計和解釋變異函數。(請注意,估計過程引入了兩個稱為“變異函數”的對象:一個從數據派生的經驗變異函數和一個擬合它的**模型變異函數。此答案中對“變異函數”的所有引用均指向模型。vgm問題中的調用返回模型變差函數的計算機表示。)有關適當組合變差函數估計和克里金法的更現代的方法,請參閱 Diggle &基於模型的 Geostatistics (2007)(這也是R軟件包GeoR和的擴展手冊GeoRglm)。


註釋

順便說一句,無論您是使用克里金法進行預測還是使用其他算法,變異函數提供的相關性的定量表徵對於評估任何預測過程都是有用的。請注意,從這個角度來看,所有空間插值方法都是預測變量——其中許多是線性預測變量,例如 IDW(反距離加權)。變異函數可用於評估任何插值方法的平均值和離散度(標準偏差)。因此,它的適用性遠遠超出了克里金法的使用範圍。

引用自:https://stats.stackexchange.com/questions/111683

comments powered by Disqus

相關問答