Autocorrelation

是什麼導致空間相關圖中出現 U 形圖案?

  • June 2, 2014

我在自己的工作中註意到這種模式,當檢查不同距離的空間相關圖時,相關性中會出現 U 形模式。更具體地說,小距離箱中的強正相關隨著距離而減小,然後在特定點到達坑然後爬回。

以下是保護生態學博客Macroecology playground (3) – Spatial autocorrelation中的一個示例。

Moran’s I 相關圖

這些在更遠距離上更強的正自相關理論上違反了托布勒的第一地理定律,所以我認為它是由數據中的其他模式引起的。我希望它們在一定距離處達到零,然後在更遠的距離處徘徊在 0 附近(這通常發生在具有低階 AR 或 MA 項的時間序列圖中)。

如果您進行谷歌圖片搜索,您可以找到其他一些相同類型模式的示例(參見此處了解其他示例)。GIS 站點上的用戶發布了兩個示例,其中 Moran’s I 出現了該模式,但 Geary’s C ( 1 , 2 )沒有出現該模式。結合我自己的工作,這些模式對於原始數據是可觀察到的,但在使用空間項擬合模型並檢查殘差時,它們似乎不會持續存在。

我在時間序列分析中沒有遇到過顯示類似 ACF 圖的示例,因此我不確定原始數據中的哪種模式會導致這種情況。Scortchi 在此評論中推測正弦模式 可能是由該時間序列中省略的季節性模式引起的。相同類型的空間趨勢會導致空間相關圖中的這種模式嗎?或者它是計算相關性的方式的其他人工製品?


這是我工作中的一個例子。樣本相當大,淺灰色的線是原始數據的19個排列生成參考分佈的集合(所以可以看到紅線的方差預計會很小)。因此,雖然情節不像第一個所示那樣戲劇化,但在情節中很容易出現坑然後在更遠的距離上升。(還要注意我的坑不是負面的,其他例子也是如此,如果這在本質上使例子不同,我不知道。)

在此處輸入圖像描述

這是數據的核密度圖,以查看產生所述相關圖的空間分佈。

DC中的KDE犯罪

解釋

當在發生現象的區域的整個範圍內進行計算時,U 形相關圖很常見。它特別出現在自然界中的羽狀現像中,例如土壤或地下水中的局部污染,或者在這種情況下,這種現象與人口密度有關,人口密度通常向研究區域的邊界(地區哥倫比亞,擁有高密度的城市核心,被低密度的郊區包圍)。

回想一下,相關圖根據它們的空間分離量總結了所有數據的相似程度。較高的值更相似,較低的值不太相似。可以實現最大空間分離的唯一點對是位於地圖直徑相對兩側的點。因此,相關圖將沿邊界的值相互比較。當數據值總體趨向於向邊界減小時,相關圖只能將小值與小值進行比較。它可能會發現它們非常相似。

因此,對於任何羽狀或其他空間單峰現象,我們可以在收集數據之前預測相關圖可能會減小,直到達到該區域直徑的大約一半,然後它會開始增加。

次要影響:估計可變性

第二個影響是在短距離比在長距離有更多的數據點對可用於估計相關圖。在中長距離上,這些點對的“滯後種群”會減少。這增加了經驗相關圖的可變性。有時,僅這種可變性就會在相關圖中產生不尋常的模式。顯然,在頂部(“Moran’s I”)圖中使用了一個大型數據集,這減少了這種影響,但儘管如此,在距離超過 3500 左右的地方,局部波動的幅度更大,變異性的增加是顯而易見的:恰好一半最大距離。

因此,空間統計中長期存在的經驗法則是避免在大於研究區域直徑一半的距離處計算相關圖,並避免使用如此大的距離進行預測(例如插值)。

為什麼空間週期性不是完整的答案

有關空間統計的文獻確實指出,空間週期性模式會導致相關圖在較大距離處出現反彈。採礦地質學家稱之為“洞效應”。存在一類包含正弦項的變異函數以便對其進行建模。然而,這些變異函數也都隨著距離產生了一些強烈的衰減,因此不能解釋第一個圖中顯示的完全相關的極端回歸。此外,在二維或更多維度中,現像不可能既是各向同性的(其中方向相關圖都是相同的)又是周期性的。因此,僅數據的周期性並不能解釋所顯示的內容。

可以做什麼

在這種情況下進行的正確方法是接受這種現像不是靜止的,並採用一個模型,用一些潛在的確定性形狀來描述它——“漂移”或“趨勢”——在漂移周圍有額外的波動它可能具有空間(和時間)自相關。另一種獲取犯罪計數等數據的方法是研究不同的相關變量,例如每單位人口的犯罪率。

引用自:https://stats.stackexchange.com/questions/100919

comments powered by Disqus