Modeling
人口密度估計模型
(人口、面積、形狀)的數據庫可用於通過將人口/面積的恆定值分配給每個形狀(這是一個多邊形,例如人口普查區、區域、縣、州等)來繪製人口密度圖。然而,人口通常不會在其多邊形內均勻分佈。 對稱映射是通過輔助數據細化這些密度估計的過程。正如最近的評論所表明的,這是社會科學中的一個重要問題。
那麼,假設我們有可用的土地覆蓋輔助圖(或任何其他離散因素)。在最簡單的情況下,我們可以使用明顯不適合居住的區域(如水體)來劃定沒有人口的區域,並相應地將所有人口分配到其餘區域。更一般地說,每個人口普查單位被雕刻成具有表面積的部分,. 因此,我們的數據集被擴充為元組列表
在哪裡是以單位為單位的總體(假設測量無誤)並且——儘管嚴格來說並非如此——我們可以假設每個也是精確測量的。在這些術語中,目標是劃分每個成一筆
其中每個和估計單位內的人口居住在土地覆蓋類別. 估計需要是無偏的。此分區通過分配密度來細化人口密度圖到交匯處人口普查多邊形和土地覆蓋類。
這個問題與標準回歸設置的顯著不同:
- 每個的分區必須準確。
- 每個分區的分量必須是非負的。
- (假設)任何數據都沒有錯誤:所有人口計數和所有領域是正確的。
解決方案有很多方法,例如“智能 dasymetric 映射”方法,但我所讀到的所有方法都具有臨時元素和明顯的偏見潛力。我正在尋找能夠提出創造性的、計算上易於處理的統計方法的答案。直接應用涉及c 的集合。 -人口普查單位平均每個人 40 人(儘管相當一部分人是 0 人)和大約十幾個土地覆蓋類別。
您可能想查看Mitchel Langford 關於 dasymetric 映射的工作。
他建立了代表威爾士人口分佈的柵格,他的一些方法可能在這裡有用。
更新:您還可以查看Jeremy Mennis的作品(尤其是這 兩篇文章)。