Bayesian

可以使用什麼統計模型或算法來解決約翰·斯諾霍亂問題?

  • August 11, 2017

我有興趣學習如何根據約翰·斯諾霍亂爆發的數據開發某種震中的地理近似值。在事先不知道井的位置的情況下,可以使用什麼統計模型來解決這樣的問題。

作為一個普遍的問題,您將獲得時間、已知點的位置以及觀察者的步行路徑。我正在尋找的方法將使用這三件事來估計“爆發”的震中。

不是給出完整或權威的答案,只是為了激發想法,我將報告我十年前在空間統計課程中為實驗室練習所做的快速分析。目的是查看與使用歐幾里德距離相比,準確計算可能的旅行路徑(步行)會對相對簡單的探索方法產生什麼影響:核密度估計。密度的峰值(或峰值)相對於手柄除雪的泵在哪裡?

使用 Snow 地圖(經過適當地理參考)的相當高分辨率的柵格表示(2946 行 x 3160 列),我將地圖上顯示的數百個黑色小棺材中的每一個都數字化(在 309 個地址找到其中的 558 個),將每個棺材分配給街道的邊緣與其地址相對應,並按地址匯總為每個位置的計數。

輸入數據的點圖

經過一些圖像處理以識別街道和小巷後,我進行了僅限於這些區域的簡單高斯擴散(在 GIS 中使用重複的焦點方法)。這是KDE。

結果不言自明——甚至幾乎不需要一個傳說來解釋它。(該地圖顯示了許多其他泵,但它們都位於該視圖之外,該視圖側重於密度最高的區域。)

斯諾的地圖以顏色顯示密度。

引用自:https://stats.stackexchange.com/questions/297504

comments powered by Disqus