點過程互相關分析
我想對我正在使用的分析方法提出建議,以了解它在統計上是否合理。
我測量了兩點過程和我想確定事件是否在以某種方式與事件相關.
我在文獻中發現的一種方法是構建互相關直方圖:對於每個我們發現所有事件的延遲落在給定的時間窗口(之前和之後),然後我們構建所有這些延遲的直方圖。
如果這兩個過程不相關,我會期望一個平坦的直方圖,作為發生事件的概率在事件之後(或之前)在所有延遲時都相等。另一方面,如果直方圖中存在峰值,則表明兩點過程以某種方式相互影響(或者至少有一些共同的輸入)。
現在,這很好,但是我如何確定直方圖是否確實有一個峰值(我不得不說,對於我的特定數據集,它們顯然是平坦的,但如果有一個統計方法仍然會很好確認)?
所以,這就是我所做的:我已經重複了生成直方圖的過程幾(1000)次,保持照原樣並使用“洗牌”版本. 洗牌我計算所有事件之間的間隔,將它們打亂並求和以重新構成一個新的點過程。在 RI 中,只需執行以下操作:
times2.swp <- cumsum(sample(diff(times2)))
所以,我最終得到了 1000 個新的直方圖,它向我展示了事件的密度相比.
對於這些直方圖的每個分箱(它們都以相同的方式分箱),我計算了直方圖 95% 的密度。換句話說,我是說,例如:在時間延遲 5 毫秒時,在 95% 的洗牌點過程中,有概率 x 在在某事件之後.
然後,我會將所有時間延遲的 95% 值用作一些“置信限制”(可能這不是正確的術語),以便在原始直方圖中超出此限制的任何內容都可以被視為“真實頂峰”。
問題1:這種方法在統計上是否正確?如果不是,你將如何解決這個問題?
問題 2:我想看看的另一件事是我的數據是否存在“更長”類型的相關性。例如,兩點過程中的事件發生率可能會有類似的變化(請注意,它們可能有完全不同的發生率),但我不知道該怎麼做。我想使用某種平滑內核為每個點過程創建一個“包絡”,然後對兩個包絡進行互相關分析。你能建議任何其他可能的分析類型嗎?
謝謝你,很抱歉這個很長的問題。
在二維或更多維中分析此問題的標準方法是Ripley’s (cross) K function,但也沒有理由不在一維中使用它。(谷歌搜索在挖掘參考方面做得很好。)本質上,它繪製了兩個實現中點之間所有距離的 CDF,而不是這些距離的 PDF 的近似直方圖。(一個變體,L 函數,繪製了兩個均勻不相關過程的 K 和零分佈之間的差異。)這巧妙地迴避了您面臨的大多數問題,例如選擇箱、平滑等。K 的置信帶通常是通過模擬創建的。這在 R 中很容易做到。R 的許多空間統計數據包可以直接使用或很容易適應這種一維情況。羅傑·比萬德CRAN 上的概述頁面列出了這些包:請參閱“點模式分析”部分。