Error

校正正態分佈的時鐘不精確

  • September 4, 2012

我有一個實驗,該實驗在分佈在世界各地的數百台計算機上執行,用於測量某些事件的發生情況。每個事件都相互依賴,因此我可以按遞增順序對它們進行排序,然後計算時間差。

事件應該呈指數分佈,但是在繪製直方圖時,這是我得到的:

事件直方圖

計算機時鐘的不精確導致某些事件被分配的時間戳早於它們所依賴的事件的時間戳。

我想知道時鐘同步是否可以歸咎於PDF的峰值不在0(他們將整個事情向右移動)這一事實?

如果時鐘差異是正態分佈的,我可以假設效果會相互補償,因此只使用計算出的時間差異嗎?

時鐘同步問題確實會導致峰值向右移動。R中的以下模擬顯示了這種現象。我使用指數時間和正常時鐘差異來獲得與您的圖片大致相似的形狀:

時鐘

左邊的分佈(實際差異,無誤差測量)在 0 處有峰值,而右邊的分佈(有誤差測量的差異)在 100 附近有峰值。

R代碼:

set.seed(20120904)

# Generate exponential time differences:
x<-rexp(100000,1/900)

# Generate normal clock differences:
y<-rnorm(100000,0,50)

# Resulting observations:
xy<-x+y

# Truncate at 500:
xy<-xy[xy<=500]

# Plot histograms:
par(mfrow=c(1,2))
hist(x[x<=500],breaks=100,col="blue",main="Actual differences")
hist(xy,breaks=100,col="blue",main="Observed differences")
lines(c(0,0),c(0,550),col="red")

如果時鐘差異是正常的,平均值為 0,則差異應該抵消,即觀察到的差異的平均值應該等於實際差異的平均值。是否是這種情況取決於發生第一個事件的計算機和發生第二個事件的計算機之間是否存在系統差異。

引用自:https://stats.stackexchange.com/questions/35666

comments powered by Disqus