兩個正態分佈的重疊區域的百分比

June 22, 2011

我想知道，給定兩個正態分佈和

如何計算兩個分佈的重疊區域的百分比？

我想這個問題有一個特定的名稱，你知道描述這個問題的任何特定名稱嗎？

你知道這個的任何實現（例如，Java 代碼）嗎？

這通常也稱為“重疊係數”（OVL）。谷歌搜索這個會給你很多點擊。您可以在此處找到雙法線情況的列線圖。有用的論文可能是：

亨利·英曼；小埃德溫·L·布拉德利 (1989)。重疊係數作為概率分佈和兩個正態密度重疊的點估計之間一致性的度量。統計通訊 - 理論和方法，18（10），3851-3874。（鏈接）

編輯

現在你讓我對這個更感興趣了，所以我繼續創建 R 代碼來計算這個（這是一個簡單的集成）。我加入了兩個分佈的圖，包括重疊區域的陰影：
min.f1f2 <- function(x, mu1, mu2, sd1, sd2) {
   f1 <- dnorm(x, mean=mu1, sd=sd1)
   f2 <- dnorm(x, mean=mu2, sd=sd2)
   pmin(f1, f2)
}

mu1 <- 2;    sd1 <- 2
mu2 <- 1;    sd2 <- 1

xs <- seq(min(mu1 - 3*sd1, mu2 - 3*sd2), max(mu1 + 3*sd1, mu2 + 3*sd2), .01)
f1 <- dnorm(xs, mean=mu1, sd=sd1)
f2 <- dnorm(xs, mean=mu2, sd=sd2)

plot(xs, f1, type="l", ylim=c(0, max(f1,f2)), ylab="density")
lines(xs, f2, lty="dotted")
ys <- min.f1f2(xs, mu1=mu1, mu2=mu2, sd1=sd1, sd2=sd2)
xs <- c(xs, xs[1])
ys <- c(ys, ys[1])
polygon(xs, ys, col="gray")

### only works for sd1 = sd2
SMD <- (mu1-mu2)/sd1
2 * pnorm(-abs(SMD)/2)

### this works in general
integrate(min.f1f2, -Inf, Inf, mu1=mu1, mu2=mu2, sd1=sd1, sd2=sd2)
對於這個例子，結果是：0.6099324with absolute error < 1e-04。下圖。

引用自：https://stats.stackexchange.com/questions/12209

兩個正態分佈的重疊區域的百分比

相關問答

損失函數和評估指標

時間序列主題和矩陣配置文件算法是否適合我的問題？

Bhattacharya 係數和 Bhattacharya 距離的直覺？

與 Kullback-Leibler 散度相比，Wasserstein 度量的優勢是什麼？

在計算餘弦距離之前是否需要特徵歸一化？

量化詞袋的相似度