Data-Visualization

如何解釋密度圖的高度

  • April 23, 2015

我應該如何解釋密度圖的高度:

在此處輸入圖像描述

例如,在上圖中,峰值在 x=18 處約為 0.07。我可以推斷出大約 7% 的值在 18 左右嗎?我可以比這更具體嗎?在 x=30 處還有一個高度為 0.02 的第二個峰。這是否意味著大約 2% 的值在 30 左右?

編輯:關於概率分佈值是否可以超過 1 的問題?討論 >1 的概率值,這在這裡根本不是問題。它還討論了與朴素貝葉斯分類器有關的問題,這也不是重點。我想用簡單的語言得到我們可以從這種密度曲線中得出的數值推論。討論了曲線下面積的作用,但我的問題具體是我們可以就曲線上存在的特定 x 和 y 組合得出什麼推論。例如,我們如何在這張圖上關聯 x=30 和 y=0.02。關於 30 和 0.02 之間的關係,我們可以在這裡寫什麼陳述。由於密度是針對一個單位值的,我們可以說 2% 的值出現在 29.5 和 30.5 之間嗎?如果是這種情況,如果值僅從 0 變化到 1,我們如何解釋,如下圖所示:

在此處輸入圖像描述

如果 100% 的值出現在 0 和 1 之間,為什麼在 0 和 1 之外有曲線?

在 x=0.1 到 x=0.2 處有一個平坦部分,其中 y 等於 0.8。它形成一個矩形。我們如何找出在 x=0.1 和 x=0.2 之間出現的值的比例

你需要小心你的措辭。假設x是一個連續變量,任何單個值的概率恰好為零。正如您所做的那樣,談論某個值位於某個點附近的概率是可以的,儘管您可能想要更精確一些。您的第二個陳述,您在其中提供了間隔和概率,這是我正在尋找的東西。

本質上,密度函數關於x的積分將告訴您概率本身(這就是為什麼它被稱為密度)。顯然,您將積分的區間可以任意小,因此您可以任意程度地接近一個點。也就是說,當密度函數在該區間內變化非常緩慢時,您可以通過一些數值技術來近似積分,例如梯形法則

總結一下:密度函數的高度就是它的高度。您可能想要得出的關於概率的任何結論都必須包括某種形式的積分。

引用自:https://stats.stackexchange.com/questions/147885

comments powered by Disqus