Probability

什麼是概率分佈?[複製]

  • April 26, 2018

這是一個非常基本的問題,也許是一個愚蠢的問題,但我很難理解概率分佈的實際定義。

例如,在 Wasserman 的“所有統計數據”中,他說“如果是有限的,如果每個結果的可能性相同,那麼,稱為均勻概率分佈。”

這向我表明,概率分佈專門指選擇的概率度量,即概率分佈與概率空間相關的度量。然而,在維基百科和其他在線網站上,概率分佈僅在某些隨機變量的上下文中定義,例如“概率分佈是描述隨機變量的可能值及其相關概率的函數”。所以我的問題是,概率分佈是給定空間上的度量,還是給定隨機變量的 pdf/pmf?當我們說我們從概率分佈中“繪製一個隨機變量”時,這是否意味著我們使用該概率度量從給定的概率空間構造一個隨機變量,或者我們的隨機變量具有該 pdf/pmf?這是一個有意義的區別嗎?

概率分佈是隨機變量的隨機結構的規範。 ”(Gentle,矩陣代數,第 9 章)

就是說,是的,您正確地假設就概率論中的距離而言,度量在就是所謂的概率測度,或者說概率分佈規律,或者說概率分佈。(這裡是所有可測量子集的集合在哪裡本身就是樣本空間。)(參見,Deza & Deza,Encyclopedia of Distances,第 14 章)

因此,我認為“什麼是概率分佈”這個問題的答案取決於使用該短語的上下文。對於大多數應用目的,例如從與我們的數據相關聯的概率分佈中“*繪製隨機變量”,使用具有特定 PMF/PDF 的變量的概念是完全足夠的;*沒有人明確定義概率空間,而只是通過假設特定的概率分佈來間接暗示它。這實際上也是計算完成的;在大多數情況下,在隨機數生成期間,通過分佈的逆 CDF 或通過某種複合方案(例如拒絕抽樣),我們在樣本中強制執行特定的 PMF/PDF。不過,在數學上,是的,在給定的空間上定義一個隨機變量。

關於為什麼我們需要 σ -代數來定義概率空間,有一個很好的線索?這更多地質疑圍繞概率空間的機制。在這方面,Math.SE 也有一些非常相關的主題,關於密度和分佈之間的差異 [用正式的數學術語]以及“概率密度函數”和“概率分佈函數”之間的差異。

引用自:https://stats.stackexchange.com/questions/343029

comments powered by Disqus