究竟什麼是分佈?
我對概率和統計知之甚少,我希望學習。我看到“分發”這個詞在不同的上下文中到處使用。
例如,離散隨機變量具有“概率分佈”。我知道這是什麼。一個連續隨機變量有一個概率密度函數,那麼對於, 積分來自到概率密度函數的 是累積分佈函數.
顯然,“分佈函數”與“累積分佈函數”是同義詞,至少在談論連續隨機變量時(問題:它們總是同義詞嗎?)。
然後有許多著名的發行版。 分配分佈等。但究竟什麼是分配?是a的累積分佈函數嗎隨機變量?或者一個概率密度函數隨機變量?
但是有限數據集的頻率分佈似乎是直方圖。
長話短說:在概率與統計中,“分佈”一詞的定義是什麼?
我知道數學中分佈的定義(配備歸納極限拓撲的測試函數集合的對偶空間的元素),但不知道概率和統計。
以下是針對值隨機變量。如果您有興趣,可以直接擴展到其他空間。我認為以下稍微更一般的定義比單獨考慮密度、質量和累積分佈函數更直觀。
我在文本中包含了一些數學/概率術語以使其正確。如果不熟悉這些術語,只需將“Borel 集”視為“我能想到的”,以及隨機變量 a 是一些具有相關概率的實驗的數值結果。
讓是一個概率空間並且一個這個空間上的隨機變量。
設定功能, 在哪裡是一個 Borel 集,稱為分佈.
換句話說,分佈告訴你(鬆散地說),對於任何子集, 的概率取該集合中的一個值。可以證明完全由函數決定反之亦然。為此——我在這裡跳過細節——在分配概率的 Borel 集上構建一個度量到所有集合並認為這個有限的度量符合在一個產生 Borel 的系統代數。
如果發生這種情況可以寫成然後是一個密度函數你可以看到,雖然這個密度不是唯一確定的(考慮 Lebesgue 測量零組的變化),但也有道理作為分佈. 然而,通常我們稱其為概率密度函數.
同樣,如果發生這種情況可以寫成,那麼說起來就有意義了作為分佈儘管我們通常稱其為概率質量函數。
因此,每當您閱讀類似“服從均勻分佈",它只是意味著函數,它告訴你概率在某些集合中取值,以概率密度函數為特徵或累積分佈函數.
關於沒有提及隨機變量而僅提及分佈的情況的最後說明。可以證明,給定一個分佈函數(或質量、密度或累積分佈函數),存在一個概率空間,其中包含具有該分佈的隨機變量。因此,在談論分佈或具有該分佈的隨機變量時,基本上沒有區別。這只是一個人專注的問題。