Distributions
理論分佈和經驗分佈有什麼區別?
現在,我對這兩種分佈之間的區別感到非常困惑。我認為理論上意味著我們已經知道其所有信息的給定分佈。但是,對於經驗分佈,我們也知道有關它的所有信息。它們之間到底有什麼區別?
例如,
在 R 中,
dnorm()
:獲得理論正態分佈的密度值;為什麼它不是經驗正態分佈?在 R 中,
density()
:將經驗密度曲線擬合到一組值;為什麼在這種情況下,它使用“經驗”?
簡而言之,當您知道分佈是什麼及其參數時,您就可以構建理論分佈。
因此,在 R 的情況下,該
dnorm
命令返回標準正態分佈。那就是概率密度函數為的分佈:以及我們知道的地方 和所以我們實際上有
和
那是因為我們開始知道一切。
使用 EMPIRICAL 分佈,我們開始一無所知。我們擁有的是一組觀察結果,我們想嘗試從該集合中獲得一些知識。也許我們會擬合一個分佈,也許如果我們有足夠的觀察結果,我們就可以從中進行測量。
例如,如果我有以下 10 個數字,我可以創建一個經驗分佈:
僅看這些數字,選擇 5或更少的**經驗概率為 60%,因為我有 10 個觀察值中有 6 個為 5 或更少。
所做的是
density
通過觀察集合運行並為它們擬合核平滑密度。它不是正常的、二項式的、泊鬆的、帕累託的,或者任何特別的必然。它是直方圖的(有時)平滑版本,可以將其視為與觀察相關的計算的密度。我們可以嘗試擬合以某種方式“接近”經驗的理論分佈。然後可以將這些擬合的理論分佈用作代理,我們可以使用它們的屬性來獲得更多樂趣和遊戲。