Distributions

為什麼β分佈密度函數中有-1?

  • February 20, 2017

Beta 分佈出現在兩個參數化下(或此處

或似乎更常用的一種

但究竟為什麼會有““在第二個公式中?

第一個公式直觀地似乎更直接對應於二項分佈

但從“看到”的觀點這在beta-二項式模型中尤其明顯,其中可以理解為先前的成功次數和是先前的失敗次數。

那麼,為什麼第二種形式會受到歡迎,其背後的基本原理是什麼*?**使用任一參數化的後果*是什麼(例如與二項分佈的連接)?

如果有人能另外指出這種選擇的起源和最初的論點,那就太好了,但這對我來說不是必需的。

這是一個關於自由度和統計參數的故事,以及為什麼兩者有一個直接的簡單聯繫是件好事。

從歷史上看,“” 術語出現在歐拉對 Beta 函數的研究中。他在 1763 年使用該參數化,Adrien-Marie Legendre 也是如此:它們的使用建立了隨後的數學慣例。這項工作早於所有已知的統計應用。

現代數學理論通過在分析、數論和幾何中的大量應用提供了充分的指示,即“" 術語實際上有一些含義。我在對該問題的評論中概述了其中一些原因。

更有趣的是“正確的”統計參數化應該是什麼。這不是很清楚,也不必與數學約定相同。有一個巨大的網絡,由常用的、眾所周知的、相互關聯的概率分佈族組成。因此,用於命名(即參數化)一個族的約定通常意味著命名相關族的相關約定。更改一個參數化,您將想要全部更改它們。因此,我們可能會從這些關係中尋找線索。

很少有人會不同意最重要的分佈族來自 Normal 族。回想一下隨機變量被稱為“正態分佈”時有一個概率密度成正比. 什麼時候和,據說服從標準正態分佈。

許多數據集使用相對簡單的統計數據進行研究,這些統計數據涉及數據和低冪(通常是平方)的合理組合。當這些數據被建模為來自正態分佈的隨機樣本時——這樣每個被視為正常變量的實現, 所有共享一個共同的分佈,並且是獨立的 - 這些統計數據的分佈由該正態分佈確定。在實踐中最常出現的是

  1. ,學生分佈與“自由程度。” 這是統計分佈

在哪裡模型數據的平均值和是均值的標準誤。劃分方式表明必須是或更大,從哪裡來是一個整數或更大。這個公式雖然看起來有點複雜,但它是二次數據的有理函數的平方根:它比較簡單。 2. , _(卡方)分佈“自由度”(df)。這是平方和的分佈獨立的標準正態變量。因此,這些變量的平方均值的分佈將是分佈按比例縮放:我將其稱為“標準化”分配。 3. , _帶參數的比率分佈是兩個獨立歸一化的比率分佈與和自由程度。

數學計算表明,所有這三個分佈都有密度。重要的是,密度分佈與歐拉伽瑪積分定義中的被積函數成正比() 功能。讓我們比較一下:

這表明兩次變量具有帶參數的 Gamma 分佈. 二分之一的因素已經夠麻煩了,但是減去會使關係變得更糟。**這已經為這個問題提供了一個令人信服的答案:**如果我們想要一個分佈以計算產生它的平方正態變量的數量(最多為),那麼其密度函數中的指數必須是該計數的一半。

為什麼是因子比差異更麻煩? 原因是當我們加起來時,這個因素將保持一致。如果平方和獨立標準正態與帶參數的 Gamma 分佈成比例(乘以某個因子),然後是的平方和獨立標準正態與帶參數的 Gamma 分佈成比例(乘以相同的因子),因此所有的平方和變量與帶有參數的 Gamma 分佈成比例(仍然是相同的因素)。 添加參數如此接近地模擬添加計數的事實非常有幫助。

但是,如果我們要刪除那個討厭的“" 從數學公式來看,這些良好的關係會變得更加複雜。例如,如果我們將 Gamma 分佈的參數化更改為參考實際功率在公式中,使得分佈將與“Gamma" 分佈(由於在其 PDF 中是),然後是三個的總和分佈必須被稱為“Gamma” 分佈。簡而言之,自由度和 Gamma 分佈中的參數之間的密切加性關係將通過刪除從公式中提取並將其吸收到參數中。

類似地,一個概率函數比率分佈與 Beta 分佈密切相關。確實,當有一個比率分佈,分佈有一個 Beta分配。它的密度函數與

此外——將這些想法繞一圈——學生的正方形分佈與df 有一個帶參數的比率分佈. 再一次明顯的是,保持傳統參數化與有助於自由度的基礎計數保持清晰的關係。

那麼,從統計的角度來看,使用傳統數學參數化的變體將是最自然和最簡單的和 Beta 分佈:我們應該更喜歡調用分配一個"分佈”和 Beta分佈應該被稱為“Beta分佈。”事實上,我們已經這樣做了:這正是我們繼續使用名稱“卡方”和“Ratio”分佈而不是“Gamma”和“Beta”。無論如何,我們都不想刪除“” 出現在其密度的數學公式中的術語。 如果我們這樣做,我們將失去密度中的參數和與之相關的數據計數之間的直接聯繫:我們總是會偏離一個。

引用自:https://stats.stackexchange.com/questions/262956

comments powered by Disqus