Distributions

多項式(1/n, …, 1/n) 能否被表徵為離散的狄利克雷(1, .., 1)?

  • April 10, 2015

所以這個問題有點混亂,但我會用彩色圖表來彌補這一點!首先是背景,然後是問題。

背景

說你有一個-維多項式分佈,概率相等類別。讓是標準化計數() 從該分佈中,即:

現在分佈結束支持- 簡單但具有離散步驟。例如,與此發行版具有以下支持(紅點):

在此處輸入圖像描述

另一個具有類似支持的發行版是維分佈,即單位單純形上的均勻分佈。例如,這裡是從 3 維隨機抽取的:

在此處輸入圖像描述

現在我有了這樣的想法,即來自分佈可以被描述為從一個離散化為離散支持. 我想到的離散化(這似乎運作良好)是將單純形中的每個點“四捨五入”到支持的最近點. 對於 3 維單純形,您會得到以下分區,其中每個彩色區域中的點應“四捨五入”到最近的紅點:

在此處輸入圖像描述

由於狄利克雷分佈是均勻的,因此每個點的最終密度/概率與每個點“四捨五入”的面積/體積成正比。對於二維和三維情況,這些概率是:

在此處輸入圖像描述這些概率來自蒙特卡羅模擬

所以看起來,至少對於 2 維和 3 維,離散化得到的概率分佈在這種特殊的方式是相同的概率分佈. 這是一個標準化的結果分配。我也嘗試過 4 維,它似乎在那里工作。

問題)

所以我的主要問題是:

當以這種特殊方式離散均勻狄利克雷時,與持有更多的尺寸?這種關係是否成立?(我只用蒙特卡洛模擬試過這個……)

此外,我想知道:

  • 如果這個關係成立,它是一個已知的結果嗎?我可以為此引用一些資料嗎?
  • 如果均勻狄利克雷的這種離散化與多項式沒有這種關係。有沒有類似的結構?

一些背景

我問這個問題的原因是我正在研究非參數 Bootstrap 和貝葉斯 Bootstrap 之間的相似性,然後就出現了這個問題。我還注意到上面 3 維單純形上彩色區域的圖案看起來像(並且應該是)Voronoi 圖。一種方法(我希望)您可以將其視為帕斯卡三角形/Simpex 的序列(http://www.math.rutgers.edu/~erowland/pascalssimplices.html)。其中彩色區域的大小在二維情況下遵循帕斯卡三角形的第二行,在三維情況下遵循帕斯卡四面體的第三行,依此類推。這可以解釋與多項分佈的聯繫,但在這裡我真的在深水中……

這兩種分佈對於每個人來說都是不同的.

符號

我將按一個因子重新調整你的單純形, 使格點具有整數坐標。這並沒有改變任何東西,我只是認為它使符號變得不那麼麻煩。

讓成為-單純形,作為點的凸包給出, …,在. 換句話說,這些是所有坐標都是非負數的點,並且坐標總和為.

讓表示格點的集合,即在其中所有坐標都是整數。

如果是一個格點,我們讓表示它的Voronoi 單元,定義為(嚴格)更接近比任何其他點.

我們放了兩個可以放的概率分佈. 一種是多項分佈,其中點有概率. 另一個我們稱之為狄利克雷模型,它分配給每個與體積成正比的概率.

非常非正式的理由

我聲稱多項式模型和 Dirichlet 模型給出了不同的分佈, 每當.

要看到這一點,請考慮這種情況, 和點和. 我聲稱和通過向量的平移是全等的. 這意味著和具有相同的體積,因此和在狄利克雷模型中具有相同的概率。另一方面,在多項式模型中,它們具有不同的概率(和),因此分佈不可能相等。

事實是和從以下看似合理但不明顯(且有些模糊)的主張得出以下結論:

合理的說法:形狀和大小只受“近鄰”的影響, (即那些點在不同於通過一個看起來像的向量, 其中和可能在其他地方)

不難看出,“直接鄰居”的配置和是相同的,然後得出和是一致的。

以防萬一,我們可以玩同樣的遊戲,用和, 例如。

我不認為這種說法是完全顯而易見的,我也不打算證明它,而是採取稍微不同的策略。但是,我認為這是為什麼分佈不同的更直觀的答案.

嚴謹的證明

拿和如上面的非正式理由。我們只需要證明和是一致的。

給定,我們將定義如下:是點的集合, 為此. (以更容易理解的方式:讓.是最高點和最低點之差的點的集合小於 1。)

我們將證明.

步驟1

宣稱: .

這很容易:假設不在. 讓,並假設(不失一般性),.自從,我們也知道.

現在讓. 自從和兩者都有非負坐標,所以也是, 並且由此得出, 所以. 另一方面,. 因此,至少是一樣接近至於, 所以. 這表明(通過補充).

第2步

索賠:是成對不相交的。

假設不然。讓和是不同的點 , 然後讓. 自從和是不同的,兩者都在, 必須有一個索引在哪裡, 還有一個. 不失一般性,我們假設, 和. 重新排列和相加,我們得到.

現在考慮數字和. 從事實來看, 我們有. 相似地,暗示. 將這些加在一起,我們得到,我們有矛盾。

第 3 步

我們已經證明,並且那個是不相交的。這覆蓋直到一組測度為零,它遵循(最多一組測量零)。[自從和都是開放的,我們實際上有確切地說,但這不是必需的。]

現在,我們幾乎完成了。考慮要點和. 很容易看出和是一致的並且是彼此的翻譯:它們可能不同的唯一方法是,如果邊界(除了上面的臉和兩者都撒謊)會“切斷”或者但不是另一個。但是要達到這樣的邊界的一部分,我們需要改變一個坐標或者至少 1,這足以保證將我們帶出和反正。因此,即使從有利位置看起來確實不同和,差異太遠,無法通過和, 因此和是一致的。

隨之而來的是和具有相同的體積,因此 Dirichlet 模型為它們分配相同的概率,即使它們在多項式模型中具有不同的概率。

引用自:https://stats.stackexchange.com/questions/145705

comments powered by Disqus