Distributions

為什麼所有已知的分佈都是單峰的?

  • March 27, 2014

我不知道任何多模式分佈。

為什麼所有已知的分佈都是單峰的?是否有任何“著名”發行版具有不止一種模式?

當然,分佈的混合通常是多峰的,但我想知道是否存在任何具有多個模式的“非混合”分佈。

在對問題的評論中回答了問題的第一部分:許多“品牌”分佈是多模式的,例如任何 Beta分佈與和. 那麼,讓我們轉向問題的第二部分。

所有離散分佈顯然都是(原子的,單峰的)混合物。

我將證明大多數連續分佈也是單峰分佈的混合。這背後的直覺很簡單:我們可以從 PDF 的凹凸不平的圖形中逐一“剔除”凹凸,直到圖形是水平的。凸起成為混合物成分,每個成分顯然都是單峰的。

因此,除了一些不尋常的分佈,其 PDF 高度不連續,**問題的答案是“無”:**所有絕對連續、離散或這兩者組合的多峰分佈都是單峰分佈的混合。


考慮連續分佈誰的 PDF是連續的(這些是“絕對連續”的分佈)。(連續性並沒有太大的限制;可以通過更仔細的分析進一步放寬,假設不連續點是離散的。)

為了應對可能出現的常數值的“高原”,將“模式”定義為一個區間 (這可能是一個單點) 使得

  1. 有一個常數值說.
  2. 在任何嚴格包含的區間上都不是常數.
  3. 存在一個正數使得最大值達到等於.

讓是任何模式. 因為是連續的,有區間包含為此不減少(這是一個適當的間隔,而不僅僅是一個點)並且不增加(這也是一個適當的間隔)。讓是所有這些值的無窮大並且所有這些價值的至高無上。

這種結構在圖上定義了一個“駝峰”從延伸到. 讓是較大的和. 通過構造,點集在為此是適當的間隔嚴格包含(因為它包含整個或者)。

數字

在這個多模態 PDF 的插圖中,模態由水平軸上的紅點標識。填充的紅色部分的水平範圍是間隔:它是由模式確定的駝峰的底部. 那個駝峰的底部在高處. 原始 PDF 是紅色填充和藍色填充的總和。請注意,藍色填充附近只有一種模式; 原始模式在已被刪除。

寫作對於長度, 定義

什麼時候和否則。(這使得順便說一下,一個連續函數。)分子是升到上面和分母是圖形之間的面積和. 因此是非負的並且有總面積:它是概率分佈的PDF。通過建設它有一個獨特的模式.

也通過構造,函數

是提供的PDF. (顯然,如果一無所有它必須是單峰開始的。)此外,它在區間中沒有模式(它是恆定的,這就是為什麼前面仔細地將模式定義為間隔是必要的)。此外,

是單峰 PDF的混合和PDF.

迭代這個過程(它作為連續函數的線性組合仍然是一個連續函數,使我們能夠像以前一樣進行),產生一系列模式; 相應的權重序列; 和 PDF 存在限制結果是因為 (a) 區間is flattened 包括一個適當的區間,在前面沒有被展平操作和 (b) 實數不能分解為多個可數的此類區間。極限不能有任何模式,因此是常數,它必須為零(否則它的積分會發散)。最後,已被表示(可能不是唯一的,因為選擇模式的順序很重要)作為混合

單峰分佈,QED。

引用自:https://stats.stackexchange.com/questions/91537

comments powered by Disqus