Machine-Learning

隨機變量𝑋,𝑍X,ZX, Z這樣𝑍ZZ和𝑋+𝑍‾‾‾‾‾‾‾√X+Zsqrt{X + Z}有相同的分佈嗎?

  • October 18, 2019

我正在尋找隨機變量的分佈 $ Z $ 定義為

$$ Z = \sqrt{X_1+\sqrt{X_2+\sqrt{X_3+\cdots}}} . $$

這裡 $ X_k $ 是 iid 並且具有相同的分佈 $ X $ .

1.更新

我正在尋找一個簡單的分佈 $ X_k $ ,這導致嵌套平方根的簡單分佈 $ Z $ . 因此,我的想法是研究在某些特定轉換下穩定的分佈。但這可能不是最簡單的方法。

我嘗試了伯努利(帶參數 $ \frac{1}{2} $ ) 為了 $ X_k $ , 但這會導致一些非常困難、討厭的東西,並且分佈在 $ [1, \frac{1+\sqrt{5}}{2}] $ 充滿了差距 - 有些非常大 - 對於 $ Z $ . 到目前為止,最有希望的結果如下。

使用離散分佈 $ X_k $ ,取三個可能的值 $ 0, 1, 2 $ 與概率

  • $ P(X_k = 0) = p_1 $
  • $ P(X_k = 1) = p_2 $
  • $ P(X_k = 2) = p_3 = 1-p_1-p_2 $ .

現在生成的域 $ Z $ 的分佈是 $ [1, 2] $ , 並且間隙被消除。由此產生的分佈仍然非常狂野,除非 $ p_1, p_2, p_3 $ 是精心挑選的。考慮

  • $ p_1=\sqrt{5\sqrt{2}-1}-2 $ ,
  • $ p_2=\sqrt{5\sqrt{3}-1}-\sqrt{5\sqrt{2}-1} $ ,
  • $ p_3=3-\sqrt{5\sqrt{3}-1} $ .

我天真地認為這會導致 $ Z $ 統一 $ [1, 2] $ ,基於我的文章*“一張圖片中解釋的數字表示系統”中的表格(*在此處發布,請參閱標有“嵌套平方根”的列,行標有“數字分佈”。)但是 $ Z $ 看起來並不統一,儘管它確實表現得很好:它看起來像 $ F_Z(z) $ 是一個 2 次多項式,如果 $ z\in [1, 2] $ . 然後我修改了一些值 $ p_1, p_2, p_3 $ , 去除 0.02 到 $ p_1 $ 並將 0.02 添加到 $ p_3 $ . 結果為 $ Z $ 看起來更接近制服 $ [1, 2] $ 這次。

無論如何,這就是我現在的位置。我重新制定的問題是:具有適當的值 $ p_1, p_2, p_3 $ (這些值是什麼?)我們可以有一個簡單的分佈嗎? $ Z $ ? (一致或多項式 $ [1,2] $ )

注意:對於所討論的特定離散分佈,支持域為 $ Z $ 是 $ [1, 2] $ . 當然,如果所有 $ X_k $ 為零,那麼 $ Z=0 $ 但這發生在概率為零的情況下。如果除了其中之一 $ X_k $ 為零,那麼 $ Z\geq 1 $ .

2.二次更新

關於我的陳述*,我天真地認為這會導致 $ Z $ 統一 $ [1, 2] $* . 我認為它沒有發生的原因是因為要發生這種情況, $ X_k $ 的將需要具有正確的自相關結構,以便在基於無限嵌套根式的計數係統中形成*正常數。*在我的實驗中,我使用了 iid $ X_k $ 的。但是對於正常數字(在該系統中),連續數字之間的滯後 1 自相關( $ X_k $ 是數字)接近於零,但不完全為零。相比之下,在二進制計數係統中,數字 $ X_k $ 的正態數不相關,因此如果 $ X_k $ 是參數的伯努利 $ p=\frac{1}{2} $ , 然後 $ Z = \sum_{k=0}^\infty X_k \cdot 2^{-k} $ 是統一的 $ [0, 1] $ . 但如果 $ p\neq \frac{1}{2} $ , 那麼分佈 $ Z $ 很狂野,看這裡

3. 第三次更新

假設 $ X_k $ 與前面提到的離散分佈是獨立同分佈的。那麼密度 $ f $ 有關聯 $ Z $ ,如果存在,必須滿足:

  • $ z \in ]1,\sqrt{2}[\Rightarrow f(z) = 2p_1 z f(z^2) $
  • $ z \in ]\sqrt{2},\sqrt{3}[\Rightarrow f(z) = 2p_2 z f(z^2-1) $
  • $ z \in ]\sqrt{3},2[\Rightarrow f(z) = 2p_3 z f(z^2-2) $

這排除了以下可能性 $ Z $ 的分佈就像一個有限多項式一樣簡單,無論 $ p_1, p_2, p_3 $ . 此外,在 $ z=1, \sqrt{2}, \sqrt{3} $ 或者 $ 2 $ , $ f(z) $ 可能為零、無限、不存在或不連續。

最後,如果 $ f(z) $ 被正確定義(不是零或無限)在 $ z=(1+\sqrt{5})/2 $ ,那麼我們有 $ p_2 = 1/(1+\sqrt{5}) $ :這是上述數學公式中第二個方程的直接結果。使用相同的方程 $ z=\sqrt{2} $ 和 $ z=\sqrt{3} $ 產量 $ p_2/p_1=p_3/p_2 $ , 如果 $ f(1) $ 和 $ f(2) $ 定義明確。結合價值 $ p_2 $ 並且事實上 $ p_1+p_2+p_3 =1 $ ,我們很容易獲得有趣的值: $ p_1 = 1/2, p_2 = 1/(1+\sqrt{5}), p_3= (3-\sqrt{5})/4 $ . 本節的以下內容分為三種情況。

案例一

如果 $ p_1 = 1/2 $ 和 $ f(1) $ 是明確定義的,人們會假設,如果 $ z \in ]1,\sqrt{2}[ $ 並且密度是連續的,那麼 $ f(z) = f(1) / z $ , 因為第一個公式導致

$$ f(z) = f(\sqrt{z})/\sqrt{z} = f(z^{1/2^n})\cdot\Big(z^{\frac{1}{2}+\frac{1}{2^2}+\cdots +\frac{1}{2^n}}\Big)^{-1} \rightarrow \frac{f(1)}{z}. $$

案例2

案子 $ z\in ]\sqrt{2},\sqrt{3}[ $ 很有趣。讓我們使用 $ p_2 = 1/(1+\sqrt{5}) $ 然後讓 $ \phi = 2p_2 $ . 另外,讓我們定義 $$ R_1(z) =\sqrt{1+z}, R_2(z) =\sqrt{1+\sqrt{1+z}},R_3(z) =\sqrt{1+\sqrt{1+\sqrt{1+z}}} $$ 等等。使用公式 $ f(z) = \phi\cdot\sqrt{1+z}\cdot f(\sqrt{1+z}) $ 迭代地,一個人得到 $$ f(z)=f(R_n(z))\cdot\phi^n\cdot\prod_{k=1}^n R_k(z). $$ 右手尺寸的表達式收斂為 $ n\rightarrow\infty $ . 注意 $ R_n(z) \rightarrow \phi^{-1} $ .

請注意,如果 $ z\in ]2^{1/4}, 3^{1/4}[ $ 然後 $ f(z) $ 可以使用案例 1 計算,也可以如下計算: $ f(z) = 2p_1 z f(z^2) $ 並且因為 $ z^2 \in ]\sqrt{2}, \sqrt{3}[ $ 你可以計算 $ f(z^2) $ 使用案例 2。如果兩種不同的方法產生不同的結果,可能的解釋是 $ f(1) $ 不存在: $ f $ 圍繞著無限振盪多次 $ z=1 $ ,使案例 1 無用。這是我還沒有探索的東西。

案例3

這裡 $ z\in ]\sqrt{3},2[ $ . 我還沒有檢查過。

我的回答分為三個部分。第 1 部分涉及使用之前研究的離散分佈 $ X_k $ . 第 2 部分與找到滿足原始問題要求的分佈族有關。第 3 部分是對嵌套三次根和連分數的概括。

第 1 部分:使用離散分佈 $ X_k $

使用前面討論的離散分佈 $ X_k $ (也就是說,與 $ p_1=1/2 $ , $ p_2 = 1/(1+\sqrt{5}) $ 和 $ p_3 = (3-\sqrt{5})/4 $ ) 然後 $ Z $ 的分佈比其他各種組合更平滑 $ p_1, p_2, p_3 $ . 然而,從某種意義上說,它可能在任何地方都無法區分,因此非常混亂。簡而言之, $ f(z) $ 似乎在任何地方都沒有定義,並且基於案例 1 和案例 2 的限制的公式沒有真正的意義。

密度 $ f_Z $ 可能不存在,但分佈 $ F_Z $ 做。它顯然有三條腿: $ z \in [1, \sqrt{2}] $ , $ z \in [\sqrt{2}, \sqrt{3}] $ 和 $ z \in [\sqrt{3}, 2] $ . 基於案例 1 表明 $ f_Z(z) \propto 1/z $ 如果 $ z\leq \sqrt{2} $ ,我決定計算積分以獲得“最佳選擇” $ F_Z(z) = P(Z<z) $ , 導致 $ F_Z(z) \propto \log z $ .

即使這一步並不真正有意義(因為 $ f_Z $ 不存在),它產生了一個非常好的近似值 $ F_Z $ . 的確, $ F_Z(z) $ 非常近似於 $ \log_2 z $ , 特別是如果 $ z \in [1,\sqrt{2}] $ . 下圖顯示 $ F_Z(z) $ 藍色,其近似值由 $ \log_2 z $ 紅色的。X 軸代表 $ z $ , Y 軸 $ F_Z(z) $ .

enter image description here

下圖顯示了近似誤差 $ E(z) = F_z(z) - \log_2 z $ . 請注意,誤差在 $ z = (1+\sqrt{5})/2 $ . 顯著的局部最小值 $ E(z) $ 包括(在無數其他中) $ z=1, 2^{1/4}, \sqrt{2}, \sqrt{3} $ 和 $ z=2 $ . 此外,下面的曲線似乎在任何地方都不可微,實際上它具有布朗運動的一些模式。特別是,人們可以看到一種分形行為,伴隨著連續的雙顛簸(之後和之前的大跌一直下降到 $ E(z)=0 $ )隨著時間的推移重複自己,但被放大為 $ z $ 增加。每次雙凸點達到的最大值似乎正好是前一個雙凸點達到的最大值的 2 倍。

enter image description here

此外,中位數似乎是 $ \sqrt{2} $ ,雖然我沒有檢查。現在,如果您切換 $ p_1 $ 和 $ p_3 $ ,那麼看起來中位數變成了 $ \sqrt{3} $ . 而如果 $ p_1=p_2=p_3 = 1/3 $ (一個非常混亂的情況),看起來中位數變成了 $ (1+\sqrt{5})/2 $ .

第 2 部分:發現 $ X $ 和 $ Z $ 使用特徵函數

這仍然是一項正在進行的工作,但想法如下。如果 $ \phi_2 $ 是特徵函數 (CF) $ Z^2 $ , $ \phi_1 $ 是 CF $ Z $ , 和 $ \phi $ 是 CF $ X_k $ , 而如果 $ \phi = \frac{\phi_2}{\phi_1} $ , 那麼嵌套平方根的分佈 $ X_k $ 的也是分佈 $ Z $ .

這個想法是首先找到一些 $ Z $ (那是, $ \phi_2 $ 和 $ \phi_1 $ ),計算兩個 CF 的比率。如果這個比率是某個分佈的 CF $ X $ ,然後我們解決了這個問題(以向後的方式,通過指定限制 $ Z $ 首先,然後找到 $ X_k $ .)

注意 $ Z $ can not have a log-normal distribution unfortunately, because $ Z $ can not be lower than 1 (prove it, this is an easy exercise.) A potential candidate for $ Z $ ’s distribution is uniform on $ [1, 2] $ , or log-log-normal, that is $ \log\log Z $ is normal.

Below is a chart based on $ X $ being log-normal (see here for more.) It looks like $ \log \log Z $ is almost normal, but it is not exactly normal.

enter image description here

Perhaps the easiest solution is considering $ f_z(z) = \frac{2}{3} z $ with $ z \in [1,2] $ . Then $ \mbox{CF}(Z) =\frac{2}{3}\int_1^2 z \exp(i t z)dz $ and $ \mbox{CF}(Z^2) =\frac{2}{3}\int_1^2 z \exp(i t z^2)dz $ . These two CF’s are easy to compute and result in $$ \mbox{CF}(X) = \frac{it}{2}\cdot\frac{e^{3it}-1}{e^{it}(1-2it)+it -1}. $$ But is the latter really a CF? It does not appear to be bounded. And is the support domain for $ X $ equal to $ [0, 2] $ as expected?

Part 3: Generalization to nested cubic roots and continued fractions

This can be generalized to nested cubic roots or continued fractions as follows. Consider $ Z_{k+1}=(X_k + Z_k)^{\alpha} $ with $ Z=\lim_{k\rightarrow\infty} Z_k, Z_0=0 $ and the $ X_k $ ’s are i.i.d.Then we have $ \phi = \frac{\phi_\alpha}{\phi_1} $ where $ \phi $ is the CF of $ X_k $ , $ \phi_1 $ is the CF of $ Z $ , and $ \phi_\alpha $ is the CF of $ Z^{1/\alpha} $ . The most popular cases are:

  • $ \alpha = 1/2 $ : Nested square roots,
  • $ \alpha = 1/3 $ : Nested cubic roots,
  • $ \alpha = -1 $ : continued fractions.

引用自:https://stats.stackexchange.com/questions/432136

comments powered by Disqus