相關伯努利試驗,多元伯努利分佈?
我正在簡化我在工作中遇到的一個研究問題。想像一下,我有 5 個硬幣,讓我們稱正面為成功。這些是非常有偏見的硬幣,成功概率 p=0.1。現在,如果硬幣是獨立的,那麼獲得至少 1 個或更多正面的概率非常簡單,. 在我的場景中,我的伯努利試驗(拋硬幣)不是獨立的。我可以訪問的唯一信息是成功概率(每個都是 p=.1)和二元變量之間的理論皮爾遜相關性。
有沒有辦法僅使用此信息來計算一次或多次成功的概率?我試圖避免基於模擬的方法,因為這些理論結果將用於指導模擬研究的準確性。我一直在研究多元伯努利分佈,但我認為我不能僅通過相關性和邊際成功概率來完全指定它。我的一個朋友建議構造一個帶有伯努利邊際的高斯 copula(使用 R 包
copula
),然後pMvdc()
在大樣本上使用該函數來獲得我想要的概率,但我不完全確定如何使用它。
不,只要您擁有三個或更多硬幣,這是不可能的。
兩枚硬幣的情況
讓我們首先看看為什麼它適用於兩個硬幣,因為這提供了一些關於在更多硬幣的情況下會發生什麼故障的直覺。
讓和表示對應於兩種情況的伯努利分佈變量,,. 首先,回憶一下相關性和是
既然你知道邊緣,你知道,,, 和,所以通過知道相關性,你也知道. 現在,當且僅當兩者和, 所以
通過了解邊緣,你知道, 和. 既然我們剛剛發現你知道, 這意味著你也知道和,但現在你已經完成了,因為你正在尋找的概率是
現在,我個人發現通過圖片更容易看到所有這些。讓. 然後我們可以把各種概率想像成一個正方形:
在這裡,我們看到知道相關性意味著您可以推斷,標記為紅色,並且知道邊緣,您知道每個邊緣的總和(其中一個用藍色矩形表示)。
三枚硬幣的情況
對於三個硬幣來說,這不會那麼容易;直觀地不難看出原因:通過了解邊際和相關性,您總共知道參數,但聯合分佈有結果,但通過知道概率其中,你可以找出最後一個;現在,,因此似乎合理的是,可以計算出兩種不同的聯合分佈,其邊際和相關性相同,並且可以置換概率直到您要尋找的概率不同為止。
讓,, 和是三個變量,讓
在這種情況下,上面的圖片變為以下內容:
尺寸被撞了一個:紅色頂點變成了幾條彩色邊,藍色矩形覆蓋的邊變成了整個面。在這裡,藍色平面表示通過知道邊際,您可以知道其中的概率之和;對於圖片中的那個,
同樣適用於立方體中的所有其他面。彩色邊緣表明,通過了解相關性,您可以知道由邊緣連接的兩個概率之和。例如,通過知道, 你懂(完全如上),和
因此,這對可能的聯合分佈施加了一些限制,但現在我們將練習簡化為將數字放在立方體頂點上的組合練習。事不宜遲,讓我們提供兩個邊際和相關性相同的聯合分佈:
在這裡,將所有數字除以獲得概率分佈。要查看這些工作並具有相同的邊際/相關性,只需注意每個面上的概率總和是(意味著變量是),並且彩色邊緣上的頂點的總和在兩種情況下都一致(在這種特殊情況下,所有相關性實際上都是相同的,但通常情況並非如此)。
最後,得到至少一個正面的概率,和, 在這兩種情況下是不同的,這就是我們想要證明的。
對我來說,想出這些例子歸結為把數字放在立方體上產生一個例子,然後簡單地修改並讓更改傳播。
編輯:這是我意識到您實際上是在使用固定邊際的地方,並且您知道每個變量都是,但如果上圖有意義,則可以對其進行調整,直到獲得所需的邊距。
四個或更多硬幣
最後,當我們有超過三個硬幣時,我們可以製作失敗的例子也就不足為奇了,因為我們現在在描述聯合分佈所需的參數數量與邊際和提供給我們的參數數量之間存在更大的差異。相關性。
具體來說,對於任何數量大於 3 的硬幣,您可以簡單地考慮前三個硬幣的行為與上述兩個示例相同且最後兩個硬幣的結果獨立於所有其他硬幣的示例。