以總數為條件,負二項式的分佈是什麼
如果是 iid 負二項式,那麼它的分佈是什麼給定
?
是固定的。
如果那麼是泊松,以總數為條件,是多項式。我不確定負二項式是否正確,因為它是混合泊松。
如果您想知道,這不是作業問題。
對不起,遲到的答案,但這也困擾著我,我找到了答案。該分佈確實是 Dirichlet-Multinomial 和單個否定。二項分佈甚至不需要相同,只要它們的 Fano 因子(方差與均值的比率)相同。
長答案:
如果將 NB 參數化為:
p(X=x|λ,θ)=NB(x|λ,θ)=(θ−1λ+x−1x)(11+θ−1)x(θ−11+θ−1)θ−1λ
然後 E(X)=λ 和 Var(X)=λ(1+θ) 和
∀i:Xi∼NB(λi,θ) 暗示
∑Xi∼NB(∑λi,θ)
然後取給定總和的概率:
∏NB(xi|λi,θ)NB(∑xi|∑λi,θ)=(11+θ−1)∑xi(θ−11+θ−1)θ−1∑λi∏(θ−1λi+xi−1xi)(11+θ−1)∑xi(θ−11+θ−1)θ−1∑λi(θ−1∑λi+∑xi−1∑xi)= =Γ(∑xi+1)Γ(θ−1∑λi)Γ(θ−1∑λi+∑xi)∏Γ(θ−1λi+xi)Γ(xi+1)Γ(θ−1λi) =DM(x1,…,xn|θ−1λ1,…,θ−1λn)
在哪裡 DM 是狄利克雷多項似然。這僅僅是因為除了多項式係數之外,左側分數中的許多項都被抵消了,只剩下恰好與 DM 似然性相同的伽馬函數項。
另請注意,該模型的參數無法識別為增加 θ 在所有同時減少 λi 結果完全相同的可能性。
我對此的最佳參考是Guimarães & Lindrooth (2007) 的第 2 到 3.1 節:控制分組條件 logit 模型中的過度分散:Dirichlet-多項式回歸的計算簡單應用- 不幸的是,它是付費牆,但我無法查找非付費參考。