組合兩個協方差矩陣
我正在並行計算分佈的協方差,我需要將分佈的結果組合成奇異高斯。我如何將兩者結合起來?
如果它們的分佈和大小相似,則兩者之間的線性插值幾乎可以工作。
Wikipedia在底部提供了一個供組合使用的論壇,但似乎不對;兩個同分佈的分佈應該具有相同的協方差,但頁面底部的公式將協方差加倍。
有沒有辦法結合兩個矩陣?
這個問題以各種形式出現了很多。他們的共同點是
如何組合從我的數據的不相交子集中計算的基於矩的統計數據?
最簡單的應用程序涉及已分成兩組的數據。你知道組的大小和組的意思。僅就這四個量而言,數據的整體均值是多少?
其他應用從均值泛化到方差、標準差、協方差矩陣、偏度和多元統計;並且可能涉及多個數據子組。請注意,其中許多量都是一些複雜的矩組合:例如,標準偏差是一階矩和二階矩(均值和均方)的二次組合的平方根。
*所有這些情況都可以通過將各種矩簡化為總和來輕鬆處理,*因為總和顯然很容易組合:它們是相加的。從數學上講,歸結為:你有一批數據被分成不相交的大小組:. 讓我們調用第組. 根據定義,任意一批數據的時刻是平均值權力,
明顯地是總和權力。因此,參考我們之前將數據分解成子組,我們可以打破總和權力分成總和組,獲得
除以展示了整個批次的時刻其子群的 th 矩。
在本申請中,協方差矩陣中的條目當然是協方差,其可以用多元二階矩和一階矩來表示。 **計算的關鍵部分歸結為:**在每一步中,您都將關注多元數據的兩個特定組成部分;讓我們打電話給他們和. 您正在查看的數字在表格中
像以前一樣分裂成團體。對於每個組,您知道其產品的平均總和: 這是多元時刻,. 要組合這些組值,您將它們乘以組大小,將這些結果相加,然後將總數除以.
要應用這種方法,您需要提前考慮:如果您只知道協方差和子組大小,則不可能組合協方差:您還需要知道子組的均值(因為均值以一種基本的方式參與在所有協方差公式中),或代數上可簡化為均值的東西。您可能還需要注意公式中出現的任何常量;粗心大意的人的主要陷阱是混淆“樣本協方差”(涉及乘積之和除以)具有“總體協方差”(除以)。這並沒有引入任何新東西;你只需要記住將樣本協方差乘以(或組協方差) 來收回總和,而不是通過(或者).
哦,是的:關於現在的問題。維基百科文章中給出的公式是根據組均值(第一矩)和乘積的組總和給出的。正如我上面所描述的,這些將通過添加它們來組合,然後用除法調整結果以獲得協方差。最後除以未顯示。