Multivariate-Analysis

觀測級別的馬氏距離分佈

  • January 3, 2012

如果我有一個多元正態 iid 樣本, 並定義

(這是從樣本點到向量的馬氏距離 [平方]使用矩陣加權),什麼是分佈 (到樣本均值的馬氏距離使用樣本協方差矩陣)? 我正在看一篇聲稱它是的論文,但這顯然是錯誤的:分配將獲得使用(未知)總體平均向量和協方差矩陣。當插入示例類似物時,應該得到一個 Hotelling分佈,或按比例分佈,或類似的東西,但不是. 我在Muirhead (2005)Anderson (2003)Mardia, Kent and Bibby (1979, 2003)中都找不到確切的結果。顯然,這些人並沒有為異常值診斷而煩惱,因為多元正態分佈是完美的,並且每次收集多元數據時都很容易獲得:-/。

事情可能比這更複雜。霍特林分佈結果是基於假設向量部分和矩陣部分之間的獨立性;這種獨立性適用於和,但它不再適用於和.

通過利用馬氏距離檢查高斯混合建模(替代鏈接)。見第 13 頁,第二欄。作者還為推導分佈提供了一些證據。分佈是按比例縮放的。如果這對您不起作用,請告訴我。否則我明天可以檢查 SS Wilks 書中的任何提示。

引用自:https://stats.stackexchange.com/questions/20543

comments powered by Disqus