Dispersion

變異係數與分散指數的用例

  • March 26, 2016

我正在嘗試通過算法估計數據集的突發性,並找到了兩個可比較的指標。

變異係數是標準差與平均值的比值。離散指數是方差與均值的比值。

為什麼一個人會使用一個而不是另一個?各自的優缺點是什麼?

請注意,變異係數 (CV) 始終是無量綱的並且是尺度不變的。另一方面,離散指數 (ID) 不是尺度不變的,並且僅當它應用於無量綱變量(例如計數)時才是無量綱的,就像實踐中的情況一樣。CV 和 ID 都用於非負變量,但它們用於不同的上下文。

樣本和理論 CV 為連續分佈和样本提供了很好的指示。指數分佈具有單位 CV,可以看作是某些分佈族中的參考。gamma、Weibull 和 Generalized Pareto (GP) 系列嵌入了具有任意 CV 的分佈,並且它們的形狀參數與 CV 之間存在一對一的關係。在三個家庭中,表示比指數更細的尾巴,而是一個比指數更粗的尾巴,在 GP 的情況下甚至是一個沉重的尾巴。

樣本 ID 和理論 ID 最常用於具有非負整數值的離散變量,例如計數。參考分佈與現在是泊松分佈,特別是在由三個分佈組成的族中。二項式、泊松和負二項式。二項式分散不足 ()和負二項式過度分散 ()。ID 常用於泊松分佈起主要作用的點過程理論。

更新過程提供了這兩個概念之間的有趣關係 :作為 iid 正 r.vs 的序列給出 通常代表一生,利息是總和對於大, 並在數續約 落在區間. 當。。。的時候是指數的,是泊松。在相當一般的假設下,ID趨於大CV 的平方所以 當 CV 的是.

引用自:https://stats.stackexchange.com/questions/203766

comments powered by Disqus

相關問答