如何解釋變異係數?
我正在嘗試了解Coefficient of Variation。當我嘗試將其應用於以下兩個數據樣本時,我無法理解如何解釋結果。
假設樣本 1 是 樣本 2 是. 這裡示例 2樣品 1如你看到的。
兩者俱有相同的標準差但和.
現在變異係數會有所不同。對於樣本 2,它將小於樣本 1。但是我如何解釋該結果?就方差而言,兩者是相同的;只是他們的手段不同。那麼這裡的變異係數有什麼用呢?這只是誤導我,或者我無法解釋結果。
在像您這樣的示例中,當數據只是相加不同時,即我們添加一些常數 $ k $ 對於所有內容,然後當您指出標準偏差不變時,均值恰好改變了該常數,因此變異係數從 $ \sigma / \mu $ 到 $ \sigma / (\mu + k) $ ,既無趣也無用。
有趣的是乘法變化,其中變異係數有一些用處。將所有內容乘以某個常數 $ k $ 意味著變異係數變為 $ k \sigma/k \mu $ ,即保持與以前相同。正如@Aksalal 和@Macond 的答案一樣,更改測量單位就是一個很好的例子。
由於變異係數是無單位的,所以它也是無量綱的,因為基礎變量擁有的任何單位或量綱都會被除法洗掉。這使得變異係數成為相對變異性的度量,因此可以將長度的相對變異性與權重的相對變異性進行比較,等等。變異係數已發現一些描述性用途的一個領域是生物學中生物體大小的形態計量學。
在原則和實踐中,變異係數僅被完全定義並且對完全為正的變量完全有用。因此,詳細說明您的第一個樣本,其值為 $ 0 $ 不是一個合適的例子。另一種看待這一點的方法是注意,如果平均值為零,則係數將是不確定的,如果平均值為負,則係數將為負,假設在後一種情況下標準差為正。任何一種情況都會使該度量無法作為相對可變性的度量,或者實際上對於任何其他目的都是無用的。
一個等效的陳述是,只有當對數以通常的方式為所有值定義時,變異係數才是有趣和有用的,並且實際上使用變異係數等同於查看對數的變異性。
儘管對這裡的讀者來說這似乎令人難以置信,但我已經看到氣候和地理出版物,其中攝氏溫度的變化係數使天真的科學家感到困惑,他們指出,當平均溫度接近時,係數可能會爆炸 $ 0^\circ $ C 並在平均溫度低於冰點時變為負值。更奇怪的是,我看到有人建議使用華氏溫度來解決問題。相反,當且僅當測量尺度符合比率尺度時,變異係數通常被正確地稱為定義的匯總度量。碰巧的是,即使對於以開爾文測量的溫度,變異係數也不是特別有用,而是出於物理原因而不是數學或統計原因。
就像氣候學中奇怪的例子一樣,由於作者既不值得稱讚也不值得羞恥,我沒有提及這些例子,變異係數在某些領域被過度使用。有時傾向於將其視為一種包含均值和標準差的神奇匯總度量。這自然是原始思維,因為即使該比率有意義,也無法從中恢復平均值和標準差。
在統計學中,如果變異遵循伽馬或對數正態,變異係數是一個相當自然的參數,這可以通過查看這些分佈的變異係數的形式來看出。
儘管變異係數可能有一些用處,但在應用它的情況下,更有用的步驟是在對數尺度上工作,通過對數變換或在廣義線性模型中使用對數鏈接函數。
編輯:如果所有值都是負數,那麼我們可以將符號視為可以忽略的約定。等效地在這種情況下, $ \sigma / |\mu| $ 實際上是變異係數的同卵雙胞胎。
編輯 2020 年 5 月 25 日:在 Simpson, GG, Roe, A. 和 Lewontin, RC 1960 中進行了詳細的討論。*定量動物學。*紐約:Harcourt, Brace,第 89-94 頁。該文本不可避免地在某些方面過時,但包含許多清晰的解釋和好鬥的評論和批評。
另見 Lewontin, RC 1966。關於相對變異性的測量。 系統生物學15:141-142。https://doi.org/10.2307/sysbio/15.2.141