Standard-Deviation

計算兩個數的標準差有意義嗎?

  • August 16, 2016

一個簡單的問題。我從理論上知道,可以計算兩個數字的標準偏差。我想知道這樣做是否合理。我的目標是比較同一現象的兩個任意時間序列數據,並將平均值和標準差繪製為每個時間點的誤差線。我知道您可以通過採用 Pearson 相關性等來比較兩個時間序列,但我想比較每個時間點的絕對值有多少一致。任何見解將不勝感激。

**更新:**謝謝你的回答。讓我們忘記時間序列。這是不必要的並發症。我的問題更根本。我正在做一個生物學實驗來測量一個生物學相關的量,比如我細胞中一種化學物質的濃度。理想情況下,我會對我的實驗進行 3 或 5 次或一定數量的重複,以獲得平均值和標準偏差的估計值。但由於時間限制、實驗的複雜性和所涉及的成本,我只能做兩次重複。現在,我最終得到了兩個濃度估計值。當我取這兩個量的平均值時,沒有人質疑我。但是當我計算標準偏差時,人們會感到不舒服。我可以理解他們的擔憂,但我想更深入地了解為什麼在這種情況下採用標準偏差可以或不可以?如果不行,我有什麼選擇?

評論的編譯和擴展:

假設您的數據是正態分佈的。

如果要形成雙邊誤差條(或置信區間),例如在 95% 的水平,則需要基於具有 n-1 自由度的 Student t 分佈,其中 n 是數據點的數量. 您建議有 2 個數據點,因此需要使用具有 1 個自由度的學生 t。

對於 n = 2 個數據點,95% 的 2 邊誤差線需要樣本標準差的乘法因子 12.71,而不是基於正態的熟悉因子 1.96(學生 t自由程度)。n = 3 個數據點的相應乘法因子為 4.30。

對於雙邊 99% 誤差線(置信區間),情況變得更加極端。

正如您所看到的,在任一置信水平上,如果您有 3 個數據點而不是 2 個數據點,則乘法因子會有很大的“節省”。並且使用 n-1 與 n 在樣本標準差的分母。

 n  Confidence Level  Multiplicative Factor
 2       0.95              12.71
 3       0.95               4.30
 4       0.95               3.18
 5       0.95               2.78
infinity 0.95               1.96

 2       0.99              63.66
 3       0.99               9.92
 4       0.99               5.84
 5       0.99               4.60
infinity 0.99               2.58

引用自:https://stats.stackexchange.com/questions/230171

comments powered by Disqus

相關問答