Probability

如何將部分置信區間相加以創建總置信區間?

  • July 15, 2016

我有一個響應變量,當使用不同的解釋變量計算時,它會獲得不同的置信區間 (CI)。我想將響應變量的所有值相加並為總和創建一個 CI。

如果有人請幫助我從鐵人三項中解決以下示例,我會理解該怎麼做,其中時間(分鐘)是響應變量,距離(公里)和紀律是解釋變量:

  • 游泳 1.5 公里的 95% CI 是 40 到 50 分鐘
  • 騎行 40 公里的 95% CI 是 60 到 80 分鐘
  • 跑 10 公里的 95% CI 是 30 到 40 分鐘

問:一個人完成 95% CI 的鐵人三項需要多長時間?

[如果有任何區別,我假設學科之間的正態分佈和獨立性]

謝謝

簡而言之:

  • 將每個置信區間(45+70+35=150 分鐘)的中心點之和作為置信區間的中心點。
  • 將每個置信區間的半徑平方和的平方根作為區間半徑

因此,一個人在 137.75 到 162.25 分鐘之間完成鐵人三項的概率為 95%。無論如何,小心假設。

長篇:

我假設了學科之間的正態分佈和獨立性,儘管第一個假設作為粗略的近似可能是合理的,但第二個假設可能是錯誤的,因為我希望在一個學科中表現良好的人可能在其他學科中表現良好(例如,我希望自己在鐵人三項的每個項目中都表現不佳)。

假設每個學科的時間是一個正態變量,總時間只是三個隨機變量的總和,因此是正態分佈的。和的方差也是三個變量的方差之和,由於區間半徑與方差的平方根成正比,因此只需將每個區間的半徑平方相加即可得到和變量的半徑平方.

但是,請注意,每個學科的時間是獨立的(可疑的)假設縮小了結果間隔——我會說,不切實際地縮小了它。

我們可以做出相反的假設,即各學科的時間是絕對相關的(也就是說,大致而言,40 分鐘內游泳的人與 60 分鐘內騎自行車和 30 分鐘內跑步的人相同)。這種假設可能與獨立的假設一樣不切實際,但肯定不會更不切實際。

在這個假設下,間隔的半徑只是總和,預計 95% 的運動員將在 130 到 170 分鐘內完成鐵人三項。

最後,我們應該期望實際區間在 [137.25,162.25] 和 [130,170] 之間(都是不切實際的極端情況),但要給出更準確的結果,我們需要(至少)知道相關性是什麼在不同學科的時間之間。

編輯術語

正如 Whiber 在他的評論中指出的那樣,目前尚不清楚問題中給出的間隔的含義是什麼。雖然,答案是有效的,以與問題中的間隔相同的方式解釋結果間隔。

問題間隔的兩個合理含義是:

  • 每項運動平均值的置信區間。
  • 或包含每項運動 95% 參與者的時間的間隔。

儘管問題的措辭更適合第二個含義(因此我的回答中的措辭),但通常不將“置信區間”這個名稱與這個含義一起使用。

但是,由於各個時間服從正態分佈(根據問題中的假設),並且均值的估計也服從正態分佈(如果樣本量足夠大或者我們繼續堅持各個時間呈正態分佈的假設),兩種含義的區間算術相同,因此給出的結果對兩種含義都成立。

引用自:https://stats.stackexchange.com/questions/223924

comments powered by Disqus