如何將部分置信區間相加以創建總置信區間?
我有一個響應變量,當使用不同的解釋變量計算時,它會獲得不同的置信區間 (CI)。我想將響應變量的所有值相加並為總和創建一個 CI。
如果有人請幫助我從鐵人三項中解決以下示例,我會理解該怎麼做,其中時間(分鐘)是響應變量,距離(公里)和紀律是解釋變量:
- 游泳 1.5 公里的 95% CI 是 40 到 50 分鐘
- 騎行 40 公里的 95% CI 是 60 到 80 分鐘
- 跑 10 公里的 95% CI 是 30 到 40 分鐘
問:一個人完成 95% CI 的鐵人三項需要多長時間?
[如果有任何區別,我假設學科之間的正態分佈和獨立性]
謝謝
簡而言之:
- 將每個置信區間(45+70+35=150 分鐘)的中心點之和作為置信區間的中心點。
- 將每個置信區間的半徑平方和的平方根作為區間半徑
因此,一個人在 137.75 到 162.25 分鐘之間完成鐵人三項的概率為 95%。無論如何,小心假設。
長篇:
我假設了學科之間的正態分佈和獨立性,儘管第一個假設作為粗略的近似可能是合理的,但第二個假設可能是錯誤的,因為我希望在一個學科中表現良好的人可能在其他學科中表現良好(例如,我希望自己在鐵人三項的每個項目中都表現不佳)。
假設每個學科的時間是一個正態變量,總時間只是三個隨機變量的總和,因此是正態分佈的。和的方差也是三個變量的方差之和,由於區間半徑與方差的平方根成正比,因此只需將每個區間的半徑平方相加即可得到和變量的半徑平方.
但是,請注意,每個學科的時間是獨立的(可疑的)假設縮小了結果間隔——我會說,不切實際地縮小了它。
我們可以做出相反的假設,即各學科的時間是絕對相關的(也就是說,大致而言,40 分鐘內游泳的人與 60 分鐘內騎自行車和 30 分鐘內跑步的人相同)。這種假設可能與獨立的假設一樣不切實際,但肯定不會更不切實際。
在這個假設下,間隔的半徑只是總和,預計 95% 的運動員將在 130 到 170 分鐘內完成鐵人三項。
最後,我們應該期望實際區間在 [137.25,162.25] 和 [130,170] 之間(都是不切實際的極端情況),但要給出更準確的結果,我們需要(至少)知道相關性是什麼在不同學科的時間之間。
編輯術語
正如 Whiber 在他的評論中指出的那樣,目前尚不清楚問題中給出的間隔的含義是什麼。雖然,答案是有效的,以與問題中的間隔相同的方式解釋結果間隔。
問題間隔的兩個合理含義是:
- 每項運動平均值的置信區間。
- 或包含每項運動 95% 參與者的時間的間隔。
儘管問題的措辭更適合第二個含義(因此我的回答中的措辭),但通常不將“置信區間”這個名稱與這個含義一起使用。
但是,由於各個時間服從正態分佈(根據問題中的假設),並且均值的估計也服從正態分佈(如果樣本量足夠大或者我們繼續堅持各個時間呈正態分佈的假設),兩種含義的區間算術相同,因此給出的結果對兩種含義都成立。