Confidence-Interval

從分層數據中獲取和解釋自舉置信區間

  • August 7, 2010

我有興趣獲得數量 X 的自舉置信區間,當這個數量在 10 個人中的每一個人中測量 10 次時。

一種方法是獲取每個個體的平均值,然後引導平均值(例如,通過替換重新採樣平均值)。

另一種方法是在引導過程的每次迭代中執行以下操作:在每個個體中,重新採樣該個體的 10 個觀察值並進行替換,然後計算該個體的新均值,最後計算新的組均值。在這種方法中,在原始數據集中觀察到的每個個體總是在引導過程的每次迭代中對組均值做出貢獻。

最後,第三種方法是結合上述兩種方法:對個體重新採樣,然後在這些個體中重新採樣。這種方法與前一種方法的不同之處在於,它允許同一個人在每次迭代中對組均值做出乘數貢獻,儘管由於每個貢獻都是通過獨立的重採樣過程生成的,因此這些貢獻可能會彼此略有不同。

在實踐中,我發現這些方法對置信區間產生了不同的估計(例如,對於一個數據集,我發現第三種方法產生的置信區間比前兩種方法大得多),所以我很好奇每種方法可能是什麼解釋為代表。

您的第一種方法是關於 S CI 之間的。如果您想在 S 內進行測量,那麼這是錯誤的方法。

第二種方法將生成僅適用於這 10 個人的內部 S CI。

最後一種方法是內部 S CI 的正確方法。CI 的任何增加都是因為您的 CI 更能代表可以應用於總體的 CI,而不是那些 10 個 S。

引用自:https://stats.stackexchange.com/questions/1399

comments powered by Disqus