Terminology
“池數據”到底是什麼意思?
我認為“匯集數據”只是意味著將以前分成類別的數據組合起來……本質上,忽略類別並使數據集成為一個巨大的數據“池”。我想這是一個關於術語而不是統計應用的問題。
例如:我想比較 2 個站點,在每個站點中我有兩種年份類型(好和差)。如果我想“整體”比較 2 個站點(即忽略年份類型),說我在每個站點內匯集數據是否正確?此外,由於幾年的數據包括好年份和差年份類型,是否可以說我在年份之間匯集數據以實現每個站點內的“好年份”和“差年份”數據集?謝謝你的幫助!貓
是的,你的例子是正確的。
牛津英語詞典將pool定義為:
池灣
(puːl)
1.1 反式。投入普通股或基金按協議分配;為共同利益而合併(資本或利益);規格。競爭的鐵路公司等:分享或分割(交通或收入)。
另一個例子是:
你測量男性和女性血液中物質 X 的含量。您看不到兩組之間的統計差異,因此您將數據集中在一起,忽略了實驗對象的性別。
這樣做在統計上是否正確在很大程度上取決於具體情況。