什麼是校準?
校準調查權重意味著什麼?
另外,統計學中校準的其他定義是什麼?我聽說它在幾種情況下使用過,特別是風險預測(指一個隊列中預測事件的總數是否與觀察到的事件數在統計上一致)。
統計學中是否存在一個宏大、統一的校準概念?
我們關於校準的 wiki 涉及到表面問題,或者可能會提出問題。
用於測量權重的“校準”一詞似乎是由Deville 和 Sarndal (1992)創造的。他們在一系列使用已知人口總數的不同程序上打了傘:
在哪裡是人口中每個單位已知的特徵向量. 對於一般人群,這些將是關於人口特徵的人口普查數據,例如年齡、性別、種族/民族、教育、地理(地區、州、省),並且可能是收入。對於機構人口,這些變量通常與機構規模和收入有關。對於列表樣本 - 無論您附加到樣本中的是什麼。
Deville 和 Sarndal (1992) 討論瞭如何從設計權重(選擇的逆概率)出發,在哪裡是從中抽取的樣本, 校準權重這樣
即,樣本在這些變量上與總體一致。他們通過優化距離函數來做到這一點
通常,正如統計學中經常出現的情況一樣,引入額外的信息會漸近地改善方差,儘管可能會拋出一些問題並引入奇怪的小樣本偏差。Deville 和 Sarndal (1992) 量化了這些漸近效率增益,這是他們對文獻的核心貢獻。
在使用輔助數據方面,調查統計是一個非常獨特的分支。貝葉斯人在他們的先驗中使用輔助數據。iid 常客/可能性主義者通常沒有太多方法來整合輔助信息,因為所有信息都必須包含在可能性中。然而,有一個經驗似然估計的分支,其中輔助信息被用於生成和/或聚合估計方程;事實上,經驗似然目標函數是 Deville 和 Sarndal (1992) 考慮的目標函數案例之一。(計量經濟學家應該非常恰當地嗅出並指出,自Hansen (1982)以來,他們已經知道通過廣義矩量法校準統計模型的方法已有 30 多年了。. 二次損失是 Deville 和 Sarndal (1992) 中另一個自然有趣的案例。雖然它是最容易計算的,但它會產生通常被認為很奇怪的負權重。)
我聽說的統計中術語“校準”的另一種用法是反向回歸,其中您對感興趣的變量的測量不准確,並且想要恢復預測變量的值(我給出的運行示例由我的一位統計學教授的馬拉松選手通過騎自行車來測量路線的距離併計算自行車車輪的轉數,而不是更準確的 GPS 測量——那是在 1990 年代後期,在智能手機和手持 GPS 設備出現之前。)你校準您的自行車在已建立的 1 公里路線上行駛,然後嘗試騎自行車以達到 42 公里。
可能還有其他用途。不過,我不確定將它們全部傾倒在一個條目中是否特別明智。您指出因子分析是該術語的一個潛在用戶,但我並不是特別清楚它是如何在那裡使用的。