Identifiability
什麼是模型可識別性?
我知道,對於無法識別的模型,可以說數據是由對模型參數的多個不同分配生成的。我知道有時可以限制參數以使所有參數都可識別,如 Cassella & Berger 第 2 版第 11.2 節中的示例。
給定一個特定模型,我如何評估它是否可識別?
為了可識別性,我們正在談論一個參數(可能是一個向量),其範圍在一個參數空間,以及一系列分佈(為簡單起見,請考慮 PDF)索引為我們通常會寫類似. 例如,可能和可能
這意味著. 為了使模型可識別,映射的轉換到應該是一對一的。給定一個模型在你的腿上,最直接的檢查方法是從方程開始, (這個等式應該對(幾乎)所有在支持中)並嘗試使用代數(或其他一些論點)來表明,正是這樣一個方程意味著,事實上,. 如果你成功完成了這個計劃,那麼你的模型是可識別的;繼續您的業務。如果你不這樣做,那麼要么你的模型不可識別,要么你需要找到另一個論點。無論如何,直覺是相同的:在可識別的模型中,兩個不同的參數(可能是向量)不可能產生相同的似然函數。
這是有道理的,因為對於固定數據,如果兩個唯一參數產生相同的可能性,那麼僅基於數據就不可能區分兩個候選參數。在這種情況下,不可能識別出真正的參數。
對於上面的例子,等式是
對於(幾乎)所有. 如果我們記錄雙方的日誌,我們會得到
為了,這意味著線性函數
(幾乎)完全為零。唯一能做到這一點的線是斜率為 0 且 y 截距為零的線。希望你能看到剩下的。 順便說一句,如果您可以通過查看模型來判斷它是不可識別的(有時您可以),那麼通常會在其上引入額外的約束以使其可識別(如您所提到的)。這類似於認識到函數不是一對一的在, 但如果我們限制它是一對一的躺在裡面. 在更複雜的模型中,方程更難,但想法是一樣的。