Terminology
模型適合數據還是數據適合模型?
將模型擬合到數據和將數據擬合到模型之間是否存在概念或程序差異?第一個措辭的示例可以在https://courses.washington.edu/matlab1/ModelFitting.html中看到,第二個措辭可以在https://reference.wolfram.com/applications/eda/FittingDataToLinearModelsByLeast-SquaresTechniques.html中看到.
除了您鏈接的 Wolfram 源之外,幾乎我曾經與之交互過的每個來源或人都將這個過程稱為將模型擬合到數據。這是有道理的,因為模型是動態對象,而數據是靜態的(也就是固定不變的)。
為了說明這一點,我喜歡拉里·瓦瑟曼(Larry Wasserman)的處理方法。用他的話說,統計模型是分佈的集合。例如,所有正態分佈的集合:
$$ { \text{Normal}(\mu, \sigma) : \mu, \sigma \in R, \sigma > 0 } $$
或所有泊松分佈的集合:
$$ { \text{Poisson}(\lambda) : \lambda \in R, \lambda > 0 } $$
將分佈擬合到數據是將統計模型與一組數據(數據是固定的)相結合的任何算法,並從模型中準確選擇一個分佈作為“最佳”反映數據的分佈。
模型是變化的東西(有點):我們正在將它從一個完整的可能性集合中折疊成一個單一的最佳選擇。數據只是數據;什麼都沒有發生。