Exploratory-Data-Analysis
“讓數據自己說話”的意圖是什麼?
在閱讀以下論文時,我遇到了以下聲明:
如前所述,它通常在沒有任何參考概率模型的情況下呈現,這符合 Benzecri [1973] 的“讓數據自己說話”的想法。
(引述來自 JP Benzcrire。數據分析。第二卷:對應分析。Dunod,1973 年。)
從我閱讀本文的方式來看,聽起來“讓數據自己說話”的意思是考慮跨數據的各種度量而不考慮似然函數或數據生成過程。
雖然我之前聽過“讓數據自己說話”這句話,但我並沒有認真思考過這句話的含義。我的上述解釋是這句話的典型含義嗎?
解釋取決於上下文,但有一些常見的上下文會出現這種情況。該陳述經常在貝葉斯分析中使用,以強調我們理想地希望分析中的後驗分佈對先前的假設具有魯棒性,以便數據的影響“支配”後驗。更一般地說,引用通常意味著我們希望我們的統計模型符合數據的結構,而不是強迫數據解釋為模型的不可驗證的結構假設。
您所指的特定引用由附加引用補充:“模型必須遵循數據,而不是相反”(翻譯自 Benzécri J (1973) L’Analyse des Données. Tome II: L’Analyse des Correspondances .杜諾,第 6 頁)。Benzécri 認為統計模型應該從數據中提取結構,而不是強加結構。他認為探索性圖形方法的使用對於讓分析師“讓數據說話”非常重要。