Correlation

在 Pearson 相關之前分箱數據是否有效?

  • June 2, 2013

是否可以對數據進行分箱,計算分箱的均值,然後在這些均值的基礎上推導出皮爾遜相關係數?對我來說,這似乎有點可疑,因為(如果您將數據視為總體樣本)這些均值的分散將是均值的標準誤差,因此如果很大。所以你可能會得到比原始數據更好的相關係數,這似乎是錯誤的。另一方面,人們通常在相關性計算之前對重複測量進行平均,這並沒有太大的不同。

與您的問題不完全相同,但在相關說明中,我記得不久前讀過一篇文章(The American Statistician 或 Chance 雜誌,2000 年至 2003 年之間的某個時間),該文章表明,對於任何包含 2 個變量的數據集,它們都很漂亮非常不相關,您可以找到一種方法來對“預測變量”變量進行分箱,然後取每個箱內響應變量的平均值,並根據您的分箱方式在表格或簡單圖中顯示正關係或負關係。

引用自:https://stats.stackexchange.com/questions/60678

comments powered by Disqus