R-Squared
逐步方法是否產生最高R2R2R^2模型?
當使用前向逐步方法選擇變量時,最終模型是否保證具有最高可能? 換句話說,逐步方法是保證全局最優還是僅保證局部最優?
例如,如果我有 10 個變量可供選擇並想建立一個 5 變量模型,那麼通過逐步方法構建的最終結果 5 變量模型是否具有最高的可以構建的所有可能的 5 變量模型中的哪一個?
請注意,這個問題純粹是理論上的,即我們不爭論是否高值是否最優,是否導致過擬合等。
你不一定會得到最高的R因為您只比較可能模型的子集,可能會錯過 R 最高的模型這將包括所有變量。要獲得該模型,您需要查看所有子集。但最好的模型可能不是 R 最高的模型因為它可能是你過擬合了,因為它包含了所有的變量。