Svd

具有缺失值的矩陣的 SVD

  • July 26, 2012

假設我有一個 Netflix 風格的推薦矩陣,並且我想構建一個模型來預測給定用戶的潛在未來電影評分。使用 Simon Funk 的方法,可以使用隨機梯度下降來最小化完整矩陣和逐項 * 用戶逐用戶矩陣與 L2 正則化項之間的 Frobenius 範數。

在實踐中,人們如何處理推薦矩陣中的缺失值,這是進行計算的重點?我閱讀 Simon 的博客文章的猜測是,他只使用非缺失項(由(比如說)約 1% 的推薦矩陣組成)來構建模型(對超參數和正則化進行一些明智的選擇)來預測矩陣的其他 99%?

在實踐中,你真的跳過所有這些值嗎?還是在進行隨機梯度下降之前盡可能多地推斷?處理缺失值的一些標準最佳實踐是什麼?

是的,實際上這些值被跳過了。在您對 Frobenius 範數的描述中,這對應於最小化可以測量的範數分量,即那些具有已知評級的分量。正則化項可以看作是特徵向量分量的貝葉斯先驗,SVD 計算最大似然估計量,受此先驗和已知值的影響。

最好將 SVD 視為一種推斷缺失值的方法。如果您已經有了更好的方法,為什麼還需要 SVD?如果您不這樣做,那麼 SVD 將很樂意為您填補空白。

引用自:https://stats.stackexchange.com/questions/33103

comments powered by Disqus