Machine-Learning
有哪些統計方法可以推薦像 Netflix 這樣的電影?
我希望實現一個動態模型來向用戶推薦電影。每次用戶觀看電影或對其進行評分時,都應更新推薦。為了簡單起見,我正在考慮考慮兩個因素:
- 用戶過去對其他電影的評分
- 用戶觀看某些過去電影的時間
如何建立這樣一個模型,學術文獻有什麼建議?
我是這個領域的新手,我猜測線性回歸模型可以提供良好的結果,而不是想用更複雜的方法來避免在參數估計中施加不必要的不確定性。但也許已經有一些在實踐中常用的方法?
這其實是機器學習領域比較有名的問題。在 2006 年左右,Netflix 向算法提供了 100 萬美元,該算法為其推薦系統提供了最佳合理改進。在這本加州理工學院機器學習入門教科書中簡要討論了獲勝解決方案的理論。
基本上使用了集成學習方法。特別是,採用了一種混合或堆疊。這是不平凡的,但有點直觀。要理解和諧地使用不同統計方法的直覺,請考慮不同人喜歡同一部電影的不同原因:即,喬可能喜歡 Topgun 是因為他喜歡 80 年代的動作片,而 Jane 喜歡 Topgun 是因為她喜歡帶有 Kenny Loggins 配樂的電影。因此,兩位觀眾都觀看(並高度評價這部電影)這一事實並不一定意味著他們很可能會喜歡其他電影。理想情況下,預測算法至少在某些方面能夠適應這些差異。
這可能使解決方案聽起來很簡單,但平衡競爭算法並為每種情況確定最佳猜測的優先級絕對不簡單。Netflix 提供如此大筆獎金的事實應該使挑戰的規模相當明顯。
如果您剛剛開始學習機器學習,根據您的興趣水平和數學背景,查看上述資源可能會有所幫助。所以回歸可能會工作得很好,但可能會有更好的性能。