多臂老虎機算法與 Uplift 建模

March 10, 2014

多臂強盜：http ://en.wikipedia.org/wiki/Multi-armed_bandit

提升建模：http ://en.wikipedia.org/wiki/Uplift_modelling

這兩種方法有何不同？它們有何相似之處？這個比那個好嗎？

編輯：如果需要示例場景，請考慮以下內容。我們在網上放置橫幅廣告，並希望定位到合適的人。基本上，那些看到廣告的人更有可能採取所需的行動。這聽起來像是一個提升模型問題，但我不確定武裝匪徒是否也適用於這種情況。

快五個月沒有回音了！我是這樣理解的：提升模型使用從隨機控制實驗中收集的結果來更好地選擇下一個週期的目標。多臂老虎機問題沒有控制組和實驗組。相反，它們是在線學習的問題，您可以在其中動態切換不同的治療方法。

引用自：https://stats.stackexchange.com/questions/89396

comments powered by Disqus

多臂老虎機算法與 Uplift 建模

相關問答