Data-Mining

奧巴馬競選中的數據挖掘技術

  • January 11, 2013

我看到了這篇關於奧巴馬連任競選中數據挖掘團隊的文章。不幸的是,這篇文章對統計算法的實際機制非常模糊。然而,這聽起來好像一般技術在社會和政治科學中是眾所周知的。由於這不是我的專業領域,任何人都可以向我指出有關此類技術的(概述)文獻嗎?

該區域稱為微定位(如果您想用谷歌搜索)。競選活動對他們的工具和程序非常保密,所以據我所知,除了 Hal Malchow 的《政治目標》(2008 年)或 Green & Gerber 的(2008 年)《退出投票:如何提高選民投票率》(後者涉及更多地涉及社會科學方面,例如哪些廣告有效等)。

在更多技術問題上,文獻更加稀缺,但請參見Murray & Scime (2010) 、 Imai & Strauss (2011)的政治分析論文(後印)或我們最近的應用統計年鑑論文Rusch, Lee, Hornik、Jank & Zeileis (2013)後印本)。它們的共同點是它們都使用數據挖掘技術,主要是基於樹的。

Murray & Scime 使用標準分類樹,如 CART。

魯施等人。使用分類樹、邏輯模型以及混合樹和邏輯回歸。他們還使用(除其他外)隨機森林、神經網絡、支持向量機和貝葉斯加法回歸樹來與他們的混合樹進行比較,如論文的回復中所述。他們的混合樹在其數據集上的表現與其他方法相當,並提供更高的可解釋性(我們還共享他們的代碼和數據)。

Imai & Strauss 很有趣,因為他們提出了一個用於優化活動計劃的綜合決策理論框架,而不僅僅是像其他人那樣進行微目標定位的工具。因此,他們非常關注運營研究的各個方面,即如何充分利用投入到競選活動中的每一美元。在他們使用統計技術進行微定位和投票率估計的框架方面,他們再次依賴於分類樹。

因此,似乎存在一些共識,即基於樹的方法在該領域的使用效果很好。

引用自:https://stats.stackexchange.com/questions/47516

comments powered by Disqus