Técnicas de minería de datos en la campaña de Obama

10

Encontré este artículo sobre el equipo de minería de datos en la campaña de reelección de Obama. Desafortunadamente, el artículo es muy confuso sobre la maquinaria real de los algoritmos estadísticos. Sin embargo, sonaba como si las técnicas generales fueran conocidas en ciencias sociales y políticas. Dado que esta no es mi área de especialización, ¿alguien puede señalarme literatura (general) sobre este tipo de técnicas?

fabee
fuente

Respuestas:

16

Esa área se llama microtargeting (si desea buscar en Google). Las campañas son muy reservado sobre sus herramientas y procedimientos, por lo que yo sepa, no hay mucho trabajo publicado excepción de Hal Malchow focalización Política (2008) o verde y Gerber (2008) salga del voto: Cómo aumentar el votante desvíos (éste haya de más con aspectos de ciencias sociales como qué anuncios son efectivos y tal).

En asuntos más técnicos, la literatura es aún más escasa, pero vea, por ejemplo, Murray & Scime (2010) , el documento de Análisis político de Imai & Strauss (2011) ( post - impresión ) o el reciente documento de Annals of Applied Statistics de nosotros Rusch, Lee, Hornik, Jank y Zeileis (2013) ( postimpresión ). Lo que todos tienen en común es que utilizan técnicas de minería de datos, principalmente basadas en árboles.

Murray y Scime usan árboles de clasificación estándar como CART.

Rusch y col. utilizar árboles de clasificación, modelos logísticos y un híbrido de árboles y regresión logística. También usan (entre otros) bosques aleatorios, redes neuronales, máquinas de vectores de soporte y árboles de regresión aditiva bayesiana para comparar con sus híbridos de árboles, como se describe en la réplica del artículo . Sus árboles híbridos funcionaron a la par con esos otros métodos en sus conjuntos de datos y ofrecen una mayor capacidad de interpretación (también compartimos su código y datos).

Imai & Strauss es interesante en la medida en que presentan un marco teórico de decisión integral para una planificación óptima de la campaña, no solo herramientas para la microtargencia como lo hacen los demás. Por lo tanto, se están centrando mucho en aspectos de la investigación operativa sobre cómo aprovechar al máximo cada dólar que se pone en la campaña. En el aspecto de su marco donde emplean técnicas estadísticas para microtargeting y estimación de participación, nuevamente confían en árboles de clasificación.

Por lo tanto, parece haber cierto consenso de que el uso de métodos basados ​​en árboles funciona bien en esta área.

Momo
fuente