Tengo algunos datos interesantes sobre los artistas musicales más populares transmitidos divididos por ubicación en unos 200 distritos del Congreso. Quiero ver si es posible sondear a una persona sobre sus preferencias musicales y determinar si él o ella "escucha como un demócrata" o "escucha como un republicano". (Naturalmente, esto es alegre, ¡pero hay una entropía real en los datos!)
Tengo datos sobre unos 100 artistas, más el porcentaje promedio de votos para republicanos y demócratas en cada distrito durante los últimos tres ciclos electorales. Así que corrí una correlación en cada artista para ver cuáles eran los que se escuchaban de manera más desproporcionada en función de la participación en el voto de los demócratas. Esas correlaciones van desde aproximadamente -0.3 a 0.3 para cualquier artista dado, con muchas en el medio que tienen poco o ningún poder predictivo.
Tengo dos preguntas: Primero, el número total de transmisiones por distrito varía ampliamente. En este momento, estoy correlacionando el porcentaje de todas las transmisiones por distrito pertenecientes, por ejemplo, a Beyonce, con el porcentaje de votos emitidos para los demócratas. Pero las corrientes totales en un distrito podrían estar en millones, mientras que otro está en los bajos 100,000. ¿Necesito ponderar la correlación de alguna manera para dar cuenta de esto?
En segundo lugar, tengo curiosidad por saber cómo combinar estas correlaciones en una conjetura compuesta sobre la política del usuario. Digamos que tomo a los 20 artistas con los valores correlativos absolutos más altos (positivos y negativos), diez en cada dirección, y encuesta a un usuario sobre cuánto le gusta a cada artista. Así que tengo votos positivos o negativos para cada artista más la correlación con la política para los 20 valores. ¿Existe una forma estándar de combinar estas correlaciones en una sola estimación? (Estoy pensando en algo como el famoso cuestionario de dialecto de NYTimes , donde combina las probabilidades regionales de 25 preguntas en un mapa de calor. Pero en este caso, solo necesito un solo valor sobre qué tan democrático o republicano es el gusto musical).
¡Gracias!
fuente