Hubo elecciones generales donde vivo ayer y la cadena de televisión comenzó a llamar a los ganadores mucho antes de que se abrieran todas las papeletas.
Salieron bien en todas las cuentas, y no estoy realmente sorprendido de que lo hayan hecho. Sé que las estadísticas son absolutamente viables. Aún así, tengo curiosidad. Asumiendo:
- hemos abierto de papeletas;
- tenemos candidatos cuyos puntajes actuales son ;
¿Cómo podemos calcular la certeza con la que el candidato principal es el ganador?
Respuestas:
La principal dificultad en la práctica no es la incertidumbre estadística de que una racha de suerte le hubiera dado a un candidato más votos. La principal dificultad, en un orden de magnitud o más, es que las papeletas que se han abierto casi nunca son una muestra imparcial de los votos emitidos. Si ignoras este efecto, obtienes el famoso error "Dewey derrota a Truman", que ocurrió con una gran muestra sesgada.
En la práctica, los votantes que favorecen a un candidato frente a otro no están distribuidos de manera equitativa por región, por si trabajan durante el día o por si serían desplegados en el extranjero, por lo tanto, votarían en boletas en ausencia. Estas no son pequeñas diferencias.
Creo que lo que hacen las organizaciones de noticias ahora es dividir a la población en grupos y usar los resultados para estimar cómo votó cada grupo (incluida la participación). Estos pueden basarse en modelos y suposiciones previas basadas en elecciones anteriores, no solo en los datos de esta elección. Estos pueden no tener en cuenta las rarezas, como las boletas de mariposa de Palm Beach.
fuente
En el muestreo por encuesta, se necesita el error estándar de la estimación de la proporción. Depende más de i que de j. También requiere que las boletas abiertas i se seleccionen al azar. Si p es la verdadera proporción final para el candidato A, entonces la varianza de la estimación es
Al hacer una proyección, los encuestadores pueden seleccionar una muestra aleatoria estratificada de los votos acumulados para evitar posibles sesgos que pueden ocurrir si se miran todas las papeletas contadas. El problema con mirar todos los votos acumulados es que ciertos recintos completan el recuento sobre otros y pueden no ser representativos de la población.
El artículo aquí proporciona una buena cobertura del problema y numerosas referencias.
Se ha señalado que los votos acumulados pueden proporcionar estimaciones sesgadas de las proporciones porque los precintos que aún no se han informado son recintos que tienden a favorecer al partido con el candidato que está siguiendo o las boletas en ausencia probablemente favorezcan al candidato que está siguiendo y esos votos se cuentan al final. Los encuestadores sofisticados como Harris y Gallup no caen en tales trampas. El simple análisis de la construcción de intervalos de confianza basados en los votos acumulados que he esbozado es solo un factor que se utiliza. Estos encuestadores tienen mucha más información a su disposición. Tienen encuestas que se realizaron poco antes de las elecciones y tienen los patrones de votación de todos los recintos electorales y votos ausentes tomados en las elecciones en los últimos años.
Entonces, si hay sesgos claros que podrían llevar a una elección cerrada en la dirección opuesta, los encuestadores lo reconocerán y no proyectarán un ganador.
En los Estados Unidos, las boletas en ausencia provienen principalmente de los militares en el extranjero y estudiantes universitarios que están en la escuela lejos de casa. Mientras que los militares tienden a ser más conservadores y tienen más probabilidades de votar por los republicanos, los estudiantes universitarios tienden a ser más liberales y tienen más probabilidades de votar por los demócratas. Todas estas consideraciones son tomadas en cuenta.
El cuidado y la sofisticación de las encuestas modernas es la razón por la que no se han producido errores graves como la encuesta Literary Digest de 1936 o la concesión prematura del periódico de Chicago de las elecciones de 1948 a Dewey desde entonces.
fuente