¿Cómo se relacionan los márgenes de error con los intervalos de confianza?

11

¿Alguien puede decirme la diferencia entre los márgenes de error y los intervalos de confianza? En Internet veo que estos dos significados se usan indistintamente.

¿Es correcto decir

¿"Los intervalos de confianza se muestran como 1.96 y se muestran en los gráficos como márgenes de error"?

Mintuz
fuente
1
Se pueden encontrar discusiones útiles sobre este tema buscando en nuestro sitio .
whuber

Respuestas:

13

Internet está lleno de basura, como todos sabemos. Ayuda a encontrar fuentes autorizadas y enfocarse en ellas para ayudar a resolver tales problemas. Un folleto publicado por la Asociación Americana de Estadística (atribuido a Fritz Scheuren y "actualizado a fondo alrededor de 1997") define el margen de error como un intervalo de confianza del 95% (p. 64, a la derecha).

A la luz de esto, es sorprendente que el artículo de Wikipedia sobre margen de error utilice una definición diferente, ¡aunque hace referencia a este folleto! Wikipedia escribe,

El margen de error generalmente se define como el "radio" (o la mitad del ancho) de un intervalo de confianza para una estadística particular de una encuesta. ... Cuando se informa un único margen de error global para una encuesta, se refiere al margen de error máximo para todos los porcentajes informados utilizando la muestra completa de la encuesta.

En otras palabras, para Wikipedia, el MoE es la mitad del ancho máximo de un conjunto de intervalos de confianza (que podrían tener coberturas diferentes del 95%).

Hemos discutido esta confusión (o, al menos, la falta de estandarización) en los comentarios en otras partes de este sitio. Nuestra conclusión fue que debe tener claro lo que quiere decir con "margen de error" cuando usa ese término.

whuber
fuente
7

No existe una convención universal sobre lo que es un "margen de error", pero creo que (como ha observado) se usa con mayor frecuencia como el radio de un intervalo de confianza , ya sea en la escala original de la estimación o como un porcentaje de una estimación. A veces se usa como sinónimo del "error estándar", por lo que debe tener cuidado de que otros entiendan lo que quiere decir cuando lo usa.

Un "intervalo de confianza" no tiene convenio universal sobre su significado. Básicamente es el rango de posibles estimaciones generadas por un proceso de estimación que contendría, X% del tiempo (siendo el 95% el más utilizado) el valor verdadero del parámetro que se estima. Este concepto de un "proceso" que produciría el verdadero valor X% de las veces es un poco contra-intuitivo y no debe mezclarse con un "intervalo de credibilidad" de la inferencia bayesiana, que tiene una definición mucho más intuitiva, pero es no es lo mismo que el intervalo de confianza ampliamente utilizado.

Su presupuesto actual es un poco desordenado y necesita algunas reparaciones menores como se describe. Evitaría este uso adicional de la palabra "margen" y favorecería las "barras de error". Entonces:

"Los intervalos de confianza se estiman en 1.96 multiplicado por los errores estándar relevantes y se muestran en los gráficos como barras de error".

(Esto deja de lado la pregunta de si esta es una buena manera de calcular los intervalos de confianza, que depende de su modelo, etc. y no es relevante).

Comentario final sobre la terminología: no me gusta el "error estándar", que solo significa "la desviación estándar de la estimación"; o "error de muestreo" en general: prefiero pensar en términos de aleatoriedad y la varianza de las estadísticas, en lugar de "errores". Pero me metí en el uso del término "error estándar" anterior porque supongo que es muy utilizado.

Peter Ellis
fuente