¿Para qué se usa el error estándar?

9

Estoy usando un tutorial que encontré y trazando valores medios junto con los errores estándar para mostrar mis datos. Pero tengo un problema para discutir los resultados. Mi diagrama es como se muestra a continuación: algunos de los errores estándar (mostrados como una barra de error) varían mucho y algunos de ellos son muy cercanos a cero.

ingrese la descripción de la imagen aquí

berkay
fuente
2
Un problema secundario aquí es que el uso de barras puede resultar confuso. Trivialmente, las barras descendentes son un trabajo un poco más difícil que las barras ascendentes. Más fundamentalmente, las barras que comienzan en 1e-3 son arbitrarias. Más positivamente, mostrar estimaciones puntuales por símbolos de puntos y agregar barras de error sería mucho más simple que mostrar barras más barras de error. Google "plot de dinamita" para más.
Nick Cox
No estoy seguro de cuál es la pregunta. Según la respuesta que marcó correcta y el título, podría ser simplemente saber qué es un error estándar. Pero según lo que tiene aquí, parece que necesita ayuda para describir los datos. ¿Podría por favor aclarar en la pregunta? Además, si desea ayuda para describir los datos, por favor, relacione más sobre los datos, no solo sobre la figura. Las N en cada grupo y el significado de los valores serían útiles. Cualquier transformación realizada también sería útil.
John

Respuestas:

10

Las barras de error en general son para convencer al lector de la trama de que las diferencias que ve en la trama son estadísticamente significativas. En una aproximación, puede imaginar un pequeño gaussiano cuyo rango se muestra como esta barra de error: la "integración visual" de un producto de dos gaussianos de este tipo tiene más posibilidades de que los dos valores sean realmente iguales.±1σ

En este caso particular, se puede ver que tanto la diferencia entre la barra roja y violeta como la gris y la verde no son demasiado significativas.


fuente
¿Qué pasa con el error estándar en este caso? como barras de error trazadas.
berkay
Es una barra de error pobre si ese es el propósito. La no superposición de las barras no es suficiente para la significancia estadística y la cantidad de no superposición necesaria para ser realmente diferente a 0.05 varía con N. ¿Y qué significa "no demasiado significativo"? Ambas condiciones marginales que usted señala fallarían una prueba t.
John
@John Como escribí, las barras de error son una pista visual para ayudar a hacer evaluaciones ad hoc mientras se investiga la trama; Las pruebas reales necesitan alguna hipótesis para ser probadas, por lo que obviamente debería suceder en el texto.
11

En general, el error estándar le dice cuán incierto es que el verdadero valor de la parte superior de la barra es donde la barra dice que está. Cuando hay varias barras, también puede permitir comparaciones entre barras, en el sentido de una prueba estadística. Sin embargo, interpretarlos de esta manera requiere algunos supuestos, que se muestran gráficamente a continuación. Si está realmente interesado en comparar las barras para ver si las diferencias son estadísticamente significativas, entonces debe ejecutar pruebas en los datos y mostrar qué pruebas fueron significativas, como esta.

comparación de significancia

Además, sugeriría usar intervalos de confianza en lugar de errores estándar.

Vale la pena leer este artículo:

Cumming y Finch. "Inferencia por ojo: intervalos de confianza y cómo leer imágenes de datos". Am Psych. Vol. 60, N ° 2, 170-180.

Su conclusión general es: "Busque barras que se relacionen directamente con los efectos de interés, sean sensibles al diseño experimental e interpreten los intervalos".

Para muestras independientes, utilizando intervalos de confianza, la mitad de la superposición de los IC significa que la diferencia es estadísticamente significativa.

barras independientes

Para muestras independientes que utilizan barras de error estándar, el siguiente gráfico muestra cómo calcular la significación estadística:

barras indep, SE

Ari B. Friedman
fuente
Esto no es realmente una respuesta (todavía). ¿Le importaría aumentar esta cita con información sobre cómo ayuda a responder la pregunta del OP? (por cierto, no soy el downvoter)
Gung - Restablecer Mónica
1
@gung La vida real intervino, así que publiqué una respuesta parcial. Actualizado.
Ari B. Friedman
6

Como dice mbq, las barras de error son una forma de permitir que sus lectores tengan una idea de si las diferencias entre dos grupos son significativas, es decir, si la variación dentro de cada uno de sus grupos es lo suficientemente pequeña como para creer que la diferencia que ha encontrado para la media entre sus grupos

Si todo lo demás es igual, las barras de error más grandes significan más diferencia dentro del grupo, pero parece que el eje y de su gráfico está transformado logarítmicamente, por lo que los grupos más bajos no están en la misma escala que los más altos.

Debe tener en cuenta que muchos de sus lectores no entenderán qué representan las barras de error, ¡incluso si lo explica explícitamente! A menudo, puede lograr el mismo objetivo con un diagrama de puntos nervioso o un diagrama de caja (o ambos juntos) para lograr el mismo efecto.

david w
fuente
con respecto al artículo que mencionó, es una observación interesante, sin embargo, no me sorprende. Encuentro que una parte significativa de los conceptos estadísticos y las prácticas comunes son confusos y complicados (a pesar de que tengo una sólida formación en matemáticas y he tomado varios cursos en estadística matemática). Personalmente, creo que muchos de los conceptos habrían sido mucho más fáciles de entender si se les enseñara visualmente y usaran ejemplos, en lugar de explicaciones verbales largas y complicadas.
posdef