¿Cómo evalúo la desviación estándar?

15

He recopilado respuestas de 85 personas sobre su capacidad para realizar ciertas tareas.

Las respuestas están en una escala Likert de cinco puntos:

5 = Muy bueno, 4 = Bueno, 3 = Promedio, 2 = Malo, 1 = Muy pobre,

La puntuación media es 2.8 y la desviación estándar es 0.54.

Entiendo lo que significan la media y la desviación estándar.

Mi pregunta es: ¿qué tan buena (o mala) es esta desviación estándar?

En otras palabras, ¿hay alguna guía que pueda ayudar en la evaluación de la desviación estándar?

Amarald
fuente
¿Qué significaría que el SD sea bueno o malo aquí?
gung - Restablece a Monica
77
Es bastante difícil obtener una SD tan pequeña con datos como este: para una media de 2.8, la SD debe ser al menos . (Incluso si 2.8 representa un valor redondeado, la DE todavía debe exceder 0.357.) Una DE de 0.54 implica que no más de dos personas podrían haber respondido con un 5 (con 21 2 y 62 3) y no más de seis podrían haber respondido con un 1 (con 5 2's y 74 3's). Esto sugiere que la pregunta puede proporcionar información excepcionalmente escasa porque la escala no discrimina de manera efectiva. 0.2 0.2×0.8=0.4 0.4
whuber
@whuber excelentes datos para la física! Pero también podría imaginar que o promedió diferentes preguntas o hizo algo mal en sus cálculos. Parece difícil imaginar que las personas realmente respondieran de manera tan uniforme, especialmente cuando hablaban de sus supuestas habilidades.
Erik

Respuestas:

17

Las desviaciones estándar no son "buenas" o "malas". Son indicadores de la dispersión de sus datos. A veces, en las escalas de calificación, queremos una amplia difusión porque indica que nuestras preguntas / calificaciones cubren el rango del grupo que estamos evaluando. Otras veces, queremos un pequeño SD porque queremos que todos estén "altos".

3 3+2

Entonces. ¿Cuál es el propósito de tu prueba? ¿Quiénes están en la muestra?

Peter Flom - Restablece a Monica
fuente
2
(+1) Solo para agregar un poco a la observación "Las desviaciones estándar no son 'buenas' o 'malas'": tener un predictor con una gran desviación estándar puede ser "bueno" porque, en la regresión, está inversamente relacionado con el estándar error de una estimación del coeficiente de regresión. Por otro lado, si le preocupa la precisión de una medición, entonces una gran desviación estándar es "mala". Supongo que el interés del cartel original está más cerca del anterior, pero no está claro.
Macro
10

Respuesta corta, está bien y es un poco más bajo de lo que podría haber esperado de los datos de la encuesta. Pero probablemente su historia de negocios esté más en la media o en el porcentaje del top 2 de la caja.

Para escalas discretas de la investigación en ciencias sociales, en la práctica la desviación estándar es una función directa de la media. En particular, he encontrado a través del análisis empírico de muchos de estos estudios que la desviación estándar real en las encuestas en escalas de 5 puntos es del 40% al 60% de la variación máxima posible (por desgracia, aquí no está documentado).

En el nivel más simple, considere los extremos, imagine que la media fue 5.0. La desviación estándar debe ser cero, ya que la única forma de promediar 5 es que todos respondan 5. Por el contrario, si la media fue 1.0, entonces el error estándar también debería ser 0. Entonces, la desviación estándar se define con precisión dada la media.

Ahora en el medio hay más área gris. Imagine que las personas pudieran responder 5.0 o 1.0 pero nada intermedio. Entonces la desviación estándar es una función precisa de la media:

stdev = sqrt ((5-mean) * (mean-1))

La desviación estándar máxima para las respuestas en cualquier escala acotada es la mitad del ancho de la escala. Aquí es sqrt ((5-3) (3-1)) = sqrt (2 * 2) = 2.

Ahora, por supuesto, las personas pueden responder valores intermedios. A partir de los metaestudios de los datos de la encuesta en nuestra empresa, encuentro que la desviación estándar para las escalas numéricas en la práctica es del 40% al 60% del máximo. Específicamente

  • 40% para escalas de puntos 100%,
  • 50% para escalas de 10 puntos y
  • 60% para escalas de 5 puntos y
  • 100% para escalas binarias

Entonces, para su conjunto de datos, esperaría una desviación estándar de 60% x 2.0 = 1.2. Obtuviste 0,54, que es aproximadamente la mitad de lo que hubiera esperado si los resultados fueran calificaciones autoexplicadas. ¿Los resultados de las calificaciones de habilidades de baterías de pruebas más complicadas son promedios y, por lo tanto, tendrían una variación menor?

Sin embargo, la verdadera historia es que la capacidad es tan baja o tan alta en relación con otras tareas. Informe las medias o los porcentajes de top-2-box entre habilidades y centre su análisis en eso.

prototipo
fuente
-1

Si los datos se distribuyen normalmente, podría ver cómo se ubica la población.

  • El 68% de todas las personas se encuentran dentro de 1 desviación estándar de la media ( 2.26 - 3.34):

ingrese la descripción de la imagen aquí

  • El 95% de todas las personas se encuentran dentro de 2 desviaciones estándar de la media ( 1.72 - 3.88):

ingrese la descripción de la imagen aquí

Te dice qué tan "dispersos" están tus números.

Ian Boyd
fuente
1
Esta respuesta no ha sido votada porque es incorrecta: utiliza una regla general aproximada (como si fuera exacta) en un caso en el que no es aplicable. La respuesta sería verdadera si se reemplazara por las conclusiones de la Desigualdad de Chebyshev (que establece que al menos el 75% de las observaciones se encuentran dentro de dos SD de la observación media; es decir, al menos el 75% de las respuestas son 2 o 3), pero esto No proporcionará mucha información.
whuber
Además, solo es cierto para poblaciones verdaderamente normalmente distribuidas. A partir de ahí, puede calcular los números de forma arbitraria exactamente al evaluar la integral sobre el pdf normal con los límites dados por el sd alrededor de la media. Realmente no es útil aquí.
Douba