¿Se puede informar una desviación estándar de puntajes brutos como una desviación estándar de porcentajes?

8

Supongamos que tenemos una prueba que consta de 30 preguntas, y 10 personas toman esta prueba. El puntaje promedio de la prueba de estas 10 personas es 17, y la desviación estándar de todos los puntajes en la muestra es 4. Al informar las estadísticas descriptivas en la escuela, usamos estos puntajes brutos y escribimos ( M = 17, SD = 4); pero en algunos casos tengo la sensación de que reportar porcentajes sería mejor. Porque creo que tenemos una comprensión más intuitiva de lo que significa anotar 56.7 sobre 100 que anotar 17 sobre 30 (probablemente porque estamos acostumbrados al sistema decimal).

Entonces, para el ejemplo dado anteriormente, ¿sería posible informar la media y la desviación estándar como ( M = 56.7%, SD = 13.3%)?

¿Tiene sentido decir que los puntajes del examen en una muestra tienen la desviación estándar de 13.3%?

Estos porcentajes son el equivalente aritmético de los puntajes brutos que preparé y proporcioné anteriormente, pero no estoy seguro de si es una buena práctica convertirlos directamente en porcentajes como ese.

Freya
fuente
AFAIK puede transformar variables continuas a otra escala y mostrar la distribución en esa escala siempre que tenga claro cómo llegó allí. Sin embargo, en su caso, puede preguntarse si la puntuación bruta obtenida de 30 preguntas ofrece suficiente información para transformarse en una escala continua que va de 0 a 100 (%) (porque los datos solo admiten incrementos de 3.33%).
IWS
Sí, eso es verdad. Un puntaje superior a 30 no es tan informativo como el puntaje convertido (más de 100), porque los incrementos de 100 son más pequeños (1) y, por lo tanto, una prueba de más de 100 puntos sería más "sensible" siempre que todas las calificaciones sean enteras. Aún así, dada su respuesta, creo que no se considerará "negligencia" en mi caso denunciarlos de esta manera. (En realidad, estoy preparando una tarea para la escuela, e informaré la media bruta y la DE en el texto, pero creo que tendrá más sentido mostrar estos puntajes como porcentajes en las tablas y gráficos). Por lo que entiendo, esto sería factible.
Freya
Solo para completar: tenga en cuenta que algunas transformaciones en realidad pueden cambiar la forma de la distribución, por lo que no solo debe aplicar la transformación que desea aplicar a sus datos directamente a su ubicación de medida y propagación. En su lugar, aplique la transformación a sus datos y luego evalúe las medidas de ubicación y propagación como si se tratara de los datos originales (es decir, redefina la media y la SD en su caso).
IWS
Técnicamente, como una medida de la distancia en lugar de la ubicación, el SD sería puntos porcentuales (pp) en lugar de porcentaje. También desconfiaría de interpretarlo en este contexto, ya que el modelo de error debería tener en cuenta que la escala es discreta como se menciona en @freya.
James

Respuestas:

13

La desviación estándar es solo una propiedad estadística que puede medir para un conjunto de puntos de datos. La desviación estándar en sí misma no supone que sus datos se distribuyan normalmente o que no hayan pasado por ninguna transformación, lineal o de otro tipo.

Por lo tanto, es perfectamente aceptable usar la desviación estándar en cualquier dato, incluidos los puntajes porcentuales.

Tenga en cuenta que, en su caso particular, la transformación que está aplicando es una transformación lineal, de la forma:

y=Ax+b

es decir, una transformación afín. Por lo tanto, puede calcular la desviación estándar en los datos originales no transformados y luego multiplicar por Apara obtener la desviación estándar después de la transformación. Parece que no hay una ventaja particular al hacer esto en lugar de simplemente calcular la desviación estándar en los datos ya transformados, pero podría ser tranquilizador.

Podemos ver que una transformación afín transformará la desviación estándar linealmente por , como sigue:A

Dado que tenemos datos de entrada , la desviación estándar original, , estará dada por:{X1,X2,...,Xn}σ

σX2=1ni=1n(Xi1nj=1nXj)2

Apliquemos la transformación . Entonces nosotros tenemosY=AX+b

σY2=1norteyo=1norte(UNAXyo+si-1nortej=1norte(UNAXj+si))2

=1norteyo=1norte(UNAXyo+si-norte1nortesi-1nortej=1norte(UNAXj))2

=1norteyo=1norte(UNAXyo-1nortej=1norte(UNAXj))2

=UNA2(1norteyo=1norte(Xyo-1nortej=1norte(Xj))2)

=UNA2σX2

Por lo tanto

σY=UNAσX.
Hugh Perkins
fuente
Esto es realmente muy útil e iluminador. Gracias.
Freya