Mis estadísticas han sido autodidactas, pero una gran cantidad de material que leo apunta a un conjunto de datos que tiene una media de 0 y una desviación estándar de 1.
Si ese es el caso, entonces:
¿Por qué la media 0 y la SD 1 son buenas propiedades?
¿Por qué una variable aleatoria extraída de esta muestra es igual a 0.5? La posibilidad de sacar 0.001 es la misma que 0.5, por lo que debería ser una distribución plana ...
Cuando la gente habla de Z Scores, ¿qué quieren decir realmente aquí?
fuente
Para comenzar, de lo que estamos hablando aquí es de la distribución normal estándar, una distribución normal con una media de 0 y una desviación estándar de 1. La abreviatura de una variable que se distribuye como una distribución normal estándar es Z.
Aquí están mis respuestas a sus preguntas.
(1) Creo que hay dos razones clave por las que las distribuciones normales estándar son atractivas. En primer lugar, cualquier variable distribuida normalmente puede convertirse o transformarse en una normal estándar restando su media de cada observación antes de dividir cada observación por la desviación estándar. Esto se llama transformación Z o creación de puntuaciones Z. Esto es muy útil, especialmente en los días anteriores a las computadoras.
La segunda razón por la cual la distribución normal estándar se usa con frecuencia se debe a la interpretación que se brinda en términos de puntajes Z. Cada "observación" en una variable transformada en Z es cuántas desviaciones estándar era la observación original no transformada de la media. Esto es particularmente útil para pruebas estandarizadas donde el rendimiento bruto o absoluto es menos importante que el rendimiento relativo.
(2) No te sigo aquí. Creo que puede estar confundido sobre lo que queremos decir con una función de distribución acumulativa. Tenga en cuenta que el valor esperado de una distribución normal estándar es 0, y este valor corresponde al valor de .5 en la función de distribución acumulativa asociada.
(3) Las puntuaciones Z son las "observaciones" o datos individuales en una variable que ha sido transformada en Z. Regrese a mi ejemplo de la variable: altura de las mujeres estadounidenses en pulgadas. Una observación particular de los cuales puede ser una mujer alta de 75 pulgadas de altura. La puntuación Z para esto es el resultado de la transformación Z de la variable como lo hicimos anteriormente:
fuente
Como recibió excelentes explicaciones de Graham y John, solo voy a responder su última pregunta:
La mejor manera de responder esto es pensar en esta pregunta: las calificaciones en la clase CS 101 normalmente se distribuyen conμ = 80 y σ = 5. ¿Cuál es el puntaje z para el grado 65?
Entonces: (65-80) / 5 = -3
Puede decir que el puntaje z para el grado 65 es -3 ; o en otras palabras, 3 desviaciones estándar a la izquierda.
fuente