¿Qué es una desviación estándar?

31

¿Qué es una desviación estándar, cómo se calcula y cuál es su uso en estadísticas?

Oren Hizkiya
fuente
77
No creo que el propósito de este sitio sea responder preguntas de alumnos de 6to grado. Y mi hijo, cuando se enfrenta a una pregunta así, busca la respuesta en Google. Si hay una parte específica de la definición que no comprende, pregunte. Pero una pregunta tan desenfocada sobre un tema tan básico indica (para mí de todos modos) que el póster ni siquiera intentó encontrar una respuesta. ¿Cuál será el próximo "¿Qué es un número y cómo se usan?"
PeterR
99
Creo que esta pregunta está bien. En realidad, fue el ejemplo más votado sobre la pregunta de tema en el Área 51. ¡Lo básico está bien aquí!
Peter Smit el
66
De acuerdo, es una pregunta válida. También está bien indicado, ya que pide, por ejemplo, el uso y el cálculo. Seguramente el propósito del sitio es crear un repositorio para TODAS las preguntas estadísticas.
Joel
55
Estoy de acuerdo con Joel. La desviación estándar es un concepto importante en estadística. ¿No sería absurdo si no pudieras hacer una pregunta al respecto en un sitio sobre preguntas estadísticas?
Parbury
44
Como maestra de secundaria en una vida anterior, diré que no hay preguntas tontas. En el momento en que etiqueta una pregunta como indigna, ese momento le quita la forma más potente de aprendizaje, ¡es hacer preguntas! (Voy a responder esta pregunta a continuación.)
Adhesh Josh

Respuestas:

30

La desviación estándar es un número que representa la "dispersión" o "dispersión" de un conjunto de datos. Existen otras medidas para la propagación, como el rango y la varianza.

Aquí hay algunos ejemplos de conjuntos de datos y sus desviaciones estándar:

[1,1,1]     standard deviation = 0   (there's no spread)  
[-1,1,3]    standard deviation = 1.6 (some spread) 
[-99,1,101] standard deviation = 82  (big spead)

Los conjuntos de datos anteriores tienen la misma media.

La desviación significa "distancia de la media".

"Estándar" aquí significa "estandarizado", lo que significa que la desviación estándar y la media están en las mismas unidades, a diferencia de la varianza.

Por ejemplo, si la altura media es de 2 metros , la desviación estándar podría ser de 0,3 metros , mientras que la varianza sería de 0,09 metros cuadrados .

Es conveniente saber que al menos el 75% de los puntos de datos siempre se encuentran dentro de las 2 desviaciones estándar de la media (o alrededor del 95% si la distribución es Normal).

Por ejemplo, si la media es 100 y la desviación estándar es 15, entonces al menos el 75% de los valores están entre 70 y 130.

Si la distribución resulta ser Normal, entonces el 95% de los valores están entre 70 y 130.

En términos generales, los puntajes de las pruebas de CI se distribuyen normalmente y tienen un promedio de 100. Alguien que es "muy brillante" tiene dos desviaciones estándar por encima de la media, lo que significa un puntaje de prueba de CI de 130.

Neil McGuigan
fuente
Neil, gracias por tu respuesta, ¿podrías explicar con más detalles la parte "estándar" en el término "desviación estándar"? Si es apropiado, podría tocar el mismo término "estándar" en "error estándar de media". Gracias de antemano.
Stan
Re sus ediciones recientes: ¿en qué sentido la SD está "estandarizada"? Por lo general, se convierte en la base para la estandarización, pero no está estandarizada en sí misma (como reescalarla mediante alguna estimación de su variación de muestreo).
whuber
Está estandarizado para estar en la misma unidad que la media
Neil McGuigan
El ejemplo con una altura media de 2 metros es un buen ejemplo de la necesidad de cuidar el uso de decimales. El mismo ejemplo podría hacerse en centímetros donde una desviación estándar de 30 centímetros derivaría lógicamente de una varianza de 900 centímetros.
Robert Jones
Mi impresión es que deben evitarse en las unidades primarias de medida. Considere los resultados de una SD de 0.133 en metros convertidos a decímetros, centímetros y milímetros. ¿A alguien le gustaría dilucidar, por favor?
Robert Jones
9

Una cita de Wikipedia .

Muestra cuánta variación hay del "promedio" (valor medio o esperado / presupuestado). Una desviación estándar baja indica que los puntos de datos tienden a estar muy cerca de la media, mientras que la desviación estándar alta indica que los datos se extienden en un amplio rango de valores.

c4il
fuente
5

Al describir una variable, generalmente la resumimos utilizando dos medidas: una medida de centro y una medida de propagación. Las medidas comunes de centro incluyen la media, la mediana y la moda. La medida común de propagación incluye la varianza y el rango intercuartil.

La varianza (representada por la sigma griega minúscula elevada a la potencia dos) se usa comúnmente cuando se informa la media. La varianza es la desviación cuadrática promedio de la variable. La desviación se calcula restando la media de cada observación. Esto es al cuadrado porque la suma sería cero y la cuadratura elimina este problema mientras se mantiene el tamaño relativo de las desviaciones. El problema con el uso de la variación como medida de propagación es que está en unidades cuadradas. Por ejemplo, si nuestra variable de interés era la altura medida en pulgadas, la varianza se informaría en pulgadas cuadradas, lo que tiene poco sentido. La desviación estándar (representada por la sigma en minúscula griega) es la raíz cuadrada de la varianza y devuelve la medida de propagación a las unidades originales.

Cuando se usa la desviación estándar, hay que tener cuidado con los valores atípicos, ya que sesgarán la desviación estándar (y la media) ya que no son medidas resistentes de propagación. Un ejemplo simple ilustrará esta propiedad. La media de mis terribles puntajes de bateo de cricket de 13, 14, 16, 23, 26, 28, 33, 39 y 61 es 28.11. Si consideramos que 61 es un valor atípico y lo eliminamos, la media sería 24.

Graham Cookson
fuente
1
σ2σ
2

Así es como respondería esta pregunta usando un diagrama.

Digamos que pesamos 30 gatos y calculamos el peso medio. Luego producimos un diagrama de dispersión, con peso en el eje yy identidad de gato en el eje x. El peso medio se puede dibujar como una línea horizontal. Luego podemos dibujar líneas verticales que conectan cada punto de datos con la línea media: estas son las desviaciones de cada punto de datos de la media, y las llamamos residuales. Ahora, estos residuos pueden ser útiles porque nos pueden decir algo sobre la difusión de los datos: si hay muchos residuos grandes, entonces los gatos varían mucho en masa. Por el contrario, si los residuos son principalmente pequeños, entonces los gatos se agrupan bastante cerca del peso promedio. Entonces, si pudiéramos tener alguna métrica que nos diga el promediolongitud de un residuo en este conjunto de datos, esta sería una forma práctica de denotar la extensión que hay en los datos. La desviación estándar es, efectivamente, la longitud del residuo promedio.

Seguiría con esto dando el cálculo para sd, explicando por qué cuadramos y luego raíz cuadrada (me gusta la breve y dulce explicación de Vaibhav). Luego mencionaría los problemas de los valores atípicos, como lo hace Graham en su último párrafo.

Freya Harrison
fuente
1

Si la información requerida es la distribución de datos sobre la media, la desviación estándar es útil.

La suma de la diferencia de cada valor de la media es cero (obviamente, dado que el valor se distribuye uniformemente alrededor de la media), por lo tanto, cuadramos cada diferencia para convertir los valores negativos en positivos, sumarlos a través de la población y tomar su raíz cuadrada. Este valor se divide por el número de muestras (o el tamaño de la población). Esto da la desviación estándar.

Vaibhav Garg
fuente
".de aquí que cuadramos cada diferencia ..." También podríamos tomar el valor absoluto para deshacernos de los valores negativos. Entonces, ¿por qué la cuadratura es un método mejor ya que tenemos que sacar una raíz cuadrada al final? ¿Por qué no simplemente sumar los valores absolutos de las desviaciones?
Dilip Sarwate
Visto este? enlace
Vaibhav Garg
45
1
@DilipSarwate, con el debido respeto, la prueba por autoridad no me impresiona. La suposición de que "por lo tanto" es "autoritario" es un "hombre de paja" que preferiría ignorar. El nivel de detalle en cualquier declaración dada es proporcional a la inclinación y / o la importancia pedagógica de la misma en un contexto dado. Supongo que una persona que pregunta "¿Qué es una desviación estándar, cómo es ... así sucesivamente?" Es posible que no desee cargar con rigurosas definiciones matemáticas de lo mismo. La simplificación es deliberada y, permíteme asegurarte, no es el resultado de no ser consciente.
Vaibhav Garg
1
¿Y qué, por favor, diga, es ... "por lo tanto, cuadramos ..." aparte de una prueba de autoridad que no te impresiona? No hay una razón lógica por la que la cuadratura sea automáticamente la solución al problema, como implica su "por lo tanto".
Dilip Sarwate
1

Me gusta pensar de la siguiente manera: la desviación estándar es la distancia promedio del promedio . Esto es más útil conceptualmente que matemáticamente útil, pero es una buena manera de explicarlo a los no iniciados.

Behacad
fuente
0

Una desviación estándar es la raíz cuadrada del segundo momento central de una distribución. Un momento central es la diferencia esperada del valor esperado de la distribución. Un primer momento central generalmente sería 0, por lo que definimos un segundo momento central como el valor esperado de la distancia al cuadrado de una variable aleatoria de su valor esperado.

Para ponerlo en una escala que esté más en línea con las observaciones originales, tomamos la raíz cuadrada de ese segundo momento central y lo llamamos la desviación estándar.

La desviación estándar es una propiedad de una población. Mide cuánta "dispersión" promedio hay en esa población. ¿Están todas las obsrvaciones agrupadas alrededor de la media, o están muy extendidas?

Para estimar la desviación estándar de una población, a menudo calculamos la desviación estándar de una "muestra" de esa población. Para hacer esto, tome observaciones de esa población, calcule una media de esas observaciones y luego calcule la raíz cuadrada de la desviación cuadrática promedio de esa "media de muestra".

Para obtener un estimador imparcial de la varianza, en realidad no calcula la desviación cuadrática promedio de la media de la muestra, sino que divide entre (N-1) donde N es el número de observaciones en su muestra. Tenga en cuenta que esta "desviación estándar muestral" no es un estimador imparcial de la desviación estándar, pero el cuadrado de la "desviación estándar muestral" es un estimador imparcial de la varianza de la población.

Baltimark
fuente
66
Esta es una respuesta increíblemente poco clara. Intenta escribir en inglés.
Neil McGuigan el
1
Tal vez sea así. es una persona que hace esta pregunta, una persona que salió de la calle o una persona que al menos ha abierto un libro de estadísticas. Decirle a alguien que la desviación estándar es solo la raíz cuadrada de la varianza es una pregunta completamente diferente.
Baltimark
-1

¡La mejor forma en que he entendido la desviación estándar es pensar en una peluquería! (Debe recopilar datos de una peluquera y calcular su velocidad de corte de cabello para que este ejemplo funcione).

Al peluquero le toma un promedio de 30 minutos cortar el cabello de una persona.

Suponga que hace el cálculo (la mayoría de los paquetes de software lo harán por usted) y descubre que la desviación estándar es de 5 minutos. Significa lo siguiente:

  • la peluquera corta el cabello del 68% de sus clientes en 25 minutos y 35 minutos
  • la peluquera corta el cabello del 96% de sus clientes en 20 y 40 minutos

¿Cómo se esto? Debe observar la curva normal, donde el 68% cae dentro de 1 desviación estándar y el 96% cae dentro de 2 desviaciones estándar de la media (en este caso, 30 minutos). Entonces sumas o restas la desviación estándar de la media.

Si se desea consistencia, como en este caso, cuanto menor sea la desviación estándar, mejor. En este caso, el peluquero pasa un máximo de aproximadamente 40 minutos con cualquier cliente. ¡Necesitas cortar el pelo rápido para ejecutar un salón exitoso!

Adhesh Josh
fuente
No creo que corrijas tu respuesta, Adhesh. Tienes información contradictoria aquí. Vea si está de acuerdo con mis ediciones, ¿de acuerdo?
rolando2
1
Solo ha descrito la interpretación de la desviación estándar en el caso de la distribución normal. La 'regla del 68%' y (y la regla del 95%) solo se aplican a los datos distribuidos normalmente. Al menos indique que las dos viñetas solo son ciertas si los tiempos de corte de cabello siguen una distribución normal.
Macro
Macro, mencioné la curva normal y es un hecho que si usa la curva normal, los datos seguirían una distribución normal.
Adhesh Josh
@ rolando2 Parece que no entiendo lo que está mal con la explicación de
Adhesh
@Amarald: ¿ha hecho clic en "31 de enero a la 1:06" para ver las versiones antes y después de la edición? Creo que la respuesta es más fuerte después, aunque Macro también hace un punto importante.
rolando2