Me preguntaba cuál es la diferencia entre la varianza y la desviación estándar.
Si calcula los dos valores, está claro que obtiene la desviación estándar de la varianza, pero ¿qué significa eso en términos de la distribución que está observando?
Además, ¿por qué realmente necesitas una desviación estándar?
Respuestas:
La desviación estándar es la raíz cuadrada de la varianza.
La desviación estándar se expresa en las mismas unidades que la media, mientras que la varianza se expresa en unidades cuadradas, pero para observar una distribución, puede usar cualquiera de ellos siempre que tenga claro lo que está usando. Por ejemplo, una distribución Normal con media = 10 y sd = 3 es exactamente lo mismo que una distribución Normal con media = 10 y varianza = 9.
fuente
No necesitas los dos. Cada uno tiene diferentes propósitos. El SD suele ser más útil para describir la variabilidad de los datos, mientras que la varianza suele ser mucho más útil matemáticamente. Por ejemplo, la suma de distribuciones no correlacionadas (variables aleatorias) también tiene una variación que es la suma de las variaciones de esas distribuciones. Esto no sería cierto para el SD. Por otro lado, la SD tiene la conveniencia de expresarse en unidades de la variable original.
fuente
Si John se refiere a variables aleatorias independientes cuando dice "distribuciones no relacionadas", entonces su respuesta es correcta. Sin embargo, para responder a su pregunta, se pueden agregar varios puntos:
La media y la varianza son los dos parámetros que determinan una distribución normal.
La desigualdad de Chebyshev limita la probabilidad de que una variable aleatoria observada esté dentro de desviaciones estándar de la media.k
La desviación estándar se usa para normalizar estadísticas para pruebas estadísticas (por ejemplo, la desviación estándar conocida se usa para normalizar una media muestral para la prueba que la media difiere de o la desviación estándar muestral se usa para normalizar la media muestral cuando el estándar verdadero la desviación es desconocida, lo que resulta en la prueba ).0 tz 0 t
Para una distribución normal, el por ciento de la distribución está dentro de desviación estándar. dentro de desviaciones estándar y más de dentro de desviaciones estándar.1 95.4 % 2 99 % 368% 1 95.4% 2 99% 3
El margen de error se expresa como un múltiplo de la desviación estándar de la estimación.
La varianza y el sesgo son medidas de incertidumbre en una cantidad aleatoria. El error cuadrado medio para una estimación es igual a la varianza + el sesgo al cuadrado.
fuente
La varianza de un conjunto de datos mide la dispersión matemática de los datos en relación con la media. Sin embargo, aunque este valor es teóricamente correcto, es difícil de aplicar en un sentido del mundo real porque los valores utilizados para calcularlo fueron al cuadrado. La desviación estándar, ya que la raíz cuadrada de la varianza da un valor que está en las mismas unidades que los valores originales, lo que hace que sea mucho más fácil trabajar con él y más fácil de interpretar junto con el concepto de la curva normal.
fuente
En términos de distribución, son equivalentes (aunque obviamente no son intercambiables), pero tenga en cuenta que en términos de estimadores no lo son: la raíz cuadrada de una estimación de la varianza NO es un estimador (imparcial) de la desviación estándar. Solo para un número moderadamente grande de muestras (y dependiendo de los estimadores) los dos se acercan entre sí. Para tamaños de muestra pequeños, necesita conocer la forma paramétrica de la distribución para convertir entre los dos, que puede volverse ligeramente circular.
fuente
Mientras calculamos la varianza, elevamos al cuadrado las desviaciones. Significa que si los datos (observaciones) dados están en metros, se convertirán en metros cuadrados. Espero que no sea una representación correcta sobre las desviaciones. Entonces, volvemos a la raíz cuadrada (SD) que no es más que SD.
fuente