Estoy tratando de entender un concepto muy básico de desviación estándar.
De la fórmula
No puedo entender por qué deberíamos reducir a la mitad la población "N", es decir, ¿por qué queremos tomar cuando no hicimos ? ¿No distorsiona eso a la población que estamos considerando? N 2
No debería ser la fórmula be
fuente
Lo primero que hay que entender es que la desviación estándar (estándar) es diferente de la desviación absoluta promedio . Estos dos definen diferentes propiedades matemáticas sobre los datos.
A diferencia de la desviación absoluta promedio, la desviación estándar (estándar) pesa más a los valores que están lejos de la media, lo que se hace al cuadrar los valores de diferencia.
Por ejemplo, para los siguientes cuatro puntos de datos:
desviación absoluta promedio (aad) , y=16/4=4.0
Desviación estándar (estándar) =80/4−−−−√=2–√0=4.47
En los datos, hay dos puntos que están a 6 distancias de la media, y dos puntos que están a 2 distancias de la media. Entonces, la desviación de 4.47 tiene más sentido que 4.
Dado que la observación total siempre es , para calcular std no estamos buceando por , en su lugar dividimos la varianza total entre y tomamos su raíz cuadrada para llevarla a la misma unidad que los datos originales.√N NN−−√ N
fuente
@Mahesh Subramaniya: esto es solo un giro matemático . Cuando tenemos un valor original como . Podemos obtener el mismo valor usando estas dos ecuaciones y .a 2 ╱ b = c √a/b=(−)d a2╱b=c c╱b−−−−√=d
Por ejemplo, simplemente hazlo con = . Pero, solo queremos valor, no menos. - 2.5−5╱2 −2.5
Ahora, . Y, √−52╱2=12.5 12.5╱2−−−−−−√=2.5
fuente