¿Es una desviación estándar de CoStandard?

8

Entonces, hay desviación estándar, varianza y covarianza, pero ¿hay una desviación estándar co?

¿Si no, porque no? ¿Existe una razón matemática fundamental o es solo una convención?

Si es así, ¿por qué no se usa más, o al menos es realmente difícil de encontrar con las búsquedas de Google?

No quiero decir que sea una pregunta frívola, estoy tratando de cuestionar realmente las estadísticas en lugar de simplemente memorizar un montón de fórmulas.

variance standard-deviation covariance-matrix cañón289
fuente

1

¿Podría aclarar lo que cree que representaría una "desviación estándar estándar"? ¿Existe alguna motivación subyacente, o simplemente está preguntando (en un sentido meta) si puede haber algún significado universal para anteponer "co" al nombre de alguna estadística?

whuber

1

Supongo que el OP se está generalizando a partir de la varianza: covarianza :: desviación estándar: "desviación estándar", pero no estaría de más que la pregunta sea más explícita (suponiendo que realmente signifiquen )

\sqrt{σ_{X Y}}

$\sqrt{\sigma_{XY}}$

Ben Bolker

12

Una propiedad útil de la desviación estándar es que tiene las mismas unidades que la media, por lo que las magnitudes de y son directamente comparables. Nunca he visto a nadie calcular la desviación coestándar (con lo cual supongo que te refieres a la raíz cuadrada de la covarianza); si las unidades de e se denotan como e , entonces las unidades de la covarianza son y las unidades de la desviación co-estándar serían , que no es particularmente útil. Por otro lado, la correlación $\sigma_X$ $\bar X$ $X$ $Y$ $[X]$ $[Y]$ $[X][Y]$ $\sqrt{[X][Y]}$ $\sigma_{XY}/(\sigma_X \sigma_Y)$ no tiene unidades y es una escala muy común para informar asociaciones.

La varianza (en contraste con la desviación estándar) es útil porque generalmente tiene mejores propiedades matemáticas; en particular

σ_{X + Y}^{2} = σ_{X}^{2} + σ_{Y}^{2} + 2 σ_{X Y},

$\sigma^2_{X+Y} = \sigma^2_X + \sigma^2_Y + 2 \sigma_{XY},$ que se simplifica muy bien cuando e son independientes (de ahí ).

X

$X$

Y

$Y$

σ_{X Y} = 0

$\sigma_{XY}=0$

Mientras piensa en formas de escalar las variaciones, también podría considerar el coeficiente de variación (que no tiene unidades), o la relación varianza / media (que tiene un efecto extraño) unidades pero es significativo en el contexto de una distribución de conteo como el Poisson, que también es sin unidades). $\sigma_X/\bar X$ $\sigma^2_X/\bar X$

Ben Bolker
fuente

3

Puntos buenos, pero no parece responder por qué no tiene sentido sacar raíz cuadrada de covarianza.

Tim

3

Aquí hay una forma de explotar su fórmula: úsela para observar que la covarianza se puede definir como

σ_{X Y} = (σ_{X + Y}^{2} - σ_{X}^{2} - σ_{Y}^{2}) / 2.

$\sigma_{XY} = (\sigma^2_{X+Y}-\sigma_X^2-\sigma_Y^2)/2.$ Entonces, ¿por qué no simplemente definir una "co-SD"?

τ

$\tau$ , saya s

τ_{X Y} = (σ_{X + Y} - σ_{X} - σ_{Y}) / 2 ?

$\tau_{XY}=(\sigma_{X+Y}-\sigma_X-\sigma_Y)/2?$ Esto sugiere la dificultad de responder la pregunta original sin saber qué podría significar el "co" de algo: no se puede demostrar mucho simplemente mostrando que una generalización en particular no tiene sentido o es inútil; ¡Hay que considerar todas las formas posibles de generalizar un concepto!

whuber

5

La pregunta parece al revés. En matemáticas no inventamos nombres para cantidades "solo porque podemos", sino porque la cantidad nombrada es útil para algo.

La pregunta del OP no da y las razones por las cuales él / ella piensa que hay una cantidad útil que podría llamarse "desviación estándar" y las respuestas están adivinando cosas que podrían ser útiles.

Para generalizar el concepto de regresión lineal multivariable con $n$ variables, la "covarianza" se convierte en un $n \times n$ simétrica matriz . Ciertamente puede hacer una definición sensata de la "raíz cuadrada de una matriz simétrica" siempre que sea positiva definida o semi-definida, pero es difícil pensar en un uso en este contexto, y no es lo mismo como tomar la raíz cuadrada de cada término de la matriz por separado!

Por supuesto, la raíz cuadrada de una matriz diagonal (por ejemplo, la matriz de varianza) es solo la raíz cuadrada de los términos individuales, por lo que el concepto de "desviación estándar" se generaliza de una manera obvia y útil, pero la "desviación estándar" no OMI. Y en general, la "raíz cuadrada de una matriz" ni siquiera está definida de manera única, entonces, ¿qué raíz cuadrada en particular desea elegir como la desviación estándar?

alephzero
fuente

4

La covarianza puede ser tanto positiva como negativa.

Entonces la raíz cuadrada de la covarianza podría ser real o imaginaria.

Puede comparar un número real con un número imaginario para el tamaño. Las unidades para la "desviación estándar" serían inconvenientes. No hay beneficio en sacar la raíz cuadrada.

James K
fuente

Por favor, vea mi comentario a la respuesta de Ben Bolker.

whuber

y ver la respuesta de Ben.

James K

¿Es una desviación estándar de CoStandard?

Respuestas: