¿Es la varianza un concepto más fundamental que la desviación estándar?

18

En este sitio web de psicometría leí que

[A] ta la variación de nivel profundo es un concepto más fundamental que la desviación estándar.

El sitio en realidad no explica más por qué la variación debe ser más fundamental que la desviación estándar, pero me recordó que he leído algunas cosas similares en este sitio.

Por ejemplo, en este comentario @ kjetil-b-halvorsen escribe que "la desviación estándar es buena para la interpretación, la presentación de informes. Para desarrollar la teoría, la varianza es mejor".

Siento que estas afirmaciones están vinculadas, pero realmente no las entiendo. Entiendo que la raíz cuadrada de la varianza de la muestra no es un estimador imparcial de la desviación estándar de la población, pero seguramente debe haber más que eso.

Quizás el término "fundamental" es demasiado vago para este sitio. En ese caso, quizás podamos operacionalizar mi pregunta como si la varianza es más importante que la desviación estándar desde el punto de vista del desarrollo de la teoría estadística. ¿Por qué por qué no?

user1205901 - Restablecer Monica
fuente
¿No son lo mismo? ¿Es como 1 + 1 es lo mismo que 2 * 1?
SmallChess
2
La varianza es el segundo acumulativo, . El artículo de Wikipedia sobre acumulantes debería impresionar a cualquiera con lo naturales e importantes que son, no solo para el estudio de variables aleatorias sino también en física y combinatoria. La desviación estándar no disfruta de la propiedad multilinealidad (que es fundamental para realizar cálculos), así como la extensión de los acumulantes a distribuciones multivariadas. κ2
whuber

Respuestas:

16

Las respuestas de Robert y Bey dan parte de la historia (es decir, los momentos tienden a considerarse como propiedades básicas de las distribuciones, y la desviación estándar convencional se define en términos del segundo momento central y no al revés), pero la medida en que esos las cosas son realmente fundamentales depende en parte de lo que entendemos por el término.

No habría ningún problema insuperable, por ejemplo, si nuestras convenciones fueran al revés: no hay nada que nos impida definir convencionalmente alguna otra secuencia de cantidades en lugar de los momentos habituales, digamos parap=1,2,3,. . . (tenga en cuenta queμE[(Xμ)p]1/pp=1,2,3,...μencaja tanto en la secuencia de momentos como en este como el primer término) y luego define los momentos, y toda clase de cálculos en relación con los momentos, en términos de ellos. Tenga en cuenta que todas estas cantidades se miden en las unidades originales, lo cual es una ventaja sobre los momentos (que están en la potencia -ésima de las unidades originales y, por lo tanto, son más difíciles de interpretar). Esto haría que la desviación estándar de la población sea la cantidad y la varianza definidas definidas en términos de la misma.p

Sin embargo, haría que las cantidades como la función de generación de momentos (o algún equivalente relacionado con las nuevas cantidades definidas anteriormente) sean bastante menos "naturales", lo que haría las cosas un poco más incómodas (pero algunas convenciones son un poco así). Hay algunas propiedades convenientes del MGF que no serían tan convenientes para el otro lado.

Más básico, en mi opinión (pero relacionado con él), es que hay una serie de propiedades básicas de varianza que son más convenientes cuando se escriben como propiedades de varianza que cuando se escriben como propiedades de desviación estándar (por ejemplo, la varianza de sumas de variables aleatorias es la suma de las variaciones).

Esta aditividad es una propiedad que no comparten otras medidas de dispersión y tiene una serie de consecuencias importantes.

[Hay relaciones similares entre los otros acumulantes, así que esto es un sentido en el que podríamos querer definir las cosas en relación con los momentos de manera más general.]

Podría decirse que todas estas razones son convenciones o conveniencia, pero hasta cierto punto es una cuestión de punto de vista (por ejemplo, desde algunos puntos de vista, los momentos son cantidades bastante importantes, desde otros no son tan importantes). Puede ser que el bit "a un nivel profundo" no signifique nada más que el de kjetil "al desarrollar la teoría".

Estoy de acuerdo con el punto de kjetil que planteaste en tu pregunta; Hasta cierto punto, esta respuesta es simplemente una discusión ondulada a mano.

Glen_b -Reinstate a Monica
fuente
Yo diría que los dos están en el mismo lugar, cada uno con su propio conjunto de comodidades que lo acompañan.
JM no es un estadístico
2

La varianza se define por el primer y segundo momento de una distribución. Por el contrario, la desviación estándar se parece más a una "norma" que a un momento. Los momentos son propiedades fundamentales de una distribución, mientras que las normas son solo formas de hacer una distinción.


fuente
2

La varianza es más fundamental que la desviación estándar porque la desviación estándar se define como 'la raíz cuadrada de la varianza', por ejemplo, su definición depende completamente de la varianza.

La varianza, por otro lado, se define, de forma completamente independiente, como "la expectativa de la diferencia al cuadrado entre una muestra y la media".

Robert de Graaf
fuente
3
Vería esto más como un informe sobre las formas en que (a menudo) usamos términos, por ejemplo en la enseñanza, no como una reflexión sobre lo que es fundamental. Es perfectamente posible introducir la desviación estándar sin mencionar la varianza (todavía) y muchos textos y cursos hacen precisamente eso, así como puedes hablar sobre el teorema de Pitágoras sin necesidad de usar ningún nombre especial para las cantidades al cuadrado. Históricamente, el término varianza en su sentido estadístico es posterior al de la desviación estándar, por lo que incluso esta forma de palabras fue imposible durante algunas décadas.
Nick Cox
Me di cuenta de que la desviación estándar había surgido como una etiqueta antes de la variación al intentar formular una respuesta al comentario ahora eliminado de Glen; en ese momento reflexioné que el hecho de que el término más antiguo ahora se definía comúnmente en términos del término más nuevo se fortaleció las afirmaciones del nuevo término de ser más fundamentales en lugar de debilitarlos.
Robert de Graaf
1
Se pueden encontrar todo tipo de explicaciones. En mi enseñanza introductoria de SD (para geógrafos, no todos los cuales son matemáticamente fuertes), no uso el término varianza en absoluto. Me apresuro a señalar que SD es una medida de escala natural para distribuciones normales (gaussianas), como la distancia entre la media y cualquiera de las inflexiones en la función de densidad. Sospecho que es más para mi propia diversión y placer que para los estudiantes.
Nick Cox
0

nXVar[X]=σ2S2σ2Sσ

E[S2]=σ2, E[S]σ,
StijnDeVuyst
fuente
2
nn1
Var[]Var[iXi]=iVar[Xi]Xi ? Eso parece ser bastante "natural".
1
De hecho, la aditividad de las variaciones independientes es una propiedad fundamental, pero ese no es su argumento.
Nick Cox
Tal vez lo que es interesante es que, al igual que con la media, se puede construir un estimador insesgado de la varianza sin especificar una distribución particular (estimaciones no sesgadas de la desviación estándar son la distribución específica.)
Scortchi - Restablecer Mónica