Enlace entre varianza y distancias por pares dentro de una variable

20

Por favor, demuestre que si tenemos dos variables (tamaño de muestra igual) e y la varianza en es mayor que en , entonces la suma de las diferencias al cuadrado (es decir, las distancias al cuadrado euclidianas) entre los puntos de datos dentro de también es mayor que que dentro de .XY YXY YXY

ttnphns
fuente
1
Por favor aclare: cuando dice varianza , ¿se refiere a varianza muestral ? Cuando dice suma de diferencias al cuadrado, ¿quiere decir ? i,j(xixj)2
cardenal
99
Suponiendo lo anterior: contabilizando cuidadosamente los elementos en el término cruzado. Me imagino que puedes llenar los (pequeños espacios). El resultado luego sigue trivialmente.
i,j(xixj)2=ij((xix¯)(xjx¯))2=2ni=1n(xix¯)2,
cardenal
2
También hay una manera de hacer esto "sin" ningún cálculo considerando el hecho de que si y son iid de (con una varianza bien definida), entonces . Sin embargo, requiere una comprensión un poco más firme de los conceptos de probabilidad. X 2 F E ( X 1 - X 2 ) 2 = 2 V a r ( X 1 )X1X2FE(X1X2)2=2Var(X1)
cardenal
1
Para una pregunta relacionada, utilicé una visualización de lo que está sucediendo aquí en una respuesta en stats.stackexchange.com/a/18200 : las diferencias al cuadrado son áreas de cuadrados.
whuber
1
@whuber: Muy bien. De alguna manera me había perdido esta respuesta tuya en el camino.
cardenal

Respuestas:

5

Solo para proporcionar una respuesta "oficial", para complementar las soluciones esbozadas en los comentarios, aviso

  1. Ninguno de , , , o se cambian cambiando todo uniformemente a para alguna constante o cambiando todo a para alguna constante . Por lo tanto, podemos suponer que tales cambios se han realizado para hacer , de donde y .Var ( ( Y i ) ) i , j ( X i - X j ) 2 i , j ( Y i - Y j ) 2 X i X i - μ μ Y i Y i - ν ν X i = Y i = 0Var((Xi))Var((Yi))i,j(XiXj)2i,j(YiYj)2XiXiμμYiYiννXi=Yi=0Var((Xi))=Xi2Var((Yi))=Yi2

  2. Después de eliminar los factores comunes de cada lado y usar (1), la pregunta pide mostrar que implica .Xi2Yi2i,j(XiXj)2i,j(YiYj)2

  3. La expansión simple de los cuadrados y la reorganización de las sumas dan con un resultado similar para las 's.

    i,j(XiXj)2=2Xi22(Xi)(Xj)=2Xi2=2Var((Xi))
    Y

La prueba es inmediata.

whuber
fuente