Por favor, demuestre que si tenemos dos variables (tamaño de muestra igual) e y la varianza en es mayor que en , entonces la suma de las diferencias al cuadrado (es decir, las distancias al cuadrado euclidianas) entre los puntos de datos dentro de también es mayor que que dentro de . Y Y
20
Respuestas:
Solo para proporcionar una respuesta "oficial", para complementar las soluciones esbozadas en los comentarios, aviso
Ninguno de , , , o se cambian cambiando todo uniformemente a para alguna constante o cambiando todo a para alguna constante . Por lo tanto, podemos suponer que tales cambios se han realizado para hacer , de donde y .Var ( ( Y i ) ) ∑ i , j ( X i - X j ) 2 ∑ i , j ( Y i - Y j ) 2 X i X i - μ μ Y i Y i - ν ν ∑ X i = ∑ Y i = 0Var((Xi)) Var((Yi)) ∑i,j(Xi−Xj)2 ∑i,j(Yi−Yj)2 Xi Xi−μ μ Yi Yi−ν ν ∑Xi=∑Yi=0 Var((Xi))=∑X2i Var((Yi))=∑Y2i
Después de eliminar los factores comunes de cada lado y usar (1), la pregunta pide mostrar que implica .∑X2i≥∑Y2i ∑i,j(Xi−Xj)2≥∑i,j(Yi−Yj)2
La expansión simple de los cuadrados y la reorganización de las sumas dan con un resultado similar para las 's.
La prueba es inmediata.
fuente