Esta publicación presenta un poderoso método de razonamiento que evita una gran cantidad de álgebra y cálculo. Para aquellos familiarizados con este método, el trabajo es tan automático y natural que la respuesta inicial de uno a una pregunta como esta es "¡es obvio!" Pero tal vez no sea tan obvio hasta que hayas visto el método. Por lo tanto, se explican todos los detalles, paso a paso.
Antecedentes
Hay varias fórmulas para la varianza de datos (con media ), incluyendox=x1,x2,…,xnx¯=(x1+⋯+xn)/n
Var(x)=1n∑i=1n(xi−x¯)2=1n(∑i=1nx2i)−x¯2.(1)
Esto determina la covarianza de los datos emparejados través de(x1,y1),…,(xn,yn)
Cov(x,y)=14(Var(x+y)−Var(x−y)).
La fórmula implícita en la publicación referenciada de covarianza con crayones es
C(x,y)=∑i=1n−1∑j=i+1n(xj−xi)(yj−yi)=12∑i,j=1n(xj−xi)(yj−yi).(2)
Esa publicación afirma que es proporcional a la covarianza. La constante de proporcionalidad podría (y varía) con . Por lo tanto, cuando una implicación de esta afirmación es queCc(n)nx=y
C(x,x)=c(n)Var(x).
Análisis
Aunque esto podría demostrarse con álgebra de fuerza bruta, hay una mejor manera: explotemos las propiedades fundamentales de la covarianza. ¿Qué propiedades serían esas? Me gustaría sugerir que los siguientes son básicos:
Lugar de independencia. Es decir, para cualquier número . (La expresión refiere al conjunto de datos .)
Cov(x,y)=Cov(x−a,y)
ax−ax1−a,x2−a,…,xn−a
Multilinealidad. Esto implica para cualquier número . (La expresión refiere al conjunto de datos .)
Cov(λx,y)=λCov(x,y)
λλxλx1,λx2,…,λxn
Simetría. La covarianza de y es la covarianza de y :xyyx
Cov(x,y)=Cov(y,x).
Invarianza bajo permutaciones. La covarianza no cambia cuando volvemos a indexar . Formalmente, para cualquier permutación . (Expresiones como representan reordenar el acuerdo con , de modo que )(xi,yi)
Cov(x,y)=Cov(xσ,yσ)
σ∈Snxσxiσxσ=xσ(1),xσ(2),…,xσ(n).
Todas estas propiedades obviamente son válidas tanto para como para al inspeccionar las formas de las expresiones y . El único que podría necesitar alguna explicación es la independencia de la ubicación. Sin embargo, un cambio constante de valores de no cambia los residuos ni las diferencias:VarC(1)(2)xi
xi−x¯=(xi−a)−x−a¯¯¯¯¯¯¯¯¯¯¯¯
y
xj−xi=(xj−a)−(xi−a).
En consecuencia, es obvio que la primera versión de y son independientes de la ubicación.(1)(2)
Solución
Aquí, entonces, está el razonamiento. Como es simétrico y multilineal, es una forma cuadrática completamente determinada por los coeficientes :Ccij=cji
C(x,y)=∑i,j=1ncijxiyj.
Debido a que es invariante a la permutación, para cualquier índice para el cual e ; también, para todos los índices e . Por lo tanto, está determinado por solo dos números, digamos y . Finalmente, uno de estos números determina los otros dos en virtud de la invariancia de ubicación: esa condición significacij=ci′j′i,j,i′,j′i≠ji′≠j′cii=ci′i′ii′Cc11c12
0=C(0,0)=location-invarianceC(1,0)=symmetryC(0,1)=location-invarianceC(1,1)
(donde " " y " " se refieren a -vectores constantes con estos valores). Pero01n
0=C(1,1)=∑i,jncij=nc11+(n2−n)c12,
determinando cada de y en términos del otro.
c11c12
Esto ya demuestra el punto principal: debe ser proporcional a , ya que cada uno está determinado por cualquiera de sus coeficientes. Para encontrar la constante de proporcionalidad, inspeccione las dos fórmulas y , buscando todas las apariencias de : puede leer el valor asociado de de ellas. De la segunda versión de , el coeficiente de claramente es . Desde la primera versión de , con , el coeficiente de claramente esCCov(1)(2)x21c11(1)x211/n−(1/n)2(2)y=xx21n−1. (Geométricamente, cada punto en el diagrama de dispersión de está emparejado con otros, de donde el cuadrado de su coordenada aparecerá veces.) Por lo tanto(x,x)n−1n−1
c(n)=n−11/n−(1/n)2=n2,
QED . Este fue el único cálculo requerido para demostrar
Cov(x,y)=1n2C(x,y)=1n2∑i=1n−1∑j=i+1n(xj−xi)(yj−yi).