Conocí la siguiente técnica de rastreo aleatorio en M. Seeger, "Actualizaciones de bajo rango para la descomposición de Cholesky", Universidad de California en Berkeley, Tech. Representante, 2007.
donde .
Como una persona sin profundos antecedentes matemáticos, me pregunto cómo se puede lograr esta igualdad. Además, ¿cómo podemos interpretar , por ejemplo geométricamente? ¿Dónde debo mirar para comprender el significado de tomar el producto interno de un vector y su valor de rango? ¿Por qué la media es igual a la suma de los valores propios? Además de la propiedad teórica, ¿cuál es su importancia práctica?
He escrito un fragmento de código MATLAB para ver si funciona
#% tr(A) == E[x'Ax], x ~ N(0,I)
N = 100000;
n = 3;
x = randn([n N]); % samples
A = magic(n); % any n by n matrix A
y = zeros(1, N);
for i = 1:N
y(i) = x(:,i)' * A * x(:,i);
end
mean(y)
trace(A)
La traza es 15 donde la aproximación es 14.9696.
fuente
Si es simétrico positivo definido, entonces con ortonormal y diagonal con valores propios en la diagonal. Como tiene una matriz de covarianza de identidad y es ortonormal, también tiene una matriz de covarianza de identidad. Por lo tanto, escribiendo , tenemos . Como el operador de expectativa es lineal, esto es solo . Cada es chi-cuadrado con 1 grado de libertad, por lo que tiene el valor esperado 1. Por lo tanto, la expectativa es la suma de los valores propios.A A=UtDU U D x U Ux y=Ux E[xTAx]=E[ytDy] ∑ni=0λiE[y2i] yi
Geométricamente, las matrices simétricas positivas definidas están en correspondencia 1-1 con elipsoides, dada por la ecuación . Las longitudes de los ejes del elipsoide están dadas por donde son los valores propios.A xTAx=1 1/λ−−√i λi
Cuando donde es la matriz de covarianza, este es el cuadrado de la distancia de Mahalanobis .A=C−1 C
fuente
Permítanme abordar la parte de la pregunta "cuál es su importancia práctica". Hay muchas situaciones en las que tenemos la capacidad de los productos de la matriz de vectores de cómputo manera eficiente, incluso si no tenemos una copia almacenada de la matriz o no tienen suficiente capacidad de almacenamiento para guardar una copia de . Por ejemplo, podría tener un tamaño de 100,000 por 100,000 y ser completamente denso; requeriría 80 gigabytes de RAM para almacenar dicha matriz en formato de coma flotante de doble precisión.Ax A A A
Algoritmos aleatorios de este tipo pueden ser utilizados para estimar la traza de o (usando un algoritmo relacionado) entradas diagonales individuales de .A A
Algunas aplicaciones de esta técnica a problemas de inversión geofísica a gran escala se discuten en
JK MacCarthy, B. Borchers y RC Aster. Estimación eficiente estocástica de la diagonal de matriz de resolución del modelo y validación cruzada generalizada para grandes problemas geofísicos inversos. Journal of Geophysical Research, 116, B10304, 2011. Enlace al documento
fuente