Tenemos un vector normal multivariado . Considere la posibilidad de particionar y en
con una partición similar de en
Luego, , la distribución condicional de la primera partición dada la segunda, es
, con media
y matriz de covarianza
En realidad, estos resultados también se proporcionan en Wikipedia, pero no tengo idea de cómo se deriva el y . Estos resultados son cruciales, ya que son una fórmula estadística importante para derivar los filtros de Kalman . ¿Alguien me proporcionaría unos pasos de derivación para derivar y ? ¡Muchas gracias!
normal-distribution
conditional-probability
Cerdo volador
fuente
fuente
Respuestas:
Puede probarlo calculando explícitamente la densidad condicional por la fuerza bruta, como en el enlace Procrastinator (+1) en los comentarios. Pero también hay un teorema que dice que todas las distribuciones condicionales de una distribución normal multivariada son normales. Por lo tanto, todo lo que queda es calcular el vector medio y la matriz de covarianza. Recuerdo que derivamos esto en una clase de series de tiempo en la universidad al definir inteligentemente una tercera variable y usar sus propiedades para derivar el resultado de manera más simple que la solución de fuerza bruta en el enlace (siempre y cuando se sienta cómodo con el álgebra matricial). Voy de memoria pero fue algo como esto:
Deje que sea la primera partición y la segunda. Ahora defina donde . Ahora podemos escribirx1 x2 z=x1+Ax2 A=−Σ12Σ−122
Por lo tanto, y no están correlacionados y, dado que son conjuntamente normales, son independientes . Ahora, claramente , por lo tanto, se deduce quez x2 E(z)=μ1+Aμ2
lo que prueba la primera parte. Para la matriz de covarianza, tenga en cuenta que
Ahora casi hemos terminado:
lo que prueba la segunda parte.
Nota: Para aquellos que no están muy familiarizados con el álgebra matricial utilizado aquí, este es un excelente recurso .
Editar: Una propiedad utilizada aquí, esta no está en el libro de cocina de la matriz (buena captura @FlyingPig) es la propiedad 6 en la página de wikipedia sobre matrices de covarianza: que es para dos vectores aleatorios , Para escalares, por supuesto, pero para los vectores son diferentes en la medida en que las matrices están dispuestas de manera diferente.x,y
fuente
La respuesta de Macro es excelente, pero aquí hay una forma aún más simple que no requiere que uses ningún teorema externo que afirme la distribución condicional. Implica escribir la distancia de Mahanalobis en una forma que separe la variable de argumento para la declaración de condicionamiento, y luego factorizar la densidad normal en consecuencia.
Reescribir la distancia de Mahanalobis para un vector condicional: esta derivación utiliza una fórmula de inversión de matriz que utiliza el complemento de Schur . Primero usamos la fórmula de inversión en bloques para escribir la matriz de varianza inversa como:ΣS=Σ11−Σ12Σ−122Σ21
dónde:
Con esta fórmula, ahora podemos escribir la distancia de Mahanalobis como:
dónde:
Tenga en cuenta que este resultado es un resultado general que no asume la normalidad de los vectores aleatorios. Proporciona una forma útil de volver a enmarcar la distancia de Mahanalobis para que sea una forma cuadrática con respecto a solo uno de los vectores en la descomposición (con el otro absorbido en el vector medio y la matriz de varianza).
Derivando la distribución condicional: ahora que tenemos la forma anterior para la distancia de Mahanalobis, el resto es fácil. Tenemos:
Esto establece que la distribución condicional también es multivariada normal, con el vector medio condicional especificado y la matriz de varianza condicional.
fuente