Transformación lineal de una variable aleatoria por una matriz rectangular alta

12

Digamos que tenemos un vector aleatorio , extraído de una distribución con función de densidad de probabilidad . Si lo transformamos linealmente por un rango completo matriz para obtener , entonces la densidad de viene dada porXRnfX(x)n×nAY=AXY

fY(y)=1|detA|fX(A1y).

Ahora digamos que transformamos X lugar por una matriz m×n matriz B , con m>n , dando Z=BX . Claramente ZRm , pero "vive" en un subespacio n dimensional GRm . ¿Cuál es la densidad condicional de Z , dado que sabemos que se encuentra en G ?

Mi primer instinto era utilizar la pseudo-inversa de B . Si B=USVT es la descomposición de valor singular de B , entonces B+=VS+UT es la pseudo-inversa, donde S+ se forma mediante la inversión de los no-cero entradas de la matriz diagonal S . Supuse que esto daría

fZ(z)=1|det+S|fX(B+z),
donde por det+S me refiero al producto de los valores singulares distintos de cero.

Este razonamiento concuerda con la densidad para una normal singular (condicionada por el conocimiento de que la variable vive en el subespacio apropiado) dada aquí y mencionada también aquí y en esta publicación CrossValidated .

¡Pero no está bien! La constante de normalización está desactivada. Se da un contraejemplo (trivial) considerando el siguiente caso: con XN(0,1) , deje

Y=(11)X=(XX).
Aquí la matriz B de arriba es solo el vector unos. Su pseudo-inverso es
B+=(1/21/2)
y det+B=2 . El razonamiento de arriba sugeriría
fY(y)=12π2exp(12yT(B+)TB+y),
pero esto de hecho se integra (en la línea y=x ) a 12. Me doy cuenta de que, en este caso, podrías soltar una de las entradas de Y hayas terminado, pero cuando B es mucho más grande, identificar el conjunto de entradas para soltar es molesto. ¿Por qué no funciona el razonamiento pseudo-inverso? ¿Existe una fórmula general para la función de densidad de una transformación lineal de un conjunto de variables aleatorias mediante una matriz "alta"? Cualquier referencia sería muy apreciada también.
Dan
fuente

Respuestas:

2

Para aquellos que podrían encontrarse con esto en el futuro ... la fuente del error en realidad proviene de la integración. En el ejemplo anterior, la integración tiene lugar sobre la línea . Por lo tanto, es necesario "parametrizar" la línea y considerar el jacobiano de la parametrización al tomar la integral, ya que cada paso unitario en el eje corresponde a pasos de longitud en la línea. La parametrización que estaba usando implícitamente fue dada por , en otras palabras, especificando ambas entradas idénticas de por valor. Esto tiene Jacobian , que se cancela perfectamente con ely=xx2x(x,x)y22 (proveniente de exactamente el mismo jacobiano) en el denominador.

El ejemplo fue artificialmente simple: para una transformación general , uno puede tener otra parametrización para la salida que es natural en el contexto del problema. Dado que la parametrización debe cubrir el mismo subespacio que , y este subespacio es un hiperplano, es probable que la parametrización sea lineal. Llamando a la representación matricial de la parametrización , el requisito es simplemente que tenga el mismo espacio de columna que (cubra el mismo hiperplano). Entonces la densidad final se convierte enBGBm×nLB

fZ(z)=|det+L||det+B|fX(B+z).

En general, esta configuración es un poco extraña, y creo que lo correcto es encontrar un conjunto máximo de filas linealmente independientes de y eliminar el resto de las filas (junto con los componentes correspondientes de la variable transformada ) para obtener una matriz cuadrada . Luego, el problema se reduce al caso de rango completo (suponiendo que tiene rango de columna completo).BzB^n×nB

Dan
fuente