¿Cuáles son las distribuciones en el cuadrante k-dimensional positivo con matriz de covarianza parametrizable?

12

Siguiendo la pregunta de zzk sobre su problema con las simulaciones negativas, me pregunto cuáles son las familias parametrizadas de distribuciones en el cuadrante k-dimensional positivo, para el cual se puede establecer la matriz de covarianza .R+kΣ

Como se discutió con zzk , comenzar desde una distribución en y aplicar la transformación lineal no funciona.R+kXΣ1/2(Xμ)+μ

Xi'an
fuente

Respuestas:

6

Supongamos que tenemos un vector aleatorio normal multivariado con y matriz completa positiva simétrica de rango completo .μ R k k × k Σ = ( σ i j )

(logX1,,logXk)N(μ,Σ),
μRkk×kΣ=(σij)

Para lognormal no es difícil demostrar que m i : = E [ X i ] = e μ i + σ i i / 2(X1,,Xk)c i j : = Cov [ X i , X j ] = m i

mi:=E[Xi]=eμi+σii/2,i=1,,k,
cij:=Cov[Xi,Xj]=mimj(eσij1),i,j=1,,k,

y se deduce que .cij>mimj

Por lo tanto, podemos hacer la pregunta inversa: dado y matriz simétrica positiva definida , satisfaciendo , si dejamos tendremos un vector lognormal con los medios y covarianzas prescritos. k × k C = ( c i j ) c i j > - m i m j μ i = log m i - 1m=(m1,,mk)R+kk×kC=(cij)cij>mimjσ i j = log ( c i j

μi=logmi12log(ciimi2+1),i=1,,k,
σij=log(cijmimj+1),i,j=1,,k,

La restricción en y es equivalente a la condición natural .m E [ X i X j ] > 0CmE[XiXj]>0

zen
fuente
¡Estupendo, Paulo! Obtuviste tanto una solución de trabajo como la condición adecuada en la matriz de covarianza, que también responde a esta pregunta . Los log-normales resultan más prácticos que los gammas, al final.
Xi'an
3

En realidad, tengo una solución definitivamente peatonal.

  1. Comience con y elija los dos parámetros para que se ajusten a los valores de , .X1Ga(α11,β1)E[X1]var(X1)
  2. Tome y elija los tres parámetros para que se ajusten a los valores de , y .X2|X1Ga(α21X1+α22,β2)E[X2]var(X2)cov(X1,X2)
  3. Tome y elija los cuatro parámetros para que se ajusten a los valores de , , y .X3|X1,X2Ga(α31X1+α32X2+α33,β3)E[X3]var(X3)cov(X1,X3)cov(X2,X3)

y así sucesivamente ... Sin embargo, dadas las restricciones sobre los parámetros y la naturaleza no lineal de las ecuaciones de momento, puede ser que algunos conjuntos de momentos no correspondan a ningún conjunto aceptable de parámetros.

Por ejemplo, cuando , termino con el sistema de ecuaciones k=2

β1=μ1/σ12,α11μ1β1=0

α22=μ2β2α21μ1,α21=(σ12+μ1μ2μ2)σ12+μ12μ1β2
(σ12+μ1μ2μ2)2(σ12+μ12μ1)2σ12+μ2β2=σ22.
Ejecutar un código R con valores arbitrarios (y a priori aceptables) para y condujo a muchos casos sin solución. Nuevamente, esto no significa mucho porque las matrices de correlación para distribuciones en pueden tener restricciones más fuertes que un simple determinante positivo.μΣR+2

actualización (04/04): deinst reformuló esta pregunta como una nueva pregunta en el foro de matemáticas.

Xi'an
fuente
1
Una forma de extender ligeramente esto es considerar la familia exponencial natural Luego la media y de covarianza son el gradiente y Hessian de . Si es un polinomio (con exponentes reales> -1), entonces es el logaritmo de un polinomio (con exponentes reales), y la varianza y la arpillera son funciones racionales. Creo que esto da suficiente libertad para representar cualquier matriz de media y covarianza.
f(X|θ)=h(x)eθTXA(θ).
AhA
Deinst
@deinst: (+1) ¿Tiene un ejemplo en el que esta representación familiar exponencial pueda explotarse directamente?
Xi'an
2
Quizás no entiendo bien el problema. Pero, considere un vector aleatorio bivariado con el mismo marginal con soporte completo en y que tenga una media de . ¿Cómo puede una distribución bivariada tener una correlación cercana a -1, por ejemplo? Heurísticamente, aunque no lo he llevado a cabo, parece que si , debe surgir una contradicción con respecto al soporte. ¿No? (X,Y)FR+0<μ<ρP(X>2μ)>0
cardenal
1
Ciertamente, existen restricciones en la matriz de covarianza cuando el soporte es , cubierto a través de la condición de momento Stieltjes . De todos modos, no veo por qué una correlación cercana a -1 se excluye a priori . ΣR+k
Xi'an
2
Bien, esto está relacionado con lo que estaba llegando. Con respecto a la correlación, considere mi ejemplo. Si e tienen el mismo marginal con media y una correlación de exactamente -1 y , ¿cuál debe ser el valor de para todas esas realizaciones de ? (+1 en ambas preguntas y respuestas. Me gusta esto.)XYFμP(X>2μ)>0YX
cardenal
2

OK, esta es una respuesta al comentario de Xi'an. Es demasiado largo y tiene mucho TeX para ser un comentario cómodo. Advertencia Lector: Es prácticamente seguro que he cometido un error de álgebra. Esto no parece ser tan flexible como pensé al principio.

Creemos una familia de distribuciones en de la forma Sea y . Deje será un polinomio de dos términos donde son números reales mayores que 0 para todo . Entonces encontramos que R+3

f(x|θ)=h(x)eθTxA(θ)
x=(x,y,z)θ=(θ1,θ2,θ3)
h(x)=cx1e11x2e21x3e31+dx1f11x2f21x3f31
ei,fii
A(θ)=log(cΓ(e1)θ1e1Γ(e2)θ2e2Γ(e3)θ3e3+dΓ(f1)θ1f1Γ(f2)θ2f2Γ(f3)θ3f3).

Ahora, por conveniencia, definamos y

c=cΓ(e1)Γ(e2)Γ(e2)θ1f1θ2f2θ3f3
d=dΓ(f1)Γ(f2)Γ(f2)θ1e1θ2e2θ3e3

Ahora, como la media de nuestra distribución es el gradiente de , tenemos , , y . Y como la covarianza es la arpillera de , tenemos y (los otros términos de la matriz de covarianza obtenidos al cambiar los subíndices de la manera obvia).AμX=e1c+f1dθ1(c+d)μY=e2c+f2dθ2(c+d)μZ=e3c+f3dθ3(c+d)A Cov(X,Y)=(e1-f1)(e2-f2)cd

σX2=(e1c+f1d)(c+d)+(e1f1)2cdθ12(c+d)2
Cov(X,Y)=(e1f1)(e2f2)cdθ1θ2(c+d)

Esto no parece ser suficiente flexibilidad para obtener una matriz de covarianza. Necesito probar otro término en el polinomio (pero sospecho que también puede no funcionar (obviamente necesito pensar más en esto)).

deinst
fuente
¿Cuatro parámetros para cinco restricciones ...? (θ1,θ2,θ3,c)
Xi'an
@xian También están los 6 exponentes y . f ieifi
deinst 01 de
Estoy un poco (?) Confundido: no procesaste los exponentes como parámetros de la familia exponencial. Pero, de hecho, puede cambiar esos poderes como desee para obtener las ecuaciones de 9 momentos correctas.
Xi'an
@ Xi'an Tienes razón, no los procesé como parámetros de la familia exponencial. Si lo hiciera, la familia ya no sería una familia natural, e incluirlos simplemente habría confundido el álgebra para comentar las ecuaciones de momento (que para empezar era lo suficientemente confusa).
deinst