Diferencia entre distribución normal estándar multivariante y cópula gaussiana

17

Me pregunto cuál es la diferencia entre la distribución normal estándar multivariada y la cópula gaussiana, ya que cuando miro la función de densidad me parecen iguales.

Mi problema es por qué se introduce la cópula gaussiana o qué beneficio genera la cópula gaussiana o cuál es su superioridad cuando la cópula gaussiana no es más que una función normal estándar multivariante.

Además, ¿cuál es el concepto detrás de la transformación integral de probabilidad en cópula? Quiero decir que sabemos que una cópula es una función con variable uniforme. ¿Por qué tiene que ser uniforme? ¿Por qué no utilizar los datos reales como distribución normal multivariante y encontrar la matriz de correlación? (Normalmente, graficamos los dos rendimientos de los activos para considerar sus relaciones, pero cuando se trata de una cópula, graficamos los Estados Unidos, que son las probabilidades).

Otra pregunta. También dudo si la matriz de correlación de MVN podría ser no paramétrica o semiparamétrica como las de la cópula (para el parámetro de la cópula puede ser la tau de kendall, etc.)

Estaría muy agradecido por su ayuda ya que soy nuevo en esta área. (pero he leído muchos documentos y estas son las únicas cosas que no entiendo)

usuario26979
fuente
¿Cómo estás "mirando la función de densidad"? Es posible que no esté utilizando un método que sea lo suficientemente sensible. ¡Por ejemplo, la densidad seguramente no es multivariante normal cuando los marginales no son normales! Pruebe esto usando una cópula gaussiana con una distribución multimodal , como una Beta : ¡eso debería parecer decididamente no normal! (1/2,1/2)
whuber
la ecuación (6) es una cópula gaussiana bivariada CDF iopscience.iop.org/2041-8205/708/1/L9/fulltext/... mientras que la primera ecuación de la sección de descripción es CDF normal bivariada normal CDF roguewave.com/portals/0/products/ imsl-numerical-bibliotecas / ... y cuando las comparamos juntas, la forma funcional es muy similar. Bueno, son exactamente lo mismo para mí.
user26979
Tiene razón: por eso no debe confiar en referencias aleatorias de Internet, especialmente aquellas con términos mal definidos y una composición tipográfica horrible. Consulte a Nelson (una de las fuentes para su primer enlace, y de fácil lectura).
whuber
1
Entonces, si no se menciona lo anterior, ¿cuál es la diferencia en su opinión?
user26979

Respuestas:

20

Una regla general sobre los documentos técnicos, especialmente los que se encuentran en la Web, es que la confiabilidad de cualquier definición estadística o matemática ofrecida en ellos varía inversamente con el número de temas no estadísticos no relacionados mencionados en el título del artículo. El título de la página en la primera referencia ofrecida (en un comentario a la pregunta) es "De las finanzas a la cosmología: la cópula de la estructura a gran escala". Con tanto "finanzas" como "cosmología" apareciendo prominentemente, podemos estar bastante seguros de que esta no es una buena fuente de información sobre cópulas.

Pasemos a un libro de texto estándar y muy accesible, Introducción a las cópulas de Roger Nelsen (Segunda edición, 2006), para las definiciones clave.

... cada cópula es una función de distribución conjunta con márgenes uniformes en [el intervalo unitario cerrado .[0,1]]

[En la p. 23, abajo.]

Para obtener una idea de las cópulas, recurra al primer teorema del libro, el Teorema de Sklar :

Deje ser una función de distribución conjunta con márgenes F y G . Entonces existe una cópula C tal que para todos x , y en [los números reales extendidos], H ( x , y ) = C ( F ( x ) , G ( y ) ) .HFGCx,y

H(x,y)=C(F(x),G(y)).

[Declarado en las págs. 18 y 21.]

Aunque Nelsen no lo llama así, sí define la cópula gaussiana en un ejemplo:

... si denota la función de distribución normal estándar (univariante) y N ρ denota la función de distribución normal bivariada estándar (con el coeficiente de correlación producto-momento de Pearson ρ ), entonces ... C ( u , v ) = 1ΦNρρ

C(u,v)=12π1ρ2Φ1(u)Φ1(v)exp[(s22ρst+t2)2(1ρ2)]dsdt

[en p. 23, ecuación 2.3.6]. A partir de la notación, es inmediato que esta es la distribución conjunta de ( u , v ) cuando ( Φ - 1 ( u ) , Φ - 1 ( v ) ) es bivariada Normal. Ahora podemos dar la vuelta y construir una nueva distribución bivariada que tenga cualquier distribución marginal deseada (continua) F y G para la cual esta C es la cópula, simplemente reemplazando estas ocurrencias de Φ por F yC(u,v)(Φ1(u),Φ1(v))FGCΦF : tomeesta C particularen la caracterización de las cópulas anteriores.GC

Entonces sí, esto se parece notablemente a las fórmulas para una distribución normal bivariada, porque es bivariada normal para las variables transformadas . Debido a que estas transformaciones serán no lineales siempre que F y G no sean CDF normales (univariantes), la distribución resultante no es (en estos casos) bivariada normal.(Φ1(F(x)),Φ1(G(y)))FG


Ejemplo

F(4,2)XG(2)YHFGxy

Trama

0x10y

La falta de simetría lo hace obviamente no normal (y sin márgenes normales), pero sin embargo tiene una cópula gaussiana por construcción. FWIW tiene una fórmula y es feo, obviamente tampoco bivariante Normal:

132(20(1x)x3)(eyy)exp(w(x,y))

w(x,y)

erfc1(2(Q(2,0,y))223(2erfc1(2(Q(2,0,y)))erfc1(2(Ix(4,2)))2)2).

QIx

whuber
fuente
Gracias por la edición, @Cardinal: ¡Me da vergüenza escribir mal el nombre de Nelsen, especialmente cuando lo estaba mirando al frente del libro! (En mi defensa, lo había notado por primera vez en la bibliografía del documento referenciado del OP, donde también está mal escrito: eso debe haber quedado
grabado en
Era algo tan menor, pensé que simplemente seguiría adelante y haría las ediciones. La ortografía es inusual (¡al menos en inglés!), Especialmente en comparación con la variante más común. :-)
cardenal