Fórmula de probabilidad para una distribución multivariada de bernoulli

13

Necesito una fórmula para la probabilidad de un evento en una distribución de Bernoulli n-variada con las probabilidades dadas para un solo elemento y para pares de elementos . De manera equivalente que podría dar media y la covarianza de . P ( X i = 1 ) = p iX{0,1}nP(Xi=1)=piP(Xi=1Xj=1)=pijX

Ya aprendí que existen muchas distribuciones de tienen las propiedades al igual que hay muchas distribuciones que tienen una media y una covarianza determinadas. Estoy buscando una canónica en , así como el gaussiano es una distribución canónica para y una media y covarianza dadas.{0,1}n{0,1}nRn

mpiktas
fuente

Respuestas:

11

La variable aleatoria que toma valores en es una variable aleatoria discreta. Su distribución está completamente descrita por las probabilidades con . Las probabilidades y que da son sumas de para ciertos índices .p i = P ( X = i ) i{ 0 , 1 } n p i p i j p i i{0,1}npi=P(X=i)i{0,1}npipijpii

Ahora parece que desea describir utilizando solo y . No es posible sin asumir ciertas propiedades en . Para ver que tratan de derivar función característica de . Si tomamos obtenemos p i p i j p i X n = 3pipipijpiXn=3

Eei(t1X1+t2X2+t3X3)=p000+p100eit1+p010eit2+p001eit3+p110ei(t1+t2)+p101ei(t1+t3)+p011ei(t2+t3)+p111ei(t1+t2+t3)
No es posible reorganizar esta expresión para que desaparezca. Para la variable aleatoria gaussiana, la función característica depende solo de los parámetros de media y covarianza. Las funciones características definen de manera única las distribuciones, por lo que esta es la razón por la cual Gauss puede describirse de manera única utilizando solo la media y la covarianza. Como vemos para la variable aleatoria este no es el caso.piX

 

mpiktas
fuente
10

Ver el siguiente documento:

JL Teugels, algunas representaciones de las distribuciones multivariadas de Bernoulli y binomial , Journal of Multivariate Analysis , vol. 32, no. 2, febrero de 1990, 256–268.

Aquí está el resumen:

Las versiones multivariadas pero vectorizadas para las distribuciones binomiales y de Bernoulli se establecen utilizando el concepto de producto Kronecker a partir del cálculo matricial. La distribución multivariada de Bernoulli implica un modelo parametrizado, que ofrece una alternativa al modelo log-lineal tradicional para variables binarias.

Hamed
fuente
2
Gracias por compartir eso, Hamed. ¡Bienvenido a nuestro sitio!
whuber
1

No sé cómo se llama la distribución resultante, o si incluso tiene un nombre, pero me parece que la forma obvia de configurar esto es pensar en el modelo que usarías para modelar un 2 × 2 × 2 × … × 2 tabla usando un modelo log-lineal (regresión de Poisson). Como solo conoce las interacciones de primer orden, es natural suponer que todas las interacciones de orden superior son cero.

P(X1=x1,X2=x2,,Xn=xn)=i[pixi(1pi)1xij<i(pijpipj)xixj]
una parada
fuente
pipi
@whuber Muy bien! Me apego al modelo que establecí en el primer párrafo, pero mi ecuación se arruinó de varias maneras ... Muestra que en realidad no he usado el modelado log-lineal de tablas de contingencia desde mi maestría, y no lo he hecho. Tengo las notas o libros a mano. Aunque creo que lo he solucionado ahora. ¡Avísame si estás de acuerdo! Disculpas por el retraso. Algunos días mi cerebro simplemente no hace álgebra.
parada
1
pi=1/npij=0ijI{1,...,n}XI=1Xj=0jI