Estoy buscando la distribución limitante de la distribución multinomial sobre los resultados d. IE, la distribución de lo siguiente
Donde es una variable aleatoria de valor vectorial con densidad para modo que , y 0 para todos los demás , donde
Encontré una forma en el Teorema "Todas las estadísticas" de Larry Wasserman 14.6, página 237, pero para limitar la distribución da Normal con una matriz de covarianza singular, por lo que no estoy seguro de cómo normalizar eso. Podría proyectar el vector aleatorio en el espacio dimensional (d-1) para hacer que la matriz de covarianza sea de rango completo, pero ¿qué proyección usar?
Actualización 11/5
Ray Koopman tiene un buen resumen del problema del gaussiano singular. Básicamente, la matriz de covarianza singular representa una correlación perfecta entre las variables, que no es posible representar con un gaussiano. Sin embargo, uno podría obtener una distribución gaussiana para la densidad condicional, condicionada por el hecho de que el valor del vector aleatorio es válido (los componentes se suman a en el caso anterior).
La diferencia para el gaussiano condicional es que el inverso se reemplaza por pseudoinverso, y el factor de normalización usa "producto de valores propios distintos de cero" en lugar de "producto de todos los valores propios". Ian Frisce da enlace con algunos detalles.
También hay una manera de expresar el factor de normalización del gaussiano condicional sin referirse a los valores propios, aquí hay una derivación
fuente
Respuestas:
La covarianza sigue siendo definida no negativa (por lo que es una distribución normal multivariada válida ), pero no definida positiva: lo que esto significa es que (al menos) un elemento del vector aleatorio es una combinación lineal de los otros.
Como resultado, cualquier sorteo de esta distribución siempre estará en un subespacio de . Como consecuencia, esto significa que no es posible definir una función de densidad (ya que la distribución se concentra en el subespacio: piense en la forma en que una normal univariada se concentrará en la media si la varianza es cero).Rd
Sin embargo, como lo sugiere Robby McKilliam, en este caso puede soltar el último elemento del vector aleatorio. La matriz de covarianza de este vector reducido será la matriz original, con la última columna y fila eliminada, que ahora será positiva definida y tendrá una densidad (este truco funcionará en otros casos, pero debe tener cuidado con qué elemento se cae, y es posible que deba soltar más de uno).
fuente
No hay ningún problema inherente con la covarianza singular aquí. Su distribución asintótica es la normal singular. Ver http://fedc.wiwi.hu-berlin.de/xplore/tutorials/mvahtmlnode34.html que da la densidad del singular normal.
fuente
Me parece que la matriz de covarianza de Wasserman es singular, para ver, multiplíquela por un vector de unos, es decir, de longitud .[ 1 , 1 , 1 , ... , 1 ] ′ dd [1,1,1,…,1]′ d
Wikipedia da la misma matriz de covarianza de todos modos. Si nos limitamos a una distribución binomial, el teorema del límite central estándar nos dice que la distribución binomial (después de la escala apropiada) converge a la normal a medida que crece (vea wikipedia nuevamente ). Aplicando ideas similares, debería ser capaz de demostrar que un mulinomial a escala apropiada convergerá en distribución a la normal multivariada, es decir, cada distribución marginal es solo un binomio y converge a la distribución normal, y se conoce la varianza entre ellas.n
Por lo tanto, estoy muy seguro de que encontrará que la distribución de converge a la normal multivariada con media cero y covarianza donde es la covarianza matriz del multinomio en cuestión y es el vector de probabilidades . C
fuente
¿No es el caso quepara todo donde es la matriz de covarianza multinomial con la -ésima fila y columna eliminadas? Como este es el caso, no entiendo lo que quiere decir con "libertad de elección" ya que cualquier "elección" es equivalente.i , j S - i i|S−i|=|S−j| i,j S−i i
fuente