El modelo de regresión de Poisson inflado a cero se define para una muestra por y además supone que los parámetros \ mathbf {\ lambda} = (\ lambda_1, \ dots, \ lambda_n) y \ textbf {p} = (p_1, \ dots, p_n) satisfacenλ = ( λ 1 , ... , λ n )
La probabilidad de registro correspondiente del modelo de regresión de Poisson inflado a cero es
Aquí, y son las matrices de diseño. Estas matrices podrían ser las mismas, dependiendo de las características que uno desee usar para los dos procesos de generación. Sin embargo, tienen el mismo número de filas.
Suponiendo que pudiéramos observar cuando es del estado perfecto, cero y cuando es del estado de Poisson, la probabilidad logarítmica sería
¿Pero no son las variables latentes inobservables? El propósito es maximizar la primera probabilidad de registro. Pero tenemos que introducir variables latentes y derivar un nuevo log-verosimilitud. Luego, utilizando el algoritmo EM, podemos maximizar la segunda probabilidad de registro. ¿Pero esto supone que sabemos que o ?
Respuestas:
La raíz de la dificultad que tienes está en la oración:
Como has observado, no puedes. En cambio, lo que maximiza es el valor esperado de la segunda probabilidad de registro (conocida como la "probabilidad de registro de datos completa"), donde el valor esperado se toma sobre .zi
Esto lleva a un procedimiento iterativo, donde en la iteración se calculan los valores esperados de dadas las estimaciones de los parámetros de la iteración ( (esto se conoce como el "paso E ",) luego sustitúyalos en la probabilidad de registro de datos completa (consulte EDITAR a continuación para ver por qué podemos hacer esto en este caso), y maximícela con respecto a los parámetros para obtener las estimaciones para la iteración actual (el" paso M " .)kth zi (k−1)th
La probabilidad log-datos completa para la Poisson inflado de cero en el caso más simple - dos parámetros, por ejemplo y - permite simplificar de manera importante cuando se trata de la M-paso, y esto se traslada en cierta medida a su formulario. Le mostraré cómo funciona eso en el caso simple a través de un código R, para que pueda ver la esencia del mismo. No simplificaré tanto como sea posible, ya que eso podría causar una pérdida de claridad cuando piense en su problema:λ p
En su caso, en cada paso hará una regresión ponderada de Poisson donde los pesos sonβ λi
1-zhat
para obtener las estimaciones de y, por lo tanto, , y luego maximizar:con respecto al vector coeficiente de su matriz para obtener las estimaciones de . Los valores esperados , nuevamente calculados en cada iteración.G pi Ezi=pi/(pi+(1−pi)exp(−λi))
Si desea hacer esto para datos reales, en lugar de simplemente comprender el algoritmo, los paquetes R ya existen; Aquí hay un ejemplo http://www.ats.ucla.edu/stat/r/dae/zipoisson.htm usando la
pscl
biblioteca.EDITAR: Debo enfatizar que lo que estamos haciendo es maximizar el valor esperado de la probabilidad de registro de datos completos, NO maximizar la probabilidad de registro de datos completos con los valores esperados de los datos faltantes / variables latentes conectadas. Como sucede, si la probabilidad de registro de datos completos es lineal en los datos faltantes, ya que está aquí, los dos enfoques son iguales, pero de lo contrario, no lo son.
fuente