Estoy tratando de entender EM e intentando inferir los parámetros de este modelo usando esta técnica, pero tengo problemas para entender cómo comenzar:
Entonces, tengo un modelo de regresión lineal ponderado de la siguiente manera donde tengo observaciones y las observaciones correspondientes . El modelo de la relación entre e es un modelo de regresión lineal ponderado y los supuestos de distribución son los siguientes:
Aquí son los parámetros de regresión y el modelo permite variaciones desiguales al hacer que las variables de respuesta tengan pesos individuales sobre la variación. Mi objetivo es encontrar la relación lineal más probable dada por los parámetros .
Entonces, ahora puedo escribir el log-posterior de la siguiente manera:
Ahora, he estado tratando de entender EM y no estoy seguro de que mi comprensión aún esté completa, pero tal como lo entiendo, para comenzar a estimar los parámetros, empiezo tomando la expectativa de la distribución log-posterior con respecto a los parámetros latentes / ocultos que en mi caso son y . Entonces este valor esperado requerido será:
Sin embargo, no tengo idea de cómo proceder desde aquí para calcular esta expectativa. Agradecería cualquier sugerencia sobre cuál debería ser el siguiente paso. No estoy buscando a alguien que me dé todas las cosas necesarias, sino solo un empujón en la dirección correcta sobre lo que debería buscar resolver en los próximos pasos.
Respuestas:
Permítanme recordar primero los conceptos básicos del algoritmo EM. Al buscar la estimación de probabilidad máxima de una probabilidad de la forma
En su caso, parece que la variable latente esϖ hecho de la wi mientras que el parámetro de interés es β . Si procesas ambosβ y ϖ como variables latentes no queda parámetro para optimizar. Sin embargo, esto también significa que lo anterior enβ No se utiliza.
Si miramos más precisamente el caso dewi , su distribución condicional viene dada por
El log-verosimilitud completado es
fuente