Tengo un problema donde
Observo y, pero ni ni . Quiero estimar
Puedo estimar , usando algún tipo de modelo de regresión. Esto me da . Entonces podría estimar
Primer problema: un modelo de regresión para predecir podría llevar a ser negativo, lo que no tendría ningún sentido. No estoy seguro de cómo solucionar esto (no es el tipo de problema con el que he lidiado mucho), pero parece ser el tipo de cosas con las que los demás tratan habitualmente. ¿Algún tipo de GLM no gaussiano?
El principal problema es cómo explicar la incertidumbre en el modelo principal que proviene de la estimación de . He usado imputación múltiple antes para covariables faltantes. Pero este es un "parámetro latente" que falta. Alternativamente, son los datos de resultados, lo que parece correcto imputar . Sin embargo, a menudo escucho sobre EM usado para parámetros "latentes". No estoy seguro de por qué, ni sé si EM es mejor en estos contextos. MI es intuitivo tanto para comprender, implementar y comunicarse. EM es intuitivo de entender, pero parece más difícil de implementar (y no lo he hecho).
¿Es EM superior para el tipo de problema que tengo arriba? Si es así, ¿por qué? En segundo lugar, ¿cómo se implementa en R para un modelo lineal o para un modelo semiparamétrico (GAM)?
fuente
Respuestas:
Si tiene sentido o no usar GLM depende de la distribución de . Me inclinaría a usar un modelo de mínimos cuadrados no lineales para todo.y
Entonces, si su modelo de regresión es donde son los predictores y son los parámetros en el modelo de regresión para , y su modelo para es pero donde está restringido a ser no negativo, podría escribir y ajustar un modelo como este:a=Zα+ν Z α a b b=f(x)+ϵ f(x) f(x)=exp(ψ(x))
donde es la suma de los dos términos de ruido individuales. (Si realmente tiene la intención de que sin ningún error en absoluto, debe hacerlo de manera diferente; eso no es realmente un problema de estadísticas tanto como un problema de aproximación y probablemente desee ver las normas de infinito en ese momento).η y=a+b
Si pone una spline de regresión cúbica para esa sería una manera fácil de obtener alguna función general suave. Ese modelo podría ajustarse mediante mínimos cuadrados no lineales. (De hecho, algunos algoritmos pueden aprovechar la linealidad de para simplificar y acelerar el cálculo).ψ a
Dependiendo de lo que se asume sobre o , hay otras cosas que usted puede hacer en su lugar.y f
Eso realmente no aborda el problema de imputación todavía. Sin embargo, este tipo de marco modelo se puede insertar en algo como su sugerencia de usar EM.
fuente