Qué hacer con la heterogeneidad de la varianza cuando la propagación disminuye con valores ajustados más grandes

9

Estoy tratando de producir un modelo mixto lineal, el código R es el siguiente.

lme (Promedio.pago ~ Juego + Tipo + Otros.Tipo + Juego: Tipo + Juego: Otros.Tipo + Tipo: Otros.Tipo, aleatorio = ~ 1 | Sujetos, método = "REML", datos = Sujetosm1) -> lme1

El término de respuesta Average.payoff es continuo, mientras que todas las variables explicativas son todas binarias.

Cuando llego a la validación, puedo ver claramente que la dispersión de los residuos disminuye con valores ajustados más grandes. Aunque parece haber mucha información sobre la heterogeneidad en la forma en que los residuos aumentan con valores ajustados más grandes, no he leído nada sobre casos similares al mío.

He trazado los residuos contra cada efecto explicativo y puedo ver que la dispersión disminuye con valores ajustados más grandes para las variables Juego y Tipo, pero aumenta para la variable Otros.Tipo.

¿Cuál es la causa de esto y qué debo hacer al respecto?

¿Debería considerar agregar términos cuadráticos o usar modelos aditivos? ¿Hay alguna transformación que deba aplicarse?

Gracias,

Jonathan

Jonathan Bone
fuente

Respuestas:

1

Agregar términos cuadráticos ayudaría si la media variara de esa manera, pero la variabilidad está en la varianza en su caso. Dado que son las covariables las que causan el cambio, una forma de estimación de la función de varianza que involucre esas covariables sería el enfoque que recomiendo.

Michael R. Chernick
fuente
1
Hola @ Michael - ¿Puedes darme más detalles aquí? Puede que no esté claro para algunos cómo puede incorporar una forma funcional para la varianza del error en un modelo de regresión. ¿Tenías algo específico en mente?
Macro
@Macro Pienso en los modelos que proporcionan ecuaciones conjuntas para la expectativa condicional y la varianza condicional de la variable de respuesta Y dadas las covariables. Estos modelos se analizan en los "Modelos de error de medición" de Wayne Fuller y en "Error de medición en modelos no lineales: una perspectiva moderna" de Carroll et al. La idea es expresar que el componente de error del modelo tiene una varianza que es σ2multiplicado por una función no negativa g de las covariables en el modelo.
Michael R. Chernick
1
Ver Carroll et al. pp. 79 a 85 y Fuller .
Michael R. Chernick