¿Cuál sería un número mínimo "razonable" de observaciones para buscar una tendencia en el tiempo con una regresión lineal? ¿Qué hay de ajustar un modelo cuadrático?
Trabajo con índices compuestos de desigualdad en salud (SII, RII), y solo tengo 4 ondas de la encuesta, entonces 4 puntos (1997,2001,2004,2008).
No soy estadístico, pero tengo la impresión intuitiva de que 4 puntos no son suficientes. ¿Tiene una respuesta y / o referencias?
Muchas gracias,
Françoise
regression
Francoise
fuente
fuente
Respuestas:
La regla general de Peters de 10 por covariable es una regla razonable. Una línea recta se puede ajustar perfectamente con cualquiera de los dos puntos, independientemente de la cantidad de ruido en los valores de respuesta, y una cuadrática se puede ajustar perfectamente con solo 3 puntos. Claramente, en casi cualquier circunstancia sería apropiado decir que 4 puntos son insuficientes. Sin embargo, como la mayoría de las reglas generales, no cubre todas las situaciones. Los casos donde el término de ruido en el modelo tiene una gran varianza requerirán más muestras que un caso similar donde la varianza del error es pequeña.
El número requerido de puntos de muestra depende de los objetos. Si está haciendo un análisis exploratorio solo para ver si un modelo (digamos lineal en una covariable) se ve mejor que otro (digamos una función cuadrática de la covariable), menos de 10 puntos pueden ser suficientes. Pero si desea estimaciones muy precisas de los coeficientes de correlación y regresión para las covariables, podría necesitar más de 10 por covariable. La precisión del criterio de predicción podría requerir incluso más muestras que las estimaciones precisas de los parámetros. Tenga en cuenta que la varianza de las estimaciones y predicciones implican la varianza del término de error de los modelos.
fuente