¿Cómo calcular el intervalo de confianza del 95% para la ecuación no lineal?

10

Tengo una ecuación para predecir el peso de los manatíes a partir de su edad, en días (dias, en portugués):

R <- function(a, b, c, dias) c + a*(1 - exp(-b*dias))

Lo modelé en R, usando nls (), y obtuve este gráfico:

ingrese la descripción de la imagen aquí

Ahora quiero calcular el intervalo de confianza del 95% y trazarlo en el gráfico. He usado los límites inferior y superior para cada variable a, byc, así:

lower a = a - 1.96*(standard error of a)
higher a = a + 1.96*(standard error of a)
(the same for b and c)

luego trazo una línea inferior usando a, b, c y una línea más alta usando a, b, c. Pero no estoy seguro de si esa es la forma correcta de hacerlo. Me está dando este gráfico:

ingrese la descripción de la imagen aquí

¿Es esta la forma de hacerlo, o lo estoy haciendo mal?

Rodrigo
fuente

Respuestas:

13
  1. Este control de calidad en este sitio explica las matemáticas para crear bandas de confianza alrededor de las curvas generadas por la regresión no lineal: forma de confianza e intervalos de predicción para la regresión no lineal

  2. Si sigue leyendo, ayudará a distinguir los intervalos de confianza para los parámetros de las bandas de confianza para la curva.

  3. Mirando su gráfico, parece que tiene datos de cuatro animales, midiendo cada uno de ellos durante muchos días. Si es así, ajustar todos los datos a la vez viola uno de los supuestos de regresión: que cada punto de datos sea independiente (o que cada residuo tenga un "error" independiente). Puede considerar ajustar el trazado de cada animal individualmente, o usar un modelo mixto para ajustarlos todos a la vez.

Harvey Motulsky
fuente
55
+1 El tercer punto es crucial: cualquier esfuerzo para calcular los CI o las bandas de confianza, suponiendo que estos datos sean independientes, producirá intervalos lamentablemente inadecuados (es decir, cortos ). Podría ayudar al OP a enfatizar que el método propuesto en la pregunta es definitivamente incorrecto: descuida la correlación (fuerte) entre las estimaciones de parámetros y agrega incorrectamente los límites de confianza. El resultado neto en realidad parece bastante razonable (puramente por accidente y suerte) pero, a mi parecer, todavía no es lo suficientemente conservador.
whuber