¿Se supone que las bandas de confianza y predicción alrededor de una regresión no lineal son simétricas alrededor de la línea de regresión? Lo que significa que no toman la forma del reloj de arena como en el caso de las bandas para la regresión lineal. ¿Porqué es eso?
Aquí está el modelo en cuestión:
Aquí está la figura:
y aquí está la ecuación:
Respuestas:
Se debería esperar que las bandas de confianza y predicción se ensanchen cerca de los extremos, y por la misma razón que siempre lo hacen en una regresión ordinaria; generalmente la incertidumbre del parámetro conduce a intervalos más amplios cerca de los extremos que en el medio
Puede ver esto simulando con bastante facilidad, ya sea simulando datos de un modelo determinado o simulando a partir de la distribución de muestreo del vector de parámetros.
Los cálculos habituales (aproximadamente correctos) realizados para la regresión no lineal implican tomar una aproximación lineal local (esto se da en la respuesta de Harvey), pero incluso sin ellos podemos obtener alguna noción de lo que está sucediendo.
Sin embargo, hacer los cálculos reales no es trivial y puede ser que los programas tomen un atajo en el cálculo que ignore ese efecto. También es posible que para algunos datos y algunos modelos el efecto sea relativamente pequeño y difícil de ver. De hecho, con intervalos de predicción, especialmente con una gran varianza pero con muchos datos, a veces puede ser difícil ver la curva en una regresión lineal ordinaria: pueden verse casi rectas y es relativamente fácil discernir la desviación de la rectitud.
Aquí hay un ejemplo de lo difícil que puede ser ver solo con un intervalo de confianza para la media (los intervalos de predicción pueden ser mucho más difíciles de ver porque su variación relativa es mucho menor). Aquí hay algunos datos y un ajuste de mínimos cuadrados no lineales, con un intervalo de confianza para la media de la población (en este caso, generado a partir de la distribución de muestreo, ya que conozco el modelo verdadero, pero podría hacerse algo muy similar por aproximación asintótica o por bootstrapping):
Los límites morados parecen casi paralelos a las predicciones azules ... pero no lo son. Aquí está el error estándar de la distribución de muestreo de esas predicciones medias:
que claramente no es constante
Editar:
¡Esas expresiones "sp" que acaba de publicar provienen directamente del intervalo de predicción para la regresión lineal !
fuente
Y-hat +/- sp(Y-hat)
Las matemáticas de calcular la confianza y las bandas de predicción de curvas ajustadas por regresión no lineal se explican en esta página de validación cruzada. Muestra que las bandas no son siempre / generalmente simétricas.
Y aquí hay una explicación con más palabras y menos matemáticas:
Primero, definamos G | x, que es el gradiente de los parámetros en un valor particular de X y utilizando todos los valores de mejor ajuste de los parámetros. El resultado es un vector, con un elemento por parámetro. Para cada parámetro, se define como dY / dP, donde Y es el valor Y de la curva dado el valor particular de X y todos los valores de los parámetros de mejor ajuste, y P es uno de los parámetros).
G '| x es ese vector de gradiente transpuesto, por lo que es una columna en lugar de una fila de valores. Cov es la matriz de covarianza (Hessian inversa de la última iteración). Es una matriz cuadrada con el número de filas y columnas igual al número de parámetros. Cada elemento en la matriz es la covarianza entre dos parámetros. Usamos Cov para referirnos a la matriz de covarianza normalizada , donde cada valor está entre -1 y 1.
Ahora calcular
El resultado es un número único para cualquier valor de X.
Las bandas de confianza y predicción se centran en la curva de mejor ajuste, y se extienden por encima y por debajo de la curva en una cantidad igual.
Las bandas de confianza se extienden por encima y por debajo de la curva al:
Las bandas de predicción se extienden una distancia adicional por encima y por debajo de la curva, igual a:
En ambas ecuaciones, el valor de c (definido anteriormente) depende del valor de X, por lo que las bandas de confianza y predicción no están a una distancia constante de la curva. El valor de SS es la suma de cuadrados para el ajuste, y DF es el número de grados de libertad (número de puntos de datos menos número de parámetros). CriticalT es una constante de la distribución t basada en el nivel de confianza que desea (tradicionalmente 95%) y el número de grados de libertad. Para límites del 95%, y un df bastante grande, este valor es cercano a 1.96. Si DF es pequeño, este valor es mayor.
fuente