Tengo un modelo no lineal , donde es el cdf de la distribución normal estándar yf es no lineal (ver más abajo). Quiero poner a prueba la bondad del ajuste de este modelo con el parámetro de mis datos , después de haber usado la estimación de máxima verosimilitud para encontrar . ¿Cuál sería una prueba adecuada? Me gustaría utilizar esta prueba para etiquetar un mal ajuste como malo y determinar si se deben recopilar más datos.Φ a ( x 1 , y 1 ) , ( x 2 , y 2 ) , … , ( x n , y n ) a
He examinado el uso de la desviación, que compara este modelo con el modelo saturado, con su correspondiente prueba de bondad de ajuste utilizando la . ¿Sería esto apropiado? La mayor parte de lo que he leído sobre la desviación se aplica a los GLM, que no es lo que tengo. Si la prueba de desviación es apropiada, ¿qué suposiciones deben mantenerse para que la prueba sea válida?
Actualización: para en caso de que esto ayude. x>1,a>0
fuente
Respuestas:
Utilice el paquete "npcmstest" en la biblioteca "NP" si está utilizando la plataforma R. Advertencia: la función puede tardar varios minutos en evaluar su modelo.
También puede considerar una comparación teórica de la información de la distribución de respuesta y la distribución predictiva (es decir, divergencia KL, entropía cruzada, etc.)
fuente
lm
oglm
. ¿Cómo funcionaría esto para un modelo no lineal? (Sí, estoy usando R.) Agregué qué es a mi pregunta en caso de que eso ayude.gam
o algo similar (mgcv
paquete)? Si no, deberías echarle un vistazo.Así es como lo haría, básicamente una prueba de razón de probabilidad. Pero recuerde que la "clave" para comprender una prueba de bondad de ajuste es comprender la clase de alternativas con las que está probando. Ahora tenemos la probabilidad de que cada punto de datos individual sea:
Donde es la probabilidad del término de error en su modelo, y f i = x i - 1sol( ϵ ) es la predicción del modelo para el i-ésimo punto de datos, dadosxiya. Ahora para cada punto de datos(xi,yiFyo= xyo- 1a x2yo+ 1√ Xyo una podemos elegir un a tal que f i = y i - el "modelo saturado" como lo llaman. Por lo que está χ 2 prueba es apropiada aquí, si sólo desea la prueba de alternativas dentro de la clase de los que tienen la misma probabilidad de error, g ( ε ) , y tiene la independencia de cada una de las probabilidades (es decir, saber otro( xyo, yyo) una Fyo= yyo χ2 sol( ϵ ) no serían de ayuda para predecir y i , dado a ). Xj, yj yyo una
fuente
En el contexto de regresión lineal, las pruebas de bondad de ajuste a menudo se realizan contra una alternativa más complicada. Tiene una regresión lineal: agregue algunos términos polinómicos para probar si la forma lineal es suficiente. Como ya tiene una forma funcional no lineal, la alternativa complicada que debería considerar sería la de la regresión no paramétrica . No intentaré proporcionar una introducción al tema, ya que requiere una mentalidad propia, y merece una presentación adecuada por separado. Para la prueba de regresiones paramétricas versus no paramétricas, Wooldridge (1992) o Hardle y Mammen (1993) , hacen cosas muy similares. Hardle también escribió un gran libro sobre el tema.
fuente