¿Cómo evaluar la bondad de ajuste de un modelo no lineal particular? [cerrado]

10

Tengo un modelo no lineal , donde es el cdf de la distribución normal estándar yf es no lineal (ver más abajo). Quiero poner a prueba la bondad del ajuste de este modelo con el parámetro de mis datos , después de haber usado la estimación de máxima verosimilitud para encontrar . ¿Cuál sería una prueba adecuada? Me gustaría utilizar esta prueba para etiquetar un mal ajuste como malo y determinar si se deben recopilar más datos. $y=\Phi(f(x,a)) + \varepsilon$ $\Phi$ $a$ $(x_1,y_1),(x_2,y_2),\dots,(x_n,y_n)$ $a$

He examinado el uso de la desviación, que compara este modelo con el modelo saturado, con su correspondiente prueba de bondad de ajuste utilizando la . ¿Sería esto apropiado? La mayor parte de lo que he leído sobre la desviación se aplica a los GLM, que no es lo que tengo. Si la prueba de desviación es apropiada, ¿qué suposiciones deben mantenerse para que la prueba sea válida? $\chi^2_{n-1}$

Actualización: para en caso de que esto ayude. $f = \frac{x-1}{a\sqrt{x^2+1}}$ $x>1,a>0$

nonlinear-regression goodness-of-fit deviance spadequack
fuente

1

La respuesta depende del propósito del análisis y del modelo de probabilidad subyacente que haya utilizado; No hay una única o mejor respuesta matemática. Por ejemplo, mediríamos la bondad de ajuste de manera diferente para un modelo de la forma que para uno de la forma (con errores de iid ).

y = Φ (f (x, a) + ε)

$y=\Phi(f(x,a)+\varepsilon)$

y = Φ (f (x, a)) + ε

$y=\Phi(f(x,a))+\varepsilon$

ε

$\varepsilon$

whuber

Gracias. He aclarado mi pregunta. Soy consciente de que no hay una mejor respuesta, sin embargo, todavía me gustaría saber si la desviación es adecuada para probar la bondad de ajuste aquí, y si no, cuál es otra prueba que sería apropiada para marcar un ajuste como muy pobre y decir que se deben recopilar más datos (suponiendo que el modelo sea correcto) o decir que el modelo no describe los datos.

spadequack

1

¿Es su variable de destino o es continua? Si es lo primero, entonces podría enmarcar el modelo como lugar de tener el término de error aditivo, y comparar la predicción con y para obtener las tasas de verdadero y falso positivo, o compare con un modelo de línea de base donde , o desviación, o varias otras alternativas. Si es lo último, ¿cuál es la distribución que está asumiendo para el residuo?

y \in 0, 1

$y \in {0,1}$

p (y = 1) = Φ (f (x, a))

$p(y=1) = \Phi(f(x,a))$

y = 0

$y=0$

y = 1

$y=1$

p (y = 1) = \bar{y}

$p(y=1) = \bar{y}$

jbowman

1

Votación para cerrar porque la solicitud de aclaración no ha recibido respuesta.

whuber

1

Utilice el paquete "npcmstest" en la biblioteca "NP" si está utilizando la plataforma R. Advertencia: la función puede tardar varios minutos en evaluar su modelo.

También puede considerar una comparación teórica de la información de la distribución de respuesta y la distribución predictiva (es decir, divergencia KL, entropía cruzada, etc.)

Ram Ahluwalia
fuente

Parece que el método requiere un modelo de lmo glm. ¿Cómo funcionaría esto para un modelo no lineal? (Sí, estoy usando R.) Agregué qué es

a mi pregunta en caso de que eso ayude.

f

$f$

spadequack

@ ¿Estás usando gamo algo similar ( mgcvpaquete)? Si no, deberías echarle un vistazo.

suncoolsu

1

Así es como lo haría, básicamente una prueba de razón de probabilidad. Pero recuerde que la "clave" para comprender una prueba de bondad de ajuste es comprender la clase de alternativas con las que está probando. Ahora tenemos la probabilidad de que cada punto de datos individual sea:

pag (y_{yo} El | X_{yo}, una, yo) = sol (ϵ_{yo}) = sol (y_{yo} - F_{yo})

$p(y_i|x_i,a,I)=g(\epsilon_i)=g(y_i-f_i)$

Donde es la probabilidad del término de error en su modelo, y $g(\epsilon)$ es la predicción del modelo para el i-ésimo punto de datos, dadosy. Ahora para cada punto de datos $f_i=\frac{x_i-1}{a\sqrt{x^2_i+1}}$ $x_i$ $a$ podemos elegir un tal que - el "modelo saturado" como lo llaman. Por lo que está prueba es apropiada aquí, si sólo desea la prueba de alternativas dentro de la clase de los que tienen la misma probabilidad de error, , y tiene la independencia de cada una de las probabilidades (es decir, saber otro $(x_i,y_i)$ $a$ $f_i=y_i$ $\chi^2$ $g(\epsilon)$ no serían de ayuda para predecir , dado ). $x_j,y_j$ $y_i$ $a$

probabilidadislogica
fuente

1

Esto no va a funcionar, ya que los grados de libertad de la prueba de razón de probabilidad aumentan a medida que

para el modelo saturado.

O (n)

$O(n)$

StasK

0

En el contexto de regresión lineal, las pruebas de bondad de ajuste a menudo se realizan contra una alternativa más complicada. Tiene una regresión lineal: agregue algunos términos polinómicos para probar si la forma lineal es suficiente. Como ya tiene una forma funcional no lineal, la alternativa complicada que debería considerar sería la de la regresión no paramétrica . No intentaré proporcionar una introducción al tema, ya que requiere una mentalidad propia, y merece una presentación adecuada por separado. Para la prueba de regresiones paramétricas versus no paramétricas, Wooldridge (1992) o Hardle y Mammen (1993) , hacen cosas muy similares. Hardle también escribió un gran libro sobre el tema.

StasK
fuente

¿Cómo evaluar la bondad de ajuste de un modelo no lineal particular? [cerrado]

Respuestas: