Hemos ajustado una función no lineal a los datos observados. El siguiente paso debe ser la evaluación de la bondad de ajuste de esta función (como para modelos lineales).
¿Cuáles son las formas habituales de medir esto?
Editar 1:
El ajuste se realizó de la siguiente manera:
- Realizar una regresión lineal con variables independientes A y B .
- Calcular los parámetros de distribución a partir de los parámetros de regresión. (La distribución no es lineal y tiene la variable C como entrada).
- Evaluar la bondad del ajuste de la distribución no lineal comparando los datos estimados con los observados.
Edición 2:
Ejemplos de los pasos mencionados anteriormente:
- Modelo de regresión:
- y para la siguiente distribución no lineal:
- Evaluar la bondad de ajuste de con un conjunto dado de observaciones .
goodness-of-fit
nonlinear
Marco
fuente
fuente
Respuestas:
Tal vez haya más, pero para mí parece que solo desea determinar la bondad de ajuste (GoF) para una función f (a), ajustada a un conjunto de datos particular (a, f (a)). Entonces, lo siguiente solo responde a su tercera subpregunta (no creo que la primera y la segunda sean directamente relevantes para la tercera).
Por lo general, GoF puede determinarse paramétricamente (si conoce los parámetros de función de la distribución) o no paramétricamente (si no los conoce). Si bien es posible que pueda calcular parámetros para la función, ya que parece ser exponencial o gamma / Weibull (suponiendo que los datos sean continuos). Sin embargo, procederé, como si no supieras los parámetros. En este caso, es un proceso de dos pasos . Primero, debe determinar los parámetros de distribución para su conjunto de datos. En segundo lugar, realiza una prueba de GoF para la distribución definida. Para evitar repetirme, en este punto lo remitiré a mi respuesta anteriora una pregunta relacionada, que contiene algunos detalles útiles. Obviamente, esta respuesta se puede aplicar fácilmente a las distribuciones, además de la mencionada en el interior.
Además de las pruebas de GoF, mencionadas allí, puede considerar otra prueba: la prueba de GoF de chi-cuadrado . A diferencia de las pruebas KS y AD , que son aplicables solo a distribuciones continuas, la prueba de chi-cuadrado GoF es aplicable tanto a las discretas como a las continuas . La prueba de Chi-cuadrado GoF se puede realizar en R mediante el uso de uno de varios paquetes:
stats
paquete integrado (funciónchisq.test()
) yvcd
paquete (funcióngoodfit()
- solo para datos discretos). Más detalles están disponibles en este documento .fuente
Bueno, en Machine Learning lo que se llama validación cruzada se realiza con bastante frecuencia con el fin de probar el modelo (pruebe si ese tipo de modelo con estos hiperparámetros, como el número de grados de libertad o lo que sea, se ajusta a su problema), divide su datos varias veces en conjuntos de datos de entrenamiento y prueba, luego ejecute la optimización sobre el conjunto de entrenamiento y calcule cualquier calidad sobre los datos de las pruebas. La forma más confidencial es ejecutar la llamada "validación cruzada QxT-fold". El pseudocódigo podría gustar:
fuente