Encontré una pregunta simple sobre la comparación de modelos flexibles (es decir, splines) frente a modelos inflexibles (por ejemplo, regresión lineal) en diferentes escenarios. La pregunta es:
En general, ¿esperamos que el rendimiento de un método de aprendizaje estadístico flexible funcione mejor o peor que un método inflexible cuando:
- ¿El número de predictores es extremadamente grande y el número de observaciones es pequeño?
- La varianza de los términos de error, es decir, , ¿es extremadamente alta?
Creo que para (1), cuando es pequeño, los modelos inflexibles son mejores (no estoy seguro). Para (2), no sé qué modelo es (relativamente) mejor.
machine-learning
model
un pequeño chico
fuente
fuente
Respuestas:
En estas 2 situaciones, el rendimiento comparativo del modelo flexible frente al inflexible también depende de:
Si la relación es cercana a lineal y no restringe la flexibilidad, entonces el modelo lineal debería dar un mejor error de prueba en ambos casos porque el modelo flexible probablemente se sobreajuste en ambos casos.
Puedes verlo así:
Sin embargo, si la verdadera relación es muy no lineal, es difícil decir quién ganará (ambos perderán :)).
Si ajusta / restringe el grado de flexibilidad y lo hace de la manera correcta (por ejemplo, mediante validación cruzada), entonces el modelo flexible debería ganar en todos los casos.
fuente
Por supuesto, depende de los datos subyacentes que siempre debe explorar para descubrir algunas de sus características antes de intentar ajustar un modelo, pero lo que he aprendido como reglas generales son:
fuente
Bueno, para la segunda parte, creo que un modelo más flexible intentará ajustarse al modelo y los datos de entrenamiento contienen un alto ruido, por lo que el modelo flexible también intentará aprender ese ruido y generará más errores de prueba. Conozco la fuente de esta pregunta, ya que también estoy leyendo el mismo libro :)
fuente
Para la primera parte, esperaría que el modelo inflexible funcione mejor con un número limitado de observaciones. Cuando n es muy pequeño, ambos modelos (ya sea flexible o inflexible) no arrojarían predicciones suficientemente buenas. Sin embargo, el modelo flexible tendería a sobreajustar los datos y funcionaría peor cuando se trata de un nuevo conjunto de pruebas.
Idealmente, recolectaría más observaciones para mejorar el ajuste, pero si ese no es el caso, usaría el modelo inflexible, tratando de minimizar un error de prueba con un nuevo conjunto de pruebas.
fuente
Para la segunda pregunta, creo que la respuesta es que ambos funcionarán por igual (suponiendo que esos errores sean irreductibles, es decir, este error). Se proporciona más información en Introducción al aprendizaje estadístico en la página 18 (tema: Por qué estimar ) donde el autor explica diciendoF
fuente
Para cada una de las partes (a) a (d), indique si i. o ii. es correcto y explica tu respuesta. En general, ¿esperamos que el rendimiento de un método de aprendizaje estadístico flexible funcione mejor o peor que un método inflexible cuando:
¿El tamaño de la muestra n es extremadamente grande y el número de predictores p es pequeño?
¿El número de predictores p es extremadamente grande y el número de observaciones n es pequeño?
¿La relación entre los predictores y la respuesta es altamente no lineal?
La varianza de los términos de error, es decir, σ2 = Var (ε), ¿es extremadamente alta?
Tomado de aquí .
fuente