Definición de un modelo en machine learning

11

Esta definición no se aplica del todo, ya que no siempre asumimos una distribución subyacente. Entonces, ¿qué es realmente un modelo? ¿Puede un GBM con hiperparámetros específicos considerarse un modelo? ¿Es un modelo una colección de reglas?

agave orgánico
fuente
1
Podrías dar un paso más allá de genérico y mirar en.wikipedia.org/wiki/Mathematical_model : la mayoría de los modelos de ML coincidirán con esa definición, incluso si no coinciden con el "modelo estadístico" (aunque creo que casi todos los entrenados sin supervisión o los modelos de LA supervisados ​​se considerarían modelos estadísticos).
Neil Slater

Respuestas:

7

Hace poco me interesó la misma pregunta y me di cuenta de que no existe una definición única de "modelo" en el aprendizaje automático. Depende en gran medida de las fuentes que está consultando, que pueden ser la documentación de un programa de software en particular, la jerga adoptada por su comunidad de usuarios o las definiciones utilizadas en los artículos académicos publicados, que pueden variar ampliamente de una revista a otra. Además, tuve que aprender a tener en cuenta que dichos documentos están escritos no solo por especialistas en aprendizaje automático, sino por expertos en otras disciplinas que tienen la necesidad de aplicar técnicas de aprendizaje automático (como imágenes, diversos campos médicos, etc.) . Muchos de ellos no definen explícitamente el término "modelo", que a menudo se usa libremente. Aquí hay un par de definiciones diferentes de "modelo" I '

• Modelos estadísticos, particularmente las estadísticas relacionadas con las distribuciones de probabilidad.

• Datos de regresión y estadísticas relacionadas.

• Modelos matemáticos como los mencionados anteriormente por Neil Slater.

• Los modelos de datos utilizados en el aprendizaje automático, como las columnas involucradas, sus tipos de datos, las fuentes de datos y otros metadatos. Esto es particularmente complicado porque no hay nada matemático en esta definición, a diferencia de los primeros tres que enumeré. Para ver un ejemplo, consulte toda la documentación de los "modelos de minería" de SQL Server, que tienen doble función para fines de aprendizaje automático.

• A veces, todas las definiciones anteriores se expanden para incluir estructuras de aprendizaje automático creadas sobre las ecuaciones y los metadatos, como las especificaciones de las redes neuronales. En otros casos, se consideran entidades separadas.

Todo lo anterior a veces se mezcla y combina, dependiendo de la fuente. Estoy seguro de que hay otras definiciones de "modelo" que he dejado fuera de esta lista, lo que complicará aún más el asunto. Para lidiar con esta ambigüedad, estoy tratando de entrenarme para adivinar las intenciones del autor cada vez que usan el término "modelo". A veces es fácil de determinar según el contexto o el campo en el que trabaja el autor, pero otras veces tengo que leer profundamente un artículo o documentación antes de resolverlo. Ojalá pudiera ser más definitivo al respecto, pero en realidad es un término borroso por naturaleza; nunca habrá una respuesta única para todos. Espero que eso ayude.

SQLServerSteve
fuente
1
Si bien el término "modelo" podría aplicarse a muchas cosas, en el contexto del aprendizaje automático, el modelo es el artefacto creado a través del aprendizaje / entrenamiento, por ejemplo, en el caso de las redes neuronales, los pesos y sesgos de esa red.
Syzygy
5

Me gusta la definición de Machine Learning dada por Tom Mitchell .

Se dice que un programa de computadora aprende de la experiencia E con respecto a alguna clase de tareas T y medida de desempeño P si su desempeño en tareas en T, medido por P, mejora con la experiencia E.

Entonces, dada esta definición, debería decir que un modelo es la experiencia adquirida después de hacer alguna clase T.

omar
fuente
¿No es la experiencia E el conjunto de entrenamiento?
Itamar Mushkin
4

Del artículo sobre Amazon Machine Learning

El proceso de entrenamiento de un modelo de ML implica proporcionar un algoritmo de ML (es decir, el algoritmo de aprendizaje) con datos de entrenamiento para aprender. The term ML model refers to the model artifact that is created by the training process.

Vlad Bezden
fuente
2

Un modelo, en términos generales, es una simplificación de algo o proceso. Por ejemplo, la forma de la Tierra no es realmente una esfera, pero podríamos tratarla como tal si estamos diseñando un globo terráqueo. Del mismo modo, suponiendo que el universo sea determinista, existe un proceso natural que determina si un cliente comprará un producto en un sitio web. Podríamos construir algo que se aproxime a ese proceso, al que podríamos brindar información sobre un cliente y que nos diga si cree que ese cliente comprará un producto.

Un "modelo de aprendizaje automático", entonces, es un modelo construido por un sistema de aprendizaje automático.

(Disculpas por que esto no sea una respuesta rigurosa, pero espero que aún sea útil).

Ceasar Bautista
fuente
1

En el paradigma de aprendizaje automático, el modelo se refiere a una expresión matemática de los parámetros del modelo junto con los marcadores de posición de entrada para cada predicción, clase y acción para las categorías de regresión, clasificación y refuerzo, respectivamente.

Esta expresión está incrustada en la neurona individual como modelo.

Para el perceptrón de una sola capa y el modelo de aprendizaje profundo, uno necesita extraer este modelo caminando cuidadosamente las neuronas y las capas para recolectar y unir la función de activación de una manera ordenada.

cppRohit
fuente
0

En el aprendizaje automático, el modelo es el centro de gravedad y todo gira en torno al modelo. Aunque diferentes personas tienen diferentes definiciones del modelo. Pero en mi opinión, aquí es donde podemos definir mejor el modelo "el modelo en aprendizaje automático es la hipótesis que intenta ajustar los datos y aprender a predecir los datos no vistos".

Awais Bajwa
fuente