¿Cuándo debe llamarse la regresión lineal "aprendizaje automático"?

90

En un coloquio reciente, el resumen del orador afirmó que estaban utilizando el aprendizaje automático. Durante la charla, lo único relacionado con el aprendizaje automático era que realizaban una regresión lineal en sus datos. Después de calcular los coeficientes de mejor ajuste en el espacio de parámetros 5D, compararon estos coeficientes en un sistema con los coeficientes de mejor ajuste de otros sistemas.

¿Cuándo es el aprendizaje automático de regresión lineal , en lugar de simplemente encontrar una línea que se ajuste mejor? (¿El resumen del investigador fue engañoso?)

Con toda la atención que el aprendizaje automático ha estado obteniendo recientemente, parece importante hacer tales distinciones.

Mi pregunta es como esta , excepto que esa pregunta pide la definición de "regresión lineal", mientras que la mía pregunta cuándo la regresión lineal (que tiene un amplio número de aplicaciones) puede llamarse apropiadamente "aprendizaje automático".

Aclaraciones

No estoy preguntando cuándo la regresión lineal es lo mismo que el aprendizaje automático. Como algunos han señalado, un solo algoritmo no constituye un campo de estudio. Pregunto cuándo es correcto decir que uno está haciendo aprendizaje automático cuando el algoritmo que está usando es simplemente una regresión lineal.

Dejando de lado todos los chistes (ver comentarios), una de las razones por las que pregunto esto es porque no es ético decir que uno está haciendo aprendizaje automático para agregar algunas estrellas doradas a su nombre si realmente no están haciendo aprendizaje automático. (Muchos científicos calculan algún tipo de línea de mejor ajuste para su trabajo, pero esto no significa que estén haciendo aprendizaje automático). Por otro lado, claramente hay situaciones en las que se utiliza la regresión lineal como parte del aprendizaje automático. Estoy buscando expertos que me ayuden a clasificar estas situaciones. ;-)

jvriesem
fuente
13
Tal vez quieras ver el hilo: " Las dos culturas: ¿estadísticas vs. aprendizaje automático? ".
usεr11852
75
Debe cambiar el nombre de su regresión como 'aprendizaje automático' cuando desee duplicar las tarifas en su hoja de tarifas.
Restablecer Monica
3
Hay una diferencia. El aprendizaje es un proceso. Un mejor ajuste es un objetivo. Vea mi respuesta a continuación. Francamente, las palabras no tienen el mismo significado, aunque pueden aparecer en el mismo contexto, como "los pájaros vuelan", uno puede asociar los dos, pero los pájaros no vuelan, y aunque volar es para los pájaros, es para F -18 aviones de combate también.
Carl
20
@Sycorax y aprendizaje profundo cuando quieres cuadruplicar
Franck Dernoncourt
11
@FranckDernoncourt "Soy un científico de datos que utiliza el aprendizaje profundo en un entorno de big data para resolver problemas de aprendizaje automático" parece un buen encabezado para el perfil de LinkedIn;)
Tim

Respuestas:

78

Respondiendo a su pregunta con una pregunta: ¿qué es exactamente el aprendizaje automático? Trevor Hastie, Robert Tibshirani y Jerome Friedman en The Elements of Statistical Learning , Kevin P. Murphy en Machine Learning A Probabilistic Perspective , Christopher Bishop en Pattern Recognition and Machine Learning , Ian Goodfellow, Yoshua Bengio y Aaron Courville en Deep Learning y varios otras "biblias" de aprendizaje automático mencionan la regresión lineal como uno de los "algoritmos" de aprendizaje automático. El aprendizaje automático es en parte una palabra de moda para las estadísticas aplicadas y la distinción entre estadísticas y aprendizaje automático a menudo es borrosa.

Tim
fuente
44
Es cierto, pero en gran parte son disciplinas aisladas con grandes cantidades de literatura, métodos y algoritmos que no se superponen. Por ejemplo, en el mundo del aprendizaje automático actual, los graduados en informática y datos están muy por delante de los solicitantes de estadísticas en términos de financiación, subvenciones y oportunidades de empleo, lo que sea.
Mike Hunter
66
@DJohnson, ¿entonces aplica estadísticas con un nuevo paquete, vendido a un precio más alto ...? Yo no creo que el hecho de que está de moda no significa que sea una palabra de moda. Las estadísticas bayesianas también tienen sus propios métodos, revistas, conferencias, manuales y aplicaciones que en parte no se superponen con las estadísticas clásicas: ¿lo convierte en una disciplina distinta de las estadísticas?
Tim
3
Sip. Me olvidé de advertir mi observación sobre los practicantes de LD con la observación más general de que los practicantes aislados y centrados son endémicos en cada campo y profesión, no solo en el LD. Es un tipo de riesgo ocupacional, lea las fallas humanas, que a las personas les cegue la información fuera de sus necesidades e intereses inmediatos. El CV no es una excepción a esto.
Mike Hunter
23
(+1) Estoy de acuerdo en que no hay una distinción clara. En la medida en que pienso en las diferencias, típicamente pensaría en ML como más preocupado por las predicciones , y las estadísticas más preocupadas por la inferencia de parámetros (por ejemplo, ¿el diseño experimental para el modelado de superficie de respuesta no sería típico en ML?). Entonces, en ese sentido, el ejemplo OP, donde los coeficientes de regresión parecen ser los más preocupantes, sería más "estadístico" (?)
GeoMatt22
3
Véase también Las dos culturas de Leo Breiman, que hace un punto similar al de @ GeoMatt22: ML se centra en la predicción precisa. Si el modelo es verdadero no es importante. La estadística clásica está buscando el modelo "verdadero", en algún sentido, o al menos un modelo que dé una idea de los procesos que produjeron los datos.
Peter
41

La regresión lineal es definitivamente un algoritmo que se puede usar en el aprendizaje automático. Pero, reductio ad absurdum : cualquier persona con una copia de Excel puede ajustarse a un modelo lineal.

Incluso restringiéndonos a modelos lineales, hay algunas cosas más a tener en cuenta al hablar sobre el aprendizaje automático:

  • El aprendizaje automático sobre problemas empresariales puede implicar muchos más datos. " Big data ", si quieres usar la palabra de moda. Limpiar y preparar los datos puede llevar más trabajo que el modelado real. Y cuando el volumen de datos excede la capacidad de una sola máquina para procesarlos, los desafíos de ingeniería son tan importantes como los desafíos estadísticos. (Regla de oro: si cabe en la memoria principal no es big data).
  • El aprendizaje automático a menudo implica muchas más variables explicativas (características) que los modelos estadísticos tradicionales. Quizás docenas, a veces incluso cientos de ellas, algunas de las cuales serán variables categóricas con muchos niveles. Cuando estas características pueden interactuar potencialmente (p. Ej., En un modelo de efectos cruzados), el número de modelos potenciales para ajustarse crece rápidamente.
  • El profesional del aprendizaje automático generalmente está menos preocupado por la importancia de las características individuales, y más preocupado por exprimir la mayor cantidad de poder predictivo posible de un modelo, utilizando cualquier combinación de características que lo haga. (Los valores P están asociados con la explicación, no con la predicción).
  • Con una gran cantidad de características y varias formas de diseñar esas características, la selección de modelos a mano se vuelve inviable. En mi opinión, el verdadero desafío en el aprendizaje automático es la selección automatizada de características (ingeniería de características) y otros aspectos de la especificación del modelo. Con un modelo lineal hay varias formas de hacerlo, generalmente variantes de la fuerza bruta; incluida la regresión por pasos, la eliminación hacia atrás, etc., todo lo cual requiere nuevamente una potencia informática considerable. (Segunda regla general: si está seleccionando funciones a mano, está haciendo estadísticas, no aprendizaje automático).
  • Cuando ajusta automáticamente muchos modelos con muchas características, el ajuste excesivo es un problema potencial grave. Tratar este problema a menudo implica alguna forma de validación cruzada : es decir, ¡aún más cálculo de fuerza bruta!

La respuesta corta, desde mi punto de vista, es que donde el aprendizaje automático se desvía del modelado estadístico tradicional es en la aplicación de la fuerza bruta y los enfoques numéricos para la selección de modelos, especialmente en dominios con una gran cantidad de datos y una gran cantidad de variables explicativas , con un enfoque en el poder predictivo, seguido de más fuerza bruta para la validación del modelo.

david25272
fuente
2
Me gusta esta distinción en general. Sin embargo, ¿se utiliza alguna vez la validación cruzada en modelos "estadísticos" o rara vez se necesita, ya que normalmente se realizan a mano? ¿La ingeniería de características se considera estadística entonces como se hace a mano?
josh
3
@josh, sí, puede ser. Pero si observa la etiqueta de validación cruzada, casi todas las preguntas se refieren al modelado predictivo.
david25272
@ david25272 Me gustaría saber cómo piensas en el bootstrap, .632+ bootstrap y las pruebas de permutación. Siempre he pensado en ellos como más "estadísticas aplicadas" que "aprendizaje automático" debido a cómo son motivados, pero son similarmente "fuerza bruta" a la validación cruzada k-fold o leave-k-out. Creo que la regularización L1 también puede considerarse como un tipo de selección de características dentro de un marco estadístico ...
Patrick B.
@Patrick stats.stackexchange.com/questions/18348 es una mejor respuesta sobre los usos de bootstapping para la validación del modelo de lo que podría dar.
david25272
@ david25272 ah, lo siento, mi pregunta era más si las consideras técnicas de "aprendizaje automático" o técnicas de "estadística aplicada", ya que están motivadas estadísticamente pero también son "fuerza bruta". Estoy familiarizado con el uso de bootstraps con corrección de sesgo para la validación del modelo.
Patrick B.
14

Creo que la definición de Mitchell proporciona una forma útil de fundamentar la discusión sobre el aprendizaje automático, una especie de primer principio. Como se reproduce en Wikipedia :

Se dice que un programa de computadora aprende de la experiencia E con respecto a alguna clase de tareas T y mide el desempeño P si su desempeño en las tareas en T, medido por P, mejora con la experiencia E.

Esto es útil de varias maneras. Primero, a su pregunta inmediata: la regresión es el aprendizaje automático cuando su tarea es proporcionar un valor estimado de las características predictivas en alguna aplicación. Su rendimiento debería mejorar, medido por el error medio al cuadrado (o absoluto, etc.), ya que experimenta más datos.

En segundo lugar, ayuda a delinear el aprendizaje automático a partir de términos relacionados y su uso como palabra de moda de marketing. Contraste la tarea anterior con una regresión inferencial estándar, en la que un analista interpreta coeficientes para relaciones significativas. Aquí el programa devuelve un resumen: coeficientes, valores p, etc. No se puede decir que el programa mejore este rendimiento con experiencia; La tarea es un cálculo elaborado.

Finalmente, ayuda a unificar los subcampos de aprendizaje automático, tanto los que se usan comúnmente en la exposición introductoria (supervisada, no supervisada) con otros como el aprendizaje por refuerzo o la estimación de densidad. (Cada uno tiene una tarea, una medida de rendimiento y un concepto de experiencia, si se piensa lo suficiente en ellos). Proporciona, creo, una definición más rica que ayuda a delinear los dos campos sin reducirlos innecesariamente. Como ejemplo, "ML es para predicción, estadísticas para inferencia" ignora tanto las técnicas de aprendizaje automático fuera del aprendizaje supervisado como las técnicas estadísticas que se centran en la predicción.

Sean Easter
fuente
12

No hay una ley que diga que un ebanista no pueda usar una sierra de barril.

El aprendizaje automático y las estadísticas son etiquetas vagas, pero si están bien definidas, existe una gran superposición entre las estadísticas y el aprendizaje automático. Y esto se aplica a los métodos de estas dos áreas, así como (y por separado) para las personas que se etiquetan con estas dos áreas. Pero en lo que respecta a las matemáticas, el aprendizaje automático está completamente dentro del campo de la estadística.

La regresión lineal es un procedimiento matemático muy bien definido. Tiendo a asociarlo con el área de estadísticas y las personas que se autodenominan 'estadísticos' y aquellos que salen de programas académicos con etiquetas como 'estadísticas'. SVM (Support Vector Machines) es también un procedimiento matemático muy bien definido que tiene algunas entradas y salidas similares y resuelve problemas similares. Sin embargo, tiendo a asociarlo con el área del aprendizaje automático y las personas que se autodenominan científicos informáticos o personas que trabajan en inteligencia artificial o aprendizaje automático que tienden a considerarse parte de la informática como disciplina.

Pero algunos estadísticos pueden usar SVM y algunas personas con IA usan regresión logística. Para ser claros, es más probable que un estadístico o investigador de IA desarrolle un método que realmente lo ponga en práctica.

Puse todos los métodos de aprendizaje automático directamente dentro del dominio de las estadísticas. Incluso cosas tan recientes como Deep Learning, RNN, CNN, LSTM, CRF. Un estadístico aplicado (bioestadístico, agrónomo) puede no estar familiarizado con ellos. Esos son todos métodos de modelado predictivo generalmente etiquetados con 'aprendizaje automático', y rara vez asociados con estadísticas. Pero son modelos predictivos, con la posibilidad de que puedan juzgarse utilizando métodos estadísticos.

Al final, la regresión logística debe considerarse parte del aprendizaje automático.

Pero sí, veo y a menudo comparto su disgusto por la aplicación incorrecta de estas palabras. La regresión lineal es una parte tan fundamental de las cosas llamadas estadísticas que se siente muy extraño y engañoso llamar a su uso 'aprendizaje automático' .

Para ilustrar, la regresión logística es idéntica matemáticamente a una red de aprendizaje profundo sin nodos ocultos y la función logística como la función de activación para el nodo de salida único. No llamaría a la regresión logística un método de aprendizaje automático, pero ciertamente se usa en contextos de aprendizaje automático.

Es sobre todo una cuestión de expectativa.

R: "Utilicé el aprendizaje automático para predecir el reingreso a un hospital después de una cirugía cardíaca".

B: "¡¿Ah sí? ¿Aprendizaje profundo? ¿Bosques al azar?"

R: "Oh, no, nada tan elegante como eso, solo la regresión logística".

B: mirada extremadamente decepcionada .

Es como decir, al lavar una ventana con agua, que estás usando química cuántica. Bueno, sí, claro, eso no es técnicamente incorrecto, pero estás implicando mucho más de lo que se necesita.

Pero realmente, eso es exactamente una diferencia cultural versus una diferencia de sustancia. Las connotaciones de una palabra y las asociaciones con grupos de personas (¡LR es totalmente no ML!) Frente a las matemáticas y las aplicaciones (¡LR es totalmente ML!).

Mitch
fuente
3
La regresión logística también es muy similar, tanto práctica como teóricamente, a las SVM
Patrick B.
3

La visión común es que el aprendizaje automático consta de 4 áreas:

1) Reducción de dimensionalidad

2) Agrupación

3) Clasificación

4) regresión

La regresión lineal es una regresión. Una vez que el modelo esté entrenado, podría usarse para predicciones, como cualquier otra, por ejemplo, Regresión forestal aleatoria.

Akavall
fuente
En realidad, hay una diferencia, aunque la regresión lineal se puede resolver utilizando el aprendizaje automático. Un objetivo de regresión común son los mínimos cuadrados ordinarios, lo que significa que nuestra función de pérdida objetivo, la suma de los residuos al cuadrado, debe minimizarse. Ahora, el aprendizaje automático simplemente se referiría a ese método por el cual minimizamos una función de pérdida.
Carl
Por lo tanto, conceptualmente, la regresión lineal a través del descenso de gradiente (aprendizaje) elige mejores y mejores residuos cuadrados sumados (función de pérdida). Los conceptos básicos son los mismos que para algoritmos de aprendizaje mucho más avanzados, como las redes neuronales. Estos algoritmos simplemente reemplazan el modelo lineal con un modelo mucho más complejo y, en consecuencia, una función de costos mucho más compleja. .
Carl
1
Entonces, la respuesta a la pregunta OP ¿ Cuándo es el aprendizaje automático de regresión lineal, en lugar de simplemente encontrar la línea que mejor se ajuste? Cuando la regresión lineal se realiza utilizando un elemento definible de aprendizaje automático, como el descenso de gradiente , entonces se realiza una regresión lineal utilizando el aprendizaje automático.
Carl
55
@Carl, el problema aquí que definió el "aprendizaje automático". Para mí, si podemos usar un modelo estadístico, y ese modelo tendría la capacidad de predecir que es aprendizaje automático. Y no importa qué enfoque se usó para encontrar los coeficientes del modelo.
Akavall
1
Encontré la respuesta de Akavall bastante clara. Creo que el problema de Akavall es que la definición que presenta es circular, porque parece reducirse a "P: ¿cuándo la técnica X cuenta como 'aprendizaje automático'? A: cuando la técnica X se realiza utilizando un elemento definible del aprendizaje automático". (Desafortunadamente, no entiendo el segundo punto que está haciendo, así que no puedo responder a eso.)
Patrick B.
2

La regresión lineal es una técnica, mientras que el aprendizaje automático es un objetivo que se puede lograr a través de diferentes medios y técnicas.

Por lo tanto, el rendimiento de la regresión se mide por lo cerca que se ajusta a una línea / curva esperada, mientras que el aprendizaje automático se mide por lo bueno que puede resolver un determinado problema, con los medios necesarios.

Con suerte
fuente
2

Argumentaré que la distinción entre aprendizaje automático e inferencia estadística es clara. En resumen, aprendizaje automático = predicción de observaciones futuras ; estadística = explicación.

Aquí hay un ejemplo de mi campo de interés (medicina): cuando desarrollamos un medicamento, buscamos los genes que mejor explican un estado de enfermedad, con el objetivo de enfocarlos con el medicamento. Usamos statistis para eso. Por el contrario, cuando se desarrollan pruebas de diagnóstico, por ejemplo, prediciendo si el medicamento ayudará a un paciente, el objetivo es encontrar estrictamente el mejor predictor del resultado futuro, incluso si comprende muchos genes y es demasiado complicado de entender. Utilizamos el aprendizaje automático para este propósito. Existen múltiples ejemplos publicados [1], [2], [3], [4] que muestran que la presencia del fármaco objetivo no es un buen predictor del resultado del tratamiento, de ahí la distinción.

En base a esto, es justo decir que uno está haciendo aprendizaje automático cuando el objetivo es predecir estrictamente el resultado de observaciones futuras / nunca antes vistas. Si el objetivo es comprender un fenómeno particular, entonces esa es la inferencia estadística, no el aprendizaje automático. Como otros han señalado, esto es cierto independientemente del método involucrado.

Para responder a su pregunta: en la investigación específica que describe, los científicos estaban comparando los roles de los factores (pesos) en diferentes modelos de regresión lineal, no comparando las precisiones del modelo. Por lo tanto, no es preciso llamar a su aprendizaje automático de inferencia.

[1] Messersmith WA, Ahnen DJ. Orientación de EGFR en cáncer colorrectal. El diario Nueva Inglaterra de medicina; 2008; 359; 17)

[2] Pogue-Geile KL y col. Predicción del grado de beneficio del adyuvante Trastuzumab en el ensayo NSABP B-31. J Natl Cancer Inst; 2013; 105: 1782-1788.

[3] Aprobación de Pazdur R. FDA para Vemurafenib. https://www.cancer.gov/about-cancer/treatment/drugs/fda-vemurafenib . Actualizado el 3 de julio de 2013.

[4] Ray T. Dos estudios de la ASCO muestran el desafío de utilizar la señalización MET como marcador predictivo en ensayos de drogas NSCLC. GenomeWeb, 11 de junio de 2014.

ljubomir
fuente
77
Estoy de acuerdo en que la investigación de aprendizaje automático tiene un énfasis mucho mayor en las predicciones sobre la estimación de parámetros. Pero esa no es una línea divisoria clara: la investigación estadística es rica en métodos predictivos.
Cliff AB
44
Entonces, ¿qué pasa con los estadísticos que hicieron predicciones antes de que las computadoras existieran (o estuvieran ampliamente disponibles)? ¿Estaban aplicando el aprendizaje automático de papel y lápiz?
Tim
1
@Tim: muy buen argumento. Creo que la respuesta es sí si se centraran en observaciones futuras, aunque reconozco en esos casos (raros) que el nombre de aprendizaje estadístico sería más apropiado. Con el advenimiento de las computadoras, el término aprendizaje automático se puso de moda. El punto no es el nombre, ni el uso de computadoras; Es la claridad del propósito. En mi opinión, es casi imposible optimizar con éxito tanto la predicción precisa de observaciones nunca antes vistas como la comprensión del fenómeno. Es mejor enfocarse adecuadamente.
ljubomir
44
El pronóstico de series de tiempo (predicción de la observación futura) fue durante mucho tiempo un problema popular en las estadísticas (y la econometría), por lo que no estoy de acuerdo con una distinción clara basada en eso.
Richard Hardy
1
Esta respuesta es falsa. La predicción es solo una pequeña parte del aprendizaje automático. Los estadísticos también hacen predicciones. Si bien es difícil delinear entre el aprendizaje automático y las estadísticas, esta definitivamente no es la forma correcta.
robguinness
2

Puede ser útil llamar aprendizaje automático de regresión lineal porque hacerlo generalmente implica un par de cosas importantes acerca de cómo resolvió su problema:

  1. Decidió que no era necesario verificar los supuestos causales y la teoría previa detrás de sus variables explicativas. Señala que su modelo no estaba destinado a explicar sino a predecir. Esto es perfectamente razonable en muchas configuraciones, por ejemplo, prediciendo el correo electrónico no deseado basado en palabras clave. Realmente no hay mucha literatura sobre qué palabras predicen el spam, y hay tantas palabras que no tiene sentido pensar a través del significado teórico de cada palabra
  2. No verificó la significación de la variable ni usó valores p, sino que probablemente optó por un conjunto de reserva o validación cruzada para evaluar el rendimiento predictivo fuera de la muestra. Esto puede ser perfectamente válido si, volviendo al ejemplo de correo electrónico no deseado, si realmente lo único que le importa es producir un modelo que prediga efectivamente el correo no deseado, incluso si esto tiene el costo de incluir variables que podrían no pasar las pruebas de importancia tradicionales.

Sin embargo, si su modelo está más destinado a explicar que a predecir, y usted verifica rigurosamente los supuestos causales teóricos de su modelo, etc., entonces sí, es bastante tonto llamarlo aprendizaje automático.

Ryan Zotti
fuente
2

Es cierto que cualquier respuesta a esta pregunta es más una opinión que un hecho objetivo, pero trataré de exponer mi lógica de por qué creo que la respuesta nunca es . Cualquier supuesto experto o instructor de aprendizaje automático solo revela su ignorancia al representar la regresión lineal como tal.

La delimitación de las disciplinas académicas tiene más que ver con la delimitación de las comunidades que con los métodos. Las disciplinas científicas toman prestados métodos entre disciplinas todo el tiempo. Además, en el siglo XIX (cuando se desarrolló la regresión lineal) y antes de eso, las disciplinas científicas no estaban tan claramente delineadas como lo están hoy. Entonces, particularmente cuando los métodos se desarrollaron en el siglo XIX o antes, debemos tener cuidado de asignarlos a una disciplina en particular.

Dicho esto, uno puede mirar la historia de una disciplina y concluir razonablemente que los métodos particulares "pertenecen" a una disciplina u otra. Nadie diría hoy que el cálculo pertenece al campo de la física, a pesar de que Newton, uno de los inventores del cálculo, definitivamente estaba tratando de aplicar esto a la física. El cálculo pertenece claramente a la disciplina de las matemáticas, no a la física. Esto se debe a que el cálculo es un método matemático general que se puede usar completamente fuera de los contextos físicos.

Por el mismo razonamiento, la regresión lineal pertenece a la disciplina de la estadística, a pesar de que se usa comúnmente como un simple ejemplo de ajuste de datos a un modelo en el contexto del aprendizaje automático. Así como el cálculo puede usarse fuera del contexto de la física, la regresión lineal puede (y es) fuera del contexto del aprendizaje automático.

Los instructores de aprendizaje automático serían prudentes al señalar que la regresión lineal ha estado en uso desde fines del siglo XIX, mucho antes de que surgiera la noción moderna de aprendizaje automático. También deben enfatizar que el aprendizaje automático utiliza muchos conceptos de probabilidad y estadística, así como otras disciplinas (por ejemplo, teoría de la información). Sin embargo, estos conceptos no representan el aprendizaje automático o un "algoritmo" de aprendizaje automático.

robguinness
fuente
1

¡Es la máquina, estúpido!

No soy estadístico ni experto en Big Data (TM). Sin embargo, diría que la distinción esencial es que el "aprendizaje automático" requiere "una máquina". En particular, implica agencia . El resultado no será consumido sin prisa por un humano. Más bien, el resultado será la entrada a un ciclo cerrado mediante el cual un sistema automatizado mejora su rendimiento.

Sistema cerrado

Esto está muy en línea con la respuesta de Sean Easter, pero solo quiero enfatizar que en aplicaciones comerciales, una máquina está mirando los resultados y actuando sobre ellos . Un ejemplo clásico es el algoritmo CineMatch, que fue el objetivo del Premio Netflix. Un humano podría mirar la salida de CineMatch y aprender características interesantes sobre los espectadores de películas. Pero no es por eso que existe. El propósito de CineMatch es proporcionar un mecanismo mediante el cual los servidores de Netflix puedan sugerir películas a los clientes que puedan disfrutar. La salida del modelo estadístico se dirige al servicio de recomendación, que finalmente produce más información a medida que los clientes califican las películas, algunas de las cuales fueron seleccionadas por recomendación de CineMatch.

Sistema abierto

Por otro lado, si un investigador usa un algoritmo para producir resultados estadísticos que se muestran en una presentación a otros humanos, entonces ese investigador decididamente no participa en el aprendizaje automático . Esto es, obviamente para mí, aprendizaje humano . El análisis lo realiza una máquina, pero no es una máquina la que está aprendiendo per se. Ahora, es "aprendizaje automático" en la medida en que un cerebro humano no experimentó todas las entradas de la muestra y obtuvo los resultados estadísticos "biológicamente". Pero yo lo llamaría "estadísticas" porque esto es exactamente lo que los estadísticos han estado haciendo desde que se inventó el campo.

Conclusión

Por lo tanto, respondería a esta pregunta preguntando: "¿Quién consume los resultados?" Si la respuesta es: "humanos", entonces son "estadísticas". Si la respuesta es: "software", entonces es "aprendizaje automático". Y cuando decimos que "el software consume los resultados", no queremos decir que lo almacene en algún lugar para su posterior recuperación. Queremos decir que realiza un comportamiento determinado por los resultados en un ciclo cerrado .

Hombre cortadora de césped
fuente
8
Este es un punto razonable, pero creo que, en la práctica, los modelos de ML a menudo se entregan a personas para que los interpreten y trabajen.
gung - Restablece a Monica
1
Diría que es porque ML como campo ha generado una variedad de herramientas útiles aprovechadas por los estadísticos , incluso si eso no es lo que quieren llamarse a sí mismos, con fines de marketing. ;)
Lawnmower Man
Estoy totalmente de acuerdo con @gung; similar a otras respuestas, estoy de acuerdo en que esto es más a menudo la motivación para las personas que se autodenominan "investigadores de ML", definitivamente no es una línea definitoria. Dos ejemplos de contador: los sistemas de recomendación se consideran un área de investigación de ML, pero los resultados se envían directamente a un humano. Los filtros de Kalman se usan muy a menudo en la navegación para piloto automático, sin humanos en el bucle, pero generalmente se consideran una metodología estadística.
Cliff AB
-1

En mi opinión, se puede hablar de aprendizaje automático cuando una máquina está programada para inferir parámetros de algún modelo utilizando algunos datos.

Si la máquina realiza una regresión lineal, entonces califica.

Si se hace a mano, entonces no lo hace.

Las definiciones que dependen de la prevalencia de algún agente (como Excel), o la mejora iterativa (como Sean Easter sugiere anteriormente), de alguna manera tratar de separarlo de las estadísticas o dependiendo de qué hacer con los resultados resultará inconsistente, en mi opinión.

Ytsen de Boer
fuente
3
Entonces, si calcula la regresión, o kNN, o el árbol de decisión, usando papel y lápiz y obtiene los mismos resultados que los calculados en la computadora, entonces en el primer caso sería un aprendizaje automático y en el segundo no ... Por otro lado, si usa una computadora para asignar aleatoriamente algunos valores como "parámetros" de su modelo, ¿entonces lo calificaría como aprendizaje automático ya que lo hizo una máquina? Esta definición no parece tener mucho sentido ...
Tim
Difícilmente puede llamarse aprendizaje automático si no utiliza una máquina. Es la máquina que aprende, después de todo. Y en realidad he desplegado modelos que "aprendieron" sus parámetros mediante un proceso aleatorio (Monte Carlo). Sin embargo, debo admitir que hubo un paso de validación involucrado después.
Ytsen de Boer
2
Algoritmos como Support Vector Machines se denominan "máquinas" por razones históricas, porque en los primeros días las personas tendrían que construir máquinas / computadoras reales para ejecutarlas ( stats.stackexchange.com/questions/261041/… ), no tiene nada que hacer con "algoritmos que se ejecutan en máquinas". Por otra parte, los modelos de series temporales ARIMA como son no en el ámbito de aprendizaje de máquinas, pero las estadísticas, y que se ejecutan en los ordenadores.
Tim