¿Por qué la regresión logística se llama algoritmo de aprendizaje automático?

19

Si entendí correctamente, en un algoritmo de aprendizaje automático, el modelo tiene que aprender de su experiencia, es decir, cuando el modelo da la predicción incorrecta para los nuevos casos, debe adaptarse a las nuevas observaciones, y con el tiempo, el modelo se vuelve cada vez mejor . No veo que la regresión logística tenga esta característica. Entonces, ¿por qué todavía se lo considera un algoritmo de aprendizaje automático? ¿Cuál es la diferencia entre la regresión logística con la regresión normal en términos de "aprendizaje"?

¡Tengo la misma pregunta para los bosques al azar!

¿Y cuál es la definición de "aprendizaje automático"?

machine-learning logistic random-forest Metariado
fuente

44

Edité su pregunta por claridad gramatical, pero no estoy seguro de lo que quiere decir en general ... La regresión logística se encuentra en ML porque es un algoritmo de clasificación. El aprendizaje automático no implica que el algoritmo deba ser adaptativo (aunque existen algoritmos que aprenden de nuevas observaciones). La adaptación es más una opción de implementación, que generalmente se logra mediante algoritmos de aprendizaje automático generativos que modelan la probabilidad conjunta.

Zhubarb

12

El "aprendizaje automático" es un concepto bastante poco definido. Realmente, todos los procedimientos estadísticos que implican ajustar un modelo pueden pensarse en el aprendizaje automático. (¡Asumiendo que el ajuste del modelo puede ser realizado por una computadora, hasta cierto punto!). Es por esto que algunos se ponen en estadística frustrado con "grandes datos", "aprendizaje automático", etc comunidades enturbiando las aguas estadísticas sobre lo que es (y no lo es!)

P.Windridge

1

Relacionado: ¿Existen algoritmos para calcular parámetros de regresión logística o lineal "en ejecución"? .

Scortchi - Restablece a Monica

1

@ P.Windridge: si "todos los procedimientos estadísticos que implican ajuste de un modelo se pueden pensar en la máquina de aprendizaje", así que no veo por qué deberíamos distinguir el aprendizaje automático y Estadística

Metariat

44

@XuanQuangDO Probablemente no debamos distinguir el aprendizaje automático y las estadísticas.

Sycorax dice Reinstate Monica

21

El aprendizaje automático no es un término bien definido.

De hecho, si buscas en Google "Machine Learning Definition", las dos primeras cosas que obtienes son bastante diferentes.

Desde WhatIs.com ,

El aprendizaje automático es un tipo de inteligencia artificial (IA) que proporciona a las computadoras la capacidad de aprender sin ser programadas explícitamente. El aprendizaje automático se centra en el desarrollo de programas informáticos que pueden aprender a crecer y cambiar cuando se exponen a nuevos datos.

De Wikipedia ,

El aprendizaje automático explora la construcción y el estudio de algoritmos que pueden aprender y hacer predicciones sobre los datos.

La regresión logística, sin duda, se ajusta a la definición de Wikipedia y se podría argumentar si se ajusta o no a la definición de WhatIs.

Personalmente defino Machine Learning tal como lo hace Wikipedia y lo considero un subconjunto de estadísticas.

TrynnaDoStat
fuente

1

Estoy de acuerdo con la mayoría de lo que dijiste, excepto que es un subconjunto de estadísticas. Tiene una gran superposición, pero hay tipos de aprendizaje, como el aprendizaje por refuerzo, que en realidad no pueden considerarse un subconjunto de estadísticas.

George

2

Estas no son buenas fuentes.

Neil G

@George Right, pero seamos sinceros, si tuviera que aplicar una etiqueta a todas las metodologías de recopilación, análisis y modelado de datos, ya sea aprendizaje automático, supervisado o no supervisado, paramétrico o no paramétrico, son todas estadísticas. ML es un campo especializado en estadística.

RobertF

@RobertF No estoy de acuerdo. El aprendizaje automático es el campo que estudia cómo las máquinas pueden aprender. Estoy de acuerdo en que la mayoría de los métodos utilizados en ML pueden considerarse métodos estadísticos, pero el campo no es inherentemente un subcampo de estadísticas. Por ejemplo, no creo que los procesos de decisión de Markov se consideren métodos estadísticos.

George

1

@George Tiempo discreto Los modelos de Markov son modelos de probabilidad. Una vez que estima parámetros desconocidos de un modelo de probabilidad (por ejemplo, procesos de decisión de Markov), esa es la definición de libro de texto de un procedimiento estadístico. Creo que la clase principal de actividades que se puede llamar ML y no estadísticas son aplicaciones específicas, como construir un robot que juegue ajedrez. Los algoritmos subyacentes implicarán indudablemente probabilidad y estadísticas, pero la aplicación no es realmente "estadística". Algo así como la investigación genómica utiliza las estadísticas en gran medida, pero son campos decididamente diferentes.

ahfoss

20

Machine Learning está de moda y es donde está el dinero. Las personas llaman a las cosas que están tratando de vender todo lo que está de moda en este momento y por lo tanto "venden". Eso puede ser vender software. Puede venderse a sí mismo como empleados actuales que intentan ser promovidos, como empleados potenciales, como consultores, etc. Puede ser un gerente que intenta obtener la aprobación del presupuesto de una empresa importante para contratar personas y comprar cosas, o convencer a los inversores para que inviertan en su nueva y exitosa startup que hace Machine Learning como la clave para hacer una aplicación de sexting mejorada. Entonces, el software hace Machine Learning y las personas son expertos en Machine Learning, porque eso es lo que está de moda y, por lo tanto, lo que vende ... al menos por ahora.

Hice todo tipo de modelos estadísticos lineales y no lineales hace más de 30 años. No se llamaba Machine Learning entonces. Ahora, la mayor parte lo sería.

Así como todos y su tío son ahora un "Científico" de datos. Eso es sexy, supuestamente sexy, así es como la gente se llama a sí misma. Y eso es lo que los gerentes de contratación que tienen que obtener el presupuesto aprobado para contratar a alguien enumeran los puestos. Entonces, alguien que no sabe lo primero sobre matemáticas, probabilidad, estadísticas, optimización o cálculo numérico / de coma flotante, utiliza un paquete R o Python de dudosa corrección y solidez de implementación, y que está etiquetado como un algoritmo de Machine Learning, para aplicar a datos que no entienden, y llamarse a sí mismos un Científico de Datos basado en su experiencia al hacerlo.

Esto puede sonar frívolo, pero creo que es la esencia de la situación.

Editar: Lo siguiente fue tuiteado el 26 de septiembre de 2019:

https://twitter.com/daniela_witten/status/1177294449702928384

Daniela Witten @daniela_witten "Cuando recaudamos dinero es IA, cuando contratamos es aprendizaje automático y cuando hacemos el trabajo es regresión logística".

(No estoy seguro de a quién se le ocurrió esto, pero es una joya 💎)

Mark L. Stone
fuente

16

No voy a ocultar que comparto algunas de estas opiniones y simpatizo con el resto. Sin embargo, para que sean apropiadas como respuesta en un sitio de SE necesitan tener algún tipo de apoyo. Obviamente, eso no será a través del razonamiento deductivo: tiene que venir de aducir hechos y / o citar fuentes autorizadas. ¡Sería genial si pudieras hacer eso!

whuber

10

Fácilmente la publicación más entretenida que he leído hoy en este sitio, y estoy de acuerdo con gran parte de ella. Pero tengo que estar de acuerdo con @whuber en que realmente no responde la pregunta en su forma actual.

Nick Cox

66

Como una pequeña aclaración. Trabajo tanto en desarrollo de software como en el difamado "Data Science". Entrevisto a mucha gente. La tasa de personas que se entrevistan para puestos de desarrollo de software y puestos de ciencia de datos que no tienen las habilidades para hacer el trabajo es casi la misma. Entonces, ¿qué tiene de especial el título de ciencia de datos? Las personas van a inflar sus habilidades en todas las disciplinas técnicas. Estoy seguro de que la programación de cambio de pila tiene muchas de las mismas quejas.

Matthew Drury

77

Esto se siente más como una queja que como una respuesta. Claro, los nombres cambian, la marca es importante y el aprendizaje automático está de moda (y, por lo tanto, tiene muchos profesionales autoproclamados que no saben lo que están haciendo). Sin embargo, usar eso como argumento para minimizar un campo que se ha establecido y es altamente relevante tanto en investigación como en industria me parece barato.

Marc Claesen

77

@ MarkL.Stone Entiendo su situación y estoy totalmente de acuerdo en que hay muchos términos incompetentes para insertar aquí . Sin embargo, en mi opinión, el hecho de que esas personas encuentren (¡y conserven!) Empleos es culpa de la gerencia. Si los gerentes no están contentos con los resultados de los analistas, y tratan a todos los analistas de la misma manera, independientemente de las habilidades / resultados individuales, entonces la gerencia es tan incompetente como los malos analistas. Cualquier trabajo que tenga un olor a efectivo tiene charlatanes, por ejemplo, tome medicamentos. Las generalizaciones radicales sobre los científicos de datos / chicos de aprendizaje automático son tan malas como desconfiar de todos los analistas.

Marc Claesen

18

Como otros ya han mencionado, no hay una separación clara entre estadísticas, aprendizaje automático, inteligencia artificial, etc., así que tome cualquier definición con un grano de sal. La regresión logística probablemente se etiqueta con mayor frecuencia como estadística en lugar de aprendizaje automático, mientras que las redes neuronales generalmente se etiquetan como aprendizaje automático (aunque las redes neuronales a menudo son solo una colección de modelos de regresión logística).

En mi opinión, el aprendizaje automático estudia métodos que de alguna manera pueden aprender de los datos, generalmente al construir un modelo de alguna forma o forma. La regresión logística, como SVM, redes neuronales, bosques aleatorios y muchas otras técnicas, aprende de los datos al construir el modelo.

Si entendí correctamente, en un algoritmo de Machine Learning, el modelo tiene que aprender de su experiencia

En realidad no es así como se define el aprendizaje automático. No todos los métodos de aprendizaje automático producen modelos que se adaptan dinámicamente a los nuevos datos (este subcampo se llama aprendizaje en línea ).

¿Cuál es la diferencia entre la regresión logística con la regresión normal en términos de "aprendizaje"?

Muchos métodos de regresión también se clasifican como aprendizaje automático (por ejemplo, SVM).

Marc Claesen
fuente

2

Tenga en cuenta que el aprendizaje no supervisado todavía se llama aprendizaje (automático), por lo que no necesariamente necesita tener ningún ciclo de retroalimentación para clasificar algo como "aprendizaje automático".

vsz

Este no es el tema de la pregunta, pero esta respuesta también menciona la separación entre AI y ML. Siempre me gustó esta definición de IA: en.wikipedia.org/wiki/…

Davis Yoshida

10

La regresión logística fue inventada por el estadístico DR Cox en 1958 y es anterior al campo del aprendizaje automático. La regresión logística no es un método de clasificación, gracias a Dios. Es un modelo de probabilidad directa.

Si cree que un algoritmo debe tener dos fases (suposición inicial, luego "corregir" los "errores" de predicción) considere esto: la regresión logística funciona correctamente la primera vez. Es decir, en el espacio de modelos aditivos (en el logit). La regresión logística es un competidor directo de muchos métodos de aprendizaje automático y supera a muchos de ellos cuando los predictores actúan principalmente de forma aditiva (o cuando el conocimiento de la materia especifica previamente correctamente las interacciones). Algunos llaman a la regresión logística un tipo de aprendizaje automático, pero la mayoría no lo haría. Podría llamar a algunos métodos de aprendizaje automático (las redes neuronales son ejemplos) modelos estadísticos.

Frank Harrell
fuente

1

Curiosamente, el servicio de aprendizaje automático de Amazon usa solo un algoritmo (afaik): regresión logística , para tareas de clasificación : p aws.amazon.com/machine-learning/faqs

stmax

Puede presentar los datos de forma incremental, como en un problema de aprendizaje en línea . En ese caso, la regresión logística no "lo hace bien la primera vez". Aprendo progresivamente. Tiene una pérdida estándar y su actualización es una aplicación estándar de descenso de gradiente. La regresión logística está en cada libro de texto de aprendizaje automático que he visto.

Neil G

1

El hecho de que pueda muestrear datos de manera incremental puede aplicarse a cualquier estimador, incluso una media, así que manténgalo separado. En un método como los modelos logísticos donde la primera y segunda derivadas de la función de probabilidad logarítmica están disponibles analíticamente, solo usa el método ultrarrápido de Newton-Raphson con reducción a la mitad para estimar

β

$\beta$ con estimaciones iniciales establecidas en cero, excepto para la intersección.

Frank Harrell

@FrankHarrell: Correcto, y así es como se realiza la estimación de máxima probabilidad de la solución de un problema de regresión logística.

Neil G

La regresión logística puede ser anterior al término "Aprendizaje automático", pero no es anterior al campo : SNARC se desarrolló en 1951 y era una máquina de aprendizaje . Además, la insistencia en que la regresión logística solo modela probabilidades y no es, por sí misma, un clasificador, es desgarradora. Según esa lógica, una red neuronal no es un clasificador (a menos que la capa de salida consista en neuronas binarias, pero eso haría imposible la propagación hacia atrás).

Igor F.

8

Tendré que estar en desacuerdo con la mayoría de las respuestas aquí y afirmar que Machine Learningtiene un alcance muy preciso y una clara distinción de las estadísticas. ML es un subcampo de la informática con una larga historia, que solo en los últimos años ha encontrado aplicaciones fuera de su dominio. El campo paternal y el dominio de aplicación de ML se encuentran dentro de la Inteligencia Artificial (robótica, software de reconocimiento de patrones, etc.), por lo tanto, no es solo un "término candente" como "Big Data" o "Data Science". Las estadísticas, por otro lado, (que proviene de la palabra "estado") se desarrollaron dentro de las ciencias sociales y económicas como una herramienta para los humanos, no para las máquinas. ML evolucionó por separado de las estadísticas y, aunque en algún momento comenzó a depender en gran medida de los principios estadísticos, de ninguna manera es un subcampo de estadísticas. El LD y las estadísticas son campos complementarios, no superpuestos.

Respuesta larga :

Como su nombre lo indica, los métodos ML se hicieron para software / máquinas, mientras que los métodos estadísticos se hicieron para humanos. Tanto el ML como las estadísticas se ocupan de las predicciones sobre los datos, sin embargo, los métodos de ML siguen un enfoque automatizado no paramétrico, mientras que los métodos estadísticos requieren una gran cantidad de trabajo manual de construcción de modelos con un factor explicativo adicional. Esto tiene mucho sentido si considera que los algoritmos de ML se desarrollaron en la investigación de IA como un medio de predicción automatizada que estaba destinado a integrarse en el software de robótica (por ejemplo, para el reconocimiento de voz y rostro). Cuando una "máquina" hace una predicción, no le importan las razones detrás de ella. A una máquina no le importa conocer los controladores / predictores detrás de un modelo que clasifica el correo electrónico como spam o no spam, solo le importa tener la mejor precisión de predicción.cajas negras , no es porque no tengan un modelo, es porque el modelo está construido algorítmicamente y no debe ser visible ni para humanos ni para máquinas.

El concepto de "entrenamiento" en ML se basa en el poder computacional, mientras que la construcción de modelos estadísticos con métodos de estimación de parámetros de tipo OLS se basa en el conocimiento de un experto humano. En un escenario de regresión múltiple, depende estrictamente del estadístico usar su juicio experto para elegir su modelo y verificar todos los supuestos estadísticos requeridos. El objetivo de un estadístico no es solo encontrar patrones y usarlos para predicciones, sino también comprender sus datos y su problema en una profundidad mucho mayor que ML.

Por supuesto, en algunas ocasiones, el LD y las estadísticas se superponen, como es el caso de muchas disciplinas. La regresión logística es una de estas ocasiones; Originalmente un método estadístico, que se parece mucho al Perceptrón simple (una de las técnicas de ML más fundamentales), que algunos consideran que es un método de ML.

Digio
fuente

1

¿Quizás nunca ha oído hablar de estadísticas no paramétricas y modelos estadísticos no paramétricos y construcción de modelos?

Mark L. Stone

1

Sí, uso estadísticas no paramétricas a diario. No dije que ML es la respuesta no paramétrica a las estadísticas, solo encuentro que los métodos de ML no paramétricos son un efecto secundario. La estadística no paramétrica es una opción alternativa del estadístico cuando falla la estadística paramétrica, pero sigue siendo el resultado de la elección consciente de un experto. Probablemente no estoy siendo lo suficientemente claro al comunicar mi punto de vista y por eso me disculpo.

Digio

3

Hay muchos estadísticos que hacen modelos no paramétricos, estadísticas todo el tiempo. ¿Has oído hablar de Probabilidad empírica, inventada por un estadístico, utilizada por estadísticos y bastante no paramétrica, aunque también se puede usar de forma semiparamétrica? Así que no estoy de acuerdo contigo, pero no te he votado mal.

Mark L. Stone

1

No está de acuerdo Mark, pero todavía no entiendo de qué se trata tu contraargumento. ¿Estás insinuando que las estadísticas no paramétricas no necesitan aprendizaje automático (algo que nunca negué)? ¿O está afirmando que el aprendizaje automático es, de hecho, solo otro nombre para las estadísticas no paramétricas (algo que sí negué)?

Digio

3

Hay mucho en desacuerdo aquí. Los modelos de regresión multivariable, cuando se usan junto con herramientas estadísticas modernas, pueden ser flexibles y altamente competitivos con el LD.

Frank Harrell

3

El aprendizaje automático está bastante poco definido y tiene razón al pensar que los modelos de regresión, y no solo los de regresión logística, también "aprenden" de los datos. No estoy realmente seguro de si esto significa que el aprendizaje automático es realmente estadística o las estadísticas son realmente aprendizaje automático, o si algo de esto importa en absoluto.

Sin embargo, no creo que sea necesario que un algoritmo aprenda repetidamente de sus errores. La mayoría de los métodos usan un conjunto de entrenamiento para calcular algunos parámetros y luego usan estos parámetros fijos para hacer predicciones sobre algunos datos de prueba adicionales. El proceso de capacitación puede implicar la actualización repetida de los parámetros (como en la retropropagación), pero no necesariamente ( $k$ ¡los vecinos más cercanos no hacen nada durante el entrenamiento!). En cualquier caso, en el momento de la prueba, es posible que ni siquiera tenga acceso a datos de verdad básica.

Dicho esto, algunos algoritmos aprenden de los errores de predicción; esto es particularmente común en el aprendizaje por refuerzo , donde un agente toma alguna acción, observa su resultado y luego usa el resultado para planificar acciones futuras. Por ejemplo, una aspiradora robótica podría comenzar con un modelo del mundo donde limpie todas las ubicaciones con la misma frecuencia y luego aprender a aspirar lugares sucios (donde se "recompensa" al encontrar suciedad) más y limpiar menos los lugares.

Los algoritmos en línea o incrementales se pueden actualizar repetidamente con nuevos datos de entrenamiento. Esto no necesariamente depende de la precisión de predicción del modelo, pero podría imaginar un algoritmo donde los pesos se actualicen de manera más agresiva si, por ejemplo, los nuevos datos parecen poco probables dado el modelo actual. Existen versiones en línea para la regresión logística: por ejemplo, McMahan y Streeeter (2012) .

Matt Krause
fuente

3

Finalmente lo resolví. Ahora sé la diferencia entre el ajuste del modelo estadístico y el aprendizaje automático.

Si ajusta un modelo (regresión), eso es ajuste estadístico del modelo
Si aprende un modelo (regresión), eso es aprendizaje automático

Entonces, si aprende una regresión logística, ese es un algoritmo de aprendizaje automático.

Comentario: Disculpe por ser un viejo geezer, pero cada vez que escucho a personas hablar sobre aprender un modelo, o aprender una regresión, me hace pensar en Jethro "Ya aprendí una educación".

FIN DEL HILO

Mark L. Stone
fuente

??? También puedo aprender un modelo de logística, ¿de qué estás hablando?

SmallChess

1

@ Estudiante T, si se ajusta a un modelo de logística, es un ajuste de modelo estadístico. Si aprende un modelo logístico, eso es aprendizaje automático; es decir, es realmente una cuestión de la terminología utilizada por los diferentes campos. Lo mismo se puede llamar cosas diferentes por campos diferentes (Estadísticas y Aprendizaje automático).

Mark L. Stone el

0

¡La regresión logística (y más generalmente, GLM) NO pertenece al aprendizaje automático! Más bien, estos métodos pertenecen al modelado paramétrico .

Los modelos paramétricos y algorítmicos (ML) utilizan los datos, pero de diferentes maneras. Los modelos algorítmicos aprenden de los datos cómo los predictores se asignan al pronóstico, pero no hacen ninguna suposición sobre el proceso que ha generado las observaciones (ni ninguna otra suposición, en realidad). Consideran que las relaciones subyacentes entre las variables de entrada y salida son complejas y desconocidas y, por lo tanto, adoptan un enfoque basado en datos para comprender lo que está sucediendo, en lugar de imponer una ecuación formal.

Por otro lado, los modelos paramétricos se prescriben a priori en función de algún conocimiento del proceso estudiado, utilizan los datos para estimar sus parámetros y hacen muchos supuestos poco realistas que rara vez se mantienen en la práctica (como la independencia, la varianza igual y Distribución normal de los errores).

Además, los modelos paramétricos (como la regresión logística) son modelos globales . No pueden capturar patrones locales en los datos (a diferencia de los métodos de ML que utilizan árboles como modelos base, por ejemplo, RF o árboles potenciados). Consulte este documento, página 5. Como estrategia de remediación, se puede utilizar GLM local (es decir, no paramétrico) (ver, por ejemplo, el paquete locfit R).

A menudo, cuando hay poco conocimiento sobre el fenómeno subyacente, es mejor adoptar un enfoque basado en datos y utilizar modelos algorítmicos. Por ejemplo, si usa la regresión logística en un caso en el que la interacción entre las variables de entrada y salida no es lineal, su modelo será claramente inadecuado y no se capturará mucha señal. Sin embargo, cuando el proceso se entiende bien, los modelos paramétricos tienen la ventaja de proporcionar una ecuación formal para resumir todo, lo cual es poderoso desde un punto de vista teórico.

Para una discusión más detallada, lea este excelente artículo de Leo Breiman.

Antoine
fuente

44

Tómese el tiempo para comprender la regresión logística. No hace suposiciones de distribución de ningún tipo. Hace exactamente el mismo tipo de suposición de independencia hecha por ML. ML requiere tamaños de muestra mucho más grandes que la regresión logística. Por ejemplo, los bosques aleatorios y SVM pueden requerir 200 eventos por característica candidata para ser estable, mientras que la regresión logística generalmente requiere 200 eventos por variable candidata.

Frank Harrell

2

¡ Debería tomarse el tiempo para comprender la regresión logística! Es un modelo lineal generalizado donde el enlace es la función logit. Es paramétrico. Se supone que las observaciones son IID. Además, buena suerte con la captura de relaciones no lineales. Además, ¿qué significa la segunda parte de tu oración? Para mí, una función es una variable (?)

Antoine

55

Hay muchos libros buenos sobre el tema y le recomiendo que los consulte antes de continuar. La regresión logística no asume distribuciones idénticas y, en efecto, no supone ninguna distribución en absoluto. A menos que pueda demostrar cómo factoriza la estructura de correlación en ML, ambos enfoques suponen independencia. Las splines de regresión se han utilizado desde 1982 para relajar los supuestos de linealidad en la regresión logística. Para esta discusión, característica = variable a menos que se expanda en una spline.

Frank Harrell

55

Breiman entendió las cosas bastante bien. Simplemente no se ocupó de los desarrollos posteriores a 1982 en la regresión logística, por ejemplo, penalizó la estimación de máxima verosimilitud, splines de regresión y combinaciones con métodos de reducción de datos. La única limitación seria a la regresión logística es que, como otros métodos, no es bueno encontrar las interacciones correctas si se buscan interacciones y no están especificadas previamente. La mayoría de los métodos que pretenden poder hacer esto no dan como resultado hallazgos replicables. Además, Breiman utilizó un puntaje de precisión incorrecto que puede ser optimizado por un modelo falso.

Frank Harrell

3

@Antoine: "por qué la regresión logística difiere radicalmente de ML". Tenga en cuenta que algunos métodos en ML (más notablemente, SVM) están muy relacionados con la regresión logística. Con la excepción de las múltiples interacciones, como escribió Frank, el registro logístico con no linealidades y penalización da resultados muy similares a SVM y otros métodos de ML. Sigue asombrándome cómo algunos documentos citan mejoras de rendimiento basadas en un método de ML frente a un modelo logístico stat101 para enmarcar negativamente la regresión logística.

Thomas Speidel

-1

Creo que las otras respuestas hacen un buen trabajo al identificar más o menos qué es el aprendizaje automático (como indican, puede ser algo confuso). Agregaré que la Regresión logística (y su versión multinomial más general) se usa muy comúnmente como un medio para realizar la clasificación en redes neuronales artificiales (que creo que están cubiertas inequívocamente por cualquier definición sensible de aprendizaje automático que elija), y si menciona Regresión logística a una persona de la red neuronal, es probable que piensen de inmediato en este contexto. Engancharse con un gran bateador en el aprendizaje automático es una buena manera de convertirse en una técnica de aprendizaje automático usted mismo, y creo que hasta cierto punto eso es lo que sucedió con varias técnicas de regresión, aunque no los descartaría por ser técnicas adecuadas de aprendizaje automático en y de ellos mismos.

adamconkey
fuente

Tenga en cuenta que la regresión logística no es un clasificador sino un método de estimación de probabilidad directa.

Frank Harrell

Para obtener más información sobre el punto del Dr. Harrell, consulte mi publicación aquí. stats.stackexchange.com/questions/127042/…

Sycorax dice Reinstate Monica el

@FrankHarrell También podemos usar la probabilidad de clasificación, por lo que es realmente un clasificador.

SmallChess

@ StudentT4 Eso no podría ser más incorrecto. Si es un estimador de probabilidad directa. Depende de usted cómo utilice el resultado final del modelo logístico. Según su lógica, la media muestral es un clasificador.

Frank Harrell

-1

Creo que cualquier procedimiento que sea "iterativo" puede considerarse un caso de aprendizaje automático. La regresión puede considerarse aprendizaje automático. Podríamos hacerlo a mano, pero llevaría mucho tiempo, si es posible. Así que ahora tenemos estos programas, máquinas, que hacen las iteraciones por nosotros. Se acerca cada vez más a una solución, a la mejor solución o al mejor ajuste. Por lo tanto, "aprendizaje automático". Por supuesto, cosas como las redes neuronales reciben la mayor atención con respecto al aprendizaje automático, por lo que generalmente asociamos el aprendizaje automático a estos procedimientos sensuales. Además, la diferencia entre el aprendizaje automático "supervisado" y el "no supervisado" es relevante aquí

diariamente
fuente

-2

Es un error muy común que la mayoría de la gente hace y también puedo verlo aquí (hecho por casi todos). Permítanme explicarlo en detalle ... Regresión logística y modelo de regresión lineal, ambos son modelo paramétrico, así como la técnica de aprendizaje automático. Solo depende del método que esté utilizando para estimar los parámetros del modelo (theta's). Hay 2 formas de encontrar parámetros de modelo en Regresión lineal y Reg. Logística.

Técnica de descenso de gradiente : Aquí comenzamos asignando valores aleatorios a los parámetros y encontramos la función de costo (error). En cada iteración actualizamos nuestros parámetros y minimizamos la función de costo. Después de cierto número de iteraciones, la función de costo reducida a los valores deseados y los valores de los parámetros correspondientes son nuestros valores finales. Esto es lo que se supone que deben hacer las técnicas de aprendizaje automático. Entonces, si está utilizando la técnica de Descenso de gradiente, la regresión logística puede llamarse como una técnica de aprendizaje automático.
Al usar el método de mínimos cuadrados: aquí tenemos una fórmula directa para encontrar nuestros parámetros (se requiere un poco de álgebra matricial para comprender la derivación de esta fórmula), que se conoce como ecuación normal.

Aquí b representa los parámetros X es la matriz de diseño. Ambos métodos tienen sus propias ventajas y limitaciones. Para obtener más detalles: siga el curso de un curso de Aprendizaje automático que aún se está ejecutando.

Espero que esta publicación pueda ser útil .. :-)

Mohit Kumar
fuente

¿Por qué la regresión logística se llama algoritmo de aprendizaje automático?

Respuestas: