Estoy tratando de entender los métodos de agrupamiento.
Lo que creo que entendí:
En el aprendizaje supervisado, los datos de categorías / etiquetas a los que se les asigna se conocen antes del cálculo. Por lo tanto, las etiquetas, clases o categorías se están utilizando para "aprender" los parámetros que son realmente significativos para esos grupos.
En el aprendizaje no supervisado, los conjuntos de datos se asignan a segmentos, sin que se conozcan los grupos.
¿Eso significa que, si ni siquiera sé qué parámetros son cruciales para una segmentación, prefiero el aprendizaje supervisado?
Respuestas:
La diferencia es que en el aprendizaje supervisado se conocen las "categorías", "clases" o "etiquetas". En el aprendizaje no supervisado, no lo son, y el proceso de aprendizaje intenta encontrar "categorías" apropiadas. En ambos tipos de aprendizaje, se consideran todos los parámetros para determinar cuáles son los más apropiados para realizar la clasificación.
Si elige supervisado o no supervisado debe basarse en si sabe o no cuáles son las "categorías" de sus datos. Si lo sabe, use el aprendizaje supervisado. Si no lo sabe, use sin supervisión.
Como tiene una gran cantidad de parámetros y no sabe cuáles son relevantes, podría usar algo como el análisis de componentes principales para ayudar a determinar los relevantes.
fuente
Tenga en cuenta que hay más de 2 grados de supervisión. Por ejemplo, vea las páginas 24-25 (6-7) en la tesis doctoral de Christian Biemann, Procesamiento de lenguaje natural sin supervisión y sin conocimiento en el paradigma de estructura de descubrimiento, 2007.
La tesis identifica 4 grados: supervisado, semi-supervisado, débilmente supervisado y sin supervisión, y explica las diferencias, en un contexto de procesamiento del lenguaje natural. Aquí están las definiciones relevantes:
fuente
En el aprendizaje supervisado, las clases se conocen de antemano y también sus tipos, por ejemplo, dos clases de clientes buenos y malos. Cuando un nuevo objeto (cliente) se basa en sus atributos, el cliente puede asignarse a una clase de cliente mala o buena.
En el aprendizaje no supervisado, los grupos / clases aún no se conocen, tenemos objetos (clientes), por lo tanto, agrupe a los clientes que tienen hábitos de compra similares, por lo tanto, se forman diferentes grupos de los clientes, es decir, no se conocen sobre la base de hábitos de compra similares.
fuente
En el aprendizaje supervisado, la salida (variable dependiente) depende de la variable de entrada (variable independiente). En algún conjunto de supervisiones dadas, el respondedor intenta calcular el objetivo deseado.
En el aprendizaje no supervisado no hay supervisión, por lo que el sistema trata de adaptarse a la situación y aprende manualmente de acuerdo con alguna medida.
Por ejemplo: maestro en una clase -supervisión -aprendizaje supervisado Un curso electivo de autoaprendizaje en clase-Sin supervisión Aprendizaje no supervisado
fuente