Por lo que puedo decir, los SOM de estilo Kohonen tuvieron un pico alrededor de 2005 y no han visto tanto favor recientemente. No he encontrado ningún documento que diga que los SOM hayan sido subsumidos por otro método, o que hayan demostrado ser equivalentes a algo más (de todas formas, en dimensiones más altas). Pero parece que tSNE y otros métodos obtienen mucha más tinta hoy en día, por ejemplo en Wikipedia o en SciKit Learn, y se menciona más a SOM como método histórico.
(En realidad, un artículo de Wikipedia parece indicar que los SOM continúan teniendo ciertas ventajas sobre los competidores, pero también es la entrada más corta en la lista. EDITAR: Por solicitud de Gung, uno de los artículos en los que estoy pensando es: Reducción de dimensionalidad no lineal Tenga en cuenta que SOM ha escrito menos al respecto que los otros métodos. No puedo encontrar el artículo que menciona una ventaja que los SOM parecen retener sobre la mayoría de los otros métodos).
Alguna idea? Alguien más preguntó por qué no se están utilizando los SOM, y obtuve referencias de hace un tiempo, y encontré las actas de las conferencias de SOM, pero me preguntaba si el aumento de SVM o tSNE, et al, simplemente eclipsó a los SOM en el aprendizaje automático.
EDIT 2: Por pura coincidencia, estaba leyendo una encuesta de 2008 sobre reducción de dimensionalidad no lineal esta noche, y por ejemplo solo menciona: Isomap (2000), incrustación localmente lineal (LLE) (2000), Hessian LLE (2003), Laplaciano mapas propios (2003) e inclusión semidefinida (SDE) (2004).
Respuestas:
Creo que está haciendo algo al notar la influencia de lo que el aprendizaje automático promociona actualmente como los "mejores" algoritmos para la reducción de la dimensionalidad. Si bien t-SNE ha demostrado su eficacia en competencias, como el Merck Viz Challenge , personalmente he tenido éxito implementando SOM tanto para extracción de características como para clasificación binaria. Si bien hay algunos que descartan los SOM sin justificación además de la edad del algoritmo (consulte esta discusión , también hay una serie de artículos que se han publicado en los últimos años que implementaron los SOM y lograron resultados positivos (ver Mortazavi et al., 2013 ; Frenkel et al., 2013por ejemplo). Una búsqueda en Google Académico revelará que los SOM todavía se utilizan en varios dominios de aplicación. Sin embargo, como regla general, el mejor algoritmo para una tarea en particular es exactamente eso: el mejor algoritmo para una tarea en particular. Cuando un bosque aleatorio puede haber funcionado bien para una tarea de clasificación binaria en particular, puede funcionar horriblemente en otra. Lo mismo se aplica a las tareas de agrupamiento, regresión y optimización. Este fenómeno está ligado al Teorema de no almuerzo gratis , pero ese es un tema para otra discusión. En resumen, si SOM funciona mejor para usted en una tarea en particular, ese es el algoritmo que debe usar para esa tarea, independientemente de lo que sea popular.
fuente
He realizado una investigación sobre la comparación de SOM con t-SNE y más, y también propuse una mejora en SOM que lo lleva a un nuevo nivel de eficiencia. Por favor, échale un vistazo aquí y hazme saber tus comentarios. Me encantaría tener una idea de lo que la gente piensa al respecto y si vale la pena publicarlo en Python para que la gente lo use.
Enlace de IEEE al documento: http://ieeexplore.ieee.org/document/6178802/
Implementación de Matlab. https://www.mathworks.com/matlabcentral/fileexchange/35538-cluster-reinforcement--cr--phase
Gracias por sus comentarios.
fuente
Mi opinión subjetiva es que los SOM son menos conocidos y percibidos como menos "sexy" que muchos otros métodos, pero siguen siendo muy relevantes para ciertas clases de problemas. Bien podría ser el caso de que tendrían una contribución significativa que hacer si fueran más ampliamente utilizados. Son invaluables en las primeras etapas de la ciencia exploratoria de datos para tener una idea del 'paisaje' o 'topología' de los datos multivariados.
El desarrollo de bibliotecas como Somoclu , y la investigación como la de Guénaël Cabanes (entre muchas otras) muestra que los SOM aún son relevantes.
fuente