¿Cuál es el buen uso de t-SNE, aparte de la visualización de datos?

12

¿En qué situaciones debemos usar t-SNE (aparte de la visualización de datos)?

T-SNE se utiliza para reducir la dimensionalidad. La respuesta a esta pregunta sugiere que t-SNE debería usarse solo para la visualización y que no deberíamos usarlo para la agrupación. Entonces, ¿cuál es el buen uso de t-SNE?

Wolfe
fuente
66
El consejo estándar es NO usar tsne para la agrupación, porque los grupos dependen mucho de la perplejidad. Se supone que solo debe usarse para "visualización". Pero eso no está muy claro para mí, ya que uno inmediatamente busca (y ve) grupos cuando mira un diagrama de tsne. Por lo tanto, su pregunta es buena: ¿para qué sirve tsne?
generic_user
2
Vea la respuesta a esta pregunta que hice: stats.stackexchange.com/questions/263539/…
generic_user
como dijo el @generic_user, quiero saber el beneficio de t-sne, además de su visualización.
wolfe
No sé por qué esto se cerró como un duplicado. OP pregunta cuáles son los buenos usos de t-sne además de la visualización. El hilo vinculado tiene que ver con la agrupación. Pero puede haber otros usos.
ameba
Relacionado: stats.stackexchange.com/questions/132639/…
Amelio Vazquez-Reina

Respuestas:

4

La respuesta a esta pregunta sugiere que el t-SNE debe ser utilizado sólo para la visualización y que debemos no utilizarlo para la agrupación. Entonces, ¿cuál es el buen uso de t-SNE?

No estoy de acuerdo con esta conclusión. No hay ninguna razón para suponer que t-SNE es peor universalmente que cualquier otro algoritmo de agrupamiento. Cada algoritmo de agrupación hace suposiciones sobre la estructura de los datos, y se puede esperar que funcionen de manera diferente dependiendo de la distribución subyacente y el uso final de la dimensionalidad reducida.

El t-SNE, como muchos algoritmos de aprendizaje no supervisados, a menudo proporciona un medio para un fin, por ejemplo, obtener información temprana sobre si los datos son separables o no, probar que tiene alguna estructura identificable e inspeccionar la naturaleza de esta estructura. No es necesario visualizar la salida de t-SNE para comenzar a responder algunas de estas preguntas. Otras aplicaciones de incrustaciones de dimensiones inferiores incluyen características de construcción para la clasificación o eliminación de la multicolinealidad para mejorar el rendimiento de los métodos de predicción.

Amelio Vazquez-Reina
fuente