Las respuestas aquí han declarado que las dimensiones en t-SNE no tienen sentido , y que las distancias entre puntos no son una medida de similitud .
Sin embargo, ¿podemos decir algo sobre un punto basado en sus vecinos más cercanos en el espacio t-SNE? Esta respuesta a por qué los puntos que son exactamente iguales no están agrupados sugiere que la relación de distancias entre puntos es similar entre las representaciones dimensionales más bajas y más altas.
Por ejemplo, la imagen a continuación muestra t-SNE en uno de mis conjuntos de datos (15 clases).
¿Puedo decir que cro 479
(arriba a la derecha) es un valor atípico? ¿Es fra 1353
(abajo a la izquierda) más similar a cir 375
las otras imágenes de la fra
clase, etc.? ¿O podrían ser simplemente artefactos, por ejemplo, quedar fra 1353
atrapados en el otro lado de unos pocos grupos y no poder abrirse paso hacia la otra fra
clase?
Respuestas:
No, no es necesario que este sea el caso, sin embargo, este es, de manera enrevesada, el objetivo de T-SNE.
Antes de entrar en el meollo de la respuesta, echemos un vistazo a algunas definiciones básicas, tanto matemática como intuitivamente.
Ahora, finalmente, un claro ejemplo de codificación que demuestra este concepto también.
Aunque este es un ejemplo muy ingenuo y no refleja la complejidad, funciona mediante experimentos para algunos ejemplos simples.
EDITAR: Además, agregar algunos puntos con respecto a la pregunta en sí, por lo que no es necesario que este sea el caso, podría ser, sin embargo, racionalizarlo a través de las matemáticas demostraría que no tiene un resultado concreto (sin sí o no definitivo) .
Espero que esto haya aclarado algunas de sus preocupaciones con TSNE.
fuente