¿Cuál es el significado de los ejes en t-SNE?

12

Actualmente estoy tratando de entender las matemáticas de t-SNE . Desafortunadamente, todavía hay una pregunta que no puedo responder satisfactoriamente: ¿Cuál es el significado real de los ejes en un gráfico t-SNE? Si tuviera que hacer una presentación sobre este tema o incluirla en alguna publicación: ¿Cómo etiquetaría los ejes apropiadamente?

PD: Leí esta pregunta de Reddit, pero las respuestas que se dan allí (como "depende de la interpretación y el conocimiento del dominio"), realmente no me ayudan a entender esto.

Hagbard
fuente

Respuestas:

20

Los ejes individuales en t-SNE no tienen ningún significado.

Algoritmos como MDS, SNE, t-SNE, etc. solo se preocupan por las distancias por pares entre puntos. Intentan colocar los puntos en un plano de modo que las distancias por pares entre ellos minimicen un cierto criterio. Esto significa que si toma un gráfico t-SNE y lo gira, la disposición resultante será igualmente buena en lo que respecta a t-SNE. Entonces, la rotación general que obtiene del algoritmo t-SNE es arbitraria.

Para etiquetar los ejes, recomiendo escribir algo como "t-SNE dimension 1" y "t-SNE dimension 2".

(A veces la gente escribe "t-SNE 1" y "t-SNE 2" o algo similar, lo cual es descuidado. A veces veo "t-SNE componente 1" y "t-SNE componente 2"; pero creo que esa palabra "componente" no funciona muy bien en este contexto.)

ameba dice reinstalar Monica
fuente
2
Un corolario de esta respuesta es que la sugerencia de Reddit está un poco equivocada. Probablemente no haya una forma razonable de interpretar los ejes en general, incluso si tiene conocimiento de dominio para aplicar.
shadowtalker
3
Otro corolario de esta respuesta es que los ejes deben mostrarse en la misma escala, de modo que si se multiplica por una matriz rotadora y se inclina la cabeza correspondientemente, la gráfica se vería exactamente igual. Esto está tristemente lejos de la práctica estándar (refunfuñar).
eric_kernfeld