Representación de vector de entrada vs representación de vector de salida en word2vec

9

En los modelos CBOW y skip-gram de word2vec, ¿cómo funciona elegir vectores de palabras de W(matriz de palabras de entrada) frente a elegir vectores de palabras de (matriz de palabras de salida) ¿afecta la calidad de los vectores de palabras resultantes?W

CBOW:

ingrese la descripción de la imagen aquí

Saltar-gramo:

ingrese la descripción de la imagen aquí

Franck Dernoncourt
fuente

Respuestas:

8

Garten y col. {1} comparó vectores de palabras obtenidos mediante la adición de vectores de palabras de entrada con vectores de palabras de salida, frente a vectores de palabras obtenidos mediante la concatenación de vectores de palabras de entrada con vectores de palabras de salida. En sus experimentos, la concatenación produce resultados significativamente mejores:

ingrese la descripción de la imagen aquí

La conferencia de video {2} recomienda promediar vectores de palabras de entrada con vectores de palabras de salida, pero no se compara con la concatenación de vectores de palabras de entrada con vectores de palabras de salida.


Referencias

Franck Dernoncourt
fuente