¿Cuál es el significado de los vectores propios de una matriz de información mutua?

14

Al observar los vectores propios de la matriz de covarianza, obtenemos las direcciones de varianza máxima (el primer vector propio es la dirección en la que los datos varían más, etc.); Esto se llama análisis de componentes principales (PCA).

Me preguntaba qué significaría mirar los vectores / valores propios de la matriz de información mutua, ¿apuntarían en la dirección de la máxima entropía?

kmace
fuente
44
No lo sé, pero acabo de enterarme de que las matrices de información mutua no siempre son positivas semi-definidas: arxiv.org/abs/1307.6673 .
ameba dice Reinstate Monica
3
Recuerda algo en lo que trabajamos: people.eng.unimelb.edu.au/baileyj/papers/frp0038-Vinh.pdf
Simone

Respuestas:

3

Si bien no es una respuesta directa (ya que se trata de información mutua puntual ), observe el artículo que relaciona word2vec con una descomposición de valor singular de la matriz PMI:

Analizamos skip-gram con muestreo negativo (SGNS), un método de inclusión de palabras introducido por Mikolov et al., Y mostramos que está factorizando implícitamente una matriz de contexto de palabras, cuyas celdas son la información mutua puntual (PMI) de los respectivos pares de palabras y contexto, desplazados por una constante global. Encontramos que otro método de inclusión, NCE, está factorizando implícitamente una matriz similar, donde cada celda es la probabilidad condicional de registro (desplazada) de una palabra dado su contexto. Mostramos que el uso de una matriz de contexto de palabras PMI desplazado positivo escaso para representar palabras mejora los resultados en tareas de similitud de dos palabras y una de dos tareas de analogía. Cuando se prefieren los vectores densos de baja dimensión, la factorización exacta con SVD puede lograr soluciones que son al menos tan buenas como las soluciones de SGNS para tareas de similitud de palabras. En cuestiones de analogía, SGNS sigue siendo superior a SVD. Conjeturamos que esto se deriva de la naturaleza ponderada de la factorización de SGNS.

Piotr Migdal
fuente