Preguntas etiquetadas con information-retrieval

21
Medición de similitud de documentos

Para agrupar documentos (de texto) necesita una forma de medir la similitud entre pares de documentos. Dos alternativas son: Compare documentos como vectores de términos usando Cosine Similarity - y TF / IDF como las ponderaciones de los términos. Compare la distribución de probabilidad de cada...

21
¿Cómo proyectar un nuevo vector en el espacio PCA?

Después de realizar el análisis de componentes principales (PCA), quiero proyectar un nuevo vector en el espacio PCA (es decir, encontrar sus coordenadas en el sistema de coordenadas PCA). He calculado PCA en lenguaje R usando prcomp. Ahora debería poder multiplicar mi vector por la matriz de...

9
¿Cómo comparar los eventos observados con los esperados?

Supongamos que tengo una muestra de frecuencias de 4 eventos posibles: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 y tengo las probabilidades esperadas de que ocurran mis eventos: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Con la suma de las frecuencias observadas de mis cuatro eventos (18) puedo calcular las...