Preguntas etiquetadas con similarity

17
Agrupación basada en puntajes de similitud

Supongamos que tenemos un conjunto de elementos E y una similitud ( no lejos ) la función SIM (ei, ej) entre dos elementos de la IE, EJ ∈ E . ¿Cómo podríamos (eficientemente) agrupar los elementos de E , usando sim ? k- significa, por ejemplo, requiere una k dada , Canopy Clustering requiere dos...

16
agrandar el mapa de calor marino

Creo un corr()df a partir de un df original. El corr()DF salió 70 X 70 y es imposible de visualizar el mapa de calor ... sns.heatmap(df). Si trato de mostrar corr = df.corr(), la tabla no se ajusta a la pantalla y puedo ver todas las correlaciones. ¿Es una forma de imprimir todo dfsin importar su...

15
Predicción de similitud de oraciones

Estoy tratando de resolver el siguiente problema: tengo un conjunto de oraciones como mi conjunto de datos, y quiero poder escribir una nueva oración y encontrar la oración con la que la nueva es más similar en el conjunto de datos. Un ejemplo se vería así: Nueva oración: " I opened a new...

12
MinHashing vs SimHashing

Supongamos que tengo cinco conjuntos que me gustaría agrupar. Entiendo que la técnica SimHashing descrita aquí: https://moultano.wordpress.com/2010/01/21/simple-simhashing-3kbzhsxyg4467-6/ podría producir tres grupos ( {A}, {B,C,D}y {E}), por ejemplo, si sus resultados fueran: A -> h01 B...

10
¿Cuándo elegir regresión lineal o árbol de decisión o regresión de bosque aleatorio? [cerrado]

Cerrada . Esta pregunta necesita estar más centrada . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que se centre en un problema solo editando esta publicación . Cerrado hace 4 años . Estoy...

10
¿Cómo hacer lotes de productos internos en Tensorflow?

Tengo dos tensor a:[batch_size, dim] b:[batch_size, dim]. Quiero hacer un producto interno para cada par en el lote, generando c:[batch_size, 1], dónde c[i,0]=a[i,:].T*b[i,:].

8
Matriz de puntuación de similitud de cadena

Tengo una carga de documentos, que tienen una carga de pares de valores clave en ellos. Es posible que la clave no sea única, por lo que puede haber varias claves del mismo tipo con valores diferentes. Quiero comparar la similitud de las claves entre 2 documentos. Más específicamente, la similitud...

8
Arreglando inconsistencias de datos

Estoy tratando de analizar algunos datos que tengo pero hay muchas inconsistencias en mis datos. Tengo una tabla SQL que estoy tratando de analizar. La tabla es una tabla de universidades con la siguiente estructura: el name:string, city:string, state:string, country:string nombre siempre está...