Preguntas etiquetadas con clustering

9
¿Qué modelo de aprendizaje profundo puede clasificar categorías que no son mutuamente excluyentes?

Ejemplos: Tengo una oración en la descripción del trabajo: "Ingeniero senior de Java en el Reino Unido". Quiero usar un modelo de aprendizaje profundo para predecirlo en 2 categorías: English y IT jobs. Si uso el modelo de clasificación tradicional, solo puede predecir 1 etiqueta con...

9
Calcular curva ROC para datos

Entonces, tengo 16 ensayos en los que estoy tratando de autenticar a una persona de un rasgo biométrico usando Hamming Distance. Mi umbral está establecido en 3.5. Mis datos están a continuación y solo la prueba 1 es un verdadero positivo: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5...

9
Comenzando con biclustering

He estado haciendo algunas investigaciones casuales en Internet sobre biclusters. (He leído el artículo de Wiki varias veces). Hasta ahora, parece que hay pocas definiciones o terminología estándar. Me preguntaba si había documentos o libros estándar que alguien que estuviera interesado en...

9
¿Cómo llevar a cabo múltiples pruebas de chi-cuadrado post-hoc en una mesa de 2 X 3?

Mi conjunto de datos está compuesto por la mortalidad total o la supervivencia de un organismo en tres tipos de sitios, costero, medio canal y en alta mar. Los números en la tabla a continuación representan el número de sitios. 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20...

9
Ciclismo en algoritmo k-means

Según wiki, el criterio de convergencia más utilizado es "la asignación no ha cambiado". Me preguntaba si el ciclismo puede ocurrir si usamos ese criterio de convergencia. Me agradaría si alguien señalara una referencia a un artículo que dé un ejemplo de ciclismo o pruebe que esto es...

9
Criterios de codo para determinar el número de racimo

Aquí se menciona que uno de los métodos para determinar el número óptimo de grupos en un conjunto de datos es el "método del codo". Aquí el porcentaje de varianza se calcula como la relación entre la varianza entre grupos y la varianza total. Me sentí difícil de entender este cálculo. ¿Alguien...

9
Agrupamiento con medidas de distancia asimétricas

¿Cómo agrupa una entidad con una medida de distancia asimétrica? Por ejemplo, supongamos que está agrupando un conjunto de datos con los días de la semana como una característica: la distancia de lunes a viernes no es la misma que la distancia de viernes a lunes. ¿Cómo incorporas esto a la...

9
¿Cómo comparar los eventos observados con los esperados?

Supongamos que tengo una muestra de frecuencias de 4 eventos posibles: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 y tengo las probabilidades esperadas de que ocurran mis eventos: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Con la suma de las frecuencias observadas de mis cuatro eventos (18) puedo calcular las...

9
Elección de clústeres para k-means: el caso de 1 clúster

¿Alguien sabe un buen método para determinar si la agrupación utilizando kmeans es incluso apropiada? Es decir, ¿qué pasa si su muestra es realmente homogénea? Sé que algo así como un modelo de mezcla (a través de mclust en R) proporcionará estadísticas de ajuste para el caso de clúster 1: k, pero...

9
La mejor manera de agrupar una matriz de adyacencia

He tenido dificultades para interpretar los grupos resultantes de una matriz de adyacencia. Tengo 200 matrices relativamente grandes que representan sujetos que contienen correlaciones parciales (puntajes z) de series de tiempo (datos neuronales). El objetivo es agrupar esas 210 matrices y detectar...