Preguntas etiquetadas con clustering

16
Supuestos del análisis de conglomerados

Disculpas por la pregunta rudimentaria, soy nuevo en esta forma de análisis y tengo una comprensión muy limitada de los principios hasta ahora. Me preguntaba si muchos de los supuestos paramétricos para las pruebas multivariadas / univariadas se aplican al análisis de conglomerados. Muchas de las...

16
Agrupación de datos 1D

Tengo un conjunto de datos, quiero crear grupos en esos datos basados ​​en una sola variable (no faltan valores). Quiero crear 3 grupos basados ​​en esa variable. ¿Qué algoritmo de agrupamiento utilizar, k-means, EM, DBSCAN, etc.? Mi pregunta principal es, ¿en qué circunstancias debo usar k-means...

15
¿Cuál es la intuición detrás de las muestras intercambiables bajo la hipótesis nula?

Las pruebas de permutación (también llamadas prueba de aleatorización, prueba de aleatorización o prueba exacta) son muy útiles y resultan útiles cuando t-testno se cumple el supuesto de distribución normal requerido por ejemplo y cuando se transforman los valores mediante la clasificación de...

15
La precisión de la máquina de aumento de gradiente disminuye a medida que aumenta el número de iteraciones

Estoy experimentando con el algoritmo de la máquina de aumento de gradiente a través del caretpaquete en R. Usando un pequeño conjunto de datos de admisión a la universidad, ejecuté el siguiente código: library(caret) ### Load admissions dataset. ### mydata <-

15
Series temporales y detección de anomalías

Me gustaría configurar un algoritmo para detectar una anomalía en series de tiempo, y planeo usar el agrupamiento para eso. ¿Por qué debería usar una matriz de distancia para la agrupación y no los datos de series temporales sin procesar? Para la detección de la anomalía, utilizaré la...

15
¿Cómo calcular la pureza?

En el análisis de conglomerados, ¿cómo calculamos la pureza? ¿Cuál es la ecuación? No estoy buscando un código para hacerlo por mí. Deje ωkωk\omega_k ser clúster k, y cjcjc_j sea ​​clase j. Entonces, ¿la pureza es prácticamente precisión? parece que estaban sumando la cantidad de clase...

15
¿Qué método de comparación múltiple usar para un modelo lmer: lsmeans o glht?

Estoy analizando un conjunto de datos utilizando un modelo de efectos mixtos con un efecto fijo (condición) y dos efectos aleatorios (participante debido al diseño del sujeto y al par). El modelo se ha generado con el lme4paquete:

14
k-significa vs k-mediana?

Sé que hay un algoritmo de agrupación k-means y una mediana k. Uno que usa la media como el centro del grupo y el otro usa la mediana. Mi pregunta es: ¿cuándo / dónde usar