Tengo un conjunto de datos con 16 variables, y después de la agrupación por kmeans, deseo trazar los dos grupos. ¿Qué parcelas sugiere para representar visualmente los dos
Tengo un conjunto de datos con 16 variables, y después de la agrupación por kmeans, deseo trazar los dos grupos. ¿Qué parcelas sugiere para representar visualmente los dos
Disculpas por la pregunta rudimentaria, soy nuevo en esta forma de análisis y tengo una comprensión muy limitada de los principios hasta ahora. Me preguntaba si muchos de los supuestos paramétricos para las pruebas multivariadas / univariadas se aplican al análisis de conglomerados. Muchas de las...
El utilizado por la opción "ward.D" (equivalente a la única opción Ward "ward" en las versiones R <= 3.0.3) no implementa el criterio de agrupación de Ward (1963), mientras que la opción "ward.D2" implementa ese criterio ( Murtagh y Legendre 2014). (
Estoy intentando realizar la agrupación a nivel de documento. Construí la matriz de frecuencia de término-documento y estoy tratando de agrupar estos vectores de alta dimensión usando k-means. En lugar de agrupar directamente, lo que hice fue aplicar primero la descomposición vectorial singular de...
Tengo un conjunto de datos, quiero crear grupos en esos datos basados en una sola variable (no faltan valores). Quiero crear 3 grupos basados en esa variable. ¿Qué algoritmo de agrupamiento utilizar, k-means, EM, DBSCAN, etc.? Mi pregunta principal es, ¿en qué circunstancias debo usar k-means...
He construido algunas redes neuronales (MLP (completamente conectadas), Elman (recurrente)) para diferentes tareas, como jugar Pong, clasificar dígitos escritos a mano y otras cosas ... Además, intenté construir algunas primeras redes neuronales convolucionales, por ejemplo, para clasificar notas...
Las pruebas de permutación (también llamadas prueba de aleatorización, prueba de aleatorización o prueba exacta) son muy útiles y resultan útiles cuando t-testno se cumple el supuesto de distribución normal requerido por ejemplo y cuando se transforman los valores mediante la clasificación de...
Estoy agrupando distribuciones de probabilidad usando el algoritmo de Propagación de afinidad , y planeo usar la Divergencia de Jensen-Shannon como mi métrica de distancia. ¿Es correcto usar JSD en sí mismo como la distancia, o JSD al cuadrado? ¿Por qué? ¿Qué diferencias resultarían de elegir uno...
Estoy usando la agrupación jerárquica para analizar datos de series de tiempo. Mi código se implementa usando la función MathematicaDirectAgglomerate[...] , que genera grupos jerárquicos con las siguientes entradas: una matriz de distancia D El nombre del método utilizado para determinar la...
Intenté agrupar un conjunto de datos (un conjunto de marcas) y obtuve 2 grupos. Me gustaría representarlo gráficamente. Poco confundido acerca de la representación, ya que no tengo las coordenadas (x, y). También buscando la función MATLAB / Python para hacerlo. EDITAR Creo que publicar datos...
Estoy experimentando con el algoritmo de la máquina de aumento de gradiente a través del caretpaquete en R. Usando un pequeño conjunto de datos de admisión a la universidad, ejecuté el siguiente código: library(caret) ### Load admissions dataset. ### mydata <-
Tengo dos variables: X e Y, y necesito hacer que el clúster sea máximo (y óptimo) = 5. La gráfica ideal de variables es la siguiente: Me gustaría hacer 5 grupos de esto. Algo como esto: Por lo tanto, creo que este es un modelo de mezcla con 5 grupos. Cada grupo tiene un punto central y un...
Estoy trabajando en un problema de agrupación de texto. Los datos contienen varias oraciones. ¿Existe un buen algoritmo que alcanza una alta precisión en textos cortos? ¿Puedes proporcionar buenas referencias? Algoritmos como KMeans, el agrupamiento espectral no funciona bien para este problema....
Me gustaría configurar un algoritmo para detectar una anomalía en series de tiempo, y planeo usar el agrupamiento para eso. ¿Por qué debería usar una matriz de distancia para la agrupación y no los datos de series temporales sin procesar? Para la detección de la anomalía, utilizaré la...
En el análisis de conglomerados, ¿cómo calculamos la pureza? ¿Cuál es la ecuación? No estoy buscando un código para hacerlo por mí. Deje ωkωk\omega_k ser clúster k, y cjcjc_j sea clase j. Entonces, ¿la pureza es prácticamente precisión? parece que estaban sumando la cantidad de clase...
Estoy analizando un conjunto de datos utilizando un modelo de efectos mixtos con un efecto fijo (condición) y dos efectos aleatorios (participante debido al diseño del sujeto y al par). El modelo se ha generado con el lme4paquete:
¿Alguien puede señalarme una implementación de k-means (sería mejor si en matlab) que puede tomar la matriz de distancia en la entrada? La implementación estándar de matlab necesita la matriz de observación en la entrada y no es posible cambiar a medida la medida de similitud....
Sé que hay un algoritmo de agrupación k-means y una mediana k. Uno que usa la media como el centro del grupo y el otro usa la mediana. Mi pregunta es: ¿cuándo / dónde usar
Tengo dos partes de un conjunto de datos multidimensionales, llamémoslas trainy test. Y quiero construir un modelo basado en el conjunto de datos del tren y luego validarlo en el conjunto de datos de prueba. Se conoce el número de grupos. Intenté aplicar el agrupamiento k-means en R y obtuve un...
P: ¿Cuál es la forma estándar de agrupar datos utilizando un proceso Dirichlet? Cuando se usa Gibbs, los grupos de muestreo aparecen y desaparecen durante el muestreo. Además, tenemos un problema de identificabilidad ya que la distribución posterior es invariable para los reencadenamientos de...