Preguntas etiquetadas con mean

29
Cómo lidiar con datos jerárquicos / anidados en el aprendizaje automático

Explicaré mi problema con un ejemplo. Suponga que desea predecir el ingreso de un individuo dados algunos atributos: {Edad, Sexo, País, Región, Ciudad}. Tienes un conjunto de datos de entrenamiento como este train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2,...

27
¿Pueden los grados de libertad ser un número no entero?

Cuando uso GAM, me da un DF residual de 26.626.626.6 (última línea en el código). Qué significa eso? Yendo más allá del ejemplo de GAM, en general, ¿puede el número de grados de libertad ser un número no entero? > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~...

26
¿En qué se diferencia el centroide de la media?

Al realizar la agrupación jerárquica, se pueden usar muchas métricas para medir la distancia entre las agrupaciones. Dos de estas métricas implican el cálculo de los centroides y las medias de los puntos de datos en los grupos. ¿Cuál es la diferencia entre la media y el centroide? ¿No son estos el...

21
¿Cómo proyectar un nuevo vector en el espacio PCA?

Después de realizar el análisis de componentes principales (PCA), quiero proyectar un nuevo vector en el espacio PCA (es decir, encontrar sus coordenadas en el sistema de coordenadas PCA). He calculado PCA en lenguaje R usando prcomp. Ahora debería poder multiplicar mi vector por la matriz de...

20
Calcular la media de la variable ordinal

He leído en varios lugares que calcular la media de una variable ordinal es inapropiado. Estoy tratando de tener una intuición de por qué podría ser inapropiado. Creo que es porque, en general, una variable ordinal no se distribuye normalmente y, por lo tanto, calcular la media dará una...

20
Promedio de valores de correlación

Digamos que pruebo cómo la variable Ydepende de la variable Xen diferentes condiciones experimentales y obtengo el siguiente gráfico: Las líneas discontinuas en el gráfico anterior representan una regresión lineal para cada serie de datos (configuración experimental) y los números en la leyenda...

20
¿Cuáles son los valores correctos para precisión y recuperación en casos extremos?

La precisión se define como: p = true positives / (true positives + false positives) ¿Es cierto que, como true positivesy false positivesenfoque 0, la precisión se aproxima a 1? La misma pregunta para recordar: r = true positives / (true positives + false negatives) Actualmente estoy...