Preguntas etiquetadas con descriptive-statistics

Las estadísticas descriptivas resumen las características de una muestra, como las desviaciones medias y estándar, la mediana y los cuartiles, el máximo y el mínimo. Con múltiples variables, puede incluir correlaciones y tablas cruzadas. Puede incluir visualizaciones: diagramas de caja, histogramas, diagramas de dispersión, etc.

78
Un ejemplo: regresión LASSO usando glmnet para el resultado binario

Estoy empezando a incursionar con el uso de glmnetla LASSO regresión donde mi resultado de interés es dicotómica. He creado un pequeño marco de datos simulados a continuación: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84,...

34
¿Por qué hay una diferencia entre calcular manualmente un intervalo de confianza del 95% de regresión logística y usar la función confint () en R?

Queridos todos, he notado algo extraño que no puedo explicar, ¿verdad? En resumen: el enfoque manual para calcular un intervalo de confianza en un modelo de regresión logística y la función R confint()dan resultados diferentes. He estado pasando por la regresión logística aplicada de Hosmer &...

29
Cómo lidiar con datos jerárquicos / anidados en el aprendizaje automático

Explicaré mi problema con un ejemplo. Suponga que desea predecir el ingreso de un individuo dados algunos atributos: {Edad, Sexo, País, Región, Ciudad}. Tienes un conjunto de datos de entrenamiento como este train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2,...

21
¿Qué significa "imparcialidad"?

¿Qué significa decir que "la varianza es un estimador sesgado"? ¿Qué significa convertir una estimación sesgada en una estimación imparcial a través de una fórmula simple? ¿Qué hace exactamente esta conversión? Además, ¿cuál es el uso práctico de esta conversión? ¿Convierte estos puntajes cuando...