Preguntas etiquetadas con data-imputation

Se refiere a una clase general de métodos utilizados para "completar" los datos faltantes. Los métodos utilizados para hacer esto generalmente están relacionados con la interpolación (http://en.wikipedia.org/wiki/Interpolation) y requieren suposiciones sobre por qué faltan los datos (por ejemplo, "falta al azar")

78
Un ejemplo: regresión LASSO usando glmnet para el resultado binario

Estoy empezando a incursionar con el uso de glmnetla LASSO regresión donde mi resultado de interés es dicotómica. He creado un pequeño marco de datos simulados a continuación: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84,...

26
R caret y NAs

Prefiero preocuparme por su capacidad de ajuste de parámetros y su interfaz uniforme, pero he observado que siempre requiere conjuntos de datos completos (es decir, sin NA), incluso si el modelo "desnudo" aplicado permite NA. Eso es muy molesto, ya que uno debe aplicar métodos de imputación...

23
Imputación de valores faltantes para PCA

Utilicé la prcomp()función para realizar un PCA (análisis de componentes principales) en R. Sin embargo, hay un error en esa función de modo que el na.actionparámetro no funciona. Pedí ayuda sobre stackoverflow ; dos usuarios ofrecieron dos formas diferentes de tratar con los NAvalores. Sin...

20
Cómo combinar intervalos de confianza para un componente de varianza de un modelo de efectos mixtos cuando se usa la imputación múltiple

La lógica de la imputación múltiple (MI) es imputar los valores faltantes no una vez sino varias (típicamente M = 5) veces, lo que resulta en M conjuntos de datos completados. Los M conjuntos de datos completados se analizan luego con métodos de datos completos sobre los cuales se combinan las...

14
Paquetes de imputación KNN R

Estoy buscando un paquete de imputación KNN. He estado mirando el paquete de imputación ( http://cran.r-project.org/web/packages/imputation/imputation.pdf ) pero, por alguna razón, la función de imputación KNN (incluso cuando se sigue el ejemplo de la descripción) solo parece para imputar valores...

12
¿Cómo realizar la imputación de valores en una gran cantidad de puntos de datos?

Tengo un conjunto de datos muy grande y faltan alrededor del 5% de valores aleatorios. Estas variables están correlacionadas entre sí. El siguiente conjunto de datos R de ejemplo es solo un ejemplo de juguete con datos correlacionados ficticios. set.seed(123) # matrix of X variable xmat <-...

9
Imputación de una variable censurada

Tengo un conjunto de datos médicos con aproximadamente 200 variables. Una de las variables es un marcador biológico (concentración de una enzima particular). Su distribución es correcta, y el problema es que los valores por encima de cierto nivel están censurados / cortados en ese nivel. Entonces,...