Preguntas etiquetadas con missing-data

8
Prueba post-hoc después de 2 factores repetidos medidas ANOVA en R?

Tengo problemas para encontrar una solución con respecto a cómo ejecutar una prueba post-hoc (Tukey HSD) después de un ANOVA de medidas repetidas de 2 factores (ambos dentro de los sujetos) en R. Para el ANOVA, he usado la función aov: summary(aov(dv ~ x1 * x2 + Error(subject/(x1*x2)),...

8
¿Está bien dejar caer las observaciones faltantes?

Tengo un conjunto de datos que analiza las solicitudes de inmigración y las aceptaciones de visas (otorgamiento de visas). Las tarifas se calculan para las solicitudes de visa "aceptadas" y "rechazadas". Sin embargo, el conjunto de datos también tiene valores para los casos que se cerraron....

8
¿Por qué un modelo estadístico se sobreajusta si se le da un gran conjunto de datos?

Mi proyecto actual puede requerir que construya un modelo para predecir el comportamiento de un determinado grupo de personas. el conjunto de datos de entrenamiento contiene solo 6 variables (la identificación es solo para fines de identificación): id, age, income, gender, job category, monthly...

8
En el análisis de puntaje de propensión, ¿cuáles son las opciones para lidiar con propensiones muy pequeñas o grandes?

\newcommand{\P}{\mathbb{P}} Me interesan los datos de observación en los que la asignación del tratamiento puede explicarse extremadamente bien. Por ejemplo, una regresión logística de P (A=1 | X) = ( 1 + exp(−(Xβ)))−1P(A=1|X)=(1+exp⁡(−(Xβ)))−1\P(A =1 |X) = (1+ \exp(-(X\beta)))^{-1} si asignación...

8
¿Cómo manejar datos incompletos en Kalman Filter?

¿Cuáles son algunos enfoques típicos para manejar datos incompletos en el filtro de Kalman? Estoy hablando de la situación en la que faltan algunos elementos del vector observado , distinto del caso en el que se pierde un vector completo observado . Otra forma de pensar sobre esto sería que la...

8
Cómo realizar SVD para imputar valores perdidos, un ejemplo concreto

He leído los excelentes comentarios sobre cómo lidiar con los valores perdidos antes de aplicar SVD, pero me gustaría saber cómo funciona con un ejemplo simple: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Dada la matriz anterior, si elimino los valores de NA,...

8
Tasas faltantes e imputación múltiple

¿Existe un límite que sea el menos aceptable cuando se usa la imputación múltiple (MI)? Por ejemplo, ¿puedo usar MI si los valores faltantes en una variable son el 20% de los casos mientras que otras variables tienen valores perdidos pero no a un nivel tan