Estadísticas y Big Data

10
¿Cuál es la estimación de máxima verosimilitud de la covarianza de los datos normales bivariados cuando se conocen la media y la varianza?

Supongamos que tenemos una muestra aleatoria de una distribución normal bivariada que tiene ceros como medias y unos como varianzas, por lo que el único parámetro desconocido es la covarianza. ¿Cuál es el MLE de la covarianza? Sé que debería ser algo así como pero ¿cómo sabemos esto?1norte∑nortej =...

10
¿Cómo elegir la capacitación, la validación cruzada y los tamaños de los conjuntos de prueba para datos de tamaño de muestra pequeño?

Suponga que tengo un tamaño de muestra pequeño, por ejemplo, N = 100 y dos clases. ¿Cómo debo elegir la capacitación, la validación cruzada y los tamaños de los conjuntos de prueba para el aprendizaje automático? Yo elegiría intuitivamente Tamaño del set de entrenamiento como 50 Conjunto de...

10
RMSE normalizado

Tengo varias series de tiempo en un VAR (1) y, debido a que algunas de ellas no tienen la misma unidad de medida, me gustaría estimar el RMSE en porcentaje. Sé que se podría hacer de varias maneras (ver a continuación), pero no sé exactamente cuál es el que mejor se adapta a un problema de...

10
lmer con datos imputados multiplicados

¿Cómo puedo obtener efectos aleatorios agrupados para lmer después de una imputación múltiple? Estoy usando ratones para imputar múltiples un marco de datos. Y lme4 para un modelo mixto con intercepción aleatoria y pendiente aleatoria. Agrupar lmer funciona bien, excepto que no agrupa los efectos...

10
Confundido acerca de la explicación visual de los vectores propios: ¿cómo pueden los conjuntos de datos visualmente diferentes tener los mismos vectores propios?

Muchos libros de texto de estadísticas proporcionan una ilustración intuitiva de cuáles son los vectores propios de una matriz de covarianza: Los vectores u y z forman los vectores propios (bueno, los propios). Esto tiene sentido. Pero lo único que me confunde es que extraemos vectores propios...