Estadísticas y Big Data

14
Sistemas de recomendación dinámica

Un sistema de recomendación mediría la correlación entre las calificaciones de diferentes usuarios y generaría recomendaciones para un usuario determinado sobre los elementos que pueden ser de su interés. Sin embargo, los gustos cambian con el tiempo, por lo que las clasificaciones anteriores...

14
Referencia con distribuciones con varias propiedades.

A menudo me encuentro haciendo preguntas como: "Sé que esta variable encuentra en ( 0 , 1 ) y la mayoría de la masa se encuentra en ( 0 , .20 ) y luego disminuye continuamente hacia 1. ¿Qué distribución puedo usar para modelarla? "xxx(0,1)(0,1)(0,1)(0,.20)(0,.20)(0,.20) En la práctica, termino...

14
Estimar una probabilidad de supervivencia en R

Basado en una muestra de tiempos de supervivencia, me gustaría estimar la probabilidad de sobrevivir al tiempo , para algunos específicos , utilizando el estimador de Kaplan-Meier. ¿Es posible hacer esto en ? Tenga en cuenta que no es necesariamente un tiempo de

14
¿Qué es la aleatoriedad?

En probabilidad y estadística, el concepto de "azar" y "aleatoriedad" se utilizan con frecuencia. A menudo, el concepto de una variable aleatoria se usa para modelar eventos que ocurren debido al azar. Mi pregunta se refiere al término "aleatorio". ¿Qué es al azar? ¿Existe realmente la...

14
¿Qué significan las flechas en un biplot PCA?

Considere el siguiente biplot de PCA: library(mvtnorm) set.seed(1) x <- rmvnorm(2000, rep(0, 6), diag(c(5, rep(1,5)))) x <- scale(x, center=T, scale=F) pc <- princomp(x) biplot(pc) Hay un montón de flechas rojas trazadas, ¿qué significan? Sabía que la primera flecha etiquetada con...

14
¿Cuáles son los diferentes tipos de codificaciones disponibles para las variables categóricas (en R) y cuándo las usaría?

Si se ajusta a un modelo lineal o un modelo mixto, hay diferentes tipos de codificaciones disponibles para transformar una variable categórica o nominal en una serie de variables para las que se estiman los parámetros, como la codificación ficticia (el valor predeterminado de R) y la codificación...