Estadísticas y Big Data

12
SVD de una matriz con valores faltantes

Supongamos que tengo una matriz de recomendaciones al estilo de Netflix, y quiero construir un modelo que prediga posibles clasificaciones de películas futuras para un usuario determinado. Usando el enfoque de Simon Funk, se usaría el descenso de gradiente estocástico para minimizar la norma de...

12
¿Por qué usar variables registradas?

Probablemente, esta es una pregunta muy básica, pero parece que no puedo encontrar una respuesta sólida para ella. Espero aquí, puedo. Actualmente estoy leyendo documentos como preparación para mi propia tesis de maestría. Actualmente, estoy leyendo un artículo que investiga la relación entre los...

12
Encontrar los valores ajustados y predichos para un modelo estadístico

Digamos que tengo los siguientes datos y estoy ejecutando un modelo de regresión: df=data.frame(income=c(5,3,47,8,6,5), won=c(0,0,1,1,1,0), age=c(18,18,23,50,19,39), home=c(0,0,1,0,0,1)) Por un lado, ejecuto un modelo lineal para predecir los ingresos: md1 = lm(income ~ age + home + home,...

12
modelos bayesianos jerárquicos vs. Bayes empíricos

¿Consideraría que HBM vs EB son dos alternativas en las cuales los hiperparámetros están "en el juego" de ser muestreados / estimados / etc.? Claramente hay una conexión entre estos dos. ¿Consideraría que HBM es más "completamente bayesiano" que EB? ¿Hay algún lugar donde pueda ver cuáles son las...

12
randomForest elige la regresión en lugar de la clasificación

Estoy usando el paquete randomForest en R y usando los datos del iris, el bosque aleatorio generado es una clasificación, pero cuando uso un conjunto de datos con alrededor de 700 características (las características son cada píxel en una imagen de 28x28 píxeles) y la columna de etiqueta se llama...

12
Selección de modelo de PCA usando AIC (o BIC)

Quiero usar el Criterio de información de Akaike (AIC) para elegir el número apropiado de factores para extraer en un PCA. El único problema es que no estoy seguro de cómo determinar el número de parámetros. Considere una matriz , donde representa el número de variables y el número de...