Estadísticas y Big Data

39
¿Hay casos en los que PCA es más adecuado que t-SNE?

Quiero ver cómo 7 medidas de comportamiento de corrección de texto (tiempo dedicado a corregir el texto, número de pulsaciones de teclas, etc.) se relacionan entre sí. Las medidas están correlacionadas. Ejecuté un PCA para ver cómo se proyectaban las medidas en PC1 y PC2, lo que evitó la...

38
¿Aprendizaje en línea versus fuera de línea?

¿Cuál es la diferencia entre el aprendizaje fuera de línea y en línea ? ¿Es solo una cuestión de aprender sobre todo el conjunto de datos (sin conexión) versus aprender de forma incremental (una instancia a la vez)? ¿Cuáles son ejemplos de algoritmos utilizados en

38
Serie de tiempo 'agrupamiento' en R

Tengo un conjunto de datos de series de tiempo. Cada serie cubre el mismo período, aunque las fechas reales en cada serie de tiempo pueden no "alinearse" exactamente. Es decir, si las series temporales se leyeran en una matriz 2D, se vería así: date T1 T2 T3 .... TN 1/1/01 100 59 42 N/A 2/1/01...

38
calculado manualmente

Sé que esto es bastante específico Rpregunta, pero puede estar pensando en proporción de varianza explicado, R2R2R^2 , de forma incorrecta. Aquí va. Estoy tratando de usar el Rpaquete randomForest. Tengo algunos datos de entrenamiento y datos de prueba. Cuando ajusto un modelo de bosque aleatorio,...

38
¿Es válido incluir una medida de referencia como variable de control cuando se prueba el efecto de una variable independiente en los puntajes de cambio?

Estoy intentando ejecutar una regresión de OLS: DV: cambio de peso durante un año (peso inicial - peso final) IV: Si haces ejercicio o no. Sin embargo, parece razonable que las personas más pesadas pierdan más peso por unidad de ejercicio que las personas más delgadas. Por lo tanto, quería...

38
¿Qué es la identificabilidad del modelo?

Sé que con un modelo que no es identificable, se puede decir que los datos son generados por múltiples asignaciones diferentes a los parámetros del modelo. Sé que a veces es posible restringir los parámetros para que todos sean identificables, como en el ejemplo de Cassella & Berger, segunda...

38
Predicción en regresión de Cox

Estoy haciendo una regresión multivariada de Cox, tengo mis variables independientes significativas y valores beta. El modelo se ajusta muy bien a mis datos. Ahora, me gustaría usar mi modelo y predecir la supervivencia de una nueva observación. No tengo claro cómo hacer esto con un modelo de Cox....