Estadísticas y Big Data

20
Interpretación de salida de regresión lineal simple

He ejecutado una regresión lineal simple del logaritmo natural de 2 variables para determinar si se correlacionan. Mi salida es esta: R^2 = 0.0893 slope = 0.851 p < 0.001 Estoy confundido. Mirando el valor de R2R2R^2 , diría que las dos variables no están correlacionadas, ya que está muy...

20
¿Ideas para el software de "cuaderno de laboratorio"?

Así que este es un ajuste extraño, aunque realmente creo que es un ajuste extraño para cualquier sitio, así que pensé en probarlo aquí, entre mis hermanos que analizan datos. Llegué a la epidemiología y la bioestadística de la biología, y todavía definitivamente tengo algunos hábitos de ese campo....

20
Métodos de muestreo de Caret

Estoy usando la biblioteca careten R para probar varios procedimientos de modelado. El trainControlobjeto permite especificar un método de remuestreo. Los métodos se describen en la documentación de la sección 2.3 e incluyen: boot, boot632, cv, LOOCV, LGOCV, repeatedcvy oob. Aunque algunos de...

20
¿AdaBoost es menos o más propenso al sobreajuste?

He leído varias declaraciones (aparentemente) contradictorias sobre si AdaBoost (u otras técnicas de refuerzo) son menos o más propensas al sobreajuste en comparación con otros métodos de aprendizaje. ¿Hay buenas razones para creer lo uno o lo otro? Si depende, ¿de qué depende? ¿Cuáles son las...