Estadísticas y Big Data

14
Usando LASSO en bosque aleatorio

Me gustaría crear un bosque aleatorio usando el siguiente proceso: Construya un árbol en muestras aleatorias de los datos y características usando la ganancia de información para determinar divisiones Termine un nodo de hoja si excede una profundidad predefinida O cualquier división daría como...

14
Cómo encontrar residuos y trazarlos

Me han dado datos x = c(21,34,6,47,10,49,23,32,12,16,29,49,28,8,57,9,31,10,21,26,31,52,21,8,18,5,18,26,27,26,32,2,59,58,19,14,16,9,23,28,34,70,69,54,39,9,21,54,26) y = c(47,76,33,78,62,78,33,64,83,67,61,85,46,53,55,71,59,41,82,56,39,89,31,43,29,55,

14
Intervalos de confianza para CDF empírico

Sí, hay otros tipos de intervalos de confianza (IC). Uno de los IC más populares se basa en la desigualdad Dvoretzky – Kiefer – Wolfowitz , que establece que P[supx|F^n(x)−F(x)|>ϵ]≤2exp(−2nϵ2).P[supx|F^n(x)−F(x)|>ϵ]≤2exp⁡(−2nϵ2).P\left[\sup_{x}\vert \hat{F}_n(x)-F(x)\vert>\epsilon\right]\leq...

14
Estimando lugar de

Tengo un modelo económico teórico que es el siguiente, y=a+b1x1+b2x2+b3x3+uy=a+b1x1+b2x2+b3x3+u y = a + b_1x_1 + b_2x_2 + b_3x_3 + u Entonces la teoría dice que hay factores , y para estimar .x 2 x 3 yx1x1x_1x2x2x_2x3x3x_3yyy Ahora tengo los datos reales y necesito estimar , , . El problema es...

14
Prueba de Brant en R [cerrado]

Cerrado. Esta pregunta está fuera de tema . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que esté en el tema de Cross Validated. Cerrado hace 6 meses . Al probar el supuesto de regresión paralela en...

14
Confounder - definición

Según M. Katz en su libro Análisis multivariable (Sección 1.2, página 6), " Un factor de confusión está asociado con el factor de riesgo y está relacionado causalmente con el resultado " . ¿Por qué el factor de confusión debe estar relacionado causalmente con el resultado? ¿Sería suficiente que el...