Estadísticas y Big Data

10
Fórmula del estimador de regresión cuantil

He visto dos representaciones diferentes del estimador de regresión cuantil que son Q(βq)=∑i:yi≥x′iβnq∣yi−x′iβq∣+∑i:yi<x′iβn(1−q)∣yi−x′iβq∣Q(βq)=∑i:yi≥xi′βnq∣yi−xi′βq∣+∑i:yi<xi′βn(1−q)∣yi−xi′βq∣Q(\beta_{q}) = \sum^{n}_{i:y_{i}\geq x'_{i}\beta} q\mid y_i - x'_i \beta_q \mid +...

10
Superioridad de LASSO sobre la selección hacia adelante / eliminación hacia atrás en términos del error de predicción de validación cruzada del modelo

Obtuve tres modelos reducidos de un modelo completo original usando selección hacia adelante eliminación hacia atrás Técnica de penalización L1 (LASSO) Para los modelos obtenidos usando la selección hacia adelante / eliminación hacia atrás, obtuve la estimación validada cruzada del error de...

10
Notación para modelado multinivel

La fórmula que uno debe especificar para entrenar un modelo multinivel (usando lmerdesde la lme4 Rbiblioteca) siempre me da. He leído innumerables libros de texto y tutoriales, pero nunca lo he entendido correctamente. Así que aquí hay un ejemplo de este tutorial que me gustaría ver formulado en...

10
¿Pueden las variables independientes con baja correlación con la variable dependiente ser predictores significativos?

Tengo ocho variables independientes y una dependiente. He ejecutado una matriz de correlación, y 5 de ellos tienen una baja correlación con el DV. Luego ejecuté una regresión múltiple por pasos para ver si alguno / todos los IV pueden predecir el DV. La regresión mostró que solo dos IV pueden...

10
¿Cuándo terminar la prueba bayesiana A / B?

Estoy tratando de hacer pruebas A / B de la manera bayesiano, como en Probabilístico de programación para los hackers y bayesiano A / B pruebas . Ambos artículos suponen que el tomador de decisiones decide cuál de las variantes es mejor basándose únicamente en la probabilidad de algún criterio, por...

10
¿Por qué calculamos el valor de la información?

Tengo los datos con variables categóricas y variables continuas, pero es la necesidad de encontrar valor de información en el análisis explicativo de datos. Solo dé la razón por la cual estamos calculando el valor de la información para cada variable al comienzo del análisis de datos y cuál será...

10
Ajustar un GARCH (1,1) - modelo con covariables en R

Tengo algunas experiencias con el modelado de series de tiempo, en forma de modelos ARIMA simples, etc. Ahora tengo algunos datos que exhiben agrupamiento de volatilidad, y me gustaría intentar comenzar ajustando un modelo GARCH (1,1) en los datos. Tengo una serie de datos y una serie de variables...