Estadísticas y Big Data

10
Problemas de trampa variable ficticia

Estoy ejecutando una gran regresión OLS donde todas las variables independientes (alrededor de 400) son variables ficticias. Si se incluyen todos, existe una multicolinealidad perfecta (la trampa de variable ficticia), por lo que tengo que omitir una de las variables antes de ejecutar la...

10
¿Cómo saber si las buenas actuaciones vienen en rachas?

Resuelvo los cubos de Rubik como un hobby. Grabo el tiempo que me llevó resolver el cubo usando algún software, y ahora tengo datos de miles de soluciones. Los datos son básicamente una larga lista de números que representan el tiempo que tomó cada resolución secuencial (por ejemplo, 22.11, 20.66,...

10
Generando vectores aleatorios con restricciones

Necesito crear vectores aleatorios de números reales a_i que satisfagan las siguientes restricciones: abs(a_i) < c_i; sum(a_i)< A; # sum of elements smaller than A sum(b_i * a_i) < B; # weighted sum is smaller than B aT*A*a < D # quadratic multiplication with A smaller than D where...

10
Elija el nivel de factor como base ficticia en lm () en R

Digamos que estoy retrocediendo Y en X1 y X2, donde X1 es una variable numérica y X2 es un factor con cuatro niveles (A: D). ¿Hay alguna forma de escribir la función de regresión lineal lm(Y ~ X1 + as.factor(X2))para que pueda elegir un nivel particular de X2, por ejemplo, B, como línea de...

10
Combinando probabilidades de accidentes nucleares

Los recientes acontecimientos en Japón me han hecho pensar en lo siguiente. Las plantas nucleares generalmente están diseñadas para limitar el riesgo de accidentes graves a una "probabilidad básica de diseño", por ejemplo, 10E-6 / año. Este es el criterio para una sola planta. Sin embargo, cuando...

10
Paralelizar el paquete de caret usando doSMP

ACTUALIZACIÓN: caret ahora se usa foreachinternamente, por lo que esta pregunta ya no es realmente relevante. Si puede registrar un backend paralelo que funcione foreach, caret lo usará. Tengo el paquete de caret para R, y estoy interesado en usar la trainfunción para validar de forma cruzada...

10
Prueba de hipótesis en datos continuos inflados a cero

Le agradecería mucho su consejo sobre el siguiente problema: Tengo un gran conjunto de datos continuo con muchos ceros (~ 95%) y necesito encontrar la mejor manera de probar si ciertos subconjuntos son "interesantes", es decir, no parecen extraídos de la misma distribución que el resto. La...

10
Enciclopedia de gráficos

Tengo que crear una aplicación web multiusuario que trate sobre mediciones de tráfico, pronósticos, etc. En este punto, sé que usaré gráficos de barras y gráficos circulares. Desafortunadamente, esos tipos de gráficos no son ricos en expresar todos los datos que recopilo y calculo. Estoy...

10
¿Es posible integrar analíticamente

En primer lugar, por integración analítica, quiero decir, ¿hay una regla de integración para resolver esto en oposición a los análisis numéricos (como las reglas trapezoidales, Gauss-Legendre o Simpson)? Tengo una función donde es la función de densidad de probabilidad de una distribución...