Estadísticas y Big Data

18
Matriz de varianza-covarianza en lmer

Sé que una de las ventajas de los modelos mixtos es que permiten especificar la matriz de varianza-covarianza para los datos (simetría compuesta, autorregresiva, no estructurada, etc.) Sin embargo, la lmerfunción en R no permite una fácil especificación de esta matriz. ¿Alguien sabe qué estructura...

18
Cómo lidiar con un SVM con atributos categóricos

Tengo un espacio de 35 dimensiones (atributos). Mi problema analítico es simple de clasificación. De las 35 dimensiones, más de 25 son categóricas y cada atributo toma más de 50 tipos de valores. En ese escenario, la introducción de una variable ficticia tampoco funcionará para mí. ¿Cómo puedo...

18
Gran desacuerdo en la estimación de la pendiente cuando los grupos se tratan como aleatorios versus fijos en un modelo mixto

Entiendo que usamos modelos de efectos aleatorios (o efectos mixtos) cuando creemos que algunos parámetros del modelo varían aleatoriamente a través de algún factor de agrupación. Deseo ajustar un modelo donde la respuesta se haya normalizado y centrado (no perfectamente, pero bastante cerca) en un...

18
uso de pesas en svyglm vs glm

Me gustaría saber cómo difiere el tratamiento de los pesos entre svyglmyglm Estoy usando el twangpaquete en R para crear puntajes de propensión que luego se usan como pesos, de la siguiente manera (este código proviene de la

18
¿Los estadísticos suponen que no se puede regar en exceso una planta, o solo estoy usando los términos de búsqueda incorrectos para la regresión curvilínea?

Casi todo lo que leo sobre regresión lineal y GLM se reduce a esto: donde es una función no creciente o no decreciente de y es el parámetro que usted estimar y probar hipótesis sobre. Hay docenas de funciones de enlace y transformaciones de y para hacer una función lineal de .f ( x , β ) y x y f (...

18
Distancias de Mahalanobis por parejas

Necesito calcular la muestra de la distancia de Mahalanobis en R entre cada par de observaciones en una matriz de covariables . Necesito una solución que sea eficiente, es decir, solo se calculan distancias, y preferiblemente se implementa en C / RCpp / Fortran, etc. Asumo que , la matriz de...

18
¿Cuáles son los cuatro ejes en biplot PCA?

Cuando construye un biplot para un análisis de PCA, tiene puntajes de PC1 del componente principal en el eje xy puntajes de PC2 en el eje y. ¿Pero cuáles son los otros dos ejes a la derecha y la parte superior de la

18
prueba t en datos muy sesgados

Tengo un conjunto de datos con decenas de miles de observaciones de datos de costos médicos. Estos datos están muy sesgados a la derecha y tienen muchos ceros. Se ve así para dos grupos de personas (en este caso, dos grupos de edad con> 3000 obs cada uno): Min. 1st Qu. Median Mean 3rd Qu. Max....