Estadísticas y Big Data

11
Cómo interpretar los resultados cuando tanto la cresta como el lazo funcionan bien por separado pero producen coeficientes diferentes

Estoy ejecutando un modelo de regresión con Lasso y Ridge (para predecir una variable de resultado discreta que va de 0 a 5). Antes de ejecutar el modelo, utilizo el SelectKBestmétodo de scikit-learnreducir el conjunto de características de 250 a 25 . Sin una selección inicial de características,...

11
¿Debo informar resultados no significativos?

He realizado una prueba de Kruskal Wallis, y para algunas de las preguntas el valor p no es significativo. ¿Informaría esto de la misma manera que si fuera significativo, indicando el df, el estadístico de prueba y el valor p? Por lo tanto, sería algo así como una prueba de Kruskal Wallis, pero se...

11
Flechas de variables subyacentes en PCA biplot en R

A riesgo de hacer la pregunta específica del software, y con la excusa de su ubicuidad e idiosincrasia, quiero preguntar sobre la función biplot()en R y, más específicamente, sobre el cálculo y el trazado de sus flechas rojas superpuestas predeterminadas, correspondientes a las variables...

11
Pros y contras de bootstrapping

Acabo de aprender sobre el concepto de bootstrapping, y se me ocurrió una pregunta ingenua: si siempre podemos generar numerosas muestras de bootstrap de nuestros datos, ¿por qué molestarse en obtener más datos "reales"? Creo que tengo una explicación, por favor dígame si estoy en lo correcto:...

11
RandomForest y pesos de clase

Pregunta en una oración: ¿Alguien sabe cómo determinar los buenos pesos de clase para un bosque aleatorio? Explicación: estoy jugando con conjuntos de datos desequilibrados. Quiero usar el Rpaquete randomForestpara entrenar un modelo en un conjunto de datos muy sesgado con solo pocos ejemplos...

11
Información mutua como probabilidad

¿Podría la información mutua sobre la entropía conjunta: 0 ≤ I( X, Y)H( X, Y)≤ 10≤I(X,Y)H(X,Y)≤1 0 \leq \frac{I(X,Y)}{H(X,Y)} \leq 1 se define como: "¿La probabilidad de transmitir una información de X a Y"? Lamento ser tan ingenuo, pero nunca he estudiado teoría de la información, y estoy...