Estadísticas y Big Data

15
SVM para datos no balanceados

Quiero intentar usar Support Vector Machines (SVM) en mi conjunto de datos. Sin embargo, antes de intentar el problema, me advirtieron que los SVM no funcionan bien en datos extremadamente desequilibrados. En mi caso, puedo tener tanto como 95-98% 0's y 2-5% 1's. Traté de encontrar recursos que...

15
¿Cuál es la definición de precisión Top-n?

Estoy leyendo un artículo científico sobre clasificación de imágenes. En los resultados experimentales hablan de la precisión top-1 y top-5, pero nunca he oído hablar del término, ni puedo encontrarlo usando google. ¿Alguien puede darme una definición o señalarme a algún lado?...

15
Regresión de cresta - interpretación bayesiana

He oído que la regresión de cresta se puede derivar como la media de una distribución posterior, si la anterior se elige adecuadamente. ¿Es la intuición de que las restricciones establecidas en los coeficientes de regresión por el anterior (por ejemplo, distribuciones normales estándar alrededor de...

15
¿Cómo calcular la pureza?

En el análisis de conglomerados, ¿cómo calculamos la pureza? ¿Cuál es la ecuación? No estoy buscando un código para hacerlo por mí. Deje ωkωk\omega_k ser clúster k, y cjcjc_j sea ​​clase j. Entonces, ¿la pureza es prácticamente precisión? parece que estaban sumando la cantidad de clase...

15
Clasificador vs modelo vs estimador

¿Cuál es la diferencia entre un clasificador, modelo y estimador? Por lo que puedo decir: un estimador es un predictor encontrado del algoritmo de regresión un clasificador es un predictor encontrado de un algoritmo de clasificación un modelo puede ser tanto un estimador como un...

15
Valores p iguales a 0 en la prueba de permutación

Tengo dos conjuntos de datos y me gustaría saber si son significativamente diferentes o no (esto proviene de "¿ Dos grupos son significativamente diferentes? Prueba de uso "). Decidí usar una prueba de permutación, haciendo lo siguiente en R: permutation.test <- function(coding, lncrna) {...