Estadísticas y Big Data

32
Regresión logística del kernel vs SVM

Como todos saben, SVM puede usar el método del núcleo para proyectar puntos de datos en espacios más altos de modo que los puntos se puedan separar por un espacio lineal. Pero también podemos usar la regresión logística para elegir este límite en el espacio del núcleo, entonces, ¿cuáles son las...

32
Comparar dos modelos usando la función anova () en R

De la documentación para anova(): Cuando se le da una secuencia de objetos, 'anova' prueba los modelos uno contra el otro en el orden especificado ... ¿Qué significa probar los modelos uno contra el otro? ¿Y por qué importa el orden? Aquí hay un ejemplo del tutorial de GenABEL : >...

32
¿Es posible encontrar la desviación estándar combinada?

Supongamos que tengo 2 juegos: Conjunto A : número de elementos , μ = 2.4 , σ = 0.8n = 10n=10n= 10μ = 2.4μ=2.4\mu = 2.4σ= 0.8σ=0.8\sigma = 0.8 Conjunto B : número de elementos , μ = 2 , σ = 1.2n = 5n=5n= 5μ = 2μ=2\mu = 2σ= 1.2σ=1.2\sigma = 1.2 Puedo encontrar la media combinada ( ) fácilmente,...

32
Pautas de AIC en la selección del modelo

Normalmente uso BIC porque entiendo que valora más la parsimonia que AIC. Sin embargo, he decidido utilizar un enfoque más completo ahora y me gustaría utilizar AIC también. Sé que Raftery (1995) presentó buenas pautas para las diferencias BIC: 0-2 es débil, 2-4 es evidencia positiva de que un...

32
¿Es posible cambiar una hipótesis para que coincida con los datos observados (también conocido como expedición de pesca) y evitar un aumento en los errores de Tipo I?

Es bien sabido que los investigadores deberían pasar tiempo observando y explorando los datos e investigaciones existentes antes de formar una hipótesis y luego recolectar datos para probar esa hipótesis (refiriéndose a la prueba de significación de hipótesis nula). Muchos libros de estadísticas...