Estadísticas y Big Data

9
Valor de corte de distancia del cocinero

He estado leyendo sobre la distancia del cocinero para identificar valores atípicos que tienen una gran influencia en mi regresión. En el estudio original de Cook, dice que una tasa de corte de 1 debería ser comparable para identificar personas influyentes. Sin embargo, varios otros estudios usan o...

9
Sesgo de optimismo: estimaciones del error de predicción

El libro Elementos del aprendizaje estadístico (disponible en PDF en línea) analiza el sesgo optimista (7.21, página 229). Establece que el sesgo de optimismo es la diferencia entre el error de entrenamiento y el error en la muestra (error observado si tomamos muestras de nuevos valores de...

9
SD mayor que la media, escala no negativa

Me dieron un artículo que informaba sobre un estudio muy similar al que mi laboratorio desea realizar. Pero, noté que para la variable de interés, Duración, las DE son mayores que la media ... ya que esta es la duración medida en minutos, nunca puede ser negativa y esto me parece muy extraño. Esto...

9
En un metanálisis, ¿cómo se deben manejar los estudios no significativos que no contienen datos sin procesar?

Digamos que estoy realizando un metanálisis, observando el desempeño del grupo A y el grupo B con respecto a un determinado constructo. Ahora, algunos de los estudios que veré informarán que no se pudieron encontrar diferencias estadísticas entre los dos grupos, pero no se presentarán estadísticas...