Tengo 383 muestras que tienen un sesgo importante para algunos valores comunes, ¿cómo calcularía el IC del 95% para la media? El IC que calculé parece muy diferente, lo que supongo es que mis datos no se ven como una curva cuando hago un histograma. Así que creo que tengo que usar algo como bootstrapping, que no entiendo muy bien.
confidence-interval
mean
IhaveCandy
fuente
fuente
Respuestas:
Sí, bootstrap es una alternativa para obtener intervalos de confianza para la media (y debe hacer un poco de esfuerzo si desea comprender el método).
La idea es la siguiente:
Con respecto al último paso, hay varios tipos de intervalo de confianza de arranque (BCI). Las siguientes referencias presentan una discusión sobre las propiedades de los diferentes tipos de BCI:
http://staff.ustc.edu.cn/~zwp/teach/Stat-Comp/Efron_Bootstrap_CIs.pdf
http://www.tau.ac.il/~saharon/Boot/10.1.1.133.8405.pdf
Es una buena práctica calcular varios BCI e intentar comprender las posibles discrepancias entre ellos.
En R, puede implementar fácilmente esta idea usando el paquete R 'boot' de la siguiente manera:
fuente
Otra alternativa estándar es calcular el IC con la prueba de Wilcoxon. En R
Desafortunadamente, le da el IC alrededor de la (pseudo) mediana, no la media, pero luego, si los datos son muy no normales, tal vez la mediana sea una medida más informativa.
fuente
Para datos logarítmicos normales, Olsson (2005) sugiere un 'método Cox modificado'
Una función R está debajo:
Repitiendo el ejemplo del artículo de Olsson
fuente
fuente