Basado en algunos de los comentarios de @ mary, creo que lo siguiente es apropiado. Parece que está seleccionando la mediana porque la muestra es pequeña.
Si estaba seleccionando mediana porque es una muestra pequeña, no es una buena justificación. Selecciona mediana porque la mediana es un valor importante. Dice algo diferente de la media. También puede seleccionarlo para algunos cálculos estadísticos porque es robusto frente a ciertos problemas como valores atípicos o sesgos. Sin embargo, el tamaño de muestra pequeño no es uno de esos problemas contra los que es robusto. Por ejemplo, cuando el tamaño de la muestra se reduce, en realidad es mucho más sensible al sesgo que la media.
Sokal y Rohlf dan esta fórmula en su libro Biometry (página 139). En "Comentarios sobre aplicabilidad" escriben: Muestras grandes de poblaciones normales. Por lo tanto, me temo que la respuesta a su pregunta es no. Ver también aquí .
Una forma de obtener el error estándar y los intervalos de confianza para la mediana en muestras pequeñas con distribuciones no normales sería el arranque. Esta publicación proporciona enlaces a paquetes de Python para bootstrapping.
Advertencia
@whuber señaló que el arranque de la mediana en pequeñas muestras no es muy informativo ya que las justificaciones del arranque son asintóticas (ver comentarios a continuación).
fuente
Para cualquier distribución que no sea la normal (y Mary admite que esto es dudoso en sus datos), tendría un factor diferente. Obteniendo la estimación medianametro^ no es un gran problema, aunque puede comenzar a agonizar sobre los valores medios para el número par de observaciones frente a invertir el cdf o algo así. El valor de densidad relevante puede estimarse mediante estimadores de densidad del núcleo , si es necesario. En general, esto, por supuesto, es relativamente dudoso ya que se están tomando tres aproximaciones:
Cuanto menor es el tamaño de la muestra, más dudoso se vuelve.
fuente