Tengo un conjunto de valores de los cuales calculo la mediana M. Me preguntaba cómo podría calcular el error en esta estimación.
En la red descubrí que se puede calcular como dónde es la desviación estándar Pero no encontré referencias al respecto. Así que no entiendo por qué ... ¿Alguien podría explicarme?
Estaba pensando que podría usar bootstrap para tener una estimación del error, pero me gustaría evitarlo porque ralentizaría mucho mi análisis.
También estaba pensando en calcular el error en la mediana de esta manera
¿Tiene sentido?
standard-deviation
bootstrap
standard-error
median
Shamalaia
fuente
fuente
Respuestas:
Para lidiar directamente con el error en la mediana, puede usar el intervalo de confianza no paramétrico exacto para la mediana, que usa estadísticas de pedido. Si desea algo diferente, es decir, una medida de dispersión, considere la diferencia de medias de Gini. El código está aquí para el intervalo de confianza de la mediana.
fuente
Como se señaló en la otra respuesta, existe un IC no paramétrico para la mediana que utiliza las estadísticas de orden. Ese CI es mejor en muchos aspectos que lo que encontró en la red.
Ahora, si debes saber dónde1.2533σN√ El factor proviene, la respuesta es de la distribución asintótica de la mediana. Si denotamos la mediana de la muestra porθ~ y la mediana de la población por θ entonces se puede demostrar que
dóndef es la distribución de tu muestra. El resultado no es tan universal como el CLT porque la distribución asintética todavía depende de la distribución subyacente de su muestra (a través del término[f(θ)]2 ) Sin embargo, puede hacer la simplificación drástica de que su muestra proviene de una distribución normal con media -y mediana-θ y varianza σ2 . Evaluandof en su punto de simetría entonces produce
y entonces la variación asintótica se convierte
Dividido porN y sacar la raíz cuadrada de eso para llegar a su error estándar 1.2533σN√ .
fuente