Cómo calcular una desviación media y estándar para una distribución lognormal usando 2 percentiles

11

Estoy tratando de calcular una media y una desviación estándar de 2 percentiles para una distribución lognormal.

Tuve éxito en realizar el cálculo para una distribución normal usando X = mean + sd * Zy resolviendo para media y sd.

Creo que me falta una ecuación cuando intento hacer lo mismo para una distribución lognormal. Miré a Wikipedia y traté de usarla, ln(X) = mean + sd * Zpero me estoy confundiendo si la media y la SD en este caso son para la distribución normal o lognormal.

¿Qué ecuaciones debo usar? ¿Necesitaré más de 2 percentiles para resolver los cálculos?

JF
fuente
Bienvenido al sitio, @ Jean-Francois. Tenga en cuenta que si solo quisiera ayuda con la programación de R, esta pregunta estaría fuera de tema para CV (consulte nuestra página de ayuda ). Creo que esto tiene suficiente contenido estadístico para estar en el tema aquí, pero está cerca de la frontera. Podría ser útil si pudiera formularlo de una manera más neutral para el software, y es posible que deba estar preparado para obtener respuestas que aborden los problemas estadísticos pero que no sean específicos de R.
gung - Restablece a Monica
Yo reformularé. Estaba tratando de resolverlo con R, pero creo que me falta un concepto fundamental aquí, por eso no obtengo los resultados que esperaba.
JF

Respuestas:

12

Parece que "sabe" o asume que tiene dos cuantiles; Digamos que tiene que 42 y 666 son los puntos 10% y 90% para un lognormal.

La clave es que casi todo es más fácil de hacer y entender en la escala registrada (normal); exponga lo menos y lo más tarde posible.

Tomo como ejemplos los cuantiles que se colocan simétricamente en la escala de probabilidad acumulativa. Entonces, la media en la escala logarítmica está a medio camino entre ellos y la desviación estándar (sd) en la escala logarítmica se puede estimar usando la función de cuantil normal.

Usé Mata de Stata para estos cálculos de muestra. La barra invertida \une elementos en forma de columna.

mean = mean(ln((42 \ 666)))

(ln(666) - mean) / invnormal(0.9)
1.078232092

SD = (ln(666) - mean) / invnormal(0.9)

La media en la escala exponencial es entonces

exp(mean + SD^2/2)
299.0981759

y la varianza se deja como ejercicio.

(Aparte: debería ser tan fácil o más fácil en cualquier otro software decente. invnormal()Es solo qnorm()en R si recuerdo correctamente).

Nick Cox
fuente
Muchas gracias Nick. Mucho más simple cuando vuelves a lo básico. El único cambio que hice fue en tu última línea exp(mean + SD^2); Lo cambié aexp(mean + (SD^2)/2)
JF