¿Puedo obtener los parámetros de una distribución lognormal de la media y mediana de la muestra?

8

Tengo los valores medios y medianos para una muestra extraída de una distribución lognormal. Tenga en cuenta que esta no es la media y la mediana de los registros de la variable, aunque, por supuesto, puedo calcular los registros de la media y la mediana. ¿Existe una solución de forma cerrada para μ y σ a partir de esta información? Si solo hay una solución numérica, ¿podría decirme cómo encontrarla, idealmente con R?

Observo que esta pregunta ha sido respondida por derivar μ y σ de la media de la muestra y la varianza de la muestra, aquí: ¿Cómo calculo los parámetros de una distribución log-normal a partir de la media de la muestra y la varianza de la muestra? Sin embargo, no tengo el varianza muestral, solo la media y la mediana.

Si no hay una solución numérica directa o de forma cerrada, me gustaría saber si usar los registros de la media y mediana de la muestra, o alguna transformación de ellos, proporcionará una respuesta razonable para una muestra grande (en los cientos de millones )

andrewH
fuente

Respuestas:

10

Más bien depende de lo que quieres decir con "obtener". En general, no puede obtener cantidades de población de la información de la muestra. Sin embargo, a menudo puede obtener estimaciones, aunque en este caso las estimaciones pueden no ser muy buenas.

Si los tiene, puede calcular fácilmente los parámetros a partir de la media y la mediana de la población ; si es la mediana de la población y es la media de la población, entonces y .metro~=Exp(μ)metro=Exp(μ+12σ2)μ=Iniciar sesión(metro~)σ2=2Iniciar sesión(metrometro~)=2(Iniciar sesión(metro)-Iniciar sesión(metro~))

De manera similar, podría intentar usar la media y la mediana muestrales en algún tipo de estimador de las cantidades de la población.

Si las únicas cosas que tiene son la media y la mediana de la muestra de un lognormal ( y respectivamente), entonces al menos podría usar la estrategia obvia de reemplazar las cantidades de población por las de muestra *, combinando el método de momentos y método de cuantiles ... y .X¯X~μ^=Iniciar sesión(X~)σ^2=2Iniciar sesión(X¯X~)=2(Iniciar sesión(X¯)-Iniciar sesión(X~))

Creo que estos estimadores serán consistentes. Sin embargo, en muestras pequeñas, es seguro que están sesgadas y pueden no ser muy eficientes, pero es posible que no tenga muchas opciones sin un análisis considerable.

Por supuesto, en realidad, no sabes realmente que tus datos se obtienen de una distribución lognormal, eso es casi una suposición. Sin embargo, en la práctica podría ser una suposición bastante útil.

Idealmente, uno calcularía la distribución conjunta de la media y la mediana de la muestra a partir de un lognormal, y luego trataría de maximizar la probabilidad sobre los parámetros en esa distribución bivariada; eso debería ser lo mejor posible, pero eso es más un problema de investigación decente (vale la pena un trabajo si no se ha hecho antes) que una cuestión de unos pocos párrafos de respuesta.

Se podrían realizar algunas investigaciones de simulación sobre las propiedades de la distribución conjunta de la muestra media y mediana. Por ejemplo, considere que la distribución de la razón de la media a la mediana no debe tener escala, una función de solamente. Incluso si no podemos calcularlo algebraicamente, podemos ver cómo se comporta la relación (por ejemplo) a medida que cambia. Entonces, uno podría elegir la que maximiza aproximadamente la posibilidad de obtener la proporción que observó ( podría estimarse de varias maneras, pero la obvia, el registro de la mediana, como se mencionó anteriormente) no ser terrible)σσσμ


* Advertencia: es perfectamente posible que la mediana de la muestra exceda la media de la muestra. En ese caso, el estimador simple sugerido anteriormente no es de ayuda, ya que se basa en que la media está por encima de la mediana (dará una estimación negativa para un parámetro positivo).

Glen_b -Reinstate a Monica
fuente