He escuchado / visto en varios lugares que puede transformar el conjunto de datos en algo que se distribuye normalmente tomando el logaritmo de cada muestra, calcular el intervalo de confianza para los datos transformados y transformar el intervalo de confianza utilizando la operación inversa (por ejemplo, elevar 10 a la potencia de los límites inferior y superior, respectivamente, para ).
Sin embargo, sospecho un poco de este método, simplemente porque no funciona para la media en sí:
¿Cuál es la forma correcta de hacer esto? Si no funciona para la media en sí, ¿cómo puede funcionar para el intervalo de confianza para la media?
confidence-interval
mean
lognormal
Vegard
fuente
fuente
Respuestas:
Hay varias formas de calcular los intervalos de confianza para la media de una distribución lognormal. Voy a presentar dos métodos: Bootstrap y perfil de probabilidad. También presentaré una discusión sobre los Jeffreys antes.
Oreja
Para el MLE
En este caso, el MLE de para una muestra son(μ,σ) ( x1, . . . , xnorte)
Entonces, el MLE de la media es . Al volver a muestrear podemos obtener una muestra de bootstrap de y, utilizando esto, podemos calcular varios intervalos de confianza de bootstrap . Los siguientes códigos muestran cómo obtenerlos.δ^= exp( μ^+ σ^2/ 2) δδ^
R
Para la media de la muestra
Ahora, considerando el estimador lugar del MLE. También podría considerarse otro tipo de estimadores.δ~= x¯
Probabilidad de perfil
Para la definición de funciones de probabilidad y perfil de probabilidad, ver . Usando la propiedad de invariancia de la probabilidad, podemos reparameterise de la siguiente manera , donde y luego calcular numéricamente el probabilidad de perfil de .( μ , σ) → ( δ, σ) δ= exp( μ + σ2/ 2) δ
Esta función toma valores en ; un intervalo de nivel tiene una confianza aproximada de . Vamos a utilizar esta propiedad para construir un intervalo de confianza para . Los siguientes códigos muestran cómo obtener este intervalo .( 0 , 1 ] 0,147 95 % δ95 % δ
R
En esta sección, se presenta un algoritmo alternativo, basado en el muestreo de Metropolis-Hastings y el uso de Jeffreys antes, para calcular un intervalo de credibilidad para .δ
Recuerde que el Jeffreys anterior para en un modelo lognormal es( μ , σ)
y que este prior es invariable bajo reparameterisations. Este previo es incorrecto, pero el posterior de los parámetros es apropiado si el tamaño de la muestra . El siguiente código muestra cómo obtener un intervalo de credibilidad del 95% utilizando este modelo bayesiano.n ≥ 2
R
Tenga en cuenta que son muy similares.
fuente
Puede probar el enfoque bayesiano con el previo de Jeffreys. Debería producir intervalos de credibilidad con una propiedad correcta de coincidencia frecuente: el nivel de confianza del intervalo de credibilidad está cerca de su nivel de credibilidad.
fuente
Tienes razón: esa es la fórmula para la media geométrica, no la media aritmética. La media aritmética es un parámetro de la distribución normal y, a menudo, no es muy significativa para los datos lognormales. La media geométrica es el parámetro correspondiente de la distribución lognormal si desea hablar más significativamente sobre una tendencia central para sus datos.
Y de hecho, calcularía los IC sobre la media geométrica tomando los logaritmos de los datos, calculando la media y los IC como de costumbre, y transformando de regreso. Tienes razón en que realmente no quieres mezclar tus distribuciones colocando los CI para la media geométrica alrededor de la media aritmética ... ¡yeowch!
fuente