Problema: estoy parametrizando distribuciones para usar como antecedentes y datos en un metanálisis bayesiano. Los datos se proporcionan en la literatura como estadísticas de resumen, casi exclusivamente se supone que se distribuyen normalmente (aunque ninguna de las variables puede ser <0, algunas son proporciones, algunas son masivas, etc.).
Me he encontrado con dos casos para los que no tengo solución. A veces, el parámetro de interés es el inverso de los datos o la relación de dos variables.
Ejemplos:
- La relación de dos variables normalmente distribuidas:
- datos: media y sd para porcentaje de nitrógeno y porcentaje de carbono
- parámetro: relación de carbono a nitrógeno.
- El inverso de una variable normalmente distribuida:
- datos: masa / área
- parámetro: área / masa
Mi enfoque actual es usar la simulación:
por ejemplo, para un conjunto de datos de porcentaje de carbono y nitrógeno con medias: xbar.n, c, varianza: se.n, c, y tamaño de muestra: nn, nc:
set.seed(1)
per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C
per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N
Quiero parametrizar ratio.cn = perc.c / perc.n
# parameter of interest
ratio.cn <- perc.c / perc.n
Luego, elija las distribuciones de mejor ajuste con rango para mi anterior
library(MASS)
dist.fig <- list()
for(dist.i in c('gamma', 'lognormal', 'weibull')) {
dist.fit[[dist.i]] <- fitdist(ratio.cn, dist.i)
}
Pregunta: ¿Es este un enfoque válido? ¿Hay otros / mejores enfoques?
¡Gracias por adelantado!
Actualización: la distribución de Cauchy, que se define como la relación de dos normales con , tiene una utilidad limitada ya que me gustaría estimar la varianza. ¿Quizás podría calcular la varianza de una simulación de n sorteos de un Cauchy?
Encontré las siguientes aproximaciones de forma cerrada, pero no he probado para ver si dan los mismos resultados ... Hayya et al, 1975 σ 2 y : x =σ 2 x ×μy/mu 4
Hayya, J. y Armstrong, D. y Gressis, N., 1975. Una nota sobre la relación de dos variables normalmente distribuidas. Management Science 21: 1338--1341
fuente
Respuestas:
Es posible que desee ver algunas de las referencias en el artículo de Wikipedia sobre Distribución de proporciones . Es posible que encuentre mejores aproximaciones o distribuciones para usar. De lo contrario, su enfoque parece sólido.
Actualización Creo que una mejor referencia podría ser:
Vea las fórmulas 2-4 en la página 195.
Actualización 2
En su pregunta actualizada sobre la variación de un Cauchy, como John Cook señaló en los comentarios, la variación no existe. Entonces, tomar una varianza muestral simplemente no funcionará como un "estimador". De hecho, encontrará que la varianza de su muestra no converge en absoluto y fluctúa enormemente a medida que continúa tomando muestras.
fuente
¿No podría suponer que Para el inverso de una variable aleatoria normal y hacer el cálculo bayesiano necesario después de identificar los parámetros apropiados para la distribución normal.y−1∼N(.,.)
Mi sugerencia a continuación para usar el Cauchy no funciona como se señala en los comentarios de ars y John.
La relación de dos variables normalmente aleatorias sigue la distribución de Cauchy . Es posible que desee utilizar esta idea para identificar los parámetros del cauchy que mejor se ajustan a los datos que tiene.fuente