Combinando dos intervalos de confianza / estimaciones puntuales

17

Supongamos que uno tiene dos muestras independientes de la misma población, y se usaron diferentes métodos en las dos muestras para derivar la estimación puntual y los intervalos de confianza. En casos triviales, una persona sensata simplemente combinaría las dos muestras y usaría un método para hacer el análisis, pero supongamos por el momento que debe usarse un método diferente debido a la limitación de una de las muestras, como la falta de datos. Estos dos análisis separados generarían estimaciones independientes, igualmente válidas para el atributo de interés de la población. Intuitivamente, creo que debería haber una manera de combinar adecuadamente estas dos estimaciones, tanto en términos de estimación puntual como de intervalo de confianza, lo que da como resultado un mejor procedimiento de estimación. Mi pregunta es ¿cuál debería ser la mejor manera de hacerlo? Puedo imaginar una media ponderada de algún tipo según la información / tamaño de la muestra en cada muestra, pero ¿qué pasa con los intervalos de confianza?

usuario1600
fuente

Respuestas:

9

Podría hacer una estimación agrupada de la siguiente manera. Luego puede usar las estimaciones agrupadas para generar un intervalo de confianza combinado. Específicamente, deje:

x1¯N(μ,σ2n1)

x2¯N(μ,σ2n2)

Usando los intervalos de confianza para los dos casos, puede reconstruir los errores estándar para las estimaciones y reemplazar lo anterior con:

x1¯N(μ,SE1)

x2¯N(μ,SE2)

Una estimación agrupada sería:

x¯=n1x1¯+n2x2¯n1+n2

Así,

x¯N(μ,n12SE1+n22SE2(n1+n2)2)=N(μ,σ2n1+n2)

Comunidad
fuente
1
β^±ZαSE
@ user1600 Buen punto.
Esta respuesta podría aplicarse a cualquiera de las dos distribuciones, es solo que el producto de las normales es una normal, dando una buena solución. La simulación de MCMC podría usarse con pares de distribuciones sin una solución de forma cerrada, utilizando un enfoque bayesiano, siendo una muestra la probabilidad anterior y la otra.
David LeBauer
Si volvemos a los intervalos de confianza del SE agrupado, ¿cuáles serían los grados de libertad para la distribución T? ¿Cambiaría esto si se combinan más de 2 intervalos de confianza?
DocBuckets
3

Suena mucho a metaanálisis mí me . Su suposición de que las muestras son de la misma población significa que puede utilizar un metanálisis de efectos fijos (en lugar de un metanálisis de efectos aleatorios). El método genérico de varianza inversa toma un conjunto de estimaciones independientes y sus variaciones como entrada, por lo que no requiere los datos completos y funciona incluso si se han utilizado diferentes estimadores para diferentes muestras. La estimación combinada es entonces un promedio ponderado de las estimaciones separadas, ponderando cada estimación por el inverso de su varianza. La varianza de la estimación combinada es la inversa de la suma de los pesos (los inversos de las varianzas).

Desea trabajar en una escala donde la distribución de muestreo de la estimación es aproximadamente normal, o al menos en una escala en la que los intervalos de confianza son aproximadamente simétricos, por lo que una escala transformada logarítmica es habitual para las estimaciones de razón (razones de riesgo, razones de probabilidades, tasa ratios ...). En otros casos , sería útil una transformación de estabilización de varianza , por ejemplo, una transformación de raíz cuadrada para datos de Poisson, una transformación de raíz cuadrada de arco para datos binomiales, etc.

una parada
fuente
1

Esto no es diferente a una muestra estratificada. Por lo tanto, agrupar las muestras para una estimación puntual y error estándar parece un enfoque razonable. Las dos muestras se ponderarán por la proporción de la muestra.

Brett
fuente