Supongamos que uno tiene dos muestras independientes de la misma población, y se usaron diferentes métodos en las dos muestras para derivar la estimación puntual y los intervalos de confianza. En casos triviales, una persona sensata simplemente combinaría las dos muestras y usaría un método para hacer el análisis, pero supongamos por el momento que debe usarse un método diferente debido a la limitación de una de las muestras, como la falta de datos. Estos dos análisis separados generarían estimaciones independientes, igualmente válidas para el atributo de interés de la población. Intuitivamente, creo que debería haber una manera de combinar adecuadamente estas dos estimaciones, tanto en términos de estimación puntual como de intervalo de confianza, lo que da como resultado un mejor procedimiento de estimación. Mi pregunta es ¿cuál debería ser la mejor manera de hacerlo? Puedo imaginar una media ponderada de algún tipo según la información / tamaño de la muestra en cada muestra, pero ¿qué pasa con los intervalos de confianza?
fuente
Suena mucho a metaanálisis mí me . Su suposición de que las muestras son de la misma población significa que puede utilizar un metanálisis de efectos fijos (en lugar de un metanálisis de efectos aleatorios). El método genérico de varianza inversa toma un conjunto de estimaciones independientes y sus variaciones como entrada, por lo que no requiere los datos completos y funciona incluso si se han utilizado diferentes estimadores para diferentes muestras. La estimación combinada es entonces un promedio ponderado de las estimaciones separadas, ponderando cada estimación por el inverso de su varianza. La varianza de la estimación combinada es la inversa de la suma de los pesos (los inversos de las varianzas).
Desea trabajar en una escala donde la distribución de muestreo de la estimación es aproximadamente normal, o al menos en una escala en la que los intervalos de confianza son aproximadamente simétricos, por lo que una escala transformada logarítmica es habitual para las estimaciones de razón (razones de riesgo, razones de probabilidades, tasa ratios ...). En otros casos , sería útil una transformación de estabilización de varianza , por ejemplo, una transformación de raíz cuadrada para datos de Poisson, una transformación de raíz cuadrada de arco para datos binomiales, etc.
fuente
Esto no es diferente a una muestra estratificada. Por lo tanto, agrupar las muestras para una estimación puntual y error estándar parece un enfoque razonable. Las dos muestras se ponderarán por la proporción de la muestra.
fuente
Ver artículo: KM Scott, X. Lu, CM Cavanaugh, JS Liu, Métodos óptimos para estimar los efectos de isótopos cinéticos de diferentes formas de la ecuación de destilación de Rayleigh, Geochimica et Cosmochimica Acta, Volumen 68, Número 3, 1 de febrero de 2004, Páginas 433- 442, ISSN 0016-7037, http://dx.doi.org/10.1016/S0016-7037(03)00459-9 . ( http://www.sciencedirect.com/science/article/pii/S0016703703004599 )
fuente