¿Cómo calcular el intervalo de confianza de la media de las medias?

19

Imagina que repites un experimento tres veces. En cada experimento, recolectas medidas por triplicado. Los triplicados tienden a estar bastante juntos, en comparación con las diferencias entre los tres medios experimentales. Calcular el gran significado es bastante fácil. Pero, ¿cómo se puede calcular un intervalo de confianza para la gran media?

Data de muestra:

Experimento 1: 34, 41, 39

Experimento 2: 45, 51, 52

Experimento 3: 29, 31, 35

Suponga que los valores replicados dentro de un experimento siguen una distribución gaussiana, al igual que los valores medios de cada experimento. La SD de variación dentro de un experimento es menor que la SD entre los medios experimentales. Suponga también que no hay ordenamiento de los tres valores en cada experimento. El orden de izquierda a derecha de los tres valores en cada fila es completamente arbitrario.

El enfoque simple es calcular primero la media de cada experimento: 38.0, 49.3 y 31.7, y luego calcular la media, y su intervalo de confianza del 95%, de esos tres valores. Usando este método, la gran media es 39.7 con un intervalo de confianza del 95% que varía de 17.4 a 61.9.

El problema con ese enfoque es que ignora totalmente la variación entre triplicados. Me pregunto si no hay una buena manera de explicar esa variación.

Harvey Motulsky
fuente
1
No es una respuesta, solo una observación intuitiva. El IC para la media de datos agrupados (los nueve obs) es , el IC basado en las medias solo es ( 39.7 ± 12.83 ) Y g ) ] + V [ E ((39.7±2.13)(39.7±12.83) . No estoy seguro de lo que está haciendo su CI (error tipográfico? 17 no 27, y 51 no 61?), Obtengo por std err de tres medios, y 4.30 como 0.975 cuantil de T dist con 2 df. Creo que el CI que busca estaría en algún lugar entre estos dos, ya que tiene una agrupación parcial. También podría pensar en términos de varianza fórmula V ( Y ) = E [ V ( Y2.984.300.975 , cada CI usa la mitad de la fórmulaV(Y)=E[V(Y|Yg)]+V[E(Y|Yg)]
probabilidad es
2
@probabilityislogic: El SEM de los tres medios del experimento es 5.168 (no 2.98 como escribió), y el intervalo de confianza que di en la publicación original (17.4 a 61.9) es correcto. El SEM se calcula a partir de la SD (8.95) dividiendo por la raíz cuadrada de n (raíz cuadrada de 3). Dividiste por n (3) en su lugar.
Harvey Motulsky
mi error, también debería reemplazar por 6.40 en el intervalo agrupado (el mismo error allí)2.136.40
probabilistico
¿El siguiente enlace responde 'esto? talkstats.com/showthread.php/11554-mean-of-means
@TST, parece que no hay nada más que un enlace a Wikipedia sobre la varianza agrupada . ¿Cuidado para elaborar?
chl

Respuestas:

6

Hay un intervalo de confianza exacto natural para el grandioso en el modelo ANOVA unidireccional aleatorio balanceado De hecho, es fácil verificar que la distribución de las medias observadas ˉ y i es ˉ y i iid N ( μ , τ 2 ) con τ 2 = σ 2 b + σ 2 w

(yyojμyo)iidnorte(μyo,σw2),j=1,...,J,μyoiidnorte(μ,σsi2),yo=1,...,yo.
y¯yoy¯yoiidnorte(μ,τ2) , y es bien sabido que la suma de cuadrados entreSSbtiene distribuciónSSbJτ2χ 2 I - 1 y es independiente de la media global observada ˉ yN(μ,τ2τ2=σsi2+σw2JSSsi
SSsiJτ2χyo-12
. Así, ˉ y -μ
y¯norte(μ,τ2yo)
tiene unadistribuciónt deStudentconI-1grados de libertad, de donde es fácil obtener un intervalo de confianza exacto deμ
y¯-μ1yoSSsiJ(yo-1)
tyo-1μ .

Tenga en cuenta que este intervalo de confianza no es más que el intervalo clásico para una media gaussiana al considerar solo el grupo significa como las observacionesy¯yo . Así, el enfoque simple que mencionas:

El enfoque simple es calcular primero la media de cada experimento: 38.0, 49.3 y 31.7, y luego calcular la media, y su intervalo de confianza del 95%, de esos tres valores. Usando este método, la gran media es 39.7 con un intervalo de confianza del 95% que varía de 17.4 a 61.9.

es correcto. Y tu intuición sobre la variación ignorada:

El problema con ese enfoque es que ignora totalmente la variación entre triplicados. Me pregunto si no hay una buena manera de explicar esa variación.

Está Mal. También menciono la corrección de tal simplificación en /stats//a/72578/8402

Actualización 12/04/2014

Algunos detalles ahora están escritos en mi blog: Reducir un modelo para obtener intervalos de confianza .

Stéphane Laurent
fuente
¿Alguna ayuda para implementar esta solución en Python? stackoverflow.com/questions/45682437/…
blehman
7

Esta es una cuestión de estimación dentro de un modelo lineal de efectos mixtos. El problema es que la varianza de la gran media es una suma ponderada de dos componentes de varianza que deben estimarse por separado (a través de un ANOVA de los datos). Las estimaciones tienen diferentes grados de libertad. Por lo tanto, aunque se puede intentar construir un intervalo de confianza para la media utilizando las fórmulas habituales de muestra pequeña (t de Student), es poco probable que alcance su cobertura nominal porque las desviaciones de la media no seguirán exactamente una distribución de t de Student.

Un artículo reciente (2010) de Eva Jarosova, Estimación con el modelo de efectos lineales mixtos , analiza este tema. (A partir de 2015 ya no parece estar disponible en la Web.) En el contexto de un conjunto de datos "pequeño" (aun así, aproximadamente tres veces más grande que este), ella usa la simulación para evaluar dos cálculos aproximados de CI (el pozo aproximación de Satterthwaite conocida y el "método de Kenward-Roger"). Sus conclusiones incluyen

El estudio de simulación reveló que la calidad de la estimación de los parámetros de covarianza y, en consecuencia, el ajuste de los intervalos de confianza en muestras pequeñas puede ser bastante pobre ... Una mala estimación puede influir no solo en el verdadero nivel de confianza de los intervalos convencionales, sino que también puede hacer que el ajuste sea imposible. Es obvio que incluso para datos equilibrados, tres tipos de intervalos [convencional, Satterthwaite, KR] pueden diferir sustancialmente. Cuando se observa una diferencia notable entre los intervalos convencionales y los ajustados, se deben verificar los errores estándar de las estimaciones de los parámetros de covarianza. Por otro lado, cuando las diferencias entre [los tres] tipos de intervalos son pequeñas, el ajuste parece ser innecesario.

En resumen, un buen enfoque parece ser

  1. Calcule un IC convencional utilizando las estimaciones de los componentes de varianza y pretendiendo que se aplica una distribución t.

  2. También calcule al menos uno de los IC ajustados.

  3. Si los cálculos son "cercanos", acepte el CI convencional. De lo contrario, informe que no hay datos suficientes para producir un IC confiable.

whuber
fuente
Usar los componentes de varianza conduce al mismo intervalo de confianza que calculé en la publicación original. La tabla ANOVA tiene un SS entre columnas de 480.7 con 2 df, lo que significa que el MS es 240.3. El SD ​​es sqrt (MSbetween / n) = sqrt (240.3 / 3) = 8.95, lo que conduce al mismo CI que publiqué originalmente (17.4 a 61.9). Me resultó muy difícil seguir el documento de Jarasova que citó, y no estoy completamente seguro de que sea relevante aquí (parece ser sobre diseños de medidas repetidas). ???
Harvey Motulsky
@Harvey ¡Tu descripción me suena a medidas repetidas! Creo que el documento de Jarasova es perfecto.
whuber
1
Estoy pensando en la situación común en los laboratorios donde los triplicados son simplemente tres tubos de ensayo (o pozos) diferentes. El orden de los tres tal como se presenta en la tabla es arbitrario. No hay conexión o correlación entre la réplica n. ° 2 en el primer experimento con la réplica n. ° 2 en el segundo o tercer experimento. Cada experimento solo tiene tres medidas. Así que en realidad no se repiten las medidas. ¿Derecho?
Harvey Motulsky
Whuber, hay una distribución exacta del estudiante aquí. Mira mi respuesta.
Stéphane Laurent
@whuber, el enlace que proporciona para el artículo de Eva Jarasova está muerto y una búsqueda en Google no arrojó nada. ¿Puedes corregir la referencia?
Placidia
0

No puede tener un intervalo de confianza que resuelva ambos problemas. Tienes que elegir uno. Puede derivar uno de un término de error cuadrático medio dentro de la varianza del experimento que le permite decir algo acerca de la precisión con la que puede estimar los valores dentro del experimento o puede hacerlo entre experimentos. Si solo hiciera lo primero, tendería a querer trazarlo alrededor de 0 en lugar de alrededor de la gran media porque no le dice nada sobre el valor medio real, solo sobre un efecto (en este caso 0). O simplemente podría trazar ambos y describir lo que hacen.

Tienes un control sobre el medio. Para el interior, es como calcular el término de error en un ANOVA para que funcione un MSE y, a partir de ahí, el SE para el CI es simplemente sqrt (MSE / n) (n = 3 en este caso).

John
fuente
En realidad, puede tener un intervalo creíble para cada media y para la gran media. Simplemente use un modelo bayesiano multinivel. A veces, este tipo de estimación se denomina agrupación parcial. El problema es la pequeña muestra, creo.
Manoel Galdino
Podría tener un intervalo de confianza para cada media y la gran media también ... pero son cosas diferentes ... al igual que los intervalos creíbles. Interpreté la pregunta como acerca de los IC con respecto a la varianza dentro del estudio y el intermedio como un agregado. Todo aún te deja con diferentes CI que significan cosas diferentes. (Tampoco tomé la n literalmente)
John
1
Además, la forma en que quise decir no puede no es realmente "no puede". De alguna manera, podría llegar a una ecuación única que calcule un intervalo de confianza para todo. Simplemente no significaría nada sensato. Eso es lo que quise decir para no puedo.
John
Pocos minutos después de escribir mi comentario, me di cuenta de que no debíamos tomar la n literalmente. Pero era demasiado tarde para editarlo =).
Manoel Galdino
0

Creo que el IC para la gran media es demasiado amplio [17,62] incluso para el rango de datos originales.

Estos experimentos son MUY comunes en química. Por ejemplo, en la certificación de materiales de referencia, debe recoger algunas botellas de todo el lote de manera aleatoria, y debe llevar a cabo un análisis replicado de cada botella. ¿Cómo se calcula el valor de referencia y su incertidumbre? Hay muchas maneras de hacerlo, pero la más sofisticada (y correcta, creo) es la aplicación de metaanálisis o ML (Dersimonian-Laird, Vangel-Rukhin, etc.)

¿Qué pasa con las estimaciones de arranque?

limpiar
fuente
1
La simulación (10.000 ensayos con efectos principales y errores distribuidos normalmente) indica que [21, 58] es un IC simétrico de 95% a dos lados para la media.
whuber
whuber: Me gustaría saber cómo hiciste esas simulaciones. ¿Bootstrapping de los datos originales? ¿O realmente simulaciones? Si es lo último, ¿qué valor de media y DE utilizó para simular datos?
Harvey Motulsky