Variación técnica versus señal real

8

Estoy probando la diferencia en un resultado continuo en tres condiciones diferentes.

Bajo condición AI tome una medida del resultado. Hago esto dos veces para la misma muestra. Los valores de ejemplo podrían ser 2.2, 2.1. Estas son réplicas "técnicas" que provienen de la misma fuente biológica

Hago lo mismo con cuatro réplicas "biológicas" para la condición A:

A1, measure 1: 2.2
A1, measure 2: 2.1
A2, measure 1: 2.0
A2, measure 2: 2.1
A3, measure 1: 1.9
A3, measure 2: 1.8
A4, measure 1: 1.5
A4, measure 2: 1.6

También tengo las condiciones B, C y D, con dos réplicas "técnicas" en cada una de las cuatro réplicas "biológicas".

¿Cómo probaría la prueba de diferencias de medias (ANOVA) que explica mejor la variación técnica y biológica? No me gustaría ajustar un modelo que cuente cada medición como una observación separada, porque cada par proviene de la misma muestra biológica. Supongo que debe haber una mejor manera que simplemente promediar los pares.

Bono: ¿cómo se hace esto en R?

Suponiendo que tengo datos que se ven así:

> data
   condition sample measurement outcome
1          A      1           1     2.2
2          A      1           2     2.1
3          A      2           1     2.0
4          A      2           2     2.1
5          A      3           1     1.9
6          A      3           2     1.8
7          A      4           1     1.5
8          A      4           2     1.6
9          B      1           1     1.7
10         B      1           2     1.6
11         B      2           1     1.5
12         B      2           2     1.6
13         B      3           1     1.4
14         B      3           2     1.3
15         B      4           1     1.0
16         B      4           2     1.1
17         C      1           1     2.4
18         C      1           2     2.3
19         C      2           1     2.2
20         C      2           2     2.3
21         C      3           1     2.1
22         C      3           2     2.0
23         C      4           1     1.7
24         C      4           2     1.8

Probablemente no quisiera hacer algo como esto:

summary(lm(outcome~condition, data=data))

Gracias por adelantado.

Stephen Turner
fuente

Respuestas:

1

El problema es que tiene varias fuentes posibles de aleatoriedad. Aleatoriedad individual (el término de error normal en una regresión lineal); variación entre sus dos medidas en cada caso; y variación de las unidades particulares que ha muestreado. Creo que probablemente quieras algo como

model <- aov(outcome ~ condition + Error(samp + measurement), data=mydata)
summary(model)

Espero que ayude.

Peter Ellis
fuente