¿Qué es un bloque en el diseño experimental?

20

Tengo dos preguntas sobre la noción de bloque en el diseño experimental: (1) ¿Cuál es la diferencia entre un bloque y un factor? (2) Traté de leer algunos libros, pero algo no está claro: parece que los autores siempre asumen que no hay interacción entre el "factor de bloqueo" y otros factores. ¿Es correcto? Y si es así, ¿por qué?

experiment-design interaction interpretation Stéphane Laurent
fuente

13

El bloqueo es un factor. El objetivo principal del bloqueo es reducir la variación no explicada de un diseño, en comparación con un diseño no bloqueado. No estamos interesados en el efecto de bloqueo per se , sino que bloqueamos cuando sospechamos que el "ruido" de fondo podría contrarrestar el efecto del factor real. $(SS_{Residual})$
Agrupamos unidades experimentales en bloques "homogéneos" donde todos los niveles del factor principal están igualmente representados. El análisis de la varianza de un diseño de bloques de control aleatorio divide el término residual de un diseño aleatorio completo de factor único equivalente en componentes de bloque y residuales. Sin embargo, debemos tener en cuenta que el último componente tiene menos grados de libertad que en los diseños CR de factor único, lo que lleva a estimaciones más altas para . $MS_{Residual} = {SS_{Residual}}/{d.f.}$
La decisión de bloquear o no bloquear debe tomarse cuando consideramos que la disminución de los residuos compensará con creces la disminución de df
Por lo general, se ajusta un modelo aditivo a los datos de diseño de RCB, en el que la variable de respuesta es una combinación aditiva del factor y los efectos del bloque y se supone que no existe interacción entre los dos. Creo que esto se explica por el hecho de que RCB no nos permite distinguir la interacción BxF de la variabilidad dentro del bloque y la variabilidad dentro de las unidades experimentales. La conclusión es que tenemos que asumir que no hay interacción ya que no podemos medirla. Sin embargo, podemos probar si está presente visualmente o con la prueba de Tukey.

Un buen recurso sobre diseño experimental es este .

Charlie
fuente

(+1) Otra buena lectura es el Diseño y Análisis de Experimentos de Montgomery .

chl

Gracias @chl. Montgomery estaba en mi lista de compras, pero decidí no comprarlo, ya que estaba más orientado a la ingeniería que a la ecología. He notado que una nueva edición se publicará en abril de 2012, ¿actualizarán a su compañero de R?

Charlie el

1

Gracias a todos. Prefiero tener una mente matemática, luego tengo dificultades para leer libros como el de Montgomery en el que hay demasiado texto y no hay suficientes matemáticas

Stéphane Laurent

@Charlie Yup, ese es un proyecto que se remonta a 2006 cuando la vista Tarea de Doe CRAN no existía en absoluto. Seguiré trabajando en la sexta versión con la esperanza de terminarla este año (pero lo digo cada nuevo año, así que ...). Además del campo de aplicación "sesgado", sigo pensando que el texto sigue siendo excelente para psicólogos y biólogos.

chl

1

@ Stéphane Puedo sugerir que eche un vistazo a las respuestas del plano a preguntas complejas , por Christensen: menos DoE, más matemáticas y una buena introducción a los modelos lineales.

chl

8

Aquí hay una respuesta concisa. Se pueden encontrar muchos detalles y ejemplos en la mayoría de los documentos que tratan el diseño de experimentos; especialmente en agronomía.

A menudo, el investigador no está interesado en el efecto de bloque per se, pero solo quiere dar cuenta de la variabilidad en la respuesta entre bloques. Entonces, uso para ver el bloque como un factor con un rol particular. Es de destacar que el efecto de bloque generalmente se considera como un efecto aleatorio. Finalmente, si espera que el "efecto del tratamiento" difiera de un bloque a otro, entonces se deben considerar las interacciones.

ocram
fuente

7

Aquí hay una paráfrasis de mi explicación favorita, de mi antiguo maestro Freedom King.

Estás estudiando cómo la masa de pan y la temperatura de horneado afectan la sabrosidad del pan. Tienes una escala de calificación para el sabor. Y supongamos que está comprando masa de pan envasada de alguna compañía de alimentos en lugar de mezclarla usted mismo. Cada barra de pan horneada es una unidad experimental.

$n=160$

$2\times2$

Alternativamente, podría tratar el funcionamiento del horno como un factor de bloqueo . En este caso, haría funcionar el horno 40 veces, lo que podría acelerar la recopilación de datos. Cada horno tendría cuatro panes, pero no necesariamente dos de cada tipo de masa. (La proporción exacta se elegiría al azar). Tendría 5 hornos para cada temperatura; Esto podría ayudarlo a tener en cuenta la variabilidad entre los hornos de la misma temperatura.

Incluso más elegante, puede bloquear tanto con masa como con horno. En este diseño, tendría exactamente dos de cada tipo de masa en cada una de las ejecuciones del horno.

Cuando tenga tiempo de pensarlo bien, lo actualizaré aún más con los nombres de fantasía apropiados para esos diseños de experimentos.

Thomas Levine
fuente

2 \times 8

$2 \times 8$

2 \times 2

$2 \times 2$

¿Es este un ejemplo de bloqueo incompleto?

SmallChess

6

Los diseños experimentales son una combinación de tres estructuras:

La estructura del tratamiento: ¿Cómo se forman los tratamientos a partir de factores de interés?
La estructura del diseño: ¿Cómo se agrupan y asignan las unidades experimentales a los tratamientos?
La estructura de respuesta: ¿Cómo se toman las observaciones?

Los bloques son "factores" que pertenecen a la estructura de diseño (para distinguir, no es una mala idea llamarlos "factores de bloqueo" frente a "factores de tratamiento"). Son buenos ejemplos de parámetros molestos : parámetros del modelo que debe tener y cuya presencia debe tener en cuenta, pero cuyos valores no son particularmente interesantes. Tenga en cuenta que esto no tiene nada que ver con la naturaleza de un factor: los factores de bloqueo pueden ser fijos o aleatorios, al igual que los factores de tratamiento pueden ser fijos o aleatorios.

Mi regla de oro personal con respecto a dónde pertenece un factor en un diseño experimental es esta: si quiero estimar los parámetros asociados con el factor y compararlos dentro del factor u otros parámetros del factor, entonces pertenece a la estructura del tratamiento. Si no me importan los valores de los parámetros asociados y no me importa compararlos, el factor pertenece a la estructura de diseño.

Por lo tanto, en el ejemplo del pan en otra parte de este hilo, tengo que preocuparme por las diferencias de ejecución a ejecución. Pero no me importa comparar la ejecución 1 con la ejecución 24. La ejecución del horno pertenece a la estructura de diseño . Me lo quiero comparar las dos recetas de masa: Receta pertenece a la estructura de tratamiento. Me importa la temperatura del horno: eso también pertenece a la estructura del tratamiento. Construyamos un diseño experimental.

La estructura de diseño tiene un factor (funcionamiento del horno, funcionamiento), y la estructura de tratamiento dos factores (receta y temperatura). Debido a que cada ejecución debe ser una temperatura única (nominal), la temperatura y la ejecución deben ocurrir al mismo nivel del diseño experimental. Sin embargo, hay espacio para 4 panes en cada ejecución. Obviamente, podemos elegir hornear 1, 2, 3 o 4 panes por corrida.

Si horneamos una barra por ejecución y aleatorizamos el orden de presentación de la receta, obtenemos una estructura de diseño completamente aleatorio (CRD). Si horneamos dos panes, una de cada receta por ejecución, tenemos una estructura de diseño de bloques completos al azar (RCB). Tenga en cuenta que es importante que cada receta ocurra dentro de cada ejecución. Sin ese equilibrio, las comparaciones de recetas se verán contaminadas por las diferencias de ejecución. Recuerde: el objetivo del bloqueo es deshacerse de las diferencias de ejecución. Si horneamos tres panes por Run, probablemente estaríamos locos: 3 no es un factor de 160, por lo que tendremos uno o dos bloques de diferentes tamaños. La otra posibilidad razonable es cuatro panes por ejecución. En este caso, hornearíamos dos panes de cada receta en cada ejecución. Nuevamente, esta es una Estructura RCB. Podemos estimar la variabilidad dentro de la ejecución usando las diferencias entre los dos panes de cada receta en cada ejecución.

Si elegimos una de las estructuras de diseño de RCB, los efectos de temperatura son completamente aleatorios en el nivel de ejecución. La receta está anidada dentro de la temperatura y tiene una estructura de error diferente a la temperatura, porque cada masa aparece dentro de cada ciclo. Los contrastes que miran la receta y la receta por la no aditividad (interacción) de la masa no tienen variabilidad de ejecución a ejecución. Técnicamente, esto se llama diversamente una estructura de diseño de parcela dividida o una estructura de diseño de medidas repetidas .

¿Cuál usaría el investigador? Probablemente el RCB con cuatro panes: 40 carreras vs 80 vs 160 tiene mucho peso. Sin embargo, esto puede modificarse: si la preocupación son los hornos domésticos en lugar de la producción industrial, puede haber razones para usar el CRD si se cree que los panaderos domésticos raramente hornean múltiples panes.

Dennis
fuente

2

No sigo su análisis del experimento del pan, tal vez porque se mencionaron varios diseños diferentes de ese experimento y usted no especifica a cuál (s) se refiere. Eso hace que la mayoría de sus comentarios sean confusos en lugar de esclarecedores. Si pudieras aclarar esto, creo que tu respuesta se destacaría.

whuber

1

La importancia del # 2 merece ser destacada. El análisis puede llevarse a cabo en función de la asignación aleatoria de tratamientos experimentales: los bloques representan restricciones en esa asignación aleatoria.

Scortchi - Restablece a Monica

1

@whuber Eso es porque no lo estaba analizando, estaba diseñando un experimento a partir de esos parámetros de novo . Aclarado en la edición.

Dennis

3

Creo que la mayoría de las veces es solo una cuestión de convención, probablemente apropiada para cada campo. Creo que en el contexto médico, en dos factores, uno de los factores casi siempre se llama "tratamiento" y el otro "bloqueo".

Por lo general, como dice el ocram, el efecto de bloque será un efecto aleatorio, pero no creo que sea sistemático. Let dice que desea evaluar la efectividad de los diferentes tratamientos médicos:

Primer diseño: cada paciente toma solo un tratamiento, y la eficiencia se mide en una escala adecuada. Sospecha que el sexo del paciente es de interés: tendrá un "bloqueo" de pacientes masculinos y femeninos. En este caso, el bloque es un factor con un efecto fijo.
Segundo diseño: cada paciente prueba todos los tratamientos en diferentes momentos. Como existe cierta variabilidad entre pacientes, considera a cada paciente como un "bloque". Usted está interesado en la existencia de tal variabilidad en la población, pero no en su valor en estos pacientes particulares. En este caso, el bloque es un factor con un efecto aleatorio.

Bueno, solo enseño estas cosas, tratando de seguir las convenciones del dominio (en Francia) tal como las obtuve de los libros de texto, pero nunca participé en un ensayo clínico (y no quiero) ... así que esto es solo mis dos centavos ...!

Elvis
fuente

1

2^{k}

$2^k$

@chl ¡Creo que tienes razón! Solo estaba dando algunos ejemplos muy básicos ...

Elvis

Son buenos (un ejemplo con un experimento de rendimiento / cultivo de la agronomía lo habría hecho aún más claro); Solo estaba señalando que "bloquear" se extiende más allá del concepto de "factor" y la distinción fija versus aleatoria.

chl

@chl, si tienes una buena (y simple) referencia sobre este tipo de cosas, me encantaría leerla (y deberías publicarla como respuesta) ... (¡no se aceptan referencias tan simples también!)

Elvis

¿Te refieres example(aov)al paquete R agricolae ? :-)

chl

¿Qué es un bloque en el diseño experimental?

Respuestas: