La asignación aleatoria es valiosa porque garantiza la independencia del tratamiento de los posibles resultados. Así es como conduce a estimaciones imparciales del efecto promedio del tratamiento. Pero otros esquemas de asignación también pueden garantizar sistemáticamente la independencia del tratamiento de los posibles resultados. Entonces, ¿por qué necesitamos una asignación aleatoria? Dicho de otra manera, ¿cuál es la ventaja de la asignación aleatoria sobre los esquemas de asignación no aleatoria que también conducen a una inferencia imparcial?
Sea un vector de asignaciones de tratamiento en el que cada elemento es 0 (unidad no asignada al tratamiento) o 1 (unidad asignada al tratamiento). En un artículo de JASA , Angrist, Imbens y Rubin (1996, 446-47) dicen que la asignación de tratamiento es aleatoria si \ Pr (\ mathbf {Z} = \ mathbf {c}) = \ Pr (\ mathbf {Z} = \ mathbf {c '}) para todos \ mathbf {c} y \ mathbf {c'} de modo que \ iota ^ T \ mathbf {c} = \ iota ^ T \ mathbf {c '} , donde \ iota es un vector de columna con todos los elementos iguales a 1.c c ′ ι T c = ι T c ′ ι
En palabras, la afirmación es que la asignación es aleatoria si cualquier vector de asignaciones que incluye asignaciones al tratamiento es tan probable como cualquier otro vector que incluya asignaciones al tratamiento.
Pero, para garantizar la independencia de los posibles resultados de la asignación al tratamiento, es suficiente garantizar que cada unidad en el estudio tenga la misma probabilidad de asignación al tratamiento. Y eso puede ocurrir fácilmente incluso si la mayoría de los vectores de asignación de tratamiento tienen probabilidad cero de ser seleccionados. Es decir, puede ocurrir incluso bajo asignación no aleatoria.
Aquí hay un ejemplo. Queremos ejecutar un experimento con cuatro unidades en las que se traten exactamente dos. Hay seis posibles vectores de asignación:
- 1100
- 1010
- 1001
- 0110
- 0101
- 0011
donde el primer dígito en cada número indica si la primera unidad fue tratada, el segundo dígito indica si la segunda unidad fue tratada, y así sucesivamente.
Supongamos que realizamos un experimento en el que excluimos la posibilidad de asignar los vectores 3 y 4, pero en el que cada uno de los otros vectores tiene la misma probabilidad (25%) de ser elegido. Este esquema no es una asignación aleatoria en el sentido de AIR. Pero en expectativa, conduce a una estimación imparcial del efecto promedio del tratamiento. Y eso no es casualidad. Cualquier esquema de asignación que proporcione a los sujetos la misma probabilidad de asignación al tratamiento permitirá una estimación imparcial del ATE.
Entonces: ¿por qué necesitamos una asignación aleatoria en el sentido de AIR? Mi argumento tiene sus raíces en la inferencia de aleatorización; Si se piensa en términos de inferencia basada en modelos, ¿la definición de AIR parece más defendible?
Respuestas:
Esto sigue al comentario de Gung. El efecto global promedio del tratamiento no es el punto.
Suponga que tiene nuevos casos de diabetes en los que el sujeto tiene entre y , y nuevos pacientes con diabetes mayores de . Desea asignar la mitad al tratamiento. ¿Por qué no lanzar una moneda y, en la cara, tratar a todos los pacientes jóvenes, y en las colas, tratar a todos los pacientes mayores? Cada uno tendría un5 15 1000 30 50 % 5001000 5 15 1000 30 50% posibilidad de ser seleccionado para el tratamiento, por lo que esto no sesgaría el resultado promedio del tratamiento, pero arrojaría mucha información. No sería una sorpresa si la diabetes juvenil o los pacientes más jóvenes respondieran mucho mejor o peor que los pacientes mayores con diabetes tipo II o gestacional. El efecto del tratamiento observado puede ser imparcial, pero, por ejemplo, tendría una desviación estándar mucho mayor que la que se produciría mediante una asignación aleatoria, y a pesar de la gran muestra, no podría decir mucho. Si usa una asignación aleatoria, entonces con una alta probabilidad, aproximadamente casos en cada grupo de edad obtendrían el tratamiento, por lo que podría comparar el tratamiento con ningún tratamiento dentro de cada grupo de edad. 500
Es posible que pueda hacerlo mejor que usar una asignación aleatoria. Si observa un factor que cree que podría afectar la respuesta al tratamiento, es posible que desee asegurarse de que los sujetos con ese atributo se dividan de manera más uniforme de lo que ocurriría a través de una asignación aleatoria. La asignación aleatoria le permite hacerlo razonablemente bien con todos los factores simultáneamente, para que pueda analizar muchos patrones posibles después.
fuente
En su ejemplo, también puede dejar 2 y 5 y no contradecirse. A nivel de objeto, todavía hay una probabilidad igual de ser 1 o 0 cuando solo hay una probabilidad de 1: 1 de seleccionar 1 o 6. Pero, ahora, lo que hiciste al eliminar 3 y 4 se vuelve más obvio.
fuente
Aquí hay otra de las variables de acecho o confusión: tiempo (o deriva instrumental, efectos del almacenamiento de muestras, etc.).
Entonces, hay argumentos en contra de la aleatorización (como dice Douglas: puede ser mejor que la aleatorización). Por ejemplo, puede saber de antemano que desea que sus casos se equilibren con el tiempo. Del mismo modo que puede saber de antemano que desea tener un género y una edad equilibrados.
En otras palabras, si desea elegir manualmente uno de sus 6 esquemas, diría que 1100 (o 0011) es una elección decididamente mala . Tenga en cuenta que las primeras posibilidades que descartó son las que están más equilibradas en el tiempo ... Y las peores dos quedan después de que John propuso echar también 2 y 5 (contra las cuales no protestó).
En otras palabras, su intuición de qué esquemas son "agradables" desafortunadamente conduce a un mal diseño experimental (en mi humilde opinión, esto es bastante común; tal vez las cosas ordenadas se vean mejor, y seguramente es más fácil hacer un seguimiento de las secuencias lógicas durante el experimento).
Es posible que pueda hacerlo mejor con esquemas no aleatorios, pero también puede hacerlo mucho peor. En mi humilde opinión, debe poder dar argumentos físicos / químicos / biológicos / médicos / ... para el esquema no aleatorio particular que utiliza, si opta por un esquema no aleatorio.
fuente