Asignación aleatoria: ¿por qué molestarse?

La asignación aleatoria es valiosa porque garantiza la independencia del tratamiento de los posibles resultados. Así es como conduce a estimaciones imparciales del efecto promedio del tratamiento. Pero otros esquemas de asignación también pueden garantizar sistemáticamente la independencia del tratamiento de los posibles resultados. Entonces, ¿por qué necesitamos una asignación aleatoria? Dicho de otra manera, ¿cuál es la ventaja de la asignación aleatoria sobre los esquemas de asignación no aleatoria que también conducen a una inferencia imparcial?

Sea un vector de asignaciones de tratamiento en el que cada elemento es 0 (unidad no asignada al tratamiento) o 1 (unidad asignada al tratamiento). En un artículo de JASA , Angrist, Imbens y Rubin (1996, 446-47) dicen que la asignación de tratamiento es aleatoria si para todos y modo que , donde es un vector de columna con todos los elementos iguales a 1. $\mathbf{Z}$ $Z_i$ $\Pr(\mathbf{Z} = \mathbf{c}) = \Pr(\mathbf{Z} = \mathbf{c'})$ $\mathbf{c}$ $\mathbf{c'}$ $\iota^T\mathbf{c} = \iota^T\mathbf{c'}$ $\iota$

En palabras, la afirmación es que la asignación $Z_i$ es aleatoria si cualquier vector de asignaciones que incluye $m$ asignaciones al tratamiento es tan probable como cualquier otro vector que incluya $m$ asignaciones al tratamiento.

Pero, para garantizar la independencia de los posibles resultados de la asignación al tratamiento, es suficiente garantizar que cada unidad en el estudio tenga la misma probabilidad de asignación al tratamiento. Y eso puede ocurrir fácilmente incluso si la mayoría de los vectores de asignación de tratamiento tienen probabilidad cero de ser seleccionados. Es decir, puede ocurrir incluso bajo asignación no aleatoria.

Aquí hay un ejemplo. Queremos ejecutar un experimento con cuatro unidades en las que se traten exactamente dos. Hay seis posibles vectores de asignación:

1100
1010
1001
0110
0101
0011

donde el primer dígito en cada número indica si la primera unidad fue tratada, el segundo dígito indica si la segunda unidad fue tratada, y así sucesivamente.

Supongamos que realizamos un experimento en el que excluimos la posibilidad de asignar los vectores 3 y 4, pero en el que cada uno de los otros vectores tiene la misma probabilidad (25%) de ser elegido. Este esquema no es una asignación aleatoria en el sentido de AIR. Pero en expectativa, conduce a una estimación imparcial del efecto promedio del tratamiento. Y eso no es casualidad. Cualquier esquema de asignación que proporcione a los sujetos la misma probabilidad de asignación al tratamiento permitirá una estimación imparcial del ATE.

Entonces: ¿por qué necesitamos una asignación aleatoria en el sentido de AIR? Mi argumento tiene sus raíces en la inferencia de aleatorización; Si se piensa en términos de inferencia basada en modelos, ¿la definición de AIR parece más defendible?

econometrics experiment-design causality instrumental-variables random-allocation usuario697473
fuente

No he leído Angrist et al., Así que tal vez me estoy perdiendo algo, pero tengo una objeción con tu fraseo. No utilizamos asignaciones aleatorias para asegurar que el tratamiento sea independiente de los posibles resultados. Si el tratamiento es independiente de los resultados en un experimento verdadero depende de si existe una conexión causal directa entre el tratamiento y el resultado. Más bien, la asignación aleatoria asegura que el tratamiento es independiente de las variables al acecho (o posibles factores de confusión). Es posible que el resultado haya sido causado por algo diferente al tratamiento que esperamos excluir.

gung - Restablecer Monica

@gung, creo que estás combinando "resultados potenciales" y "resultados". Es cierto que la asignación aleatoria no garantiza la independencia del tratamiento de los resultados (es decir, de los resultados observados). Pero los resultados potenciales no son los mismos que los observados, y la asignación aleatoria garantiza la independencia del tratamiento de los resultados potenciales. No editaré la publicación original para ampliar este punto; hacerlo me llevaría demasiado lejos del tema principal. Pero en.wikipedia.org/wiki/Rubin_causal_model puede ser útil en este punto.

user697473

"[Para] garantizar la independencia de los posibles resultados de la asignación al tratamiento, es suficiente garantizar que cada unidad en el estudio tenga la misma probabilidad de asignación al tratamiento". Esto es incorrecto. Suponga que ha inscrito hombres y mujeres en un estudio. Lanza una moneda justa: si sale cara, asigna todas las hembras al grupo de tratamiento (y todos los machos al grupo de control); Si las colas, todos los machos estarán en el grupo de tratamiento y todas las hembras en el grupo de control. Cada sujeto (obviamente) tiene un 50% de posibilidades de asignación al grupo de tratamiento, pero el tratamiento se confunde completamente con el género.

x

$x$

x

$x$

whuber

@whuber, tu comentario no suena correcto. Para ver por qué, supongamos que = 1. Los posibles resultados del hombre son Y (1) = 1 e Y (0) = 0. (Es decir, = 1 si el hombre recibe tratamiento, 0 si no). Para la mujer, los resultados potenciales son Y (1) = -1 e Y (0) = 2. (Los resultados potenciales particulares no importan mucho, pero los enteros pequeños mantienen las cosas simples). Entonces E [Y (1) | Z] = E [Y (1)] = 0. Igualdades similares se mantienen para E [Y (0)]. En términos más generales, su mecanismo de asignación no se confunde con el género, y producirá una estimación imparcial de ATE. Si no estoy entendiendo algo, hágamelo saber.

x

$x$

Y_{m}

$Y_m$

user697473

¡Claro, la estimación es "imparcial" en el mismo sentido que un reloj parado da una estimación imparcial de la hora! En realidad, es peor que eso: este método de selección aleatoria produce resultados que no se pueden atribuir al tratamiento, ya que también se pueden atribuir al género. Eso es lo que significa confusión. Enfocarse en obtener resultados imparciales mientras se destruye toda la información útil en el experimento es la proverbial

expulsión

Respuestas:

Esto sigue al comentario de Gung. El efecto global promedio del tratamiento no es el punto.

Suponga que tiene nuevos casos de diabetes en los que el sujeto tiene entre y , y nuevos pacientes con diabetes mayores de . Desea asignar la mitad al tratamiento. ¿Por qué no lanzar una moneda y, en la cara, tratar a todos los pacientes jóvenes, y en las colas, tratar a todos los pacientes mayores? Cada uno tendría un $1000$ $5$ $15$ $1000$ $30$ $50\%$ posibilidad de ser seleccionado para el tratamiento, por lo que esto no sesgaría el resultado promedio del tratamiento, pero arrojaría mucha información. No sería una sorpresa si la diabetes juvenil o los pacientes más jóvenes respondieran mucho mejor o peor que los pacientes mayores con diabetes tipo II o gestacional. El efecto del tratamiento observado puede ser imparcial, pero, por ejemplo, tendría una desviación estándar mucho mayor que la que se produciría mediante una asignación aleatoria, y a pesar de la gran muestra, no podría decir mucho. Si usa una asignación aleatoria, entonces con una alta probabilidad, aproximadamente casos en cada grupo de edad obtendrían el tratamiento, por lo que podría comparar el tratamiento con ningún tratamiento dentro de cada grupo de edad. $500$

Es posible que pueda hacerlo mejor que usar una asignación aleatoria. Si observa un factor que cree que podría afectar la respuesta al tratamiento, es posible que desee asegurarse de que los sujetos con ese atributo se dividan de manera más uniforme de lo que ocurriría a través de una asignación aleatoria. La asignación aleatoria le permite hacerlo razonablemente bien con todos los factores simultáneamente, para que pueda analizar muchos patrones posibles después.

Douglas Zare
fuente

Gracias Douglas. Esta respuesta tiene sentido para mí. Para el registro, no tenía en mente nada tan extremo como su ejemplo o el ejemplo de @ whuber anterior. Estaba pensando en lugar de casos en los que eliminamos de la consideración solo unos pocos vectores de tratamiento. (Considere un caso en el que un cliente dice "puede tratar a esta persona o a esa, pero no a ambas"). Pero creo que sus puntos generales son válidos incluso para los casos más leves que tengo en mente.

user697473

Creo que si solo elimina unos pocos vectores, entonces no cambia la cantidad de información que puede extraer por mucho. Cuantificar esto con precisión puede ser complicado: existen límites ingenuos que probablemente sean demasiado pesimistas.

Douglas Zare

@DouglasZare Tengo una pregunta sobre tu ejemplo extremo. Creo que el objetivo es encontrar si el tratamiento es efectivo para la población que tiene pacientes jóvenes y viejos. Luego, su método generará dos muestras que no pueden considerarse como la muestra representativa de la distribución de resultado potencial donde todas las personas toman el tratamiento y la distribución de resultado potencial donde todas las personas toman el control. Entonces, su efecto de tratamiento observado es parcial

F_{t}

$F_t$

F_{c}

$F_c$

KevinKim

En su ejemplo, también puede dejar 2 y 5 y no contradecirse. A nivel de objeto, todavía hay una probabilidad igual de ser 1 o 0 cuando solo hay una probabilidad de 1: 1 de seleccionar 1 o 6. Pero, ahora, lo que hiciste al eliminar 3 y 4 se vuelve más obvio.

Juan
fuente

Gracias John Sí, estás en lo correcto. Parece que podemos eliminar tantos vectores de asignación de tratamiento como queramos, en cualquier combinación, siempre que usemos los vectores restantes de una manera que proporcione a cada unidad la misma probabilidad de asignación al tratamiento.

user697473

No creo que entiendas lo que digo. Lo que he presentado es el caso ad absurdum de su argumento que argumenta en contra.

John

Su ejemplo es extremo, pero no veo nada absurdo al respecto. Es una demostración válida del punto: los esquemas de asignación no aleatoria (como usar solo los vectores 1 y 6) pueden conducir directamente a una estimación imparcial del efecto promedio del tratamiento. De ello se deduce que no necesitamos una asignación aleatoria para obtener estimaciones ATE imparciales. Por supuesto, todavía puede haber razones por las cuales es malo eliminar los vectores 2 a 5. (Ver el comentario de Douglas Zare arriba ). Todavía no he pensado en estas razones.

user697473

Debieras. Es por eso que no puedes eliminarlos.

John

Aquí hay otra de las variables de acecho o confusión: tiempo (o deriva instrumental, efectos del almacenamiento de muestras, etc.).
Entonces, hay argumentos en contra de la aleatorización (como dice Douglas: puede ser mejor que la aleatorización). Por ejemplo, puede saber de antemano que desea que sus casos se equilibren con el tiempo. Del mismo modo que puede saber de antemano que desea tener un género y una edad equilibrados.

En otras palabras, si desea elegir manualmente uno de sus 6 esquemas, diría que 1100 (o 0011) es una elección decididamente mala . Tenga en cuenta que las primeras posibilidades que descartó son las que están más equilibradas en el tiempo ... Y las peores dos quedan después de que John propuso echar también 2 y 5 (contra las cuales no protestó).
En otras palabras, su intuición de qué esquemas son "agradables" desafortunadamente conduce a un mal diseño experimental (en mi humilde opinión, esto es bastante común; tal vez las cosas ordenadas se vean mejor, y seguramente es más fácil hacer un seguimiento de las secuencias lógicas durante el experimento).

Es posible que pueda hacerlo mejor con esquemas no aleatorios, pero también puede hacerlo mucho peor. En mi humilde opinión, debe poder dar argumentos físicos / químicos / biológicos / médicos / ... para el esquema no aleatorio particular que utiliza, si opta por un esquema no aleatorio.

cbeleites descontentos con SX
fuente