¿Cómo se "controla" para un factor / variable?

19

A mi entender, "Control" puede tener dos significados en estadística.

Grupo de control: en un experimento, no se administra ningún tratamiento al miembro del grupo de control. Ej: Placebo vs Drogas: le das drogas a un grupo y no al otro (control), que también se conoce como "experimento controlado".
Control para una variable: técnica para separar el efecto de una variable independiente particular. Algunos de los otros nombres dados a estas técnicas son, "contabilizar", "mantener constante", "controlar", alguna variable. Por ejemplo: en un estudio de visualización de fútbol (me gusta o no me gusta), es posible que desee eliminar el efecto del género, ya que creemos que el género causa un sesgo, es decir, al hombre puede gustarle más que a la mujer.

Entonces, mi pregunta es para el punto (2). Dos preguntas:

¿Cómo "controlas" / "cuentas" variables, en general? ¿Qué técnicas se usan? (En términos de regresión, marco ANOVA).

En el ejemplo anterior, ¿elegir hombre y mujer al azar constituye control? Es decir, ¿es la "aleatoriedad" una de las técnicas para controlar otros efectos?

regression self-study anova experiment-design controlling-for-a-variable leviatán
fuente

3

En términos de regresión y ANOVA, controlar una variable generalmente significa que esa variable se incluyó en el modelo.

Glen

Como dice Glen, incluirlo en el modelo es el camino a seguir. Sin embargo, la aleatorización se usa para evitar el sesgo de los efectos no incluidos en el modelo. Una vez que se genera un diseño, a menudo las personas contrarrestan para asegurarse de cosas como aproximadamente el mismo número de cada género en cada tratamiento. El problema de confiar exclusivamente en la aleatorización y el contrapeso es que convierten ese sesgo en varianza y, por lo tanto, es más difícil observar cuáles de sus factores están activos.

neverKnowsBest

16

Como ya se dijo, controlar generalmente significa incluir una variable en una regresión (como lo señaló @EMS, esto no garantiza ningún éxito en lograr esto, se vincula a esto ). Ya existen algunas preguntas y respuestas muy votadas sobre este tema, tales como:

Las respuestas aceptadas a estas preguntas son todos muy buenos tratamientos de la pregunta que está haciendo dentro de un marco de observación (diría que correlacional), más preguntas de este tipo se pueden encontrar aquí .

Sin embargo, está haciendo su pregunta específicamente dentro de un marco experimental o ANOVA, se pueden dar algunas ideas más sobre este tema.

Dentro de un marco experimental, usted controla una variable aleatorizando individuos (u otras unidades de observación) en las diferentes condiciones experimentales. La suposición subyacente es que, como consecuencia, la única diferencia entre las condiciones es el tratamiento experimental. Cuando se aleatoriza correctamente (es decir, cada individuo tiene la misma posibilidad de estar en cada condición), esta es una suposición razonable. Además, solo la aleatorización le permite extraer inferencias causales de su observación, ya que esta es la única forma de asegurarse de que ningún otro factor sea responsable de sus resultados.

Sin embargo, también puede ser necesario controlar las variables dentro de un marco experimental, es decir, cuando hay otro factor conocido que también afecta a esa variable dependiente. Para mejorar el poder estadístico y puede ser una buena idea controlar esta variable. El procedimiento estadístico habitual utilizado para esto es el análisis de covarianza (ANCOVA), que básicamente solo agrega la variable al modelo.

Ahora viene el quid: para que ANCOVA sea razonable, es absolutamente crucial que la asignación a los grupos sea aleatoria y que la covariable para la que se controla no esté correlacionada con la variable de agrupación.
Desafortunadamente, esto a menudo se ignora, lo que conduce a resultados no interpretables. Miller y Chapman (2001) ofrecen una introducción realmente legible a este problema exacto (es decir, cuándo usar ANCOVA o no ) :

A pesar de los numerosos tratamientos técnicos en muchos lugares, el análisis de covarianza (ANCOVA) sigue siendo un enfoque ampliamente utilizado para tratar las diferencias de grupo sustantivas en covariables potenciales, particularmente en la investigación de psicopatología. Los artículos publicados llegan a conclusiones infundadas, y algunos textos estadísticos descuidan el tema. Se revisa el problema con ANCOVA en tales casos. En muchos casos, no hay forma de lograr el objetivo superficialmente atractivo de "corregir" o "controlar" las diferencias de grupo reales en una covariable potencial. Con la esperanza de reducir el mal uso de ANCOVA y promover el uso apropiado, se proporciona una discusión no técnica, enfatizando una confusión sustantiva rara vez articulada en libros de texto y otras presentaciones generales, para complementar las críticas matemáticas ya disponibles.

Miller, GA y Chapman, JP (2001). Análisis de malentendidos de covarianza. Revista de psicología anormal , 110 (1), 40-48. doi: 10.1037 / 0021-843X.110.1.40

Henrik
fuente

Solo para enfatizar el punto sobre esta pregunta (que se vuelve a preguntar con mucha frecuencia), es bueno considerar que simplemente incluir una variable en un modelo no garantiza que "controle" su efecto, incluso bajo suposiciones extremadamente fuertes sobre la variable relacionado monotónicamente con la variable dependiente. Vea el artículo que está vinculado en mi otro comentario.

ely

1

@EMS Buen punto. Agregué una nota de advertencia y su enlace al comienzo del texto. Siéntase libre de editar mi texto si cree que hay más para agregar.

Henrik

0

Para controlar una variable, uno puede igualar dos grupos en un rasgo relevante y luego comparar la diferencia en el tema que está investigando. Solo puedo explicar esto con un ejemplo, no formalmente, B-school es años atrás, así que ahí.

Si tu dirías:

Brasil es más rico que Suiza porque Brasil tiene un ingreso nacional de 3524 mil millones de dólares y Suiza solo 551 mil millones

sería correcto en términos absolutos, pero cualquier persona mayor de 12 años con un conocimiento pasajero sobre el mundo sospecharía que también hay algo mal con esa declaración.

Sería mejor elevar la población de Suiza a la de Brasil y luego comparar los ingresos nuevamente. Entonces, si la población de Suiza fuera del tamaño de Brasil, sus ingresos serían:

(210 millones / 8,5 millones) * 551 mil millones de dólares = 13612 mil millones de dólares

Esto los hace aproximadamente 4 veces más ricos que Brasil con 3524 mil millones de dólares.

Y sí, también puede adoptar el enfoque per cápita, donde compara los ingresos promedio. Pero con el enfoque anterior, puede aplicarlo varias veces.

Heccate Newb
fuente

1

Parece que está describiendo alguna forma de normalización en lugar de "control" en el sentido que se entiende en la pregunta.

whuber

En realidad, creo que son lo mismo. Si no lo cree así, siéntase libre de explicar la diferencia entre los dos

Heccate Newb

No creo que necesite agregar a las otras respuestas que ya aparecen en este hilo.

whuber

¿Cómo se "controla" para un factor / variable?

Respuestas: