¿Es válido incluir una medida de referencia como variable de control cuando se prueba el efecto de una variable independiente en los puntajes de cambio?

38

Estoy intentando ejecutar una regresión de OLS:

  • DV: cambio de peso durante un año (peso inicial - peso final)

  • IV: Si haces ejercicio o no.

Sin embargo, parece razonable que las personas más pesadas pierdan más peso por unidad de ejercicio que las personas más delgadas. Por lo tanto, quería incluir una variable de control:

  • CV: peso inicial inicial.

Sin embargo, ahora se usa el peso inicial AMBOS para calcular la variable dependiente Y como una variable de control.

¿Esta bien? ¿Esto viola una suposición de OLS?

ChrisStata
fuente
44
¿Se asignó el tratamiento al azar?
Andy W
1
Tenga en cuenta que recientemente también se solicitó otra muy similar, stats.stackexchange.com/q/15104/1036 . La respuesta a esa pregunta es aplicable a esta pregunta (de hecho, diría que son preguntas duplicadas).
Andy W
3
@Andy En realidad, las dos preguntas son lo suficientemente diferentes como para dar una respuesta diferente a esta a la otra. Charlie ya ha dado un buen análisis aquí.
whuber
3
Tenga en cuenta que el uso de puntajes de diferencia generalmente se asocia con una reducción sustancial en la confiabilidad, aunque esto es algo debatido
Behacad

Respuestas:

25

Para responder a su pregunta literal, "¿Es válido incluir una medida de referencia como variable de control cuando se prueba el efecto de una variable independiente en los puntajes de cambio?", La respuesta es no . La respuesta es no, porque por construcción el puntaje de referencia se correlaciona con el término de error cuando el puntaje de cambio se usa como la variable dependiente, por lo tanto, el efecto estimado de la línea de base sobre el puntaje de cambio no se puede interpretar.

Utilizando

  • como el peso inicialY1
  • como peso finalY2
  • como el cambio de peso (es decir, Δ Y = Y 2 - Y 1 )ΔYΔY=Y2Y1
  • como untratamientoasignado al azar, yT
  • como otros factores exógenos que afectan el peso (por ejemplo, otras variables de control que están relacionadas con el resultado pero que no deberían estar correlacionadas con el tratamiento debido a la asignación aleatoria)X

Uno tiene un modelo que regresa en T y X ;ΔYTX

ΔY=β1T+β2X+mi

Que por definición es equivalente a;

Y2-Y1=β1T+β2X+mi

Ahora, si se incluye la línea de base como covariable, uno debe ver a un problema, ya que usted tiene la plazo en ambos lados de la ecuación. Esto muestra que β 3 Y 1 no se puede interpretar, porque está inherentemente correlacionado con el término de error.Y1β3Y1

Y2-Y1=β1T+β2X+β3Y1+miY2=β1T+β2X+β3Y1+(mi+Y1)

Ahora, parte de la confusión en las diversas respuestas parece derivarse del hecho de que diferentes modelos arrojarán resultados idénticos para el efecto del tratamiento , en mi formulación anterior. Entonces, si uno comparara el efecto del tratamiento para el modelo usando puntajes de cambio como la variable dependiente al modelo usando los "niveles" (con cada modelo incluyendo la línea de base Y 1 como covariable), la interpretación del efecto del tratamiento sería lo mismo. En los dos modelos que siguen a β 1 T será el mismo, y también lo serán las inferencias basadas en ellos (Bruce Weaver tiene publicado un código SPSS que demuestra la equivalencia también).β1TY1β1T

dohunanortesolmi Sdoormi METROoremil:Y2-Y1=β1T+β2X+β3Y1+miLmivmils METROoremil:Y2=β1T+β2X+β3Y1+mi

Entonces algunos discutirán (como Felix lo ha hecho en este hilo, y como Bruce Weaver ha hecho en algunas discusiones sobre el grupo de Google SPSS) que dado que los modelos producen el mismo efecto de tratamiento estimado, no importa cuál elija. No estoy de acuerdo, ya que la covariable de línea de base en el modelo de puntuación de cambio no puede interpretarse, nunca debe incluir la línea de base como una covariable (independientemente de si el efecto del tratamiento estimado es el mismo o no). Entonces, esto plantea otra pregunta, ¿cuál es el punto de usar los puntajes de cambio como variables dependientes? Como Felix también señaló, el modelo que usa la puntuación de cambio como la variable dependiente excluyendo la línea de base como covariable es diferente al modelo que usa los niveles. Para aclarar, los modelos posteriores darán diferentes efectos de tratamiento (especialmente en el caso de que el tratamiento esté correlacionado con la línea de base);

Change Score Model Without Baseline:Y2Y1=β1T+β2X+eLevels Model:Y2=β1T+β2X+β3Y1+e

Esto se ha señalado en la literatura anterior como "La paradoja del Señor". Entonces, ¿qué modelo es el correcto? Bueno, en el caso de los experimentos aleatorios, yo diría que el modelo de Niveles es preferible (aunque si hiciste un buen trabajo al azar, el efecto del tratamiento promedio debería ser muy cercano entre los modelos). Otros han notado las razones por las cuales es preferible el modelo de niveles, la respuesta de Charlie hace un buen punto en que puede estimar los efectos de interacción con la línea de base en el modelo de niveles (pero no puede hacerlo en el modelo de puntaje de cambio). Whuber en esta respuesta a una pregunta muy similar demuestra cómo las puntuaciones de cambio inducen correlaciones entre los diferentes tratamientos.

En situaciones en las que el tratamiento no se asigna al azar, se debe considerar más el modelo que usa puntajes de cambio como variable dependiente. El principal beneficio del modelo de puntuación de cambio es que en cualquier momento se controlan los predictores invariantes del resultado. Entonces, digamos en la formulación anterior, es constante a lo largo del tiempo (por ejemplo, digamos una predisposición genética a tener cierto peso), y que X está correlacionado con si un individuo elige hacer ejercicio (y X no se observa). En ese caso, el modelo de puntuación de cambio es preferible. También en los casos en que la selección en el tratamiento se correlaciona con el valor de referencia, el modelo de puntuación de cambio puede ser preferible. Paul Allison en su periódico,XXXCambiar las puntuaciones como variables dependientes en el análisis de regresión , da estos mismos ejemplos (e influyó en gran medida en mi perspectiva sobre el tema, por lo que sugiero leerlo).

Esto no quiere decir que las puntuaciones de cambio siempre sean preferibles en entornos no aleatorios. En el caso de que espere que la línea de base tenga un efecto causal real en el peso posterior, debe usar el modelo de niveles. En el caso de que espere que la línea base tenga un efecto causal, y la selección en el tratamiento esté correlacionada con la línea base, el efecto del tratamiento se confunde con el efecto base.

He ignorado la nota de Charlie de que el logaritmo del peso podría usarse como la variable dependiente. Si bien no dudo que podría ser una posibilidad, es algo no sequitur a la pregunta inicial. Otra pregunta se ha discutido cuando es apropiado usar los logaritmos de la variable (y todavía se aplican en este caso). Probablemente hay literatura previa sobre el tema que podría ayudarlo a guiarlo sobre si también es apropiado usar el peso registrado.


Citación

Allison, Paul D. 1990. Cambie los puntajes como variables dependientes en el análisis de regresión . Metodología Sociológica 20: 93-114. Versión PDF pública .

Andy W
fuente
3
En la ecuación si, como es práctica habitual, suponemos que todas las covariables no son variables aleatorias, entonces Y 1 no está correlacionado con e + Y 1 . Por lo tanto, creo que solo hay un problema si ves Y 1 como aleatorio, en cuyo caso (nuevamente solo mi opinión) debes modelar ( Y 1 , Y 2 )Y2=β1T+β2X+β3Y1+(e+Y1)Y1e+Y1Y1(Y1,Y2)conjuntamente pero sin como covariable. A este respecto, sin datos faltantes, he sido informado de que este enfoque es equivalente a que Y 1 sea ​​una covariable fija (intentaré encontrar algunas referencias para esto). Y1Y1
dandar
1
@dandar, esa declaración no tiene sentido para mí. Tenga en cuenta que Y1 es el valor de pretratamiento del resultado , no es la variable que se manipula en un experimento. ¿Está diciendo que si tengo el valor de línea de base de , entonces realizo un experimento y luego mido Y 2 , debería modelar tanto Y 1 como Y 2 en función de la intervención experimental? Y1Y2Y1Y2
Andy W
1
El modelo del que estoy hablando implica que es una función del tratamiento, pero solo desde el punto de vista de que, a pesar de la aleatorización, siempre habrá ligeras diferencias entre el grupo de tratamiento y control con respecto a sus medias iniciales. Por lo tanto, β 1 capturará esta diferencia, así como el efecto del tratamiento. La referencia para esto es ("Análisis de datos longitudinales de respuestas continuas y discretas para diseños pre-post" por Zeger y Liang, 2000). Y1β1
dandar
1
Se puede encontrar una discusión clara de este documento en ("¿Debe la línea de base ser una variable covariable o dependiente en los análisis de cambio desde la línea de base en los ensayos clínicos?" Por Liu, Mogg, Mallick y Mehrotra 2009). Se refieren a este modelo como un modelo incondicional (es decir, no condiciona la respuesta inicial). En el artículo de Liu (2009) discuten los principales resultados del artículo de Zeger (2000). En primer lugar, sin que falten datos, las estimaciones puntuales de del modelo incondicional son las mismas que las del enfoque condicional de ANCOVA utilizando la línea de base B1
posterior
1
medición como respuesta y condicionamiento en un valor de referencia fijo, y en segundo lugar que la varianza de estimación puntual del modelo ANCOVA es siempre mayor o igual que la del modelo incondicional. Resulta que esta diferencia de varianza suele ser pequeña debido a la aleatorización, lo que garantiza que las respuestas medias de referencia entre los grupos son pequeñas. Los autores concluyen que el modelo incondicional es apropiado para modelar la línea de base como una variable aleatoria, pero ANCOVA, según corresponda, al verlo como fijo.
dandar
21

La respuesta de Andy parece ser la visión del economista de las cosas. Es una práctica aceptada en los ensayos clínicos ajustar casi siempre la versión inicial de la variable de respuesta, para aumentar en gran medida la potencia. Dado que condicionamos las variables de línea de base, no existe un 'término de error' para que puedan confundirse con el término de error general. El único problema sería si los errores de medición en la covariable de línea de base se confunden con otra X, distorsionando el efecto de esa otra X. El método general preferido es ajustar la línea de base y modelar la variable de respuesta, no calcular el cambio. Una razón para esto es que el cambio depende en gran medida de que la transformación de Y sea correcta, y ese cambio no se aplica a los modelos de regresión en general. Por ejemplo, si Y es ordinal, la diferencia entre dos variables ordinales ya no es ordinal.

Frank Harrell
fuente
1
No entiendo completamente esta respuesta. ¿Qué quieres decir con "ajustar para la línea de base"? ¿Tomar la diferencia o controlarla?
Henrik
3
Por 'ajustar para línea de base' me refería a incluir la línea de base como una covariable. También es común usar puntajes de cambio, pero no puede usarlos sin ajustar también la línea de base como covariable (¿por qué molestarse con los puntajes de cambio?).
Frank Harrell
66
En realidad, nada de lo que diga aquí (o en respuesta a los comentarios de Félix) entra directamente en conflicto con lo que digo. El uso de puntajes de cambio no 'se ajusta a la línea de base', controla en cualquier momento las variables omitidas invariantes (o si la selección en el tratamiento está altamente correlacionada con la línea de base). Si la línea de base no es despreciable (es decir, tiene un efecto causal directo en el resultado o tiene una interacción con el tratamiento), las puntuaciones de cambio no resuelven el problema.
Andy W
2
@ Frank Harrell Gracias por unirse a esta discusión y aclarar esto. (+1)
Henrik
8

Podemos alterar ligeramente el razonamiento de @ ocram para tener

E[w1w0X,w0]=β0+xβ+w0γE[w1X,w0]=β0+xβ+w0(γ+1)

Entonces, si este es el modelo correcto , decir que la diferencia depende del peso implica que el valor final depende del valor inicial con un coeficiente que podría ser cualquier cosa. Ejecutar una regresión de la diferencia en y w 0 o el peso final en las mismas variables debería darle los mismos coeficientes en todo menos en w 0 . Pero, si este modelo no es exactamente correcto, estas regresiones también darán resultados diferentes en los otros coeficientes.xw0w0

Tenga en cuenta que esta configuración implica que el peso inicial predice la diferencia en los pesos, no el impacto del tratamiento . Esto requeriría un término de interacción, tal vez

E[w1w0X,w0]=β0+(xw0)β+w0γ.

Otro enfoque sería calcular

log(w1)log(w0)r;
aquí, es la tasa de crecimiento del peso. Este podría ser tu resultado. Tus coeficientes en xrxte diría cómo se relacionan estos predictores con los cambios de proporción en el peso. Esto "controla" el peso inicial al decir que, por ejemplo, un régimen de ejercicio que reduce el peso en un 10% (un coeficiente de 0.1 multiplicado por el 100%) para alguien que pesa 130 libras reduce el peso en 13 libras, mientras que el programa reduce el peso de un participante de 200 libras por 20 libras. En este caso, es posible que no necesite incluir el peso inicial (o su registro) en el lado derecho.

Aún puede ser necesario un término de interacción si cree que el impacto del programa depende del peso inicial. Si usa en el término de interacción, entonces el programa estaría asociado con un cambio de w 0 β 1 en la tasa de crecimiento del peso. Cada libra más pesada que una persona era al comienzo del programa conduce a unaw0w0β1 aumento en el cambio en la tasa de crecimiento (esto es el derivado transversal parcial del valor esperado con respecto tanto al tratamiento y el peso de partida).β1

Si usa en el término de interacción, el impacto del programa aumenta en β 1 /log(w0) por cada libra adicional más pesada que el participante tenía al comienzo del programa.β1/w0

Como puede ver, los parciales cruzados en términos de interacción pueden ser un poco difíciles de interpretar, pero pueden capturar un impacto que le interesa.

Charlie
fuente
Hola Charlie, veo la ventaja de usar el cambio de proporción, sin embargo, ¿por qué encuentras la diferencia en las variables registradas en lugar de simplemente dividir w1 sobre w0?
ChrisStata
Me gusta la idea del cambio proporcional. Sin embargo, la pregunta sigue siendo si la interacción esperada es literalmente proporcional o no. De lo contrario, aún necesitaría incluir el peso inicial como una covariable. ¿O estaría seguro de que es de la misma dificultad perder el 10% de su peso para una persona de 100 o 200 libras?
Henrik
@ChrisStata, tú también puedes hacer eso. Soy economista y nos encantan nuestros registros (y las diferencias también). Si tuviera una serie temporal (es decir, múltiples observaciones) para cada persona (haciendo un conjunto de datos de panel), podría argumentar que mi camino es mejor, pero eso no es relevante aquí. Henrik, tienes razón; Agregué un poco sobre eso a mi respuesta.
Charlie
8

EDITAR: El argumento de Andy W me convenció de abandonar el Modelo C. Agregué otra posibilidad: analizar el cambio con modelos de coeficiente aleatorio (también conocidos como modelos multinivel o modelos de efectos mixtos

Ha habido mucho debate científico sobre el uso de puntajes de diferencia. Mis textos favoritos son Rogosa (1982, [1]) y Fitzmaurice, Laird y Ware (2004, [2])

En general, tiene tres posibilidades de analizar sus datos:

  • A) Solo tome el puntaje de diferencia interindividual (el puntaje de cambio)
  • B) Tratar la medición posterior como DV y controlarla para la línea de base
  • C) Tome el puntaje de diferencia como DV y contrólelo para la línea de base (ese es el modelo que sugirió). Debido a los argumentos de Andy W, descarté esta alternativa
  • D) Utilizando un enfoque multinivel / modelo de efectos mixtos, donde la línea de regresión se modela para cada participante y el participante se trata como unidades de Nivel 2.

Los modelos A y B pueden producir resultados muy diferentes si la línea de base se correlaciona con la puntuación de cambio (por ejemplo, las personas más pesadas tienen más pérdida de peso), y / o la asignación del tratamiento se correlaciona con la línea de base.

Si desea saber más sobre estos temas, consulte los documentos citados, o aquí y aquí .

También ha habido un reciente estudio de simulación [3] que compara empíricamente las condiciones bajo las cuales A o B son preferibles.

Para diseños completamente equilibrados sin valores faltantes, el Modelo D debería ser equivalente al Modelo A. Sin embargo, le brinda más información sobre la variabilidad entre personas, se extiende fácilmente a más puntos de medición y tiene buenas propiedades en presencia de datos no balanceados y / o valores faltantes.

Como conclusión: en su caso, analizaría las medidas posteriores controladas para la línea de base (Modelo B).

[1] Rogosa, D., Brandt, D. y Zimowski, M. (1982). Un enfoque de curva de crecimiento para la medición del cambio. Boletín psicológico, 92, 726-748.

[2] Fitzmaurice, GM, Laird, NM y Ware, JH (2004). Análisis longitudinal aplicado. Hoboken, Nueva Jersey: Wiley.

[3] Petscher, Y. y Schatschneider, C., 2011. Un estudio de simulación sobre el rendimiento de las puntuaciones ajustadas por covarianza y diferencia simple en diseños experimentales aleatorizados. Journal of Educational Measurement, 48, 31-43.

Felix S
fuente
He rechazado esta respuesta, y puedes ver mi respuesta a por qué creo que los puntajes de cambio con la línea de base como covariable no deberían hacerse. En resumen, aunque los Modelos B y C en su formulación producen efectos de tratamiento equivalentes, no significa que el Modelo C sea preferible. De hecho, el efecto de la línea de base en el Modelo C es ininterpretable, por lo que sostengo que no debe usarse.
Andy W
@AndyW: Tu argumento me convenció; Aunque la estimación más relevante del efecto del tratamiento es la misma en ambos modelos, se debe preferir el Modelo B sobre el Modelo C. Ajusté mi respuesta en consecuencia. Pero, ¿qué le dices Laird, N. (1983). Further Comparative Analyses of Pretest-Posttest Research Designs. The American Statistician, 37, 329-330.?, ¿quién muestra una equivalencia de B y C?
Felix S
I don't think anything I said conflicts with the Laird article. Basically all my rant was that (in Laird's notation) b¯ is uninterpretable, so why report it (the equivalence was not in question). Laird does make other comments about how the baseline covariate effect may be interpreted as a hypothesis of if individual treatment groups do not change (although still is critical of it). Feel free to counter my point with situations in which b¯ is useful (it most certainly isn't useful in the normal ways we interpret regression coefficients).
Andy W
Un punto para el modelo D. Me pregunto por qué no considerar solo el modelo D. Es el más consistente (el valor de referencia es una variable aleatoria y no se ha obligado a una variable dependiente), es simple, muy flexible (la interacción puede ser agregado) y entrega también la desviación estándar de la población.
giordano
3

Glymour y col. (2005) abordaron mediante el ajuste de la línea de base al analizar una puntuación de cambio. Si el cambio en el estado de salud precedió a la evaluación inicial o existe un gran error de medición en la variable dependiente, encuentran que puede surgir un sesgo si el modelo de regresión que usa la puntuación de cambio como variable dependiente incluye una covariable inicial. La respuesta de Frank Harrell "El único problema sería si los errores de medición en la covariable basal se confunden con otra X, distorsionando el efecto de esa otra X". puede estar reflejando el mismo sesgo que las direcciones de Glymour.

Glymour (2005) "¿Cuándo es útil el ajuste de la línea de base en el análisis del cambio? Un ejemplo con educación y cambio cognitivo. American Journal of Epidemiology 162: 267-278

David Svendsgaard
fuente
1

Ocram no es correcto. La diferencia en los pesos no tiene en cuenta el peso inicial. Específicamente, el peso inicial se saca al restarle el peso final.

Por lo tanto, diría que no viola ninguna suposición si controla el peso inicial.

(La misma lógica se aplica si toma la diferencia del IMC y el IMC inicial).


Actualización
Después de que el crítico de Andy W me dejara ser más formal sobre por qué tengo razón y Ocram está equivocado (al menos desde mi punto).

Hay un nivel absoluto de peso que tiene cada persona (por ejemplo, alrededor de 100 libras en lugar de 200 libras). DejarunawSea este peso absoluto.
Entonces, el peso inicial se puede formalizar comoyow=unaw y el peso final como miw=unaw+Δw

The dv the OP wants to use is thus Δw=iwew=awaw+Δw=Δw

In other words, the absolute level of weight (formalized as aw) drops out from the equation representing the dv and, hence, does not contaminate it (which disagrees with Andy W's claim).

If you want to take it into account you need to incorporate it into your model separately (as an ordinary parameter and/or as an interaction term).

Obviosuly this same logic applies to ΔBMJ y puede acomodarse fácilmente a proporciones donde uno diría, por ejemplo: miw=unawpagsropagsΔw

Henrik
fuente
Cuando dije que la diferencia tiene en cuenta el peso inicial, esto es lo que realmente quise decir. Ahora, específicamente, ¿qué escribirías? peso final - peso inicial = ...?
ocram
Como escribí, su argumentación me parece falsa. Yo diría que, de hecho, el peso final toma el peso inicial más en cuenta, ya que es en el mismo "escala", mientras que el diffeence se "reajustarán" (como el peso final, por lo tanto alguna absoluta valor se resta de anoher absoulte valor.
Henrik
(-1) Esto no es correcto. En general, no debe incluir la misma variable tanto en el lado derecho como en el lado izquierdo de la ecuación (ya que da como resultado que la variable independiente esté correlacionada con el término de error). Entonces, si usa diferencias para la variable dependiente, no debe incluir la línea base como una covariable.
Andy W
@Andy W: I know that your argument is in principal correct. But my argument is that you kind of partial out the absolute value (by subtracting te end value with the baseline) thereby eliminating this correlation. Hence, adding it as a covariate does not inroduce that kind of spurious error correlation.
Henrik
@Henrik, see my response to this question, and why I still believe this sentiment is misguided.
Andy W
0

Observe that

end weightinitial weightY=β0+βTx

is equivalent to

end weight=initial weight+β0+βTx

En palabras, usar el cambio de peso (en lugar del peso final en sí) como DV ya representa el peso inicial.

ocram
fuente
1
Pero supongo que podría haber una interacción entre el peso inicial y la pérdida de peso dado el entrenamiento. Digamos que un adulto de 1,90 m de altura y 70 kg de masa corporal y un adulto de 1,60 m de altura y 90 kg de masa corporal participan en los mismos ejercicios de entrenamiento. Apuesto a que este último pierde más peso. En un segundo pensamiento: tal vez el índice de masa corporal es un CV mejor que solo el peso.
xmjx
1
@xmjx: Si cree que el peso inicial afectará al peso final, y probablemente tenga razón, entonces es una buena idea presentarlo como un desplazamiento en el modelo como se hace aquí ...
ocram
3
No es correcto en general. Si la pendiente del peso inicial no es 1.0, entonces el análisis del cambio no será equivalente al análisis del peso final a menos que el peso inicial esté en ambos modelos y esté utilizando una regresión ordinaria. Si el peso inicial está en dos lugares, el modelo es en realidad más difícil de explicar, por lo que las razones para persistir con este enfoque no están claras.
Frank Harrell