He encontrado muchas publicaciones útiles sobre variables independientes estandarizadas y variables independientes centradas en stats.stackexchange.com, pero todavía estoy un poco confundido. Le pido una evaluación de lo que he entendido. Además, si lo que sigue no es correcto, ¿podría corregirme?
- Cómo estandarizar Las variables estandarizadas se obtienen restando la media de la variable y dividiendo por la desviación estándar de esa misma variable.
- Cómo centrar Las variables independientes centradas se obtienen simplemente restando la media de la variable.
- El motivo de la estandarización. Usted estandariza las variables para facilitar la interpretación de los coeficientes estimados cuando las variables en su regresión tienen diferentes unidades de medida. Cuando desea estandarizar, debe estandarizar todas las variables en la regresión, lo que implica que no obtendrá una estimación de la constante (es decir, la B0 o la intersección).
- La razón para centrarse. Centra las variables si desea obtener una interpretación significativa de la constante estimada. En este caso, puede centrar la cantidad de variables que desea; no necesita centrar todas las variables independientes en el modelo.
- La variable independiente, Y. (pregunta simple) ¿Alguna vez centra o estandariza la Y?
- Utilización de logaritmo natural. Si una o más de sus variables no están distribuidas normalmente, puede transformarlas usando el logaritmo natural. Solo DESPUÉS de esta transformación, puede estandarizar todas las variables o centrar aquellas que necesita centrar. En general, cualquier transformación de una variable tiene que suceder antes de estandarizar o centrar (aquí hablo del logaritmo natural, pero podría cuadrar una variable o dividir una variable por otra, por ejemplo, población / km2)
- Coeficientes de interpretación variables estandarizadas. "Un aumento de 1 desviación estándar en X1 aumentará (o disminuirá) Y en -número-".
- Coeficientes de interpretación centrados en variables. Coeficientes de variables aleatorias: "Un aumento en X1 por -número- de su media aumentará (o disminuirá) Y por -número-". Constante: "Representa el valor esperado de Y cuando las variables no centradas son cero y cuando las variables centradas están en su media".
- Términos de interacción. La interpretación del coeficiente de un término de interacción no debería ser problemática, ya sea que haya estandarizado sus variables o las haya centrado (ya sea solo una variable de la interacción o ambas). Básicamente, la interpretación es que normalmente le das a un término de interacción (por ejemplo, estás interesado en el efecto de X1 en Y y X1 interactúa con X2, el efecto total de X1 viene dado por su coeficiente + coeff. De la interacción término cuando X2 es fijo), solo recuerde contextualizar la interpretación siguiendo los puntos 7 u 8, dependiendo del tipo de transformación que realizó.
Respuestas:
fuente