Variables estandarizadas VS centradas

11

He encontrado muchas publicaciones útiles sobre variables independientes estandarizadas y variables independientes centradas en stats.stackexchange.com, pero todavía estoy un poco confundido. Le pido una evaluación de lo que he entendido. Además, si lo que sigue no es correcto, ¿podría corregirme?

  1. Cómo estandarizar Las variables estandarizadas se obtienen restando la media de la variable y dividiendo por la desviación estándar de esa misma variable.
  2. Cómo centrar Las variables independientes centradas se obtienen simplemente restando la media de la variable.
  3. El motivo de la estandarización. Usted estandariza las variables para facilitar la interpretación de los coeficientes estimados cuando las variables en su regresión tienen diferentes unidades de medida. Cuando desea estandarizar, debe estandarizar todas las variables en la regresión, lo que implica que no obtendrá una estimación de la constante (es decir, la B0 o la intersección).
  4. La razón para centrarse. Centra las variables si desea obtener una interpretación significativa de la constante estimada. En este caso, puede centrar la cantidad de variables que desea; no necesita centrar todas las variables independientes en el modelo.
  5. La variable independiente, Y. (pregunta simple) ¿Alguna vez centra o estandariza la Y?
  6. Utilización de logaritmo natural. Si una o más de sus variables no están distribuidas normalmente, puede transformarlas usando el logaritmo natural. Solo DESPUÉS de esta transformación, puede estandarizar todas las variables o centrar aquellas que necesita centrar. En general, cualquier transformación de una variable tiene que suceder antes de estandarizar o centrar (aquí hablo del logaritmo natural, pero podría cuadrar una variable o dividir una variable por otra, por ejemplo, población / km2)
  7. Coeficientes de interpretación variables estandarizadas. "Un aumento de 1 desviación estándar en X1 aumentará (o disminuirá) Y en -número-".
  8. Coeficientes de interpretación centrados en variables. Coeficientes de variables aleatorias: "Un aumento en X1 por -número- de su media aumentará (o disminuirá) Y por -número-". Constante: "Representa el valor esperado de Y cuando las variables no centradas son cero y cuando las variables centradas están en su media".
  9. Términos de interacción. La interpretación del coeficiente de un término de interacción no debería ser problemática, ya sea que haya estandarizado sus variables o las haya centrado (ya sea solo una variable de la interacción o ambas). Básicamente, la interpretación es que normalmente le das a un término de interacción (por ejemplo, estás interesado en el efecto de X1 en Y y X1 interactúa con X2, el efecto total de X1 viene dado por su coeficiente + coeff. De la interacción término cuando X2 es fijo), solo recuerde contextualizar la interpretación siguiendo los puntos 7 u 8, dependiendo del tipo de transformación que realizó.
Fuca26
fuente
¿Generalmente desea respuestas prácticas sobre cómo hacerlo o respuestas básicas de base estadística?
rnso
Cuanto más específico, mejor. Por lo tanto, las respuestas que contienen tecnicismos tanto prácticos como estadísticos serían muy apreciadas.
Fuca26

Respuestas:

2
  1. si
  2. si
  3. Se estandarizan las variables para comparar la importancia de las variables independientes en la determinación de las variables de resultado.
  4. Es posible que desee centrar una variable cuando usa un término de interacción; su efecto será significativamente interpretable si el valor mínimo de una de las variables interactuadas no es cero.
  5. Si está regresando diferentes variables de resultado (con diferentes escalas) en el mismo conjunto de variables independientes, puede comparar significativamente los coeficientes estimados.
  6. si
  7. Si.
  8. Si.
  9. Sí, pero ten en cuenta el punto 4.
Fuca26
fuente