¿Cómo convertir coeficientes estandarizados a coeficientes no estandarizados?

11

Mi objetivo es utilizar los coeficientes derivados de investigaciones previas sobre el tema para predecir resultados reales dado un conjunto de variables independientes. Sin embargo, el trabajo de investigación enumera los coeficientes Beta y el valor t, solo. Me gustaría saber si es posible convertir los coeficientes estandarizados a los no estandarizados.

¿Sería útil convertir mis variables independientes no estandarizadas en variables estandarizadas para calcular el valor predicho? ¿Cómo volvería a un valor pronosticado no estandarizado (si eso es posible ...)

Fila de muestra agregada del papel:

Número de ruta de autobús (líneas de autobús) | 0,275 (Beta) | 5,70 *** (valor t)

También me dan esto con respecto a las variables independientes:

Número de ruta de autobús (líneas de autobús) | 12,56 (promedio) | 9.02 (estándar) | 1 (min) | 53 (máximo)


fuente
¿Cómo se han estandarizado los coeficientes? En general, los tienen una unidad que es la unidad de dividida por la unidad de , ¿cuál es su unidad en el documento? βYX
gui11aume
1
No estoy seguro de entender tu pregunta. Aquí hay una fila de muestra de una variable independiente después del análisis de regresión del artículo. Características del suministro de tránsito: número de ruta de autobús (líneas de autobús) | 0,275 (Beta) | 5.70 *** (valor t)
El coeficiente en sí no está estandarizado como se menciona en el gui11aume. Pero el estadístico t es el coeficiente estimado dividido por su desviación estándar estimada. Dados t y los grados de libertad, podría calcular el valor p y la desviación estándar estimada porque Beta = valor t x desviación estándar estimada. Pero no estoy seguro de si esto es o no lo que estás buscando. La estimación beta no está estandarizada. La estadística t es la forma estandarizada de la estimación del tiempo. Entonces ya tienes el coeficiente estandarizado.
Michael R. Chernick

Respuestas:

14

Parece que el documento usa un modelo de regresión múltiple en el formulario

Y=β0+iβiξi+ε

donde son versiones estandarizadas de las variables independientes; verbigracia. ,ξi

ξi=ximisi

con la media (como 12.56 en el ejemplo) y la desviación estándar (como 9.02 en el ejemplo) de los valores de la variable variable ('buslines' en el ejemplo). es la intercepción (si está presente). Al conectar esta expresión al modelo ajustado , con sus "betas" escritas como (0.275 en el ejemplo), y hacer algo de álgebra da las estimacionesmisiithxiβ0βi^

Y^=β0^+iβi^ximisi=(β0^(iβimi^si))+i(βi^si)xi.

Esto muestra que los coeficientes de en el modelo (aparte del término constante) se obtienen dividiendo las betas por las desviaciones estándar de las variables independientes y que la intersección se ajusta restando una combinación lineal adecuada de las betas.xi

Esto le ofrece dos formas de predecir un nuevo valor a partir de un vector de valores independientes:(x1,,xp)

  1. Utilizando los medios y las desviaciones estándar como se informa en el documento (¡no recalculado a partir de datos nuevos!), y conéctelos a la fórmula de regresión tal como la dan las betas o, de manera equivalente,misi (ξ1,,ξp)=((x1m1)/s1,,(xpmp)/sp)

  2. Conecte en la fórmula algebraicamente equivalente derivada anteriormente.(x1,,xp)

Si el documento está utilizando un modelo lineal generalizado , es posible que deba seguir este cálculo aplicando la función inversa "enlace" a . Por ejemplo, con la regresión logística sería necesario aplicar la función logística para obtener la probabilidad pronosticada ( es la probabilidad de registro pronosticada).Y^1/(1+exp(Y^))Y^

whuber
fuente
¡Perfecto, gracias! Recibí ayuda de un colega. Sin embargo, una pregunta más: mi nuevo valor (Y-hat) es muy bajo. El autor utiliza una variable dependiente transformada logarítmicamente en su regresión. ¿Eso significa que debería exp (Y-hat) para expandirme de nuevo a la unidad de medida no transformada.
Además, no hay una intersección en Y incluida en el documento, y probar el método exp (Y-hat) parece indicar que debería haber un valor para la intersección en Y que represente parte de la varianza no explicada por el modelo, en orden elevar el resultado previsto a un nivel razonable.
Entonces no son los coeficientes los que están estandarizados. Son las variables.
Michael R. Chernick
1
Michael M, sí, es probablemente lo que quieres y sí, debes averiguar cuál es la intercepción. Es posible que tenga que evitarlo adivinando la intersección y variando hasta que su modelo parezca reproducir gráficos y tablas en el papel con suficiente precisión. exp(y^)
whuber
Si está buscando hacer lo que le pide el título, mire aquí: www3.nd.edu/~rwilliam/stats1/x92.pdf si la y también está estandarizada. Ver también stats.stackexchange.com/questions/235057/…
Chris
1

B=p×sysx
  • x es la variable independiente
  • y es la variable dependiente
  • s es la desviación estándar
  • p es el coeficiente de trayectoria
  • B es el coeficiente de regresión.
lanza
fuente
2
No estoy seguro de qué es un coeficiente de ruta. Parece que tal vez B es un coeficiente de regresión que no sería adimensional. Sería en y unidades por 1 x unidad. Sin embargo, p = B sx / sy donde sx es la desviación estándar estimada en x dividida por la desviación estándar estimada en y y p no tiene dimensión. Representa una correlación estimada entre x e y. Lance, si esto es lo que pretendías, realiza los cambios editando tu publicación.
Michael R. Chernick