Regresión lineal multivariante versus varios modelos de regresión univariante

11

En la configuración de regresión univariante, intentamos modelar

y=Xβ+noise

donde un vector de n observaciones y X R n × m la matriz de diseño con m predictores. La solución es β 0 = ( X T X ) - 1 X y .yRnnXRn×mmβ0=(XTX)1Xy

En la configuración de regresión multivariante, intentamos modelar

Y=Xβ+noise

donde es una matriz de n observaciones y p diferentes variables latentes. La solución es β 0 = ( X T X ) - 1 X Y .yRn×pnpβ0=(XTX)1XY

Mi pregunta es ¿cómo es tan diferente a la realización de diferente de regresión lineal univariante? Leí aquí que en el último caso tomamos en consideración la correlación entre las variables dependientes, pero no la veo desde las matemáticas.p

Roy
fuente
1
Ver el teorema de Frisch-Waugh-Lovell.
rsm
1
@amorfati: Entonces, si entiendo correctamente, son lo mismo. ¿Por qué las personas los tratan de manera diferente?
Roy

Respuestas:

6

En el contexto de la regresión lineal multivariada clásica, tenemos el modelo:

Y=Xβ+ϵ

XYϵ

β^=(XTX)1XTY

iβ^i(XTX)1XTiYi

Sin embargo, la regresión lineal multivariada difiere de resolver por separado los problemas de regresión individuales porque los procedimientos de inferencia estadística explican las correlaciones entre las variables de respuesta múltiple (por ejemplo, ver [2], [3], [4]). Por ejemplo, la matriz de covarianza de ruido se muestra en distribuciones de muestreo, estadísticas de prueba y estimaciones de intervalo.

Otra diferencia emerge si permitimos que cada variable de respuesta tenga su propio conjunto de covariables:

Yi=Xiβi+ϵi

YiiXiϵi

Referencias

  1. Zellner (1962) . Un método eficiente para estimar regresiones aparentemente no relacionadas y pruebas de sesgo de agregación.
  2. Helwig (2017) . Regresión lineal multivariante [Diapositivas]
  3. Fox y Weisberg (2011) . Modelos lineales multivariados en R. [Apéndice de: Un compañero R para la regresión aplicada]
  4. Maitra (2013) . Modelos de regresión lineal multivariante. [Diapositivas]
usuario20160
fuente
1
Gracias, ahora está más claro. ¿Tiene una referencia para esta formulación? Solo he encontrado la forma menos cuadrada. Además, ¿conoces un paquete de Python que implemente eso?
Roy
1
En segundo lugar la solicitud de referencia. ¿Se considera que la correlación es solo la covarianza de los resultados, o se aprende algún tipo de covarianza condicional?
generic_user
No estoy 100% seguro de que @ user20160 se refería a estos, pero creo que lo que tenían en mente era estimar ecuaciones / ecuaciones de estimación generalizadas. EE / GEE son consistentes cuando la estructura de covarianza está mal especificada y también puede establecer la estructura de covarianza esperada. Sin embargo, estos modelos se estiman iterativamente en oposición a los OLS con una forma cerrada. Debería poder estimar GEE / EE en Python pero no conozco los paquetes.
iacobus
1
@Roy reescribí la respuesta y agregué referencias. Mi publicación original asumía el caso que ahora es el último párrafo de la publicación revisada. Intentaré agregar más detalles más tarde.
user20160