Se supone que debo enseñar el teorema de Frish Waugh en econometría, que no he estudiado.
He entendido las matemáticas detrás de esto y espero que la idea también "el coeficiente que obtienes para un coeficiente particular de un modelo lineal múltiple sea igual al coeficiente del modelo de regresión simple si" eliminas "la influencia de los otros regresores". Entonces la idea teórica es genial. (Si entendí totalmente mal, agradezco una corrección)
¿Pero tiene algunos usos clásicos / prácticos?
EDITAR : He aceptado una respuesta, pero todavía estoy dispuesto a tener otras nuevas que traigan otros ejemplos / aplicaciones.
regression
econometrics
least-squares
projection
decomposition
Anthony Martin
fuente
fuente
Respuestas:
Considere el modelo de datos del panel de efectos fijos, también conocido como modelo de variables ficticias de mínimos cuadrados (LSDV).
puede calcularse aplicando OLS directamente al modelo y = X β + D α + ϵ , donde D es unamatriz de tontos N T × N y α representa los efectos fijos específicos de cada individuo.bLSDV
Otra forma de calcular es aplicar la llamada transformación dentro del modelo habitual para obtener una versión degradada del mismo, es decir, M [ D ] y = M [ D ] X β + M [ D ] ϵ . Aquí, M [ D ] = I - D ( D ′ D ) - 1 D ′ , la matriz creadora residual de una regresión enbLSDV
Por el teorema de Frisch-Waugh-Lovell, los dos son equivalentes, como dice FWL que se puede calcular un subconjunto de los coeficientes de regresión de una regresión (en este ) porβ^
La segunda versión es mucho más utilizada, porque los conjuntos de datos de panel típicos pueden tener miles de unidades de panel , por lo que el primer enfoque requeriría que ejecute una regresión con miles de regresores, lo que no es una buena idea numéricamente incluso hoy en día con rapidez computadoras, ya que calcular el inverso de ( D : X ) ′ ( D : X ) sería muy costoso, mientras que degradar el tiempo y y X es de bajo costo.N (D:X)′(D:X) y X
fuente
Aquí hay una versión simplificada de mi primera respuesta, que creo que es menos relevante en la práctica, pero posiblemente más fácil de "vender" para uso en el aula.
fuente
Here is another, more indirect, but I believe interesting one, namely the connection between different approaches to computing the partial autocorrelation coefficient of a stationary time series.
Definition 1
Consider the projection
It thus gives the influence of them th lag on Yt \emph{after controlling for} Yt−1,…,Yt−m+1 . Contrast this with ρm , that gives the `raw' correlation of Yt and Yt−m .
How do we find theα(m)j ? Recall that a fundamental property of a regression of Zt on regressors Xt is that the coefficients are such that regressors and residuals are uncorrelated. In a population regression this condition is then stated in terms of population correlations. Then:
So, we sort of run a multiple regression and find one coefficient of interest while controlling for the others.
Definition 2
Them th partial correlation is the correlation of the prediction error of Yt+m predicted with Yt−1,…,Yt−m+1 with the prediction error of Yt predicted with Yt−1,…,Yt−m+1 .
So, we sort of first control for the intermediate lags and then compute the correlation of the residuals.
fuente