Si corresponde, entre ajustar una línea a múltiples "experimentos" separados y luego promediar los ajustes, o promediar los datos de los experimentos separados y luego ajustar los datos promediados. Déjame elaborar:
Realizo simulaciones por computadora que generan una curva, que se muestra a continuación. Extraemos una cantidad, llamémosla "A" ajustando la región lineal de la gráfica (tiempos largos). El valor es simplemente la pendiente de la región lineal. Por supuesto, hay un error asociado con esta regresión lineal.
Por lo general, ejecutamos más o menos 100 de estas simulaciones con diferentes condiciones iniciales para calcular un valor promedio de "A". Me han dicho que es mejor promediar los datos sin procesar (de la gráfica a continuación) en grupos de digamos 10, luego ajustarlos para "A" y promediar esos 10 "A" juntos.
No tengo intuición sobre si hay algún mérito en eso o si es mejor que ajustar 100 valores "A" individuales y promediarlos.
Respuestas:
Imagine que estamos en un contexto de datos de panel donde hay variaciones a lo largo del tiempo entre las empresas . Piense en cada período de tiempo como un experimento separado. Entiendo su pregunta como si es equivalente estimar un efecto usando:i tt i t
La respuesta en general es no.
La puesta en marcha:
En mi formulación, podemos pensar en cada período de tiempo como un experimento separado.t
Supongamos que tiene un panel equilibrado de longitud sobre empresas. Si cada período de tiempo etc ... podemos escribir los datos generales como:n ( X t , y t )T n (Xt,yt)
Promedio de ajustes:
Ajuste de promedios:
En general, esto no es igual a la estimación basada en la variación transversal de los promedios de series de tiempo (es decir, entre el estimador).
Donde etc.x¯i=1T∑txt,i
Estimación de OLS agrupada:
Algo que quizás sea útil pensar es la estimación agrupada de MCO. ¿Qué es? Luego usebt=(X′
Vamos a y ser nuestras estimaciones de sobre la muestra completa y en el período respectivamente. Entonces nosotros tenemos:S=1nT∑iX′X St=1nX′tXt E[xx′] t
Esto es algo así como un promedio de las estimaciones específicas de tiempo diferentes , pero es un poco diferente. En cierto sentido, estás dando más peso a los períodos con mayor varianza de las variables del lado derecho.bt
Caso especial: las variables del lado derecho son invariables en el tiempo y específicas de la empresa
Si las variables del lado derecho para cada empresa son constantes a lo largo del tiempo (es decir, para cualquier y ) entonces para todo y tendríamos:X t 1 = X t 2i Xt1=Xt2 t1 t2 S=St t
Comentario divertido:
Este es el caso de Fama y Macbeth cuando aplicaron esta técnica de promediar estimaciones transversales para obtener errores estándar consistentes al estimar cómo los rendimientos esperados varían con la covarianza de las empresas con el mercado (u otras cargas de factores).
El procedimiento Fama-Macbeth es una forma intuitiva de obtener errores estándar consistentes en el contexto del panel cuando los términos de error están correlacionados de forma transversal pero son independientes en el tiempo. Una técnica más moderna que produce resultados similares es la agrupación a tiempo.
fuente
(Nota: no tengo suficiente reputación para comentar, así que publico esto como respuesta).
Para la pregunta particular planteada, la respuesta de fcop es correcta: ajustar el promedio es lo mismo que promediar los ajustes (al menos para mínimos cuadrados lineales). Sin embargo, vale la pena mencionar que cualquiera de estos enfoques ingenuos "en línea " puede dar resultados sesgados, en comparación con el ajuste de todos los datos a la vez. Como los dos son equivalentes, me enfocaré en el enfoque de "ajustarse al promedio". Esencialmente, el ajuste de las curvas promediadas ignora la incertidumbre relativa en los valores entre los diferentes puntos . Por ejemplo, si , e , entoncesyxy1[x1]=y2[x1]=2y1[x2]=1y1[x2]=3 ˉ y 1x2y¯[x]=⟨y[x]⟩ y x y1[x1]=y2[x1]=2 y1[x2]=1 y1[x2]=3 xy¯[x1]=y¯[x2]=2 , pero cualquier ajuste de curva debería preocuparse mucho más por el desajuste en comparación con .x1 x2
Tenga en cuenta que la mayoría de las plataformas de software científicas deberían tener herramientas para calcular / actualizar un verdadero ajuste de mínimos cuadrados "en línea" (conocido como mínimos cuadrados recursivos ). Por lo tanto, se pueden usar todos los datos (si esto es deseable).
fuente