Tengo una pregunta básica sobre los enfoques para promediar modelos usando criterios de TI para ponderar modelos dentro de un conjunto de candidatos.
La mayoría de las fuentes que he leído sobre promedios de modelos abogan por promediar las estimaciones de coeficientes de parámetros basadas en ponderaciones de modelos (ya sea utilizando un método de "promedio natural" o un método de "promedio cero"). Sin embargo, tenía la impresión de que promediar y ponderar las predicciones de cada modelo , en lugar de las estimaciones del coeficiente de los parámetros, basadas en los pesos del modelo, es un enfoque más directo y justificado, particularmente si se comparan modelos con variables predictoras no anidadas.
¿Existe una guía clara sobre qué enfoque para promediar modelos está mejor justificado (promediar estimaciones de parámetros ponderados frente a predicciones ponderadas)? Además, ¿existen otras complicaciones con el promedio del modelo de las estimaciones de coeficientes en el caso de modelos mixtos?
fuente
Respuestas:
En los modelos lineales, el promedio de los coeficientes le dará los mismos valores pronosticados que los valores pronosticados del promedio de las predicciones, pero transmite más información. Muchas exposiciones tratan con modelos lineales y, por lo tanto, promedian coeficientes cruzados.
Puede verificar la equivalencia con un poco de álgebra lineal. Di que tienesT observaciones y norte predictores Recoges lo último en elT× N matriz X . Tu también tienesM modelos, cada uno de los cuales asigna un coeficiente estimado βm al N predictores Apile estas estimaciones de coeficientes en elN×M matriz β . Promedio significa que asigna pesoswm a cada modelo m (los pesos son típicamente no negativos y suman uno). Pon estos pesos en el vectorw de longitud M .
Los valores pronosticados para cada modelo están dados pory^m=Xβm o en la notación apilada
En los modelos no lineales, la equivalencia generalmente ya no se mantiene y, de hecho, tiene sentido promediar las predicciones. Por ejemplo, aquí se resume la vasta literatura sobre el promedio entre predicciones (combinaciones de pronósticos) .
fuente