Predecir cuando la variable de respuesta es

7

Mi modelo estimado es

ln^(yt)=9.8730.472ln(xt2)0.01xt3

Me piden que encuentre un IC predictivo con una confianza del 95% para la media de , cuando y . Suponemos que , donde .y0x02=250x03=8s2x0(XTX)1x0T=0.000243952x0=(250,8)

Tengo una solución del año anterior, que dice así:

Encuentro el CI de la forma , donde es el superior de distribución y . Esto me da .CI(E[ln(y0)|x0])=[ln^(yt)tα/2sE,ln^(yt)+tα/2sE]tα/2t(nk)sE=0.000243952[7.1563,7.2175]

Entonces el autor hace .CI(E[y0|x0])=[e7.1563,e7.2175]=[1282.158,1363.077]

No estoy de acuerdo con este último paso (por la desigualdad de Jensen subestimaremos). En la Introducción a la Econometría de Wooldridge, en la página 212, afirma que si estamos seguros de que los términos de error son normales, entonces un estimador consistente es:

E^[y0|x0]=es2/2eln^(y0)

Entonces, estaba pensando en hacer

CI(E[y0|x0])=[es2/21282.158,es2/21363.077]=[1282.314,1363.243]

¿Es esto correcto?

Además, la solución a este ejercicio indica que , que está lejos de cualquier solución que tengo.CI(E[y0|x0])=[624.020,663.519]

Cualquier ayuda sería apreciada.

PD: También he leído que la corrección no debe usarse para el IC sino solo para la estimación puntualE^[y0|x0]

Un anciano en el mar.
fuente

Respuestas:

3

No encuentra la misma respuesta debido a lo que sospecho que es un error tipográfico, que sería la razón principal de su problema: se establecería en , no en . Otra posibilidad, si mantiene , es un error en el segundo coeficiente estimado, por ejemplo, lugar de . 80 8 x 03 = 8 β 2 = - ,1 - 0.01x03808x03=8β^2=0.10.01

De todos modos, una de estas modificaciones resuelve todo y produce el mismo resultado que la solución a este ejercicio.

Considerando este cambio, con , uno obtienetα/2=1.96476138969835

Método 1

CI(E[y0|x0])=[e6.43618291164626,e6.49755798189177]=[624.020307335178,663.519326788772] (la solución dada a este ejercicio)

o

Método 2

(como se indica en la Introducción a Econometría de Wooldridge, en la página 212) si estamos seguros de que los términos de error son normales (y uno es extremadamente afortunado)

CI(E[y0|x0])=[es2/2624.0203,es2/2663.5193]=[624.0960,663.6002]

sin embargo

es muy poco probable que el método 2 sea ​​correcto, ya que, como usted menciona en su pregunta, la [...] corrección (subestimación) no debe usarse para el IC sino solo para la estimación puntual.

Por qué ? Diría que debido a la dependencia entre los dos términos, conocer las expectativas de 2/2 por un lado y por otro lado no significa que uno conozca el de .^ y 0 e s 2es2/2y0^es22+ln(y0)^

mantener viva
fuente
2

La predicción de puntos y el IC son diferentes.

Para la predicción de puntos, es mejor corregir el sesgo tanto como sea posible. Para CI, lo que se requiere desde el principio es que la probabilidad sea igual a . Cuando es el IC del 95% para por ejemplo, es ciertamente un IC del 95% para porque . Entonces su es ciertamente un CI válido.[ a , b ] ln ( y 0 ) [ e a , e b ] y100(1α)%[a,b]ln(y0)[ea,eb] P ( a ln X b ) = P ( e aX e b ) [ e 7.1563 , e 7.2175 ]y0P(alnXb)=P(eaXeb)[e7.1563,e7.2175]

Pero el centro de este IC no es el predictor ingenuo (exp [predictor de ]) ni el predictor corregido de (un factor de corrección multiplicado por el predictor ingenuo) debido a la desigualdad de Jensen, pero en realidad no importa. En algunos casos (no siempre), es posible que pueda cambiar el IC a para algunos y modo que la probabilidad aún sea del 95% y su centro sea el sesgo. predictor corregido, pero no veo el punto en él.y 0 [ e a - p , e b - q ] p qlny0y0[eap,ebq]pq

Lo que sugirió, es decir, no es un IC del 95%. Para ver por qué, deje que el factor de corrección sea (no aleatorio y perfectamente conocido, por simplicidad), de modo que el predictor con corrección de sesgo sea , donde es el predictor imparcial de ( en su ejemplo). Esta " " puede estimarse mediante por ejemplo, pero si bien esta última es aleatoria, se supone que es aleatoria para simplificarla. Sea el IC del 95% para , es decir,h h e theta theta ln y 0 β 0 + β 2 ln x 2 + β 3 x 3 h e s 2 / 2 h [ una , b ] ln y 0 P ( a ln[es2/2ea,es2/2eb]hheθθlny0β^0+β^2lnx2+β^3x3hes2/2h[a,b]lny0P ( h e ay 0h e b ) 0ln h + b ) , P ( a ln y 0b ) = 0.95 ln y 0P(alny0b)=0.95. Entonces, que no es igual a menos que la distribución de sea ​​uniforme, lo cual generalmente no lo es.

P(heay0heb)=P(lnh+alny0lnh+b),
P(alny0b)=0.95lny0

EDITAR

Lo anterior es sobre el CI de , no de . La pregunta original es sobre el CI para . Sea , que se estima mediante . En ese caso, creo que el método Delta es una opción útil (ver la respuesta de luchonacho). E ( y | X = x 0 ) E ( y | X = x 0 ) E ( y | X =y0E(y|X=x0)E(y|X=x0)h exp ( x 0 β )E(y|X=x0)=hexp(x0β)h^exp(x0β^)

Para ser rigurosos, necesitamos la distribución conjunta de y , o para ser precisos, la distribución asintótica del vector . Luego, la distribución límite de se deriva utilizando el método Delta y luego los CI para se puede construir. ßh^β^n[(β^β),h^h]hexp(x0β)n[h^exp(x0β^)hexp(x0β)]hexp(x0β)

chan1142
fuente
Gracias por responder a Chan. Por cierto, en este ejercicio, el estimador puntual para o es igual. La estimación resultante está fuera del CI para pero dentro del CI para . ¿No deberían estar ambos dentro de su CI? E ( y | X 0 ) E ( yy0E(y|X0)y 0E(y|X0)y0
Un viejo en el mar.
Si, ayuda. ¿Podrías revisar esta pregunta mía? Está relacionado con esto. economics.stackexchange.com/questions/16891/…
Un anciano en el mar.
En un comentario que hice y eliminé, cometí un error. es, por supuesto, diferente de como dice la respuesta de Alecos Papadopoulos a su pregunta. Muchas gracias @Anoldmaninthesea, y lo siento por eso. Quizás estaba pensando que está lo suficientemente cerca de , que no es lo que planteaste. Hmm, en ese caso tu comentario es aún más interesante. exp { E ( log y | X = x 0 ) } expE(y|X=x0)exp{E(logy|X=x0)}exp ( x 0 β )exp(x0β^)exp(x0β)
chan1142
1
Nunca he pensado en este tema. Lo hare ahora. Entonces se trata del CI para . El método Delta explicado por luchonacho parece útil en este caso. Gracias @Anoldmaninthesea por plantearlo. E(y|X=x0)
chan1142
Chan, he vinculado otra pregunta mía a esta. Allí encontrará una respuesta que he escrito que le puede resultar interesante.
Un viejo en el mar.
1

Utiliza el método Delta . Digamos que la distribución asintótica de muestras grandes de un solo parámetro es:β

β^aN(β,Var(β^)n)

(suponiendo que su estimación sea consistente)

Además, está interesado en una función de , por ejemplo, . Luego, una aproximación de Taylor de primer orden de lo anterior conduce a la siguiente distribución asintótica: F( β )β^F(β^)

F(β^)aN(F(β),(F(β^)β^)2Var(β^)n)

En su caso, es . Desde aquí, puede construir el CI de forma normal.e βF(β^)eβ^

Fuente y más detalles en el documento vinculado.

luchonacho
fuente
Lucho, no puedo usar el método Delta para esto ... pero gracias de todos modos. ;)
Un anciano en el mar.
: o por qué no? ¿Alguna suposición que leí mal o no mencioné?
luchonacho
1
Simplemente no es el objetivo del ejercicio. Estoy realmente interesado en saber cuál de los métodos es el correcto. Además, su método proporciona una distribución aproximada, mientras que en el ejercicio quieren un CI exacto.
Un viejo en el mar.