La predicción de puntos y el IC son diferentes.
Para la predicción de puntos, es mejor corregir el sesgo tanto como sea posible. Para CI, lo que se requiere desde el principio es que la probabilidad sea igual a . Cuando es el IC del 95% para por ejemplo, es ciertamente un IC del 95% para porque . Entonces su es ciertamente un CI válido.[ a , b ] ln ( y 0 ) [ e a , e b ] y100 ( 1 - α ) %[ a , b ]En(y0 0)[euna,esi] P ( a ≤ ln X ≤ b ) = P ( e a ≤ X ≤ e b ) [ e 7.1563 , e 7.2175 ]y0 0PAGS( a ≤lnX≤ b ) = P( euna≤ X≤ esi)[ e7.1563, e7.2175]
Pero el centro de este IC no es el predictor ingenuo (exp [predictor de ]) ni el predictor corregido de (un factor de corrección multiplicado por el predictor ingenuo) debido a la desigualdad de Jensen, pero en realidad no importa. En algunos casos (no siempre), es posible que pueda cambiar el IC a para algunos y modo que la probabilidad aún sea del 95% y su centro sea el sesgo. predictor corregido, pero no veo el punto en él.y 0 [ e a - p , e b - q ] p qEny0 0y0 0[ ea - p, eb - q]pagsq
Lo que sugirió, es decir, no es un IC del 95%. Para ver por qué, deje que el factor de corrección sea (no aleatorio y perfectamente conocido, por simplicidad), de modo que el predictor con corrección de sesgo sea , donde es el predictor imparcial de ( en su ejemplo). Esta " " puede estimarse mediante por ejemplo, pero si bien esta última es aleatoria, se supone que es aleatoria para simplificarla. Sea el IC del 95% para , es decir,h h e theta theta ln y 0 β 0 + β 2 ln x 2 + β 3 x 3 h e s 2 / 2 h [ una , b ] ln y 0 P ( a ≤ ln[ es2/ 2miuna, es2/ 2misi]hh eθθEny0 0β^0 0+ β^2EnX2+ β^3X3hmis2/ 2h[ a , b ]Eny0 0P ( h e a ≤ y 0 ≤ h e b ) 0 ≤ ln h + b ) , P ( a ≤ ln y 0 ≤ b ) = 0.95 ln y 0PAGS( a ≤ lny0 0≤ b ) = 0.95. Entonces,
que no es igual a menos que la distribución de sea uniforme, lo cual generalmente no lo es.
PAGS( h euna≤ y0 0≤ h esi) = P( lnh + a ≤ lny0 0≤ lnh + b ) ,
PAGS( a ≤ lny0 0≤ b ) = 0.95Eny0 0
EDITAR
Lo anterior es sobre el CI de , no de . La pregunta original es sobre el CI para . Sea , que se estima mediante . En ese caso, creo que el método Delta es una opción útil (ver la respuesta de luchonacho). E ( y | X = x 0 ) E ( y | X = x 0 ) E ( y | X =y0 0mi( yEl |X= x0 0)mi( yEl |X= x0 0)h exp ( x 0 β )mi( yEl |X= x0 0) = h exp( x0 0β)h^Exp( x0 0β^)
Para ser rigurosos, necesitamos la distribución conjunta de y , o para ser precisos, la distribución asintótica del vector . Luego, la distribución límite de se deriva utilizando el método Delta y luego los CI para se puede construir. ß √h^β^ √norte--√[ ( β^- β)′, h^- h ]′hexp(x0β)norte--√[ h^Exp( x0 0β^) - h exp( x0 0β) ]h exp( x0 0β)
Utiliza el método Delta . Digamos que la distribución asintótica de muestras grandes de un solo parámetro es:β
(suponiendo que su estimación sea consistente)
Además, está interesado en una función de , por ejemplo, . Luego, una aproximación de Taylor de primer orden de lo anterior conduce a la siguiente distribución asintótica: F( β )β^ F(β^)
En su caso, es . Desde aquí, puede construir el CI de forma normal.e βF(β^) eβ^
Fuente y más detalles en el documento vinculado.
fuente