Problema de identificación de parámetros

8

Siempre lucho por obtener la verdadera esencia de la identificación en econometría. Sé que afirmamos que se puede identificar un parámetro (por ejemplo, ) si simplemente mirando su distribución (conjunta) podemos inferir el valor del parámetro. En un caso simple de , donde podemos afirmar que se identifica si sabemos que su varianza . Pero, ¿qué pasa si donde es un parámetro desconocido? ¿Puede y ser identificados?θ^y=b1X+uE[u]=0,E[u|x]=0b1Var(b^)>0E[u|X]=aaab1

Si expando el modelo a donde y , para mostrar que están identificados, haga ¿Simplemente tengo que repetir que la varianza de los tres parámetros es mayor que cero?Y=b0+b1X+b2XD=uD{0,1}E[u|X,D]=0b1,b2,b3

Agradezco toda la ayuda para aclarar mi mente con respecto a la identificación.

CharlesM
fuente
Me dijeron que para el modelo con la variable ficticia simplemente tengo que mostrar que existe ... lo que significa que los determinantes de esta matriz no son iguales a 0. ¿Correcto? [XX]1
CharlesM
También publiqué una pregunta sobre el intercambio de matemáticas y nada ...
CharlesM
¿Esto ayuda o simplemente más de lo que ya sabes? Notas del curso UChicago
kirk

Respuestas:

3

Primero definamos los siguientes objetos: en un modelo estadístico que se usa para modelar en función de , hay parámetros designados por vector . Se permite que estos parámetros varíen dentro del espacio de parámetros . No estamos interesados ​​en la estimación de todos estos parámetros, sino solo de un cierto subconjunto, digamos en de los parámetros que denotamos y que varía dentro del espacio de parámetros . En nuestro modelo las variables y los parámetrosMYXpθΘRpqpθ0Θ0RqMXθ ahora se asignarán como para explicar . Esta asignación está definida por y los parámetros.YM

Dentro de este entorno, la identificabilidad dice algo sobre la equivalencia observacional . En particular, si los parámetros son identificables wrt entonces mantendrá que . En palabras, no existe un parámetro diferente vector que induciría el mismo proceso de generación de datos, dada nuestra especificación del modelo . Para hacer estos conceptos más concebibles, doy dos ejemplos.θ0Mθ1Θ0:θ1θ0,M(θ0)=M(θ1)θ1M

Ejemplo 1 : Definir para ; el modelo estadístico simple : y supongamos que (entonces ). Está claro que si o , siempre mantendrá que es identificable: el proceso que genera partir de tiene una relación con los parámetros y . Fijaciónθ=(a,b)XN(μ,σ2In);εN(0,σe2In)M

Y=a+Xb+ε
(a,b)R2Θ=R2θ0=(a,b)θ0=aθ0YX1:1ab(a,b) , no será posible encontrar una segunda tupla en describa el mismo proceso de generación de datos.R

Ejemplo 2 : Definir para ; el modelo estadístico más complicado : θ=(a,b,c)XN(μ,σ2In);εN(0,σe2In)M

Y=a+X(bc)+ε
y supongamos que (a,b)R2 y cR{0} (entonces Θ=R3{(l,m,0)|(l,m)R2}) Mientras que paraθ0, este sería un modelo estadístico identificable, esto no se cumple si uno incluye otro parámetro (es decir, b o c) ¿Por qué? Porque para cualquier par de , existen infinitamente muchos otros pares en el conjunto . La solución obvia al problema en este caso sería introducir un nuevo parámetro reemplace la fracción para identificar el modelo. Sin embargo, uno podría estar interesado en y como parámetros independientes para razones teóricas - los parámetros podrían corresponder a los parámetros de interés en un (económico) sentido teoría. (Por ejemplo, podría ser 'propensión al consumo' podría ser 'confianza', y es posible que desee estimar estas dos cantidades a partir de su modelo de regresión. Desafortunadamente, esto no sería posible).(b,c)B:={(x,y)|(x/y)=(b/c),(x,y)R2}d=b/cbcbc
Jeremias K
fuente
1
"No existe un vector de parámetros diferente θ1eso generaría los mismos datos "no suena del todo bien, a menos que se refiera a algo inusual con" generar ". Quizás eso necesite deletrearse o quizás su significado de" modelo estadístico "deba ser explícito. En la mayoría de los modelos, incluidos aquellos que utiliza en sus ilustraciones, cualquier conjunto de datos podría haber sido producido por cualquiera de los parámetros posibles.
whuber
1
@whuber que es un buen punto. Lo que debería haber dicho es que "No hay ... eso induciría el mismo proceso de generación de datos ". Cambié esto ahora :)
Jeremias K