¿Importa la no estacionariedad en logit / probit?

8

Me gustaría preguntar: estoy usando logit para investigar si algunas variables mejoran el riesgo de crisis monetarias. Tengo datos anuales de 1980 para muchos países (panel desequilibrado), la variable ficticia es 1 si comenzaron las crisis monetarias (según mi definición), 0 de lo contrario. Las variables explicativas están de acuerdo con algunas teorías, como cuenta corriente / PIB, activos externos netos / PIB, préstamos / PIB, etc. Todas están rezagadas (-1). Estoy usando errores estándar robustos, que deberían ser consistentes con la heterocedasticidad. Sin embargo, por ejemplo, los préstamos al PIB o NFA / PIB no son estacionariedad (prueba de panel). ¿Esto importa? No he visto ninguna prueba en papel para la estacionalidad que realiza logit / probit. Para mí también es intuitivo que no importa. Si estoy probando si una variable aumenta el riesgo de una crisis, no debería ser un problema, que esta variable está aumentando de forma permanente. Por el contrario, el aumento de la variable aumenta permanentemente el riesgo de la crisis y cuando alcanza un nivel insostenible, se produce la crisis. ¿Podría darme una respuesta, si estoy en lo cierto?

Jirka
fuente
2
¿Hay alguna razón por la que no puedas usar efectos fijos de tiempo? Hacerlo a menudo controla los cambios en el nivel de variables no estacionarias. El logit utiliza la máxima probabilidad que asume los errores latentes. Si los errores están correlacionados a lo largo del tiempo, podría dar lugar a un ajuste sesgado, independientemente de cómo se calculen los errores estándar. Una vez más, el uso de efectos fijos de tiempo debería explicar la mayor parte de esto.
Zachary Blumenfeld
2
No están permitiendo un efecto fijo en el logit porque están tratando de evitar el sesgo incidental de los parámetros, lo cual, pensándolo bien, tiene sentido. Una cosa que podría hacer es ejecutar un modelo de probabilidad lineal, con y sin efectos de tiempo aleatorio / fijo. Puede hacer diagnósticos residuales para estos modelos y ver si cambian sus márgenes de interés. Si sus residuos dentro del grupo no están correlacionados y los controles de tiempo no cambian significativamente los márgenes, entonces puede estar bien con el logit (los márgenes promedio para el logit deberían ser similares al modelo lineal)
Zachary Blumenfeld
2
También hay algunas cosas interesantes que puede hacer con el re-muestreo para reducir el sesgo incidental en los modelos de paneles no lineales que creo que se aplican bien a su problema. <a href=" onlinelibrary.wiley.com/doi/10.1111/j.1468-0262.2004.00533.x/…> es un artículo de Hahn y Newey que lo hace con una trampa. No sabría cómo implementar algo como esto en Eveiws o STATA (Lo siento), pero estoy seguro de que es factible en STATA. "
Zachary Blumenfeld
1
No estoy 100% seguro. La idea con el modelo lineal es que puede hacer fácilmente diagnósticos residuales para no estacionariedad (o autocorrelación) en los residuos. Los efectos marginales promedio para el logit deberían estar extremadamente cerca de los márgenes del modelo lineal. Usando este hecho, si sabe que el modelo lineal es imparcial (mediante la verificación de los residuos), entonces puede decir que el logit también está estimando efectos marginales promedio imparcialmente (dado que observa que los márgenes promedio son más o menos los de ambos modelos). Por lo tanto, parece razonable creer que el logit es unbias.
Zachary Blumenfeld
1
Cuando se trata de la primera diferenciación, esto es algo así como "descifrar" las variables de series de tiempo que es muy similar a la idea de agregar efectos fijos ... controlar los cambios de nivel para cada período de tiempo individual. Sin embargo, el tratamiento formal de este tipo puede ser un complejo silencioso y aún existe la posibilidad de autocorrelación en los residuos <a href=" people.stern.nyu.edu/jsimonof/classes/2301/pdf/…> tiene algunas sugerencias sensatas con Pearson residuos para verificar la autocorrelación.
Zachary Blumenfeld

Respuestas:

5

Cualquiera sea el modelo que esté utilizando, los fundamentos de la teoría de la econometría deben ser verificados y respetados. Los investigadores se jactan de su uso de modelos muy sofisticados, pero a menudo, más o menos voluntariamente, se olvidan de los fundamentos de la econometría; Por lo tanto, se vuelven bastante ridículos. La econometría no es más que estimar la media y la varianza de sus parámetros, pero si la media, la varianza y la covarianza de sus variables cambian con el tiempo, se deben realizar dispositivos y análisis adecuados. En mi opinión, los modelos probit / logit con datos no estacionarios no tienen sentido porque desea ajustar el lado derecho de su ecuación (que no es estacionario) en el lado izquierdo que es una variable binaria. La estructura de la dinámica del tiempo de sus variables independientes debe ser coherente con las dependientes. Si algunos de sus regresores no son estacionarios, especificará erróneamente su relación; de hecho debe ser que la combinación de sus regresores debe ser estacionaria. Así que creo que probablemente tengas que hacer una regresión de dos pasos. En el primero, encuentra una relación estacionaria de sus variables, luego coloca esta relación en su modelo probit / logit y estima un solo parámetro.

Obviamente, en el primer paso debe tener en la lista dos variables integradas (en el caso de cointegración) o al menos dos variables con el mismo tipo de tendencia. Si este no es el caso, tiene un problema de variables omitidas.

La alternativa a todo esto es que cambia el alcance de su análisis y transforma todos sus regresores en estacionarios.

Cerbero
fuente
3

Sugiero mirar los resultados en Chang Jiang Park (2006) y Park, Phillips (2000) . * Según el primer artículo, los estimadores logit son consistentes incluso en el caso de series integradas (teorema 2 en la página 6-7) y habituales Las estadísticas t se pueden utilizar para los parámetros de interés en su caso (los coeficientes en los regresores). Otros artículos de los mismos autores desarrollan la teoría econométrica para otros casos de procesos no estacionarios en modelos no lineales.

* Estos documentos tratan solo la teoría, desafortunadamente no puedo encontrar un ejemplo de un documento empírico que mencione realmente el tema de la no estacionariedad en este contexto.

Giuseppe
fuente
1

Sé que esta publicación es antigua, pero las personas realizan búsquedas y a menudo usan estas cosas como referencia.

Hagámoslo simple. Tengamos un modelo de probabilidad individual de impago de una hipoteca como nuestra Y. Ahora vamos a ejecutar el PIB nivelado en ella. Digamos que sus datos son 2002-2017, trimestralmente. Tienes millones de observaciones que en el momento T comparten todas las mismas variables económicas. Elijo este marco de tiempo por una buena razón.

¿Qué obtendrás como relación? Oh hombre, encontrarás que Shazaam, un PIB más bajo está correlacionado con valores predeterminados más altos. Se ve bien, ¿verdad?

Pero ahora pronostiquemos esto, digamos 50 años (por diversión). Tome el PIB esperado a una tasa de crecimiento histórica, digamos 2%, y extrapole el PIB. Ahora ejecuta el pronóstico. ¿Qué encuentras? Shazaam, como magia, la probabilidad de incumplimiento tenderá a 0%.

Obtendría lo contrario si seleccionara el número total de desempleados (no la tasa). Encontrará ese shazaam, lo pronosticará en el futuro y la probabilidad de tendencias predeterminadas al 100%.

Ambos son ridículos. Y aquí está el pateador. Si hiciera una prueba estacionaria en algunos de estos marcos de tiempo, descubriría que son estacionarios. La razón es que puedes cortar una serie no estacionaria en partes estacionarias. Particularmente porque el PIB real aumentó, disminuyó y aumentó en el período de tiempo.

Sí, su ajuste de muestra se verá bien. Pero sus pronósticos no tendrán sentido.

Veo esto con frecuencia en el modelado métrico de riesgo.

Stratozyck
fuente
-1

Claramente estás bien desde una perspectiva teórica. Es una comprensión errónea de las series no estacionarias que tienen medios cambiantes. No tienen ningún medio. El promedio de la muestra es un número aleatorio porque converge en ningún punto y, por lo tanto, parece cambiar. Esto tampoco es un problema para logit o probit.

Los modelos estadísticos son mapeos y no hay razón por la que uno no pueda envolver una serie independiente en una serie limitada. Por ejemplo, normalmente se considera que la recta numérica real no tiene longitud, pero envuélvala alrededor de un círculo con el polo sur como 0 y el polo norte como y para un círculo unitario, la recta numérica completa ahora tiene longitud π.

Al mapear una serie no estacionaria a un conjunto bien delimitado, ha creado un problema bien delimitado ya que la solución final tiene que mapearse al intervalo [0,1].

Todas las razones contables deben carecer de una variación y todos los rendimientos financieros deben carecer de una variación. Consulte el documento en https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2828744

No necesita preocuparse intrínsecamente por los errores robustos. Es un malentendido de las series no estacionarias que sean heteroscedasticas. No son; son asquedastic porque no tienen forma de formar una varianza en primer lugar, por lo que nuevamente es un número aleatorio. La estructura de términos de error tiene más que ver con el modelo que asigna que la falta de estacionariedad.

Donde podría enfrentar un problema es con el concepto de covarianza. La distribución de los rendimientos de capital es de una distribución que carece de una matriz de covarianza. No es que las acciones no puedan comove, pero no pueden covariar. Lo mismo es cierto para las economías. Es un concepto más complejo que la covarianza, que es una relación simple. Deberá leer el documento anterior y pensar detenidamente en sus relaciones modelo.

Dave Harris
fuente