¿Cuáles son las principales diferencias filosóficas, metodológicas y terminológicas entre la econometría y otros campos estadísticos?

70

La econometría tiene una superposición sustancial con las estadísticas tradicionales, pero a menudo usa su propia jerga sobre una variedad de temas ("identificación", "exógena", etc.). Una vez escuché a un profesor de estadística aplicada en otro campo comentar que frecuentemente la terminología es diferente pero los conceptos son los mismos. Sin embargo, también tiene sus propios métodos y distinciones filosóficas (me viene a la mente el famoso ensayo de Heckman).

¿Qué diferencias de terminología existen entre la econometría y las estadísticas generales, y dónde divergen los campos para ser diferentes en algo más que la terminología?

Ari B. Friedman
fuente

Respuestas:

96

Hay algunas diferencias terminológicas donde lo mismo se llama nombres diferentes en diferentes disciplinas:

  1. Los datos longitudinales en bioestadística son observaciones repetidas de los mismos individuos = datos de panel en econometría.
  2. El modelo para una variable dependiente binaria en la que la probabilidad de 1 se modela como se denomina modelo logit en econometría y modelo logístico en bioestadística. Los bioestadísticos tienden a trabajar con la regresión logística en términos de odds ratios, ya que sus s son a menudo binarias, por lo que los odds ratios representan las frecuencias relativas del resultado de interés en los dos grupos de la población. Esta es una interpretación tan común que a menudo verá una variable continua transformada en dos categorías (presión arterial baja versus alta) para facilitar esta interpretación.1/(1+exp[xβ])x
  3. Las "ecuaciones de estimación" de los estadísticos son las "condiciones de momento" de los econometristas. Los estimados estadísticos son estimadores extremos de econométricos.M

Existen diferencias terminológicas en las que el mismo término se usa para significar cosas diferentes en diferentes disciplinas:

  1. Los efectos fijos representan el en la ecuación de regresión para los estadísticos de ANOVA, y para un estimador "dentro" de los econométricos.xβ
  2. Inferencia robusta significa errores estándar corregidos por heteroscedasticidad para economistas (con extensiones a errores estándar agrupados y / o errores estándar corregidos por autocorrelación) y métodos robustos a valores estadísticos muy lejanos.
  3. Parece que los economistas tienen una idea ridícula de que las muestras estratificadas son aquellas en las que las probabilidades de selección varían entre las observaciones. Deben llamarse muestras de probabilidad desigual. Las muestras estratificadas son aquellas en las que la población se divide en grupos predefinidos de acuerdo con las características conocidas antes del muestreo.
  4. La "minería de datos" de los economometristas (al menos en la literatura de los años ochenta) solía significar múltiples pruebas y dificultades relacionadas que se explicaron maravillosamente en el libro de Harrell . Los procedimientos de minería de datos de los informáticos (y los estadísticos) son métodos no paramétricos para encontrar patrones en los datos, también conocidos como aprendizaje estadístico .

Veo que las contribuciones únicas de la econometría son

  1. Formas de lidiar con la endogeneidad y los modelos de regresión mal especificados, reconociendo, como mpiktas ha explicado en otra respuesta , que (i) las variables explicativas pueden ser aleatorias (y por lo tanto correlacionadas con errores de regresión que producen sesgos en las estimaciones de los parámetros), (ii) los modelos pueden sufrir variables omitidas (que luego se convierten en parte del término de error), (iii) puede haber una heterogeneidad no observada de cómo los agentes económicos reaccionan a los estímulos, lo que complica los modelos de regresión estándar. Angrist & Pischke es una maravillosa revisión de estos temas, y los estadísticos aprenderán mucho sobre cómo hacer análisis de regresión a partir de ella. Como mínimo, los estadísticos deberían aprender y comprender la regresión de variables instrumentales.
  2. En términos más generales, los economistas quieren hacer la menor cantidad posible de suposiciones sobre sus modelos, para asegurarse de que sus hallazgos no dependan de algo tan ridículo como la normalidad multivariante. Es por eso que GMM es muy popular entre los economistas, y nunca quedó atrapado en las estadísticas (a pesar de que Ferguson lo describió como mínimo a fines de la década de 1960). Es por eso que la adopción de la probabilidad empírica creció exponencialmente en la econometría, con un seguimiento marginal en las estadísticas. Es por eso que los economistas realizan su regresión con errores estándar "robustos", y estadísticos, con los errores estándar OLS predeterminados .χ2s2(XX)1
  3. Se ha trabajado mucho en el dominio del tiempo con procesos regularmente espaciados, así es como se recopilan los datos macroeconómicos. Las contribuciones únicas incluyen procesos integrados y cointegrados y métodos de heteroscedasticidad condicional autorregresiva (ARCH). Siendo generalmente una persona micro, estoy menos familiarizado con estos.

En general, los economistas tienden a buscar una interpretación sólida de los coeficientes en sus modelos. Los estadísticos tomarían un modelo logístico como una forma de llegar a la probabilidad del resultado positivo, a menudo como un simple dispositivo predictivo, y también pueden notar la interpretación GLM con buenas propiedades familiares exponenciales que posee, así como conexiones con análisis discriminante. Los economistas pensarían en la interpretación de la utilidad del modelo logit y se preocuparían de que solo se identifique en este modelo, y que la heterocedasticidad pueda descartarlo. (Los estadísticos se preguntarán quéβ/σσ están hablando los economistas, por supuesto.) Por supuesto, una utilidad que es lineal en sus entradas es algo muy divertido desde la perspectiva de Microeconomía 101, aunque algunas generalizaciones a funciones semicóncavas probablemente se realizan en Mas-Collel.

Lo que los economistas generalmente tienden a pasar por alto, pero, en mi humilde opinión, se beneficiarían, son aspectos del análisis multivariado (incluidos los modelos de variables latentes como una forma de lidiar con los errores de medición y los poderes múltiples ... los estadísticos también son ajenos a estos modelos) , diagnóstico de regresión (todas estas distancias de Cook, 'Cp, DFBETA, etc.), análisis de datos faltantes (la identificación parcial de Manski es seguramente elegante, pero el desglose MCAR / MAR / NMAR convencional y la imputación múltiple son más útiles), y estadísticas de encuestas. La econometría ha recibido muchas otras contribuciones de las estadísticas principales y las ha adoptado como metodología estándar, o las ha aprobado a corto plazo: los modelos ARMA de la década de 1960 probablemente se conocen mejor en econometría que en estadística, como algunos programas de posgrado. en estadística puede no ofrecer un curso de series de tiempo en estos días; los estimadores de contracción / regresión de cresta de los años 70 han ido y venido; El bootstrap de la década de 1980 es una reacción instintiva ante cualquier situación complicada, aunque los economistas deben ser más conscientes de las limitaciones del bootstrap.; La probabilidad empírica de la década de 1990 ha visto un mayor desarrollo de la metodología de los economistas teóricos que de los estadísticos teóricos; Los métodos bayesianos computacionales de la década de 2000 se están entreteniendo en econometría, pero creo que son demasiado paramétricos, demasiado basados ​​en modelos, para ser compatibles con el paradigma de robustez que mencioné anteriormente. Es una decisión abierta si los economistas encontrarán algún uso del aprendizaje estadístico / bioinformática o material espacio-temporal que es extremadamente candente en las estadísticas modernas.

StasK
fuente
14
+1 Este es un espléndido ejemplo de qué grandes respuestas pueden surgir cuando una pregunta se abre a una comunidad diversa .
whuber
1
@whuber, gracias por el comentario. Las divisiones disciplinarias me vuelven loco, francamente.
StasK
@StasK Excelente respuesta. Sin embargo, un punto rápido. "En general, los economistas tienden a buscar una interpretación sólida de los coeficientes en sus modelos". Estrictamente hablando, esto es un poco erróneo ya que en el análisis VAR (que es muy popular, por lo tanto, su afirmación no debe decirse en términos de "general"), el punto central es interpretar las funciones de respuesta al impulso en lugar de interpretar los coeficientes del modelo (a menudo , son demasiado complicados para intentar interpretarlos).
Graeme Walsh
@GraemeWalsh: veo, como dije, no trabajo en series macro / temporales. Gracias por señalar esto.
StasK
20

Es mejor explicarlo en términos de regresión lineal, ya que es la herramienta principal de la econometría. En regresión lineal tenemos un modelo:

Y=Xβ+ε

La principal diferencia entre otros campos estadísticos y econometría es que se trata como fijo en otros campos y se trata como variable aleatoria en econometría. El cuidado adicional que debe usar para ajustarse a esta diferencia produce diferentes jergas y diferentes métodos. En general, puede decir que todos los métodos utilizados en econometría son los mismos métodos que en otros campos estadísticos con ajuste para la aleatoriedad de las variables explicativas. La notable excepción es GMM , que es una herramienta exclusivamente econométrica.X

Otra forma de ver la diferencia es que los datos en otros campos estadísticos pueden considerarse como una muestra iid. En econometría, los datos en muchos casos son una muestra del proceso estocástico, de los cuales iid es solo un caso especial. De ahí otra vez jerga diferente.

Conocer lo anterior suele ser suficiente para saltar fácilmente de otros campos estadísticos a la econometría. Como generalmente se proporciona el modelo, no es difícil descubrir qué es qué. En mi opinión personal, la diferencia de jerga entre el aprendizaje automático y las estadísticas clásicas es mucho mayor que entre la econometría y las estadísticas clásicas.

Sin embargo, tenga en cuenta que hay términos que tienen un significado complicado en las estadísticas sin la econometría. El primer ejemplo son los efectos fijos y aleatorios. Los artículos de Wikipedia sobre estos términos son un desastre, ya que combinan econometría con estadísticas.

mpiktas
fuente
55
"El primer ejemplo son los efectos fijos y aleatorios. Los artículos de Wikipedia sobre estos términos son un desastre, ya que mezclan la econometría con las estadísticas". Tan verdadero.
Michael Bishop
8

Una sutil diferencia es que los economistas a veces atribuyen significado a los términos de error en los modelos. Esto es especialmente cierto entre los economistas "estructurales" que creen que puede estimar parámetros estructurales que representan interés o heterogeneidad individual.

Un ejemplo de clase de esto es el probit. Mientras que los estadísticos generalmente son agnósticos acerca de qué causa el término de error, los economistas con frecuencia ven los términos de error en las regresiones como una representación de la heterogeneidad de las preferencias. Para el caso probit, puede modelar la decisión de una mujer de unirse a la fuerza laboral. Esto estará determinado por una variedad de variables, pero el término de error representará un grado no observado en el que las preferencias individuales para el trabajo pueden variar.

d_a_c321
fuente
44
Si bien los estadísticos pueden ser agnósticos acerca de qué causa el término de error, eso no significa que no les importe. Lo que describe es la heterogeneidad del término de error, lo que significa que no se cumplen los supuestos habituales sobre los términos de error. Ningún estadístico ignorará eso.
mpiktas
2
Curiosamente, en este caso, no hay problema con la forma del término de error. Tanto los estadísticos como los economistas se levantarán en armas y se preocuparán por la heterocedasticidad o cualquier otro término de error que no sea iid. Sin embargo, incluso si el término de error es N (0,1) como en un probit, los economistas pueden darle una interpretación económica.
d_a_c321
55
Eso se aplica al modelado en general. Interpretar el modelo a su manera especial no se limita a los economistas, en lo que respecta a mi experiencia.
mpiktas
Estoy en desacuerdo. Los economistas claramente tienen el monopolio de la interpretación inteligente de los modelos <¡es broma!>. Buen punto sin embargo.
d_a_c321
8

Por supuesto, cualquier declaración general está destinada a ser demasiado amplia. Pero mi experiencia ha sido que la econometría está preocupada por las relaciones causales y las estadísticas se han interesado más en la predicción.

En el aspecto económico, no se puede evitar la literatura sobre la "revolución de la credibilidad" ( Econometría principalmente inofensiva , etc.). Los economistas se centran en el impacto de algún tratamiento en algún resultado con miras a la evaluación y recomendación de políticas.

En el lado de las estadísticas, puede ver el aumento de la minería de datos / aprendizaje automático con aplicaciones de análisis y genética en línea como ejemplos notables. Aquí, los investigadores están más interesados ​​en predecir el comportamiento o las relaciones, en lugar de explicarlos con precisión; buscan patrones, en lugar de causas.

También mencionaría que los estadísticos tradicionalmente estaban más interesados ​​en el diseño experimental, volviendo a los experimentos agrícolas en la década de 1930.

Charlie
fuente
7

Me he dado cuenta de que, en comparación con lo que yo llamaría economistas de ciencia estadística convencionales, parecen reacios a usar gráficos, ya sea esquemáticos o basados ​​en datos. La cobertura de la regresión, que es naturalmente aún más central en econometría que en otros lugares, es un caso importante en este punto. Las introducciones modernas a la regresión por parte de los estadísticos enfatizan el valor de trazar los datos y trazar los resultados de la regresión, incluidas las gráficas de diagnóstico, mientras que el tratamiento en los textos de econometría es claramente más formal. Los textos principales en econometría no incluyen muchos gráficos y no promueven su valor fuertemente.

Es difícil analizar esto sin el riesgo de parecer poco diplomático o peor, pero supongo que alguna combinación de lo siguiente es contribuyente.

  1. Deseo de rigor. Los econométricos tienden a ser sospechosos u hostiles a aprender de los datos y prefieren que las decisiones se basen en pruebas formales (siempre que no salgan de un teorema). Esto está relacionado con una preferencia por modelos basados ​​en la "teoría" (aunque esto puede significar simplemente que un predictor fue mencionado previamente en un artículo por algún economista que no hablaba de datos).

  2. Prácticas de publicación. Los trabajos de las revistas de economía o econometría están llenos de tablas altamente estilizadas de coeficientes, errores estándar, estadísticas t y valores P. La adición de gráficos ni siquiera parece estar pensada en muchos casos y, si se ofrece, posiblemente sea sugerida por los revisores. Estas prácticas se han incorporado a lo largo de una generación o más en la medida en que se han vuelto automáticas, con convenciones rígidas sobre los niveles de importancia, etc.

  3. Gráficos para modelos complejos. Los gráficos tácitamente se ignoran siempre que no parece que haya un gráfico que coincida con un modelo complejo con muchos predictores, etc., etc. (que de hecho a menudo es difícil de decidir).

Naturalmente, lo que sugiero es una diferencia de medios, por así decirlo, y reconozco mucha variabilidad en ambos casos.

Nick Cox
fuente
4

A diferencia de la mayoría de las otras disciplinas cuantitativas, la economía se ocupa de las cosas en MARGIN. Es decir, utilidad marginal, tasa marginal de sustitución, etc. En términos de cálculo, la economía se ocupa de "primero" (y derivados de orden superior).

Muchas disciplinas estadísticas se ocupan de cantidades no derivadas, como medias y variaciones. Por supuesto, puede ir al área de distribuciones de probabilidad marginales y condicionales, pero algunas de estas aplicaciones también entran en economía (por ejemplo, "valor esperado").

Tom Au
fuente
2

No es econometría, es contexto. Si su función de probabilidad no tiene un óptimo único, se referirá tanto a un estadístico como a un econométrico. Ahora, si propone una suposición que proviene de la teoría económica y restringe la parametrización para que se identifique el parámetro, podría llamarse econometría, pero la suposición podría provenir de cualquier campo sustantivo.

La exogeneidad es una cuestión filosófica. Ver, por ejemplo, http://andrewgelman.com/2009/07/disputes_about/ para una comparación de diferentes puntos de vista, donde los economistas generalmente lo entienden como lo hace Rubin.

En resumen, adopte la jerga que usa su maestro o mantenga una mente abierta y lea ampliamente.

Alex
fuente
2

Los econométricos están casi exclusivamente interesados ​​en la inferencia causal, mientras que los estadísticos también usan modelos para predecir resultados. Como resultado, los economometristas se centran más en la exogeneidad (como otros han mencionado). Los economometristas de forma reducida y los economometristas estructurales llegan a estas interpretaciones causales de diferentes maneras.

Los economometristas de forma reducida tratan con frecuencia la exogeneidad utilizando técnicas de variables instrumentales (mientras que los estadísticos usan mucho menos IV).

Los economometristas estructurales obtienen interpretaciones causales de los parámetros al confiar en una cantidad de teoría que es rara en el trabajo de los estadísticos.

DanB
fuente
1
Los no estadísticos usan mucho la IV, y la econometría de forma reducida utiliza muchas técnicas para la inferencia causal además de la IV (diff-in-diff, discontinuidad de regresión, etc.). Consulte este documento de Imbens para una conciliación de la econometría IV con los recientes desarrollos estadísticos IV no econométricos.
Ari B. Friedman
2

Como estadístico, pienso en esto en términos más generales. Tenemos biometría y econometría. Ambas son áreas donde las estadísticas se utilizan para resolver problemas. Con la biometría nos ocupamos de problemas biológicos / médicos, mientras que la econometría se ocupa de la economía. De lo contrario, serían lo mismo, excepto que diferentes disciplinas enfatizan diferentes técnicas estadísticas. En biometría, el análisis de supervivencia y el análisis de tablas de contingencia son muy utilizados. Para la econometría, las series de tiempo son muy utilizadas. El análisis de regresión es común a ambos. Habiendo visto las respuestas sobre las diferencias de terminología entre economatría y bioestadística, parece que la pregunta real era principalmente sobre terminología y realmente solo abordé las otras dos. Las respuestas son tan buenas que no puedo agregarle nada. Me gustaron especialmente las respuestas de StasK. Pero como bioestadístico creo que utilizamos el modelo logit y el modelo logístico indistintamente. Llamamos log (p / [1-p]) la transformación logit.

Michael Chernick
fuente
2
(+1) Podría agregar psicometría a la lista de aplicaciones específicas de dominio de estadísticas aplicadas a problemas específicos de dominio.
Andy W