Obviamente, hay muchas formas de abusar de los métodos estadísticos. ¿Conoce algún ejemplo de mala práctica estadística que se publicó por primera vez como un consejo explícito (por ejemplo, "debe usar este método para ..."), en revistas académicas acreditadas que luego fueron citadas repetidamente?
Un ejemplo podría ser la regla de 10 eventos por predictor que a menudo se invoca para modelos de regresión logística o Cox PH ( LINK ).
Para ser claros, no me refiero a artículos altamente citados que utilizaron métodos de estadísticas deficientes; desafortunadamente, estos son trivialmente comunes.
references
statistical-falsehoods
DL Dahly
fuente
fuente
Respuestas:
RA Fisher, "La disposición de los experimentos de campo". Revista del Ministerio de Agricultura de Gran Bretaña. 33: 503-513. 1926
Según diversas fuentes en Internet, este documento es el origen del uso de como umbral de significancia en una prueba estadística arbitraria.α = 0.05
fuente
En econometría, ciertamente puede encontrar algún ejemplo de métodos propagados por econométricos bien conocidos (y altamente calificados) publicados en revistas decentes. No conozco un artículo teórico, pero Lalonde (1986) es bastante famoso por señalar que los métodos utilizados actualmente no funcionan bien: compara los métodos experimentales del mismo conjunto de datos con los observacionales y encuentra grandes diferencias en el campo del tratamiento (causal) evaluación . Existe una gran literatura que propagó estos métodos no experimentales que se utilizaron en aquel entonces y que a menudo todavía se usan en la actualidad.
Posteriormente, hubo (y creo que todavía hay) un debate sobre si la coincidencia de puntaje de propensión es una posible solución (ver, por ejemplo, aquí ).
Además, existe mucha controversia sobre la estimación de variables instrumentales . Las conclusiones de artículos originales muy citados han sido cuestionadas. Este es probablemente el ejemplo más cercano a su pregunta. Bound y Jaeger (1996, y documentos posteriores) han cuestionado los hallazgos del conocido artículo de Angrist y Krueger (1991; 2700 citas según Google Scholar) que básicamente estableció el método de la variable instrumental en la literatura de econometría aplicada.
También existe un gran debate sobre la idoneidad de las llamadas estimaciones de forma reducida para establecer la causalidad, véase, por ejemplo, Imbens (2010) .
Otro gran tema es, por supuesto, sobre el error estándar. Quizás se pueda encontrar un papel conocido que propague valores p. En econometría, el error estándar para series de tiempo más largas a menudo se ha calculado mal (en el diseño de diferencia en diferencia ) debido a métodos existentes incorrectos, ver aquí . Sin embargo, no conozco un documento original altamente citado que proponga estos métodos en ese contexto, pero estoy seguro de que encontrará algunos ejemplos en esta área.
Fuentes:
Angrist, Joshua D. y Alan B. Keueger. "¿La asistencia escolar obligatoria afecta la escolaridad y los ingresos?" The Quarterly Journal of Economics 106, núm. 4 (1991): 979-1014.
Bertrand, Marianne, Esther Duflo y Sendhil Mullainathan. "¿Cuánto debemos confiar en las estimaciones de diferencias en diferencias?" La revista trimestral de economía 119, no. 1 (2004): 249-275.
Bound, John y David A. Jaeger. Sobre la validez de la temporada de nacimiento como instrumento en las ecuaciones salariales: un comentario sobre "La asistencia obligatoria a la escuela de Angrist & Krueger afecta Scho. No. w5835. Oficina Nacional de Investigación Económica, 1996.
Dehejia, Rajeev. "Coincidencia práctica de puntaje de propensión: una respuesta a Smith y Todd". Revista de econometría 125, no. 1-2 (2005): 355-364.
Imbens, Guido W. "Mejor TARDE que nada: Algunos comentarios sobre Deaton (2009) y Heckman y Urzua (2009)". Revista de literatura económica 48, no. 2 (2010): 399-423.
LaLonde, Robert J. "Evaluación de las evaluaciones econométricas de programas de capacitación con datos experimentales". The American Economic Review (1986): 604-620. *
fuente
Lo intento (aunque no tan fuerte):
Lo muy útil [Cameron, AC y Miller, DL (2015). Guía de un practicante para inferencia robusta en clúster. Journal of Human Resources, 50 (2), 317-372.] // ya 1900 citas académicas de Google // proporciona consejos sobre el nivel apropiado de agrupamiento de errores estándar:
"El consenso es ser conservador y evitar sesgos y utilizar grupos más grandes y agregados cuando sea posible, hasta el punto en el que existe la preocupación de tener muy pocos grupos".
Sin embargo, [Abadie, A., Athey, S., Imbens, GW y Wooldridge, J. (2017). ¿Cuándo debe ajustar los errores estándar para la agrupación? (No. w24003). Oficina Nacional de Investigación Económica.] Muestra que "de hecho hay daño en la agrupación a un nivel demasiado agregado". Consulte la página 1 de más adelante: https://economics.mit.edu/files/13927
Tal vez también podría hacer un caso más sólido a partir de los dos conceptos erróneos resaltados por Abadie et al (2017).
fuente