Si en las regresiones estándar de OLS se violan dos supuestos (distribución normal de errores, homocedasticidad), ¿son los errores estándar de arranque y los intervalos de confianza una alternativa apropiada para llegar a resultados significativos con respecto a la importancia de los coeficientes regresores?
¿Las pruebas de significación con errores estándar de arranque e intervalos de confianza todavía "funcionan" con heterocedasticidad?
En caso afirmativo, ¿cuáles serían los intervalos de confianza aplicables que se pueden utilizar en este escenario (percentil, BC, BCA)?
Finalmente, si el bootstrapping es apropiado en este escenario, ¿cuál sería la literatura relevante que debe leerse y citarse para llegar a esta conclusión? Cualquier sugerencia sería muy apreciada!
Respuestas:
Hay al menos tres (puede haber más) enfoques para realizar el arranque para la regresión lineal con datos independientes, pero no distribuidos de manera idéntica. (Si tiene otras violaciones de los supuestos "estándar", por ejemplo, debido a autocorrelaciones con datos de series de tiempo, o agrupamiento debido al diseño de muestreo, las cosas se vuelven aún más complicadas).
La referencia final es Wu (1986) , pero los Anales no son exactamente la lectura del libro ilustrado.
ACTUALIZACIONES basadas en las preguntas de seguimiento del OP formuladas en los comentarios:
El número de réplicas me pareció grande; La única buena discusión de este parámetro de arranque que conozco es en el libro Introducción a Bootstrap de Efron y Tibshirani .
fuente
reps(2500)
es probablemente una exageración, al menos para los errores estándar; Creo quereps(500)
está bien para la mayoría de los propósitos prácticos. El libro de introducción de Efron y Tibshirani tiene una sección sobre el número de réplicas. También tienen un capítulo completo sobre regresión, por lo que puede ser otra buena referencia para que la veas.robust
opción de su regresión.est store
ambos resultados yest tab, se
compararlos uno al lado del otro.