Lee y Lemieux (p. 31, 2009) sugieren al investigador que presente los gráficos mientras realiza el análisis de diseño de regresión discontinua (RDD). Sugieren el siguiente procedimiento:
"... para algo de ancho de banda , y para cierto número de bins y a la izquierda y a la derecha del valor de corte, respectivamente, la idea es construir bins ( , ], para + , donde "K 0 K 1 b k b k + 1 k = 1 , . . . , K = K 0 K 1 b k = c - ( K 0 - k + 1 ) ⋅ h .
c=cutoff point or threshold value of assignment variable
h=bandwidth or window width.
... luego compare los resultados medios justo a la izquierda y derecha del punto de corte ... "
... en todos los casos, también mostramos los valores ajustados de un modelo de regresión cuártica estimado por separado en cada lado del punto de corte ... (p. 34 del mismo documento)
Mi pregunta es cómo programamos ese procedimiento en Stata
o R
para trazar los gráficos de la variable de resultado contra la variable de asignación (con intervalos de confianza) para el RDD agudo. AquíStata
se menciona un ejemplo de muestra aquí y aquí (reemplace rd con rd_obs) y una muestra ejemplo en R
está aquí . Sin embargo, creo que ambos no implementaron el paso 1. Tenga en cuenta que ambos tienen los datos sin procesar junto con las líneas ajustadas en los gráficos.
Gráfico de muestra sin variable de confianza [Lee y Lemieux, 2009] Gracias de antemano.
Respuestas:
¿Es esto muy diferente de hacer dos polinomios locales de grado 2, uno para debajo del umbral y otro para arriba con suavizado en los puntos ? Aquí hay un ejemplo con Stata:Kyo
Alternativamente, puede guardar los valores suavizados de lpoly y los errores estándar como variables en lugar de usarlosX s e u l l ls s e tu l l l
twoway
. Debajo de está el bin, es la media suavizada, es el error estándar y y son los límites superior e inferior del intervalo de confianza del 95% para el resultado suavizado.Como puede ver, las líneas en la primera gráfica son las mismas que en la segunda.
fuente
Aquí hay un algoritmo enlatado. Calonico, Cattaneo y Titiunik propusieron recientemente un procedimiento para una selección robusta de ancho de banda. Implementaron su trabajo teórico para Stata y R , y también viene con un comando de trazado. Aquí hay un ejemplo en R:
Eso te dará este gráfico:
fuente