Estoy tratando de entender cómo funcionan las funciones de influencia. ¿Podría alguien explicar en el contexto de una regresión OLS simple
donde quiero la función de influencia para .
regression
least-squares
stevejb
fuente
fuente
Respuestas:
Las funciones de influencia son básicamente una herramienta analítica que se puede utilizar para evaluar el efecto (o "influencia") de eliminar una observación sobre el valor de una estadística sin tener que volver a calcular esa estadística . También se pueden usar para crear estimaciones de varianza asintótica. Si la influencia es igual a entonces la varianza asintótica es I 2yo .yo2norte
La forma en que entiendo las funciones de influencia es la siguiente. Tiene algún tipo de CDF teórico, denotado por . Para OLS simples, tienesFyo( y) = Pr ( Yyo< yyo)
DondeΦ(z)es el CDF normal estándar, yσ2es la varianza del error. Ahora puede mostrar que cualquier estadística será una función de este CDF, de ahí la notaciónS(F)(es decir, alguna función deF). Ahora supongamos que cambiamos la funciónFpor un "poco", aF(i)(z)=(1+ζ)F(z)-ζδ(i)(
Por lo tanto, beta es una función de dos estadísticas: la varianza de X y la covarianza entre X e Y. Estas dos estadísticas tienen representaciones en términos de CDF como:
Ahora podemos usar la serie Taylor:
Simplificando esto da:
fuente
Aquí hay una forma súper general de hablar sobre las funciones de influencia de una regresión. Primero voy a abordar una forma de presentar las funciones de influencia:
De esto podemos definir la función de influencia con bastante facilidad:
La estimación de OLS es una solución al problema:
Tomando condiciones de primer orden:
Dado que la función de influencia es solo una derivada de Gateaux, ahora podemos decir:
La contraparte de muestra finita de esta función de influencia es:
En general, encuentro que este marco (trabajando con funciones de influencia como derivados de Gateaux) es más fácil de manejar.
fuente