Suponga la siguiente relación lineal: , donde es la variable dependiente, una variable independiente y el término de error.
Según Stock & Watson (Introducción a la Econometría; Capítulo 4 ), el tercer supuesto de mínimos cuadrados es que los cuartos momentos de y son distintos de cero y finitos .
Tengo tres preguntas:
No entiendo completamente el papel de esta suposición. ¿Es parcial e inconsistente OLS si esta suposición no se cumple o necesitamos esta suposición para inferencia?
Stock y Watson escriben "esta suposición limita la probabilidad de hacer una observación con valores extremadamente grandes de o ". Sin embargo, mi intuición es que esta suposición es extrema. ¿Estamos en problemas si tenemos grandes valores atípicos (de modo que los cuartos momentos son grandes) pero si estos valores siguen siendo finitos? Por cierto: ¿Cuál es la definición subyacente de un valor atípico?
¿Podemos reformular esto de la siguiente manera: "La curtosis de y son distintas de cero y finitas?"
Respuestas:
Usted no necesita supuestos en la 4ª momentos para la consistencia del estimador MCO, pero lo hace suposiciones necesita en los momentos más altos de y ε de normalidad asintótica y estimar consistentemente lo que la matriz de covarianza asintótica es.X ϵ
Sin embargo, en cierto sentido, ese es un punto matemático, técnico, no práctico. Para que OLS funcione bien en muestras finitas, en cierto sentido requiere más que los supuestos mínimos necesarios para lograr la consistencia o normalidad asintótica como .n → ∞
Condiciones suficientes para la consistencia:
Si tiene una ecuación de regresión:
El OLS estimador de b se puede escribir como: b = β + ( X ' Xsi^
Para mantener la coherencia , debe poder aplicar la Ley de grandes números de Kolmogorov o, en el caso de series temporales con dependencia en serie, algo así como el Teorema ergódico de Karlin y Taylor para que:
Otros supuestos necesarios son:
Entonces y se obtiene b p →ß( X′Xnorte)- 1( X′ϵnorte) →pag0 0 si^→pagβ
Si desea que se aplique el teorema del límite central, entonces necesita suposiciones en los momentos superiores, por ejemplo, donde g i = x i ϵ i . El teorema del límite central es lo que le da la normalidad asintótica de b y le permite hablar acerca de los errores estándar. Para que exista el segundo momento E [ g i g ′ i ] , necesita los 4tos momentos de x y ϵ para existir. Quieres argumentar que √E [ gyosol′yo] solyo= xyoϵyo si^ E [ gyosol′yo] X ϵ dondeΣ=E[xix ′ i ϵ 2 i ]. Para que esto funcione,Σtiene que ser finito.norte--√( 1norte∑yoX′yoϵyo) →renorte( 0 , Σ ) Σ = E [ xyoX′yoϵ2yo] Σ
Una buena discusión (que motivó esta publicación) se da en la Econometría de Hayashi . (Ver también p. 149 para los 4tos momentos y estimar la matriz de covarianza.)
Discusión:
Estos requisitos en los 4tos momentos es probablemente un punto técnico más que práctico. ¿Probablemente no va a encontrar distribuciones patológicas donde esto sea un problema en los datos cotidianos? Es para que los supuestos más comunes u otros OLS salgan mal.
Una pregunta diferente, sin duda respondida en otro lugar en Stackexchange, es qué tan grande de una muestra necesita para que las muestras finitas se acerquen a los resultados asintóticos. En cierto sentido, los valores atípicos fantásticos conducen a una convergencia lenta. Por ejemplo, intente estimar la media de una distribución lognormal con una varianza realmente alta. La media de la muestra es un estimador consistente e imparcial de la media de la población, pero en ese caso logarítmico normal con una curtosis excesiva excesiva, etc.
Finito vs. infinito es una distinción enormemente importante en matemáticas. Ese no es el problema que encuentras en las estadísticas diarias. Los problemas prácticos están más en la categoría pequeña vs. grande. ¿La varianza, curtosis, etc. es lo suficientemente pequeña como para que pueda lograr estimaciones razonables dado el tamaño de mi muestra?
Ejemplo patológico donde el estimador de MCO es consistente pero no asintóticamente normal
Considerar:
Donde x i ∼ N ( 0 , 1 ) pero ϵ i se extrae de una distribución t con 2 grados de libertad, entonces V a r ( ϵ i ) = ∞ . Los OLS estiman converge en probabilidad a B pero la distribución de la muestra para los OLS estiman b no se distribuye normalmente. A continuación se muestra la distribución empírica para b
La distribución de b no es normal, las colas son demasiado pesados. Pero si aumenta los grados de libertad a 3 para que exista el segundo momento de ϵ i , entonces se aplica el límite central y obtiene:si^ ϵyo
Código para generarlo:
fuente
Estos fundamentos teóricos de las estadísticas causan mucha confusión cuando se reducen a aplicaciones prácticas. No existe una definición de valor atípico, es un concepto intuitivo. Para entenderlo más o menos, la observación tendría que ser un alto punto de apalancamiento o un alto punto de influencia, por ejemplo, uno para el que el diagnóstico de eliminación (DF beta) es muy grande, o para el cual la distancia de Mahalanobis en los predictores es grande (en estadísticas univariadas eso es solo un puntaje Z). Pero volvamos a los asuntos prácticos: si llevo a cabo una encuesta aleatoria de las personas y los ingresos de su hogar, y de cada 100 personas, 1 de las personas que tomo como muestra es millonaria, mi mejor conjetura es que los millonarios son representativos del 1% de la población . En una conferencia de bioestadística, estos principios se discuten y enfatizan que cualquier herramienta de diagnóstico es esencialmente exploratoria [3].no "el análisis que excluye el valor atípico es el que creo", es "eliminar un punto cambió por completo mi análisis".
La curtosis es una cantidad escalada que depende del segundo momento de una distribución, pero la suposición de una varianza finita no distinta de estos valores es tácita, ya que es imposible que esta propiedad se mantenga en el cuarto momento pero no en el segundo. Básicamente sí, pero en general nunca he inspeccionado ni la curtosis ni los cuartos momentos. No creo que sean una medida práctica o intuitiva. En este día, cuando se produce un histograma o diagrama de dispersión con el chasquido de los dedos, nos corresponde usar estadísticas de diagnóstico gráficas cualitativas, al inspeccionar estos gráficos.
[1] /math/79773/how-does-one-prove-that-lindeberg-condition-is-satisfied
[2] http://projecteuclid.org/download/pdf_1/euclid.ss/1177013818
[3] http://faculty.washington.edu/semerson/b517_2012/b517L03-2012-10-03/b517L03-2012-10-03.html
fuente