Los resultados asintóticos no pueden ser probados por simulación por computadora, porque son declaraciones que involucran el concepto de infinito. Pero deberíamos poder tener la sensación de que las cosas realmente marchan como la teoría nos lo dice.
Considere el resultado teórico
donde es una función de variables aleatorias, digamos distribuidas de manera idéntica e independiente. Esto dice que converge en probabilidad a cero. El ejemplo arquetípico aquí, supongo, es el caso donde es la media de la muestra menos el valor común esperado de los iidrv de la muestra,
PREGUNTA: ¿Cómo podríamos demostrar de manera convincente a alguien que la relación anterior "se materializa en el mundo real", utilizando los resultados de la simulación por computadora de muestras necesariamente finitas?
Tenga en cuenta que elegí específicamente la convergencia a una constante .
Proporciono a continuación mi enfoque como respuesta, y espero mejores.
ACTUALIZACIÓN: Algo en la parte posterior de mi cabeza me molestó, y descubrí qué. Desenterré una pregunta anterior en la que se realizó una discusión muy interesante en los comentarios a una de las respuestas . Allí, @Cardinal proporcionó un ejemplo de un estimador que es consistente pero que su varianza permanece no nula y finita asintóticamente. Entonces, una variante más difícil de mi pregunta es: ¿cómo mostramos por simulación que una estadística converge en probabilidad a una constante, cuando esta estadística mantiene asintóticamente la varianza finita y no nula?
fuente
Respuestas:
Pienso en como una función de distribución (complementaria en el caso específico). Como quiero usar la simulación por computadora para demostrar que las cosas tienden de la manera en que el resultado teórico nos dice, necesito construir la función de distribución empírica de, o la distribución de frecuencia relativa empírica, y luego de alguna manera muestran que a medida que aumenta, los valores de concentrarse "más y más" a cero. | X n | n | X n |PAG( ) El | XnorteEl | norte El | XnorteEl |
Para obtener una función de frecuencia relativa empírica, necesito (mucho) más de una muestra que aumenta de tamaño, porque a medida que aumenta el tamaño de la muestra, la distribución decambios para cada diferente . norteEl | XnorteEl | norte
Entonces necesito generar a partir de la distribución de las de , "en paralelo", digamos en miles, cada una de un tamaño inicial , digamos en decenas de miles. Necesito entonces calcular el valor dede cada muestra (y para el mismo ), es decir, obtener el conjunto de valores . m m n n | X n | n { | x 1 n | , | x 2 n | , . . . , | x m n | }Yyo metro metro norte norte El | XnorteEl | norte { | X1 nEl | , | X2 nEl | ,. . . , | Xm nEl | }
Estos valores pueden usarse para construir una distribución empírica de frecuencia relativa. Teniendo fe en el resultado teórico, espero que "mucho" de los valores deestará "muy cerca" de cero, pero por supuesto, no todos.El | XnorteEl |
Entonces, para mostrar que los valores dede hecho, marcho hacia cero en números cada vez mayores, tendría que repetir el proceso, aumentando el tamaño de la muestra para decir , y mostrar que ahora la concentración a cero "ha aumentado". Obviamente, para mostrar que ha aumentado, se debe especificar un valor empírico para .2 n ϵEl | XnorteEl | 2 n ϵ
¿Sería eso suficiente? ¿Podríamos formalizar de alguna manera este "aumento de la concentración"? ¿Podría este procedimiento, si se realiza en más pasos de "aumento del tamaño de la muestra", y el uno está más cerca del otro, proporcionarnos alguna estimación sobre la tasa real de convergencia , es decir, algo así como "masa de probabilidad empírica que se mueve por debajo del umbral por cada "de, digamos, mil?norte
O, examine el valor del umbral para el cual, digamos que el % de la probabilidad se encuentra debajo, y vea cómo este valor de se reduce en magnitud.ϵ90 ϵ
UN EJEMPLO
Considere que los son y así U ( 0 , 1 )Yyo U( 0 , 1 )
Primero generamos muestras de tamaño cada una. La distribución de frecuencia relativa empírica deparecem=1,000 n=10,000 |X10,000|
y notamos que el % de los valores deson más pequeños que .90.10 |X10,000| 0.0046155
A continuación, aumento el tamaño de la muestra a . Ahora la distribución empírica de frecuencia relativa deparece y notamos que el % de los valores deestán por debajo de . Alternativamente, ahora el % de los valores caen por debajo de .| X 20 , 000 | 91,80 | X 20 , 000 | 0.0037101 98.00 0.0045217n=20,000 |X20,000| 91.80 |X20,000| 0.0037101 98.00 0.0045217
¿Te convencería tal demostración?
fuente