¿Qué se entiende por error estándar de una estimación de máxima verosimilitud?

21

Soy matemático y estudio las estadísticas y lucho especialmente con el idioma.

En el libro que estoy usando, existe el siguiente problema:

Una variable aleatoria se da como -distribuido con . (Por supuesto, puede tomar cualquier distribución dependiendo de un parámetro en aras de esta pregunta). Luego se proporciona una muestra de cinco valores , , , , .XPareto(α,60)α>014216322

Primera parte: "Utilizando el método de máxima verosimilitud, encuentre una estimación de basada en [la muestra]". Esto no fue problema. La respuesta es .α^ alpha4,6931αα^4.6931

Pero luego: "Dé una estimación del error estándar de ".α^

¿Qué quieres decir con esto? Como es solo un número real fijo, no veo de qué manera podría tener un error estándar. ¿Debo determinar la desviación estándar de ?α^Pareto(α^,60)

Si cree que la pregunta no está clara, esta información también me ayudaría.

Stefan
fuente
¿Qué significa ? 60
Alecos Papadopoulos
¿Tienes una fórmula para ? Eso lo ayudará a estimar su error estándar. α^
soakley
1
@Glen_b Pero si fuera el límite inferior, ¿cómo podría ser que todos los valores de la muestra realizada sean más pequeños?
Alecos Papadopoulos
1
@ Alecos Ese es un excelente punto. Mi comentario no tiene sentido; Lo borré.
Glen_b -Reinstalar Monica
1
@Alecos: es la distribución con densidad . f ( x ) = α λ αPareto(α,λ)f(x)=αλα(λ+x)α+1
Stefan

Respuestas:

17

La otra respuesta ha cubierto la derivación del error estándar, solo quiero ayudarlo con la notación:

Su confusión se debe al hecho de que en Estadística usamos exactamente el mismo símbolo para denotar el Estimador (que es una función) y una estimación específica (que es el valor que toma el estimador cuando recibe como entrada una muestra concreta realizada).

Entonces y para . Entonces es una función de variables aleatorias y, por lo tanto, una variable aleatoria en sí misma, que ciertamente tiene una varianza. α (X=x)=4,6931x={14,α^=h(X)α^(X=x)=4.6931α ( X )x={14,21,6,32,2}α^(X)

En la estimación de ML, en muchos casos lo que podemos calcular es el error estándar asintótico , porque no se conoce la distribución de estimador de muestra finita (no se puede derivar).

Estrictamente hablando, no tiene una distribución asintótica, ya que converge a un número real (el número verdadero en casi todos los casos de estimación de ML). Pero la cantidad converge a una variable aleatoria normal (mediante la aplicación del Teorema del límite central).α^n(α^α)

Un segundo punto de confusión de notación : la mayoría, si no todos los textos, escribirán ("Avar" = varianza asintótica ") mientras que lo que significan es , es decir, se refieren a la varianza asintótica de la cantidad , no de ... Para el caso de un Pareto básico distribución tenemosAvar ( Avar(α^)Avar(n(α^α)) αn(α^α)α^

Avar[n(α^α)]=α2

y entonces

Avar(α^)=α2/n

(pero lo que encontrará escrito es ) Avar(α^)=α2

Ahora, ¿en qué sentido el Estimador tiene una "varianza asintótica", ya que, como se dijo, asintóticamente converge a una constante? Bueno, en un sentido aproximado y para muestras grandes pero finitas . Es decir, en algún lugar entre una muestra "pequeña", donde el Estimador es una variable aleatoria con una distribución (generalmente) desconocida, y una muestra "infinita", donde el estimador es una constante, existe este "territorio de muestra grande pero finito" donde el Estimador aún no se ha convertido en una constante y su distribución y varianza se derivan de forma indirecta, utilizando primero el Teorema del límite central para derivar la distribución asintótica adecuada de la cantidad Z=α^ α = 1Z=n(α^α)(lo cual es normal debido al CLT), y luego cambiar las cosas y escribir (mientras da un paso atrás y trata como finito) que muestra como una función afín de la variable aleatoria normal , por lo que normalmente se distribuye a sí misma (siempre aproximadamente).nαZα^=1nZ+αnα^Z

Alecos Papadopoulos
fuente
+1 para distinguir entre y - ciertamente la notación puede ser inconsistente. α^n(α^α)
Nate Pope
21

alfaα^ - un estimador de máxima verosimilitud - es una función de una muestra aleatoria, y también es aleatorio (no fijo). Se podría obtener una estimación del error estándar de partir de la información de Fisher,α^

I(θ)=E[2L(θ|Y=y)θ2|θ]

Donde es un parámetro y es la función de verosimilitud de condicional en la muestra aleatoria . Intuitivamente, la información de Fisher indica la inclinación de la curvatura de la superficie de probabilidad logarítmica alrededor del MLE y, por lo tanto, la cantidad de 'información' que proporciona sobre .L ( θ | Y = y ) θ y y θθL(θ|Y=y)θyyθ

Para una distribución con una sola realización , la probabilidad de registro donde se conoce :Y = y y 0Pareto(α,y0)Y=yy0

I(α)=1

L(α|y,y0)=logα+αlogy0(α+1)logyL(α|y,y0)=1α+logy0logyL(α|y,y0)=1α2
Enchufando a la definición de información de Fisher, Para una muestra El estimador de máxima verosimilitud se distribuye asintóticamente como: Donde es el tamaño de la muestra. Como es desconocido, podemos conectar {y1,y2,.
I(α)=1α2
α α n ~ N ( α , 1{y1,y2,...,yn}α^ nα α SE( α )
α^nN(α,1nI(α))=N(α,α2n), 
nαα^ para obtener una estimación del error estándar:
SE(α^)α^2/n4.69312/52.1
Papa Nate
fuente
1
Para su penúltima línea, , no parece que la notación sea correcta. Si , entonces no puede aparecer en el lado derecho. En su lugar, deseann α ˙ N(α,1α^nN(α,1nI(α))nnα^˙N(α,1nI(α))
user321627