Soy matemático y estudio las estadísticas y lucho especialmente con el idioma.
En el libro que estoy usando, existe el siguiente problema:
Una variable aleatoria se da como -distribuido con . (Por supuesto, puede tomar cualquier distribución dependiendo de un parámetro en aras de esta pregunta). Luego se proporciona una muestra de cinco valores , , , , .
Primera parte: "Utilizando el método de máxima verosimilitud, encuentre una estimación de basada en [la muestra]". Esto no fue problema. La respuesta es . alpha ≈4,6931
Pero luego: "Dé una estimación del error estándar de ".
¿Qué quieres decir con esto? Como es solo un número real fijo, no veo de qué manera podría tener un error estándar. ¿Debo determinar la desviación estándar de ?
Si cree que la pregunta no está clara, esta información también me ayudaría.
fuente
Respuestas:
La otra respuesta ha cubierto la derivación del error estándar, solo quiero ayudarlo con la notación:
Su confusión se debe al hecho de que en Estadística usamos exactamente el mismo símbolo para denotar el Estimador (que es una función) y una estimación específica (que es el valor que toma el estimador cuando recibe como entrada una muestra concreta realizada).
Entonces y para . Entonces es una función de variables aleatorias y, por lo tanto, una variable aleatoria en sí misma, que ciertamente tiene una varianza. α (X=x)=4,6931x={14,α^= h ( X ) α^( X = x ) = 4.6931 α ( X )x ={14,21 ,6 ,32 ,2 } α^( X)
En la estimación de ML, en muchos casos lo que podemos calcular es el error estándar asintótico , porque no se conoce la distribución de estimador de muestra finita (no se puede derivar).
Estrictamente hablando, no tiene una distribución asintótica, ya que converge a un número real (el número verdadero en casi todos los casos de estimación de ML). Pero la cantidad converge a una variable aleatoria normal (mediante la aplicación del Teorema del límite central). √α^ norte--√( α^- α )
Un segundo punto de confusión de notación : la mayoría, si no todos los textos, escribirán ("Avar" = varianza asintótica ") mientras que lo que significan es , es decir, se refieren a la varianza asintótica de la cantidad , no de ... Para el caso de un Pareto básico distribución tenemosAvar ( √Avar ( α^) √Avar ( n--√( α^- α ) ) αnorte--√( α^- α ) α^
y entonces
(pero lo que encontrará escrito es )Avar ( α^) = α2
Ahora, ¿en qué sentido el Estimador tiene una "varianza asintótica", ya que, como se dijo, asintóticamente converge a una constante? Bueno, en un sentido aproximado y para muestras grandes pero finitas . Es decir, en algún lugar entre una muestra "pequeña", donde el Estimador es una variable aleatoria con una distribución (generalmente) desconocida, y una muestra "infinita", donde el estimador es una constante, existe este "territorio de muestra grande pero finito" donde el Estimador aún no se ha convertido en una constante y su distribución y varianza se derivan de forma indirecta, utilizando primero el Teorema del límite central para derivar la distribución asintótica adecuada de la cantidad Z=√α^ α = 1Z= n--√( α^- α ) (lo cual es normal debido al CLT), y luego cambiar las cosas y escribir (mientras da un paso atrás y trata como finito) que muestra como una función afín de la variable aleatoria normal , por lo que normalmente se distribuye a sí misma (siempre aproximadamente).nαZα^= 1norte√Z+ α norte α^ Z
fuente
alfaα^ - un estimador de máxima verosimilitud - es una función de una muestra aleatoria, y también es aleatorio (no fijo). Se podría obtener una estimación del error estándar de partir de la información de Fisher,α^
Donde es un parámetro y es la función de verosimilitud de condicional en la muestra aleatoria . Intuitivamente, la información de Fisher indica la inclinación de la curvatura de la superficie de probabilidad logarítmica alrededor del MLE y, por lo tanto, la cantidad de 'información' que proporciona sobre .L ( θ | Y = y ) θ y y θθ L(θ|Y=y) θ y y θ
Para una distribución con una sola realización , la probabilidad de registro donde se conoce :Y = y y 0Pareto(α,y0) Y=y y0
I(α)=1
fuente