Valor esperado de estimación de parámetro de moneda de máxima verosimilitud

8

Supongamos que tengo un experimento de lanzamiento de moneda en el que quiero calcular la estimación de probabilidad máxima del parámetro de moneda cuando lanzo la moneda veces. Después de calcular la derivada de la función de probabilidad binomial L (p) = {n \ choose x} p ^ x (1-p) ^ {nx} , obtengo el valor óptimo para p para que sea p ^ {*} = \ frac {x} {n} , siendo x el número de éxitos.pnL(p)=(nx)px(1p)nxpp=xnx

Mis preguntas ahora son:

  • ¿Cómo calcularía el valor / varianza esperado de esta estimación de máxima verosimilitud para p ?
  • ¿Necesito calcular el valor / varianza esperado para L(p) ?
  • En caso afirmativo, ¿cómo haría eso?
Manu
fuente
1
Supongo que esto es algún tipo de autoaprendizaje (deberías etiquetarlo como tal). ¿Qué es exactamente lo que quieres? ¿Inferencia en su parámetro?
pkofod
¿Qué quiere decir inferencia sobre el parámetro? No estoy seguro de cómo calcularía el valor / varianza esperado para la cantidad . Quiero decir, sé qué es la media / varianza y cómo calcularla para ejemplos simples, pero no entiendo cómo aplicarla a . pp
Manu

Respuestas:

6

En primer lugar, esta es una pregunta de autoaprendizaje, por lo que voy a entrar demasiado en todos y cada uno de los pequeños detalles técnicos, pero tampoco voy a entrar en un frenesí de derivación. Hay muchas maneras de hacer esto. Te ayudaré utilizando las propiedades generales del estimador de máxima verosimilitud.

Información de contexto

Para resolver su problema, creo que necesita estudiar la máxima probabilidad desde el principio. Probablemente esté utilizando algún tipo de libro de texto, y la respuesta realmente debería estar allí en alguna parte. Te ayudaré a descubrir qué buscar.

La probabilidad máxima es un método de estimación que es básicamente lo que llamamos un estimador M (piense en la "M" como "maximizar / minimizar"). Si se cumplen las condiciones requeridas para usar estos métodos, podemos mostrar que las estimaciones de los parámetros son consistentes y normalmente distribuidas asintóticamente, por lo que tenemos:

N(θ^θ0)dNormal(0,A01B0A01),

donde y son algunas matrices. Cuando usamos la máxima verosimilitud podemos mostrar que , y por lo tanto tenemos una expresión simple: Tenemos que donde denota la arpillera. Esto es lo que necesita estimar para obtener su varianza.A0B0A0=B0

N(θ^θ0)dNormal(0,A01).
A0E(H(θ0))H

Su problema específico

Entonces, ¿Cómo lo hacemos? Aquí llamemos a nuestro vector de parámetros lo que haces: . Esto es solo un escalar, por lo que nuestra "puntuación" es solo la derivada y el "hessian" es solo la derivada de segundo orden. Nuestra función de probabilidad se puede escribir como: que es lo que queremos maximizar. Usó la primera derivada de esto o la probabilidad de registro para encontrar su . En lugar de establecer la primera derivada igual a cero, podemos diferenciar nuevamente para encontrar la derivada de segundo orden . Primero tomamos registros: Luego nuestra 'puntuación' es: y nuestro 'hessian': θp

l(p)=(p)x(1p)nx,
pH(pags)
ll(pags)Iniciar sesión(l(pags))=XIniciar sesión(pags)+(norte-X)Iniciar sesión(1-pags)
ll(pags)=Xpags+norte-X1-pags,
H(pags)=ll(pags)=-Xpags2-norte-X(1-pags)2.
Entonces nuestra teoría general de arriba solo te dice que encuentres . Ahora solo tiene que tomar la expectativa de (Sugerencia: use ), multiplique por y tome el inverso. Entonces tendrás tu varianza del estimador.(-mi(H(pags)))-1H(pags)mi(X/ /norte)=pags-1
pkofod
fuente
¿ correcto? Vunar(pags)=pags2-1norte-1nortepags
Manu
@Manu: No del todo, pero parece que acabas de cometer un pequeño error en alguna parte. ¿Puedes publicar algunos pasos más?
pkofod
(E(H(p)))1=E(H(p))1]=(E(xp2)+E(nx(1p)2))1=(p2np+(1p)2(nnp))1 . a partir de ahí simplifiqué multiplicando y tomando el inverso.
Manu
Eso es todo correcto, ahora simplemente simplifica. En la primera parte, p se cancela, y en la segunda parte puede tomar n fuera del paréntesis.
pkofod
2
(n/p+n/[1p])1 es lo que tienes arriba. Solo factoriza la , pon un denominador común y luego toma el recíproco. norte
ekvall
6

Para comenzar, hagamos el valor esperado:

Si es el número de éxitos en lanzamientos, entonces es la proporción de éxitos en su muestra. Considere ; para cada lanzamiento, la probabilidad de éxito es acuerdo con los supuestos, de modo que cuando se lanza la moneda una vez, el "número de éxitos" esperado es , ¿verdad? Por lo tanto, si lanzas la moneda veces, esperarías éxito veces porque los lanzamientos son independientes. Entonces, dado que es el número de éxitos esperados en lanzamientos, obtienesXnortex/nortemiXpagspags×1+(1-pags)×0 0=pagsnortenortepagsnortepagsnorte

mipags=minorte-1X=norte-1miX=norte-1×nortepags=pags

Entonces el estimador es imparcial. ¿Puedes imaginar cómo hacer la varianza desde aquí?

Editar: también hagamos la varianza. Usamos ese . El segundo término ya lo tenemos del cálculo del valor esperado, así que hagamos el primero: Para simplificar algunos , podemos expresar el número de éxitos en lanza de la siguiente manera: donde toma el valor 1 si tiro fue un éxito y 0 en caso contrario. Por lo tanto, y así juntando las cosas llegas a .Var(pags)=mipags2-(mipags)2

mipags2=norte-2miX2
norte
X=1norteχyo,
χyoyo
miX2=mi(1norteχyo)2=mi[1norteχyo2+2yo<jχyoχj]=nortepags+norte(norte-1)pags2,
Var(pags)=pags(1-pags)norte
ekvall
fuente
Si arrojas seguidas, tu . Sin embargo, ¿qué valor exacto tomaría Var ( )? norte=3pagsMETROLmi=1.0pags
Piccolo