¿Cómo derivar la función de probabilidad de distribución binomial para la estimación de parámetros?

22

Según Miller and Freund's Probability and Statistics for Engineers, 8ed (pp.217-218), la función de probabilidad de maximizar la distribución binomial (ensayos de Bernoulli) se da como

L(p)=i=1npxi(1p)1xi

¿Cómo llegar a esta ecuación? Me parece bastante claro con respecto a las otras distribuciones, Poisson y Gaussian;

L(θ)=i=1nPDF or PMF of dist.

Pero el del binomio es solo un poco diferente. Para ser directo, ¿cómo

nCx px(1p)nX

volverse

pxyo(1-pags)1-Xyo

en la función de probabilidad anterior?

Ébe Isaac
fuente

Respuestas:

25

En la estimación de máxima verosimilitud, está intentando maximizar ; sin embargo, maximizar esto es equivalente a maximizar p x ( 1 - p ) n - x para una x fija .nortedoX pagsX(1-pags)norte-XpagsX(1-pags)norte-XX

En realidad, la probabilidad de que gaussiano y poisson tampoco impliquen sus constantes principales, por lo que este caso es como el de w


Direccionamiento OPs Comentario

Aquí hay un poco más de detalle:

Primero, es el número total de éxitos, mientras que x i es una única prueba (0 o 1). Por lo tanto:XXyo

yo=1nortepagsXyo(1-pags)1-Xyo=pags1norteXyo(1-pags)1norte1-Xyo=pagsX(1-pags)norte-X

Eso muestra cómo obtienes los factores de probabilidad (ejecutando los pasos anteriores al revés).

¿Por qué desaparece la constante? Informalmente, y lo que hace la mayoría de las personas (incluyéndome a mí), es solo notar que la constante principal no afecta el valor de que maximiza la probabilidad, por lo que simplemente lo ignoramos (efectivamente lo establecemos en 1).pags

Podemos derivar esto tomando el registro de la función de probabilidad y encontrando dónde su derivada es cero:

En(nortedoX pagsX(1-pags)norte-X)=En(nortedoX)+XEn(pags)+(norte-X)En(1-pags)

pags0 0

rerepagsEn(nortedoX)+XEn(pags)+(norte-X)En(1-pags)=Xpags-norte-X1-pags=0 0

norteX=1pagspags=Xnorte

Observe que la constante inicial se retiró del cálculo de la MLE.

L1,L2L1=kL2pags

A nivel práctico, la inferencia que usa la función de probabilidad se basa realmente en la razón de probabilidad, no en el valor absoluto de la probabilidad. Esto se debe a la teoría asintótica de las razones de probabilidad (que son asintóticamente chi-cuadrado, sujetas a ciertas condiciones de regularidad que a menudo son apropiadas). Las pruebas de razón de probabilidad se ven favorecidas debido al Lema de Neyman-Pearson . Por lo tanto, cuando intentamos probar dos hipótesis simples, tomaremos la relación y el factor principal común se cancelará.

NOTA: Esto no sucederá si estuviera comparando dos modelos diferentes, digamos un binomio y un poisson. En ese caso, las constantes son importantes.

De las razones anteriores, la primera (irrelevancia para encontrar el maximizador de L) responde más directamente a su pregunta.


fuente
2
nortedoXnorte
@ ÉbeIsaac agregó algunos detalles más
2

xi en el producto se refiere a cada prueba individual. Para cada prueba individual, xi puede ser 0 o 1 yn es igual a 1 siempre. Por lo tanto, trivialmente, el coeficiente binomial será igual a 1. Por lo tanto, en la fórmula del producto para la probabilidad, el producto de los coeficientes binomiales será 1 y, por lo tanto, no hay nCx en la fórmula. Me di cuenta de esto mientras lo trabajaba paso a paso :) (Perdón por el formato, no estoy acostumbrado a responder con expresiones matemáticas en las respuestas ... todavía :))

Abhishek Tiwari
fuente