Estoy estudiando sobre la estimación de máxima verosimilitud y leí que la función de verosimilitud es el producto de las probabilidades de cada variable. ¿Por qué es el producto? ¿Por qué no la suma? He estado intentando buscar en Google pero no puedo encontrar ninguna respuesta significativa.
maximum-likelihood
RuiQi
fuente
fuente
80% + 75% = 155%
? ¿qué tal80% * 75% = 60%
?Respuestas:
Esta es una pregunta muy básica, y en lugar de usar lenguaje formal y notación matemática, trataré de responderla a un nivel en el que todos los que puedan entender la pregunta también puedan entender la respuesta.
Imagina que tenemos una raza de gatos. Tienen un 75% de probabilidad de nacer blanco y un 25% de probabilidad de nacer gris, sin otros colores. Además, tienen un 50% de probabilidad de tener ojos verdes y un 50% de probabilidad de tener ojos azules, y el color del pelaje y el color de los ojos son independientes.
Ahora echemos un vistazo a una camada de ocho gatitos:
Verá que 1 de cada 4, o el 25%, son grises. Además, 1 de cada 2, o el 50% tiene ojos azules. Ahora la pregunta es:
Puedes contarlos, la respuesta es una. Es decir, , o 12.5% de 8 gatitos.14 4× 12= 18
¿Por que sucede? Porque cualquier gato tiene una probabilidad de 1 en 4 de ser gris. Entonces, elige cuatro gatos, y puedes esperar que uno de ellos sea gris. Pero si solo elige cuatro gatos de entre muchos (y obtiene el valor esperado de 1 gato gris), el que es gris tiene una probabilidad de 1 en 2 de tener ojos azules. Esto significa que, del total de gatos que eliges, primero multiplicas el total por un 25% para obtener los gatos grises, y luego multiplicas el 25% seleccionado de todos los gatos por un 50% para obtener los que tienen ojos azules. Esto te da la probabilidad de tener gatos grises de ojos azules.
Resumirlos te daría , que hace314 4+ 12 o 6 de 8. En nuestra imagen, corresponde a resumir los gatos que tienen ojos azules con los gatos que tienen pelaje gris, ¡y contar dos veces el gatito gris de ojos azules! Tal cálculo puede tener su lugar, pero es bastante inusual en los cálculos de probabilidad, y ciertamente no es el que está preguntando.34 4
fuente
fuente
Por lo tanto, si supone que todas sus observaciones son independientes, entonces la probabilidad de observar todos los valores que vio es igual al producto de las probabilidades individuales.
fuente
¿Por qué no agregar?
Porque eso claramente no tiene sentido. Supongamos que tiene un cuarto y una moneda de cinco centavos, y desea voltearlos a ambos. Hay un 50% de posibilidades de que el trimestre salga cara, y un 50% de posibilidades de que el níquel salga cara. Si la probabilidad de que ambos salieran cara fuera la suma, eso daría un 100% de posibilidades, lo que obviamente es incorrecto, ya que no deja ninguna posibilidad para HT, TH y TT.
¿Por qué multiplicar?
Porque tiene sentido. Cuando multiplicas el 50% de probabilidad de que el cuarto salga cara por el 50% de probabilidad de que el níquel salga cara, obtienes 0.5 x 0.5 = 0.25 = 25% de probabilidad de que ambas monedas sean caras. Dado que hay cuatro combinaciones posibles (HH, HT, TH, HT) y cada una es igualmente probable, esto encaja perfectamente. Al evaluar la probabilidad de que ocurran dos eventos independientes, multiplicamos sus probabilidades individuales.
fuente
Estoy leyendo estas publicaciones porque, al igual que el póster original, mi necesidad es entender por qué la ' Probabilidad ' fn es el ' Producto ' de la densidad de cada valor de muestra: ' x '. Una razón legible y lógica se da bajo el título Principio de máxima verosimilitud Ref: [ http://www-structmed.cimr.cam.ac.uk/Course/Likelihood/likelihood.html] Una cita adicional Matemáticamente, la probabilidad está definida como la probabilidad de hacer el conjunto de mediciones (misma referencia). En resumen, la probabilidad de que haya llegado a la muestra que tiene a mano.
fuente
El objetivo del método de máxima verosimilitud es encontrar un estimador que maximice la probabilidad de observar ciertos valores de la variable (variable endógena). Esa es la razón por la cual debemos multiplicar las probabilidades de ocurrencia.
Por ejemplo: imagine que el número de llamadas telefónicas que una secretaria puede responder en una hora sigue una distribución de Poisson. Luego, extrae 2 valores de la muestra (5 llamadas telefónicas y 8 llamadas telefónicas por hora) Ahora debe responder esta pregunta. ¿Cuál es el valor del parámetro que maximiza la probabilidad de observar 5 y 8 llamadas telefónicas, simultáneamente? Después, intente responder con la probabilidad de observar todos los valores del sam
Debido a las variables aleatorias independientes,
f (y1 = 5 llamadas telefónicas) * f (y2 = 8 llamadas telefónicas) = ∏if (y, θ) = L (θ, y1, y2)
Finalmente, intente responder, la probabilidad de observar todos los valores de la muestra.
fuente