Registro de probabilidad vs producto de probabilidades

17

De acuerdo con este artículo de Wikipedia , uno puede representar el producto de las probabilidades x⋅ycomo -log(x) - log(y)hacer que el cálculo sea más computacionalmente óptimo. Pero si intento un ejemplo, diga:

p1 = 0.5
p2 = 0.5
p1 * p2 = 0.25
-log(p1) - log(p2) = 2

p3 = 0.1
p4 = 0.1
p3 * p4 = 0.01
-log(p3) - log(p4) = 6.64

El producto de las probabilidades p1y p2es mayor que el de p3y p4, pero la probabilidad logarítmica es menor.

¿Cómo?

mono espacial
fuente
2
Que pasa Probabilidades más pequeñas serán dar valores más grandes porque aumenta de 0 cuando p = 1 hacia como p 0 . logp0p=1p0
Dilip Sarwate
55
(+1) ¿Por qué votar a favor? Creo que esta es una pregunta bien escrita sobre el tema, aunque muy elemental.
Juho Kokkala
@DilipSarwate mi problema no es con la parte matemática, sino con esta forma particular de representar probabilidades. Tal vez es solo una cuestión de sentirse cómodo con eso.
spacemonkey

Respuestas:

22

Me temo que has entendido mal lo que pretende el artículo. Esto no es una gran sorpresa, ya que está algo poco claro escrito. Están sucediendo dos cosas diferentes.

El primero es simplemente trabajar en la escala logarítmica.

Es decir, en lugar de " " (cuando tienes independencia), se puede escribir " log ( p A B ) = log ( p A ) + log ( p B ) ". Si necesita la probabilidad real, puede exponer al final para volver p A B :pAB=pApBlog(pAB)=log(pA)+log(pB)pABpAB=elog(pA)+log(pB), pero si fuera necesario, la exponenciación normalmente se dejaría al último paso posible. Hasta aquí todo bien.

La segunda parte es reemplazar con - log p . Esto es para que trabajemos con valores positivos.logplogp

Personalmente, realmente no veo mucho valor en esto, especialmente porque invierte la dirección de cualquier orden ( es monotónico creciente, así que si p 1 < p 2 , entonces log ( p A ) < log ( p 2 ) ; esto el orden se invierte con - log p ).logp1<p2log(pA)<log(p2)logp

logp

si=log(pi)spAB=e[sA+sB].

Glen_b -Reinstate a Monica
fuente
2
+1 "Piensa en la probabilidad de registro negativa como una escala de" rareza "- cuanto mayor es el número, más raro es el evento"
Zhubarb