De acuerdo con este artículo de Wikipedia , uno puede representar el producto de las probabilidades x⋅y
como -log(x) - log(y)
hacer que el cálculo sea más computacionalmente óptimo. Pero si intento un ejemplo, diga:
p1 = 0.5
p2 = 0.5
p1 * p2 = 0.25
-log(p1) - log(p2) = 2
p3 = 0.1
p4 = 0.1
p3 * p4 = 0.01
-log(p3) - log(p4) = 6.64
El producto de las probabilidades p1
y p2
es mayor que el de p3
y p4
, pero la probabilidad logarítmica es menor.
¿Cómo?
probability
logarithm
arithmetic
mono espacial
fuente
fuente
Respuestas:
Me temo que has entendido mal lo que pretende el artículo. Esto no es una gran sorpresa, ya que está algo poco claro escrito. Están sucediendo dos cosas diferentes.
El primero es simplemente trabajar en la escala logarítmica.
Es decir, en lugar de " " (cuando tienes independencia), se puede escribir " log ( p A B ) = log ( p A ) + log ( p B ) ". Si necesita la probabilidad real, puede exponer al final para volver p A B :pAB=pA⋅pB log(pAB)=log(pA)+log(pB) pAB pAB=elog(pA)+log(pB), pero si fuera necesario, la exponenciación normalmente se dejaría al último paso posible. Hasta aquí todo bien.
La segunda parte es reemplazar con - log p . Esto es para que trabajemos con valores positivos.logp −logp
Personalmente, realmente no veo mucho valor en esto, especialmente porque invierte la dirección de cualquier orden ( es monotónico creciente, así que si p 1 < p 2 , entonces log ( p A ) < log ( p 2 ) ; esto el orden se invierte con - log p ).log p1<p2 log(pA)<log(p2) −logp
fuente