Ratio de probabilidades vs ratio de PDF

12

Estoy usando Bayes para resolver un problema de agrupamiento. Después de hacer algunos cálculos termino con la necesidad de obtener la razón de dos probabilidades:

P(A)/P(B)

para poder obtener . Estas probabilidades se obtienen mediante la integración de dos KDE multivariados 2D diferentes como se explica en esta respuesta :P(H|D)

P(A)=x,y:f^(x,y)<f^(ra,sa)f^(x,y)dxdy
P(B)=x,y:g^(x,y)<g^(rb,sb)g^(x,y)dxdy

donde f^(x,y) y g^(x,y) son los KDE y la integración se realiza para todos los puntos por debajo de los umbrales f^(ra,sa) y g^(rb,sb) . Ambos KDE utilizan un núcleo gaussiano . Aquí se puede ver una imagen representativa de un KDE similar a las que estoy trabajando: Integrando el estimador de densidad del núcleo en 2D .

Calculo los KDE por medio de una pythonfunción stats.gaussian_kde , por lo que asumo la siguiente forma general:

KDE(x,y)=1ni=1n12h2e(xxi)2+(yyi)22h2

donde nes la longitud de mi conjunto de puntos y hes el ancho de banda utilizado.

Las integrales anteriores se calculan aplicando un proceso de Monte Carlo que es bastante costoso computacionalmente. Leí en alguna parte (olvidé dónde, lo siento) que en casos como este es posible reemplazar la razón de probabilidades por la razón de PDF (KDE) evaluados en los puntos de umbral para obtener resultados igualmente válidos. Estoy interesado en esto porque calcular la relación de KDE es un orden de magnitud más rápido que calcular la relación de las integrales con MC.

Entonces la pregunta se reduce a la validez de esta expresión:

P(A)P(B)=f^(ra,sa)g^(rb,sb)

¿En qué circunstancias, si las hay, puedo decir que esta relación es verdadera?

[error tipográfico fijo (EDITAR)]


Añadir :

Aquí está básicamente la misma pregunta pero hecha en una forma más matemática .

Gabriel
fuente
1
Tenga en cuenta que la existencia de adecuada está garantizada por el teorema de valor medio para integrales. ra,b,sa,b
Dave
1
Creo que Mills Ratio puede ser relevante.
whuber
@whuber esa proporción aparentemente requiere que sepa P(X)cuál es el valor que estoy tratando de evitar calcular. ¿Podría ampliar un poco la relevancia de ese parámetro?
Gabriel

Respuestas:

3

El KDE es una mezcla de distribuciones normales. Veamos uno solo de ellos.

Las definiciones de y muestran que sus valores son invariables bajo traducciones y reescalamientos en el plano, por lo que es suficiente considerar la distribución Normal estándar con PDF . La desigualdadP(A)P(B)f

f(x,y)f(r,s)

es equivalente a

x2+y2r2+s2.

Introduciendo las coordenadas polares permite reescribir la integralρ,θ

P(r,s)=12π02πr2+s2ρexp(ρ2/2)dρdθ=exp((r2+s2)/2)=2πf(r,s).

Ahora considere la mezcla. Porque es lineal,

P(r,s)=1ni2πf((rxi)/h,(syi)/h)=2πh2(1ni1h2f((rxi)/h,(syi)/h))=2πh2KDE(r,s).

De hecho, y son proporcionales. La constante de proporcionalidad es .fP2πh2


Que tal relación de proporcionalidad entre y sea ​​especialPf se puede apreciar contemplando un contraejemplo simple. Deje que tenga una distribución uniforme en un conjunto medible de unidad de área y tenga una distribución uniforme en un conjunto medible que es disjunto de y tiene un área . Entonces la mezcla con PDF tiene un valor constante en , en , y es cero en otro lugar. Hay tres casos a considerar:f1A1f2A2A1μ>1f=f1/2+f2/21/2A11/(2μ)A2

  1. (r,s)A1 . Aquí 1/2 alcanza su máximo, de donde . La relación .f(r,s)=1/2P(r,s)=1f(r,s)/P(r,s)=1/2

  2. (r,s)A2 . Aquí es estrictamente menor que pero mayor que . Por lo tanto, la región de integración es el complemento de y la integral resultante debe ser igual a . La relación .f(r,s)1/20A11/2f(r,s)/P(r,s)=(1/(2μ))/(1/2)=1/μ

  3. En otro lugar, es cero y la integral es cero.fP

Evidentemente, la relación (donde se define) no es constante y varía entre y . Aunque esta distribución no es continua, puede hacerse agregando una distribución Normal . Al hacer que ambos valores propios de pequeños, esto cambiará muy poco la distribución y producirá cualitativamente los mismos resultados, solo que ahora los valores de la relación incluirán todos los números en el intervalo .11/μ1(0,Σ)Σf/P[1,1/μ]


Este resultado tampoco se generaliza a otras dimensiones. Esencialmente, el mismo cálculo que inició esta respuesta muestra que es una función Gamma incompleta y que claramente no es lo mismo que . Se puede apreciar que dos dimensiones son especiales al observar que la integración en concierne esencialmente a las distancias y cuando están normalmente distribuidas, la función de distancia tiene una , que es la distribución exponencial. La función exponencial es única en ser proporcional a su propia derivada, de donde el integrando integral deben ser proporcionales.PfPχ2(2)fP

whuber
fuente
Esta es una respuesta increíble, muchas gracias. Me llevará un tiempo procesar completamente todo lo que ha escrito aquí, pero confío completamente en sus cálculos, lo que significa que marqué la pregunta como resuelta. Salud.
Gabriel