Montón fusionable aleatorio - Altura esperada

9

Los montones fusionables aleatorios tienen una operación "fusión", que luego usamos para definir todas las demás operaciones, incluida la inserción.

La pregunta es, ¿cuál es la altura esperada de ese árbol con n nodos?

El Teorema 1 de Gambin y Malinkowski, Colas de prioridad fusionables aleatorias (Actas de SOFSEM 1998, Lecture Notes in Computer Science vol. 1521, pp. 344–349, 1998; PDF ) da la respuesta a esta pregunta con prueba. Sin embargo, no entiendo por qué podemos escribir:

E[hQ]=12((1+E[hQL])+(1+E[hQR])).

Para mí la altura del árbol es

hQ=1+max{hQL,hQR},

que puedo ampliar a:

E[hQ]=1+E[max{hQL,hQR}]=1+kP[max{hQL,hQR}=k].

La probabilidad de que el máximo de una altura de dos subárboles sea igual a k puede reescribirse usando la ley de probabilidad total:

P[max{hQL,hQR}=k]=P[max{hQL,hQR}=khQLhQR]P[hQLhQR]+P[max{hQL,hQR}=khQL>hQR]P[hQL>hQR]=P[hQR=khQLhQR]P[hQLhQR]+P[hQL=khQL>hQR]P[hQL>hQR].

Entonces al final obtengo:

E[hQ]=1+k{P[hQR=khQLhQR]P[hQLhQR]+P[hQL=khQL>hQR]P[hQL>hQR]}.

Aquí es donde estoy atrapado. Puedo ver que es más o menos igual (Sin embargo, necesitamos como máximo ) . Pero excepto que nada conduce a la fórmula desde el principio.P[hQL>hQR]1212

Las alturas de los subárboles no me parecen independientes.

Gracias por la ayuda.

Mateusz Wyszyński
fuente

Respuestas:

4

En el documento, no es la altura. Es la longitud de una caminata aleatoria desde la raíz en un árbol binario completo (insisten en que cada hoja es "nula"), por lo que la expresión que tienen es la correcta.hQ

Además, puede evitar la inducción. La probabilidad de terminar en una hoja específica de profundidad es solo . Entonces, la longitud esperada de la caminata esd2d

leaves(Q)depth()2depth()

cuál la entropía de una distribución un conjunto de tamaño.|leaves(Q)|

Louis
fuente
1
¿Podría explicar con más detalle por qué no tengo que usar la inducción? Estoy de acuerdo con la fórmula para la longitud esperada. Simplemente no veo por qué debería ser O (logn)? ¿Qué quiere decir con entropía de una distribución en cadenas?
Mateusz Wyszyński
Debido a que la entropía de una distribución en un conjunto de tamaño es conocida por ser maximizada por una distribución uniforme, en cuyo caso es . nlogn
Louis