árbol de fusión

En informática , un árbol de fusión es un tipo de estructura de datos de árbol que implementa una matriz asociativa en enteros $de w$ bits en un universo finito, donde cada uno de los enteros de entrada tiene un tamaño inferior a 2 ^w y no es negativo. Cuando opera en una colección de $n$ pares clave-valor , utiliza el espacio $O (n)$ y realiza búsquedas en el tiempo $O (log w n)$ , lo cual es asintóticamente más rápido que un árbol de búsqueda binario autoequilibrado tradicional , y también mejor que el Árbol de van Emde Boas para valores grandes de $w$ . Logra esta velocidad mediante el uso de ciertas operaciones de tiempo constante que se pueden realizar en una palabra de máquina . Los árboles de fusión fueron inventados en 1990 por Michael Fredman y Dan Willard . ^[1]

Se han logrado varios avances desde el artículo original de Fredman y Willard de 1990. En 1999 ^[2] se mostró cómo implementar árboles de fusión bajo un modelo de computación en el que todas las operaciones subyacentes del algoritmo pertenecen a AC 0 , un modelo de complejidad de circuito que permite la suma y operaciones booleanas bit a bit pero no permite la Operaciones de multiplicación utilizadas en el algoritmo de árbol de fusión original. En 1996 ^[3] se propuso una versión dinámica de árboles de fusión que utilizan tablas hash que coincidían con el tiempo de ejecución $O$ $(log$ $w$ $n$ $)$ de la estructura original según las expectativas. En 2007 ^[4] se propuso otra versión dinámica que utiliza un árbol exponencial que produce tiempos de ejecución en el peor de los casos de $O$ $(log$ $w$ $n$ $+ log log$ $n$ $)$ por operación. Finalmente, se demostró que los árboles de fusión dinámica pueden realizar cada operación en tiempo $O$ $(log$ $w$ $n$ $)$ de forma determinista. ^[5]

Esta estructura de datos implementa operaciones de búsqueda de agregar clave, eliminar clave, buscar clave y predecesor (siguiente valor más pequeño) y sucesor (siguiente valor más grande) para una clave determinada. El resultado parcial del localizador de bits más significativo en tiempo constante también ha ayudado a seguir investigando. Los árboles de fusión utilizan el paralelismo a nivel de palabras para ser eficientes, realizando cálculos en varios números enteros pequeños, almacenados en una sola palabra de máquina, simultáneamente para reducir el número de operaciones totales.

Cómo funciona

Un árbol de fusión es esencialmente un árbol B con un factor de ramificación de $w 1/5$ (también es posible cualquier exponente pequeño ya que no tendrá un gran impacto en la altura del árbol), lo que le da una altura de $O (log w norte)$ . Para lograr los tiempos de ejecución deseados para actualizaciones y consultas, el árbol de fusión debe poder buscar un nodo que contenga hasta $w 1/5$ claves en tiempo constante. Esto se hace comprimiendo ("dibujando") las claves para que todas puedan caber en una palabra de máquina, lo que a su vez permite realizar comparaciones en paralelo. Entonces, una serie de cálculos que involucran bocetos, comparación paralela y localizador del índice de bits más significativo, ayudan a llegar a la solución requerida.

Dibujar

El boceto es el método mediante el cual cada clave $de w$ bits en un nodo que contiene $k$ claves se comprime en solo $k - 1$ bits. Cada clave $x$ puede considerarse como una ruta en el árbol binario completo de altura $w$ que comienza en la raíz y termina en la hoja correspondiente a $x$ . Esta ruta se puede procesar buscando recursivamente en el hijo izquierdo de i si el i-ésimo bit es 0 y en el hijo derecho si es 1, generalmente, hasta que se escaneen todos los bits. Para distinguir dos caminos, basta con observar su punto de bifurcación (el primer bit donde dos claves difieren). Como hay un máximo de k claves, no habrá más de k-1 puntos de ramificación, lo que significa que no se requieren más de k-1 bits para identificar una clave. Y por tanto, ningún boceto tendrá más de k-1 bits.

Visualización de la función de boceto.

Una propiedad importante de la función de boceto es que conserva el orden de las claves. Es decir, $sketch(x) < sketch(y)$ para dos claves cualesquiera $x < y$ . Entonces, para todo el rango de claves, sketch(x ₀ )<sketch(x ₁ )<...<sketch(x _k-1 ) porque si se sigue la ruta de árbol binario, los nodos se ordenarán de tal manera que x ₀ <x ₁ <...<x _k-1 .

Aproximando el boceto

Si las ubicaciones de los bits del boceto son b ₁ < b ₂ < ··· < b _r , entonces el boceto de la clave x _{w -1} ··· x ₁x ₀ es el entero de r bits . ${\ Displaystyle x_ {b_ {r}} x_ {b_ {r-1}} \ cdots x_ {b_ {1}}}$

Con sólo operaciones de palabras estándar, como las del lenguaje de programación C , es difícil calcular directamente el boceto perfecto de una clave en tiempo constante. En cambio, los bits del boceto se pueden empaquetar en un rango de tamaño como máximo r ⁴ , usando AND bit a bit y multiplicación, llamado boceto aproximado, que tiene todos los bits importantes pero también algunos bits inútiles adicionales distribuidos en un patrón predecible. La operación AND bit a bit sirve como una máscara para eliminar todos estos bits que no son de boceto de la clave, mientras que la multiplicación desplaza los bits de boceto a un rango pequeño. Al igual que el boceto "perfecto", el boceto aproximado también conserva el orden de las claves y significa que sketch(x ₀ )<sketch(x ₁ )<...<sketch(x _k-1 ).

Se necesita algún procesamiento previo para determinar la constante de multiplicación correcta. Cada bit de boceto en la ubicación b _i se desplazará a b _i + m _i mediante una multiplicación por m = 2 ^m^_i . Para que el boceto aproximado funcione, se deben cumplir las tres propiedades siguientes: $\textstyle \sum _ {i=1}^{r}$

b _i + m _j son distintos para todos los pares ( i , j ). Esto asegurará que los bits del boceto no se corrompan con la multiplicación.
b _i + m _i es una función estrictamente creciente de i . Es decir, el orden de los bits del boceto se conserva incluso en x'.m.
( segundo _r + metro _r ) - ( segundo ₁ + metro ₁ ) ≤ r ⁴ . Es decir, los bits de boceto se empaquetan en un rango de tamaño como máximo r ⁴ , donde r ≤ O (w ^1/5 ).

Un argumento inductivo muestra cómo se puede construir m _i . Sea metro ₁ = w - segundo ₁ . Supongamos que 1 < t ≤ r y que m ₁ , m ₂ ... m _t-1 ya han sido elegidos. Luego elija el entero más pequeño m _t tal que se cumplan ambas propiedades (1) y (2). La propiedad (1) requiere que m _t ≠ b _i − b _j + m _l para todo 1 ≤ i , j ≤ r y 1 ≤ l ≤ t -1. Por lo tanto, hay menos de tr ² ≤ r ³ valores que m _t debe evitar. Dado que m _t se elige como mínimo, ( b _t + m _t ) ≤ ( b _{t -1} + m _{t -1} ) + r ³ . Esto implica la Propiedad (3).

Por tanto, el boceto aproximado se calcula de la siguiente manera:

Enmascare todos excepto los bits del boceto con un AND bit a bit entre x y . $\sum _{i=0}^{r-1}2^{b_{i}}$
Multiplique la clave por la constante predeterminada m como se calculó anteriormente. Esta operación en realidad requiere dos palabras de máquina, pero aún así se puede realizar en tiempo constante.
Enmascare todo menos los fragmentos del boceto desplazados. Estos ahora están contenidos en un bloque contiguo de como máximo r ⁴ < w ^4/5 bits.

Comparación paralela

El propósito de la compresión lograda mediante el boceto es permitir que todas las claves se almacenen en una palabra de w bits. Sea el boceto de nodo de un nodo la cadena de bits

1 sketch( x ₁ )1 sketch( x ₂ ) ...1 sketch( xk ₎

Aquí, todas las palabras esbozadas se agrupan en una cadena anteponiendo un bit determinado a cada una de ellas. Podemos suponer que la función de boceto usa exactamente b ≤ r ⁴ bits. Luego, cada bloque usa 1 + b ≤ w ^4/5 bits, y como k ≤ w ^1/5 , el número total de bits en el boceto del nodo es como máximo w .

Una breve nota aparte: para una cadena de bits s y un entero no negativo m , denotemos por s ^m la concatenación de s consigo mismo m veces. Si t también es una cadena de bits, st denota la concatenación de t con s .

El boceto del nodo permite buscar las claves para cualquier número entero de b bits y . Sea z = (0 y ) ^k , que se puede calcular en tiempo constante (multiplique y por la constante (0 ^b 1) ^k ), para que sea tan largo como el boceto del nodo de modo que se pueda comparar cada palabra en el boceto del nodo. con el entero de consulta y en una sola operación, lo que demuestra el paralelismo a nivel de palabra. Si y tuviera 5 bits de longitud, se multiplicaría por 000001....000001 para obtener sketch(y) ^k . La diferencia entre sketch(xi ₎ y 0y da como resultado que el bit principal de cada bloque sea 1, si y sólo si sketch(y) sketch(xi ₎ . Por tanto, podemos calcular el índice más pequeño i tal que ( x _i ) ≥ y de la siguiente manera: $\leq$ sketch

Resta z del boceto del nodo.
Tome el AND bit a bit de la diferencia y la constante (10 ^b ) ^k . Esto borra todo excepto el bit inicial de cada bloque.
Encuentre la parte más significativa del resultado, para identificar el índice exacto de transición de elementos con un boceto más pequeño que el boceto de consulta a aquellos mayores que el boceto de consulta.
Calcule i, el rango del boceto, utilizando el hecho de que el bit inicial del i -ésimo bloque tiene el índice i ( b +1).

escritorio

Para una consulta arbitraria q , la comparación paralela calcula el índice i tal que

sketch( x _{yo -1} ) ≤ sketch( q ) ≤ sketch( x _yo )

Desafortunadamente, esto da el predecesor o sucesor exacto de q , porque la ubicación del boceto de q entre los bocetos de todos los valores puede no ser la misma que la ubicación de q en todos los valores reales. Lo que es cierto es que, entre todas las claves, x _{i -1} o x _i tiene el prefijo común más largo con q . Esto se debe a que cualquier clave y con un prefijo común más largo con q también tendría más bits de boceto en común con q y , por lo tanto, sketch( y ) estaría más cerca de sketch( q ) que cualquier sketch( x _j ).

La longitud del prefijo común más largo entre dos enteros de w bits a y b se puede calcular en tiempo constante encontrando el bit más significativo del XOR bit a bit entre a y b . Esto luego se puede usar para enmascarar todos los prefijos comunes excepto el más largo.

Tenga en cuenta que p identifica exactamente dónde se ramifica q del conjunto de claves. Si el siguiente bit de q es 0, entonces el sucesor de q está contenido en el subárbol p 1, y si el siguiente bit de q es 1, entonces el predecesor de q está contenido en el subárbol p 0. Esto sugiere el siguiente algoritmo para determinar la ubicación exacta de q :

Utilice la comparación paralela para encontrar el índice i tal que sketch( x _{i -1} ) ≤ sketch( q ) ≤ sketch( x _i ).
Calcule el prefijo común p más largo de q y x _{i -1} o x _i (tomando el más largo de los dos).
Sea l -1 la longitud del prefijo común más largo p .
1. Si el l -ésimo bit de q es 0, sea e = p 10 ^{w - l} . Utilice la comparación paralela para buscar el sucesor de sketch( e ). Este es el predecesor real de q .
2. Si el l -ésimo bit de q es 1, sea e = p 01 ^{w - l} . Utilice la comparación paralela para buscar el predecesor de sketch( e ). Este es el sucesor real de q .
Una vez que se encuentra el predecesor o el sucesor de q , se determina la posición exacta de q entre el conjunto de claves.

hash de fusión

Willard dio una aplicación de árboles de fusión a tablas hash , quien describe una estructura de datos para hash en la que una tabla hash de nivel externo con encadenamiento hash se combina con un árbol de fusión que representa cada cadena hash. En el encadenamiento hash, en una tabla hash con un factor de carga constante, el tamaño promedio de una cadena es constante, pero además, con una alta probabilidad, todas las cadenas tienen un tamaño $O (log n / log log n)$ , donde $n$ es el número de elementos hash . Este tamaño de cadena es lo suficientemente pequeño como para que un árbol de fusión pueda manejar búsquedas y actualizaciones dentro de ella en un tiempo constante por operación. Por lo tanto, el tiempo para todas las operaciones en la estructura de datos es constante con una alta probabilidad. Más precisamente, con esta estructura de datos, para cada probabilidad cuasipolinomial inversa $p (n) = exp((log n) O (1))$ , existe una constante $C$ tal que la probabilidad de que exista una operación que exceda el tiempo $C$ es como máximo $p (n)$ . ^[6]

Modelo computacional y supuestos necesarios

El modelo computacional para el algoritmo Fusion Tree es una RAM de Word con un conjunto de instrucciones específico, que incluye instrucciones aritméticas (suma, resta y multiplicación (todas realizadas en módulo $2 w$ ) y operaciones booleanas: bit a bit AND, NOT, etc. Una instrucción de multiplicación de doble precisión también está incluido. Se ha demostrado ^[7] que la eliminación de esta última instrucción hace imposible ordenar más rápido que $O (n log n)$ , a menos que se permita utilizar un espacio de memoria de casi $2 w$ palabras (en contraste con el espacio lineal utilizado por Fusion Trees). ), o incluir otras instrucciones en su lugar ^[2] .

Referencias

^ Fredman, ML ; Willard, DE (1990), "BLASTING Through the Information Theoretic Barrier with FUSION TREES", Actas del vigésimo segundo simposio anual de ACM sobre teoría de la computación (STOC '90) , Nueva York, NY, EE. UU.: ACM, págs.1 –7, doi : 10.1145/100216.100217 , ISBN 0-89791-361-2, S2CID 16367160.
^ ab Andersson, Arne; Miltersen, Peter Bro; Thorup, Mikkel (1999), "Los árboles de fusión se pueden implementar solo con instrucciones $AC$ $0 ",$ Ciencias de la Computación Teórica , 215 (1–2): 337–344, doi : 10.1016/S0304-3975(98)00172-8 , SEÑOR 1678804.
^ Raman, Rajeev (1996), "Colas prioritarias: pequeñas, monótonas y transdicotómicas", Algoritmos - ESA '96 , Lecture Notes in Computer Science, vol. 1136, Berlín: Springer-Verlag, págs. 121–137, doi :10.1007/3-540-61680-2_51, ISBN 978-3-540-61680-1, señor 1469229.
^ Andersson, Arne; Thorup, Mikkel (2007), "Conjuntos ordenados dinámicos con árboles de búsqueda exponencial", Journal of the ACM , 54 (3): A13, arXiv : cs/0210006 , doi :10.1145/1236457.1236460, MR 2314255, S2CID 8175703.
^ Patrascu, Mihai; Thorup, Mikkel (2014). "Conjuntos de enteros dinámicos con clasificación, selección y búsqueda de predecesores óptimos". 55º Simposio anual del IEEE de 2014 sobre fundamentos de la informática . pag. 166-175. arXiv : 1408.3045 . doi :10.1109/FOCS.2014.26. ISBN 978-1-4799-6517-5. S2CID 8943659.
^ Willard, Dan E. (2000), "Examen de la geometría computacional, los árboles de van Emde Boas y el hash desde la perspectiva del árbol de fusión", SIAM Journal on Computing , 29 (3): 1030–1049, doi :10.1137/S0097539797322425 , señor 1740562.
^ Ben-Amram, Amir M.; Galil, Zvi (1997), "¿Cuándo podemos ordenar en ( n log n ) tiempo?", Journal of Computer and System Sciences , 54 (2): 345–370, doi : 10.1006/jcss.1997.1474.

enlaces externos

MIT CS 6.897: Estructuras de datos avanzadas: Conferencia 4, Árboles de fusión, Prof. Erik Demaine (primavera de 2003)
MIT CS 6.897: Estructuras de datos avanzadas: Conferencia 5, Más árboles de fusión; estructuras de datos autoorganizadas, movimiento al frente, optimización estática, Prof. Erik Demaine (primavera de 2003)
MIT CS 6.851: Estructuras de datos avanzadas: Conferencia 13, notas de Fusion Tree, Prof. Erik Demaine (primavera de 2007)
MIT CS 6.851: Estructuras de datos avanzadas: Conferencia 12, notas de Fusion Tree, Prof. Erik Demaine (primavera de 2012)