Geometría de árboles de búsqueda binarios.

En informática , una aproximación al problema de optimización dinámica de algoritmos en línea para árboles de búsqueda binarios implica reformular el problema geométricamente, en términos de aumentar un conjunto de puntos en el plano con la menor cantidad posible de puntos adicionales para evitar rectángulos con solo dos puntos en su límite. ^[1]

Secuencias de acceso y ratio competitivo.

Como suele formularse, el problema del árbol de búsqueda binaria en línea implica árboles de búsqueda definidos sobre un conjunto de claves fijas . Una secuencia de acceso es una secuencia ... donde cada acceso pertenece al conjunto de claves. $\{1,2,...,n\}$ $x_{1},x_{2},$ $x_{i}$

Cualquier algoritmo particular para mantener árboles de búsqueda binarios (como el algoritmo de árbol splay o la estructura de conjunto de trabajo de Iacono ) tiene un costo por cada secuencia de acceso que modela la cantidad de tiempo que tomaría usar la estructura para buscar cada una de las claves en el secuencia de acceso a su vez. El costo de una búsqueda se modela asumiendo que el algoritmo del árbol de búsqueda tiene un único puntero a un árbol de búsqueda binario, que al inicio de cada búsqueda apunta a la raíz del árbol. Luego, el algoritmo puede realizar cualquier secuencia de las siguientes operaciones:

Mueva el puntero a su elemento secundario izquierdo.
Mueva el puntero a su hijo derecho.
Mueva el puntero a su padre.
Realice una rotación de árbol única en el puntero y su padre.

La búsqueda requiere, en algún punto dentro de esta secuencia de operaciones, mover el puntero a un nodo que contiene la clave, y el costo de la búsqueda es el número de operaciones que se realizan en la secuencia. El costo total _A ( X ) para el algoritmo A en la secuencia de acceso X es la suma de los costos de las búsquedas para cada clave sucesiva en la secuencia.

Como es estándar en el análisis competitivo , la relación competitiva de un algoritmo A se define como el máximo, sobre todas las secuencias de acceso, de la relación entre el costo de A y el mejor costo que cualquier algoritmo podría lograr:

\rho _{A}=\sup _{X}{\frac {\mathrm {costo} _{A}(X)}{\mathrm {costo} _{\mathrm {opt} }(X) }}.

La conjetura de la optimización dinámica establece que los árboles extendidos tienen una proporción competitiva constante, pero esto aún no se ha demostrado. La visión geométrica de los árboles de búsqueda binarios proporciona una forma diferente de entender el problema que ha llevado al desarrollo de algoritmos alternativos que también podrían (conjeturalmente) tener una relación competitiva constante.

Traducción a un conjunto de puntos geométricos

En la vista geométrica del problema del árbol de búsqueda binaria en línea, una secuencia de acceso (secuencia de búsquedas realizadas en un árbol de búsqueda binaria (BST) con un conjunto de claves ) se asigna al conjunto de puntos , donde el eje X representa el espacio de claves. y el eje Y representa el tiempo; al que se suma un conjunto de nodos tocados . Por nodos tocados nos referimos a lo siguiente. Considere un algoritmo de acceso BST con un único puntero a un nodo del árbol. Al comienzo de un acceso a una clave determinada , este puntero se inicializa en la raíz del árbol. Siempre que el puntero se mueve o se inicializa en un nodo, decimos que el nodo es tocado. ^[2] Representamos un algoritmo BST para una secuencia de entrada determinada dibujando un punto para cada elemento que se toca. $x_{1},...,x_{m}$ ${1,2,...,n}$ ${(x_{i},i)}$ $x_{i}$

Por ejemplo, supongamos que se proporciona el siguiente BST en 4 nodos:El conjunto de claves es {1, 2, 3, 4}.

Sea 3, 1, 4, 2 la secuencia de acceso.

En el primer acceso sólo se toca el nodo 3.
En el segundo acceso se tocan los nodos 3 y 1.
En el tercer acceso se tocan 3 y 4.
En el cuarto acceso, toque 3, luego 1 y luego 2.

Los toques se representan geométricamente: si se toca un elemento x en las operaciones para el iésimo acceso, entonces se traza un punto ( x , i ).

Conjuntos de puntos arbóricamente satisfechos

Se dice que un conjunto de puntos está satisfecho arbóricamente si se cumple la siguiente propiedad: para cualquier par de puntos que no se encuentran en la misma línea horizontal o vertical, existe un tercer punto que se encuentra en el rectángulo abarcado por los dos primeros puntos (ya sea dentro o en el límite).

Teorema

Un conjunto de puntos que contiene los puntos se satisface arboralmente si y sólo si corresponde a un BST válido para la secuencia de entrada . $(x_{i},i)$ $x_{1},x_{2},...,x_{m}$

Prueba

Primero, demuestre que el punto establecido para cualquier algoritmo BST válido se cumple arbóricamente. Considere los puntos y , donde $x$ se toca en el momento $i$ y $y$ se toca en el momento $j$ . Supongamos por simetría que y . Es necesario demostrar que existe un tercer punto en el rectángulo con esquinas como y . También denotemos el ancestro común más bajo de los nodos $a$ y $b$ justo antes del tiempo $t$ . Hay algunos casos: $(x,i)$ $(y,j)$ $x<y$ $i<j$ $(x,i)$ $(y,j)$ $\mathrm {LCA} _ {t}(a,b)$

Si , entonces use el punto , ya que debe haber sido tocado si $x$ lo fue. $\mathrm {LCA} _ {i}(x,y)\neq x$ $(\mathrm {LCA} _ {i}(x,y),i)$ $\mathrm {LCA} _ {i}(x,y)$
Si , entonces se puede utilizar el punto . $\mathrm {LCA} _ {j}(x,y)\neq y$ $(\mathrm {LCA} _ {j}(x,y),j)$
Si ninguno de los dos casos anteriores se cumple, entonces $x$ debe ser un antepasado de $y$ justo antes del tiempo $i$ y $y$ debe ser un antepasado de $x$ justo antes del tiempo $j$ . Entonces, en algún momento $k$ , $y$ debe haber sido rotado por encima de $x$ , para que se pueda usar el punto . $(i\leq k<j)$ $(y,k)$

A continuación, muestre la otra dirección: dado un conjunto de puntos arbóricamente satisfecho, se puede construir un BST válido correspondiente a ese conjunto de puntos. Organice nuestro BST en un grupo que esté organizado en orden de montón al momento del siguiente toque. Tenga en cuenta que el tiempo del siguiente toque tiene vínculos y, por lo tanto, no está definido de forma única, pero esto no es un problema siempre que haya una manera de romper los vínculos. Cuando llegué al momento $,$ los nodos tocados forman un subárbol conectado en la parte superior, mediante la propiedad de ordenación del montón. Ahora, asigne nuevos tiempos de siguiente toque para este subárbol y reorganícelo en un nuevo grupo local. Si un par de nodos, $x$ e $y$ , se extienden a ambos lados del límite entre la parte tocada y la no tocada del treap, entonces si $y$ debe tocarse antes que $x$ , entonces es un rectángulo insatisfecho porque el punto más a la izquierda sería el hijo derecho de $x.$ , no $y$ . $(x,now)\to (y,next-touch(y))$

Corolario

Encontrar la mejor ejecución BST para la secuencia de entrada es equivalente a encontrar el superconjunto de puntos de cardinalidad mínima (que contiene la entrada en representación geométrica) que se satisface arboralmente. Se sabe que el problema más general de encontrar el superconjunto de cardinalidad mínima satisfecho arboralmente de un conjunto general de puntos de entrada (no limitado a un punto de entrada por coordenada $y$ ) es NP-completo . ^[1] $x_{1},x_{2},...,x_{m}$

Algoritmo codicioso

El siguiente algoritmo codicioso construye conjuntos arbóricamente satisfactibles:

Barra el punto establecido con una línea horizontal aumentando la coordenada $y$ .
En el momento $i$ , coloque el número mínimo de puntos en para que el punto configurado esté satisfecho con el árbol. Este conjunto mínimo de puntos está definido de forma única: para cualquier rectángulo insatisfecho formado en una esquina, agregue la otra esquina en . $y=i$ $y\geq i$ $(x_{i},i)$ $y=i$

Se ha conjeturado que el algoritmo es óptimo dentro de un término aditivo. ^[3]

Otros resultados

La geometría de los árboles de búsqueda binarios se ha utilizado para proporcionar un algoritmo que es dinámicamente óptimo si cualquier algoritmo de árbol de búsqueda binario es dinámicamente óptimo. ^[4]

Ver también

Referencias

^ ab Demaine, Erik D .; Armon, Dion; Iacono, Juan ; Kane, Daniel ; Pătraşcu, Mihai (2009), "La geometría de los árboles de búsqueda binarios", en Actas del vigésimo simposio anual ACM-SIAM sobre algoritmos discretos (SODA 2009) , Nueva York: 496–505, doi : 10.1137/1.9781611973068.55 , ISBN 978-0-89871-680-1
^ Demaine, Erik D .; Armon, Dion; Iacono, Juan ; Pătraşcu, Mihai (2007), "Optimidad dinámica: casi", SIAM Journal on Computing , 37 (1): 240–251, CiteSeerX 10.1.1.99.4964 , doi :10.1137/S0097539705447347, MR 2306291, S2CID 1480961
^ Fox, Kyle (15 al 17 de agosto de 2011). Límites superiores para árboles de búsqueda binarios máximamente codiciosos (PDF) . Algoritmos y estructuras de datos: XII Simposio Internacional, WADS 2011. Apuntes de conferencias sobre informática. vol. 6844. Nueva York: Springer. págs. 411–422. arXiv : 1102.4884 . doi :10.1007/978-3-642-22300-6_35.
^ Iacono, John (2013). "En busca de la conjetura de optimidad dinámica". "Estructuras de datos, flujos y algoritmos que aprovechan el espacio" . Apuntes de conferencias sobre informática. vol. 8066, págs. 236–250. arXiv : 1306.0207 . Código Bib : 2013arXiv1306.0207I. doi :10.1007/978-3-642-40273-9_16. ISBN 978-3-642-40272-2. S2CID 14729858.