Travesía de árboles

En informática , el recorrido de un árbol (también conocido como búsqueda de árbol y recorrido por el árbol ) es una forma de recorrido de grafos y se refiere al proceso de visitar (por ejemplo, recuperar, actualizar o eliminar) cada nodo en una estructura de datos de árbol , exactamente una vez. Dichos recorridos se clasifican según el orden en el que se visitan los nodos. Los siguientes algoritmos se describen para un árbol binario , pero también se pueden generalizar a otros árboles.

Tipos

A diferencia de las listas enlazadas , las matrices unidimensionales y otras estructuras de datos lineales , que se recorren canónicamente en orden lineal, los árboles se pueden recorrer de múltiples formas. Se pueden recorrer en orden de profundidad o de amplitud . Hay tres formas comunes de recorrerlos en orden de profundidad: en orden, preorden y posorden. ^[1] Más allá de estos recorridos básicos, son posibles varios esquemas más complejos o híbridos, como búsquedas limitadas en profundidad como la búsqueda en profundidad de profundización iterativa . Esta última, así como la búsqueda en amplitud, también se puede utilizar para recorrer árboles infinitos, consulte a continuación.

Estructuras de datos para el recorrido de árboles

Para recorrer un árbol es necesario iterar sobre todos los nodos de alguna manera. Debido a que a partir de un nodo dado hay más de un nodo siguiente posible (no es una estructura de datos lineal), entonces, suponiendo un cálculo secuencial (no paralelo), algunos nodos deben diferirse, es decir, almacenarse de alguna manera para visitarlos más tarde. Esto se hace a menudo a través de una pila (LIFO) o una cola (FIFO). Como un árbol es una estructura de datos autorreferencial (definida de forma recursiva), el recorrido puede definirse por recursión o, más sutilmente, por correcursión , de una manera natural y clara; en estos casos, los nodos diferidos se almacenan implícitamente en la pila de llamadas .

La búsqueda en profundidad se implementa fácilmente a través de una pila, incluso de forma recursiva (a través de la pila de llamadas), mientras que la búsqueda en amplitud se implementa fácilmente a través de una cola, incluso de forma recursiva. ^[2]^{: 45−61}

Búsqueda en profundidad

En la búsqueda en profundidad (DFS), el árbol de búsqueda se profundiza tanto como sea posible antes de pasar al siguiente hermano.

Para recorrer árboles binarios con búsqueda en profundidad, realice las siguientes operaciones en cada nodo: ^[3]^[4]

Si el nodo actual está vacío, entonces regresa.
Ejecute las siguientes tres operaciones en un orden determinado: ^[5]
N: Visita el nodo actual.
L: recorre recursivamente el subárbol izquierdo del nodo actual.
R: Recorre recursivamente el subárbol derecho del nodo actual.

La traza de un recorrido se denomina secuencialización del árbol. La traza del recorrido es una lista de cada nodo visitado. Ninguna secuenciación según el orden previo, interno o posterior describe el árbol subyacente de forma única. Dado un árbol con elementos distintos, tanto el orden previo como el posterior emparejados con el interno son suficientes para describir el árbol de forma única. Sin embargo, el orden previo con el posterior deja cierta ambigüedad en la estructura del árbol. ^[6]

Existen tres métodos en los que la posición del recorrido en relación con el nodo (en la figura: rojo, verde o azul) debe tener lugar la visita al nodo. La elección de exactamente un color determina exactamente una visita a un nodo, como se describe a continuación. La visita en los tres colores da como resultado una visita triple del mismo nodo, lo que produce la secuencialización de "todo orden":

F - B - A - A - A - B - D - C - C - C - D - E - E - E - D - B - F - G - G - I - H - H - H - I - I - G - F

Pedido anticipado, NLR

Visita el nodo actual (en la figura: posición roja).
Recorrer recursivamente el subárbol izquierdo del nodo actual.
Recorrer recursivamente el subárbol derecho del nodo actual.

El recorrido en preorden está ordenado topológicamente , porque un nodo padre se procesa antes de que lo haga cualquiera de sus nodos hijos.

Posorden, LRN

Recorrer recursivamente el subárbol izquierdo del nodo actual.
Recorrer recursivamente el subárbol derecho del nodo actual.
Visita el nodo actual (en la figura: posición azul).

El recorrido post-orden puede ser útil para obtener la expresión postfija de un árbol de expresión binaria .

En orden, LNR

Recorrer recursivamente el subárbol izquierdo del nodo actual.
Visita el nodo actual (en la figura: posición verde).
Recorrer recursivamente el subárbol derecho del nodo actual.

En un árbol de búsqueda binario ordenado de tal manera que en cada nodo la clave es mayor que todas las claves en su subárbol izquierdo y menor que todas las claves en su subárbol derecho, el recorrido en orden recupera las claves en orden ascendente . ^[7]

Pedido anticipado inverso, NRL

Visita el nodo actual.
Recorrer recursivamente el subárbol derecho del nodo actual.
Recorrer recursivamente el subárbol izquierdo del nodo actual.

Postorden inverso, RLN

Recorrer recursivamente el subárbol derecho del nodo actual.
Recorrer recursivamente el subárbol izquierdo del nodo actual.
Visita el nodo actual.

Invertir en orden, RNL

Recorrer recursivamente el subárbol derecho del nodo actual.
Visita el nodo actual.
Recorrer recursivamente el subárbol izquierdo del nodo actual.

En un árbol de búsqueda binario ordenado de tal manera que en cada nodo la clave es mayor que todas las claves en su subárbol izquierdo y menor que todas las claves en su subárbol derecho, el recorrido inverso en orden recupera las claves en orden ordenado descendente .

Árboles arbitrarios

Para recorrer árboles arbitrarios (no necesariamente árboles binarios) con búsqueda en profundidad, realice las siguientes operaciones en cada nodo:

Si el nodo actual está vacío, entonces regresa.
Visita el nodo actual para realizar un pedido anticipado.
Para cada i desde 1 hasta el número de subárboles del nodo actual − 1, o desde este último hasta el primero para el recorrido inverso, haga lo siguiente:
1. Recorrer recursivamente el subárbol i -ésimo del nodo actual.
2. Visita el nodo actual para recorrerlo en orden.
Recorrer recursivamente el último subárbol del nodo actual.
Visita el nodo actual para recorrerlo después del pedido.

Dependiendo del problema en cuestión, las operaciones de preorden, posorden y, especialmente, una de las operaciones de subárboles − 1 en orden pueden ser opcionales. Además, en la práctica, pueden requerirse más de una operación de preorden, posorden y en orden. Por ejemplo, al insertar en un árbol ternario, se realiza una operación de preorden comparando elementos. Puede ser necesaria una operación de posorden después para reequilibrar el árbol.

Búsqueda en amplitud

En la búsqueda en amplitud (BFS) o búsqueda por orden de nivel , el árbol de búsqueda se amplía tanto como sea posible antes de pasar a la siguiente profundidad.

Otros tipos

También existen algoritmos de recorrido de árboles que no se clasifican como búsquedas en profundidad ni en amplitud. Uno de estos algoritmos es la búsqueda en árbol de Monte Carlo , que se concentra en analizar los movimientos más prometedores y basa la expansión del árbol de búsqueda en un muestreo aleatorio del espacio de búsqueda.

Aplicaciones

El recorrido en preorden se puede utilizar para crear una expresión de prefijo ( notación polaca ) a partir de árboles de expresión : recorra el árbol de expresión en preorden. Por ejemplo, al recorrer la expresión aritmética representada en preorden se obtiene "+ * A − B C + D E ". En la notación de prefijo, no hay necesidad de paréntesis siempre que cada operador tenga un número fijo de operandos. El recorrido en preorden también se utiliza para crear una copia del árbol.

El recorrido en posorden puede generar una representación posfija ( notación polaca inversa ) de un árbol binario. Al recorrer la expresión aritmética representada en posorden se obtiene " A B C − * D E + +"; este último se puede transformar fácilmente en código de máquina para evaluar la expresión mediante una máquina de pila . El recorrido en posorden también se utiliza para eliminar el árbol. Cada nodo se libera después de liberar a sus hijos.

El recorrido en orden se utiliza muy comúnmente en árboles de búsqueda binaria porque devuelve valores del conjunto subyacente en orden, según el comparador que configuró el árbol de búsqueda binaria.

Implementaciones

Implementación de búsqueda en profundidad

Implementación de pedidos anticipados

Implementación posterior al pedido

Implementación en orden

Otra variante de Pre-orden

Si el árbol está representado por una matriz (el primer índice es 0), es posible calcular el índice del siguiente elemento: ^[8]^{[ aclaración necesaria ]}

procedimiento bubbleUp(matriz, i, hoja) k ← 1 yo ← (yo - 1)/2 mientras (hoja + 1) % (k * 2) ≠ k yo ← (yo - 1)/2 k ← 2 * k devuelvo yoprocedimiento preordenar(matriz) yo ← 0 mientras i ≠ array.size visita(matriz[i]) si i = tamaño - 1 yo ← tamaño De lo contrario, si i < tamaño/2 yo ← yo * 2 + 1 demás hoja ← i - tamaño/2 padre ← bubble_up(matriz, i, hoja) i ← padre * 2 + 2

Avanzando al nodo siguiente o anterior

Es posible que el elemento nodecon el que se debe iniciar se haya encontrado en el árbol de búsqueda binaria bstmediante una función de búsqueda estándar , que se muestra aquí en una implementación sin punteros padre, es decir, utiliza un stackpara almacenar los punteros antecesores.

procedimiento de búsqueda(bst, clave) // devuelve un (nodo, pila) nodo ← bst.root pila ← pila vacía  mientras nodo ≠ nulo pila.push(nodo) si clave = nodo.clave devuelve (nodo, pila) si clave < nodo.clave nodo ← nodo.izquierda  demás nodo ← nodo.derecho retorna ( nulo , pila vacía )

La función inorderNext ^[2]^{: 60} devuelve un vecino en orden de node, ya sea el sucesor en orden ( para dir=1) o el predecesor en orden (para dir=0), y el , actualizado stack, de modo que el árbol de búsqueda binario pueda recorrerse secuencialmente en orden y buscarse en la dirección dada dirmás adelante.

procedimiento inorderNext(nodo, dir, pila) nuevo nodo ← nodo.hijo[dir] si newnode ≠ null  hacer nodo ← nuevonodo pila.push(nodo) nuevo nodo ← nodo.hijo[1-dir] hasta que newnode = null  devuelva (nodo, pila) // el nodo no tiene un directorio secundario: hacer  si stack.isEmpty() return ( null , pila vacía ) nodo antiguo ← nodo nodo ← stack.pop() // padre de oldnode hasta que oldnode ≠ node.child[dir] // ahora oldnode = node.child[1-dir], // ie nodo = ancestro (y predecesor/sucesor) del nodo original retorno (nodo, pila)

Tenga en cuenta que la función no utiliza claves, lo que significa que la estructura secuencial está completamente registrada por los bordes del árbol de búsqueda binaria. Para los recorridos sin cambio de dirección, la complejidad promedio ( amortizada ) se debe a que un recorrido completo requiere pasos para un BST de tamaño 1 paso para el borde hacia arriba y 1 para el borde hacia abajo. La complejidad del peor caso es con la altura del árbol. ${\mathcal {O}}(1),$ ${\estilo de visualización 2n-2}$ ${\estilo de visualización n,}$ ${\mathcal {O}}(h)$ ${\estilo de visualización h}$

Todas las implementaciones anteriores requieren un espacio de pila proporcional a la altura del árbol, que es una pila de llamadas para las recursivas y una pila padre (antepasada) para las iterativas. En un árbol mal equilibrado, esto puede ser considerable. Con las implementaciones iterativas podemos eliminar el requisito de pila manteniendo punteros padre en cada nodo o enhebrando el árbol (siguiente sección).

Recorrido en orden de Morris utilizando subprocesos

Un árbol binario se crea haciendo que cada puntero hijo izquierdo (que de otro modo sería nulo) apunte al predecesor en orden del nodo (si existe) y cada puntero hijo derecho (que de otro modo sería nulo) apunte al sucesor en orden del nodo (si existe).

Ventajas:

Evita la recursión, que utiliza una pila de llamadas y consume memoria y tiempo.
El nodo mantiene un registro de su padre.

Desventajas:

El árbol es más complejo.
Sólo podemos realizar una travesía a la vez.
Es más propenso a errores cuando ambos hijos no están presentes y ambos valores de los nodos apuntan a sus antepasados.

El recorrido de Morris es una implementación del recorrido en orden que utiliza subprocesos: ^[9]

Crear enlaces al sucesor en orden.
Imprima los datos utilizando estos enlaces.
Revertir los cambios para restaurar el árbol original.

Búsqueda en amplitud

Además, a continuación se incluye un pseudocódigo para un recorrido simple por orden de nivel basado en colas , y requerirá un espacio proporcional al número máximo de nodos a una profundidad determinada. Esto puede ser hasta la mitad del número total de nodos. Se puede implementar un enfoque más eficiente en cuanto al espacio para este tipo de recorrido utilizando una búsqueda iterativa de profundidad en primer lugar .

nivel de procedimientoorder (nodo) cola ← cola vacía cola.enqueue(nodo) mientras  no esté en cola.isEmpty() nodo ← cola.dequeue() visita(nodo) si nodo.izquierda ≠ nulo cola.poner en cola(nodo.izquierda) si nodo.derecho ≠ nulo cola.poner en cola(nodo.derecha)

Si el árbol está representado por una matriz (el primer índice es 0), es suficiente iterar a través de todos los elementos:

procedimiento levelorder(array) para i desde 0 hasta array.size visita(matriz[i])

Árboles infinitos

Si bien el recorrido se realiza generalmente para árboles con un número finito de nodos (y, por lo tanto, profundidad finita y factor de ramificación finito ), también se puede realizar para árboles infinitos. Esto es de particular interés en la programación funcional (particularmente con evaluación diferida ), ya que las estructuras de datos infinitas a menudo se pueden definir y trabajar fácilmente, aunque no se evalúen (estrictamente), ya que esto llevaría un tiempo infinito. Algunos árboles finitos son demasiado grandes para representarlos explícitamente, como el árbol de juegos para ajedrez o go , por lo que es útil analizarlos como si fueran infinitos.

Un requisito básico para el recorrido es visitar todos los nodos eventualmente. Para árboles infinitos, los algoritmos simples a menudo no lo logran. Por ejemplo, dado un árbol binario de profundidad infinita, una búsqueda en profundidad se dirigirá hacia abajo por un lado (por convención, el lado izquierdo) del árbol, sin visitar nunca el resto, y de hecho un recorrido en orden o post-orden nunca visitará ningún nodo, ya que no ha llegado a una hoja (y de hecho nunca lo hará). Por el contrario, un recorrido en amplitud (orden de nivel) recorrerá un árbol binario de profundidad infinita sin problemas, y de hecho recorrerá cualquier árbol con un factor de ramificación acotado.

Por otra parte, dado un árbol de profundidad 2, donde la raíz tiene infinitos hijos, y cada uno de estos hijos tiene dos hijos, una búsqueda en profundidad visitará todos los nodos, ya que una vez que agote los nietos (hijos de los hijos de un nodo), pasará al siguiente (suponiendo que no sea de orden posterior, en cuyo caso nunca llega a la raíz). Por el contrario, una búsqueda en amplitud nunca llegará a los nietos, ya que busca agotar primero a los hijos.

Se puede realizar un análisis más sofisticado del tiempo de ejecución mediante números ordinales infinitos ; por ejemplo, la búsqueda en amplitud del árbol de profundidad 2 anterior tomará ω ·2 pasos: ω para el primer nivel y luego otro ω para el segundo nivel.

Por lo tanto, las búsquedas simples en profundidad o en amplitud no recorren todos los árboles infinitos y no son eficientes en árboles muy grandes. Sin embargo, los métodos híbridos pueden recorrer cualquier árbol infinito (contable), esencialmente a través de un argumento diagonal ("diagonal" -una combinación de vertical y horizontal- corresponde a una combinación de profundidad y amplitud).

Concretamente, dado el árbol infinitamente ramificado de profundidad infinita, etiquete la raíz (), los hijos de la raíz (1), (2), ..., los nietos (1, 1), (1, 2), ..., (2, 1), (2, 2), ..., y así sucesivamente. Los nodos están, por lo tanto, en una correspondencia biunívoca con secuencias finitas (posiblemente vacías) de números positivos, que son contables y pueden colocarse en orden primero por suma de entradas, y luego por orden lexicográfico dentro de una suma dada (solo un número finito de secuencias suman un valor dado, por lo que se alcanzan todas las entradas; formalmente hay un número finito de composiciones de un número natural dado, específicamente 2 ^{n −1} composiciones de n ≥ 1 ), lo que da un recorrido. Explícitamente:

()
(1)
(1, 1) (2)
(1, 1, 1) (1, 2) (2, 1) (3)
(1, 1, 1, 1) (1, 1, 2) (1, 2, 1) (1, 3) (2, 1, 1) (2, 2) (3, 1) (4)

etc.

Esto puede interpretarse como mapear el árbol binario de profundidad infinita en este árbol y luego aplicar la búsqueda en amplitud: reemplazar los bordes "hacia abajo" que conectan un nodo padre a su segundo y posteriores hijos con bordes "hacia la derecha" del primer hijo al segundo hijo, del segundo hijo al tercer hijo, etc. Así, en cada paso, uno puede ir hacia abajo (agregar un (, 1) al final) o ir a la derecha (agregar uno al último número) (excepto la raíz, que es adicional y solo puede ir hacia abajo), lo que muestra la correspondencia entre el árbol binario infinito y la numeración anterior; la suma de las entradas (menos uno) corresponde a la distancia desde la raíz, que concuerda con los 2 ^{n −1} nodos en la profundidad n − 1 en el árbol binario infinito (2 corresponde a binario).

Referencias

^ "Conferencia 8, Travesía de árboles" . Consultado el 2 de mayo de 2015 .
^ ab Pfaff, Ben (2004). Introducción a los árboles binarios de búsqueda y árboles equilibrados . Free Software Foundation, Inc.
^ Métodos de recorrido de árboles binarios
^ "Algoritmo de recorrido de preorden" . Consultado el 2 de mayo de 2015 .
^ L antes de R significa el recorrido en sentido antihorario (estándar), como en la figura.
La ejecución de N antes, entre o después de L y R determina uno de los métodos descritos.
Si el recorrido se realiza en sentido inverso (en el sentido de las agujas del reloj), se denomina recorrido inverso. Esto se describe en particular para el orden inverso, cuando los datos se deben recuperar en orden descendente.
^ "Algoritmos, ¿Qué combinaciones de secuenciación previa, posterior y en orden son únicas?, Computer Science Stack Exchange" . Consultado el 2 de mayo de 2015 .
^ Wittman, Todd. "Tree Traversal" (PDF) . UCLA Math . Archivado desde el original (PDF) el 13 de febrero de 2015. Consultado el 2 de enero de 2016 .
^ "Estructuras de árbol constexpr". Blog de Fekir . 9 de agosto de 2021 . Consultado el 15 de agosto de 2021 .
^ Morris, Joseph M. (1979). "Recorriendo árboles binarios de forma sencilla y económica". Information Processing Letters . 9 (5): 197–200. doi :10.1016/0020-0190(79)90068-1.

Fuentes

Dale, Nell. Lilly, Susan D. "Pascal Plus Data Structures". DC Heath and Company. Lexington, MA. 1995. Cuarta edición.
Drozdek, Adam. "Estructuras de datos y algoritmos en C++". Brook/Cole. Pacific Grove, CA. 2001. Segunda edición.
"Árbol transversal" (math.northwestern.edu)

Enlaces externos

Almacenamiento de datos jerárquicos en una base de datos con ejemplos de recorrido en PHP
Gestión de datos jerárquicos en MySQL
Trabajar con gráficos en MySQL
Vea el recorrido de árboles implementado en varios lenguajes de programación en Rosetta Code
Recorrido de árboles sin recursión
Algoritmos de recorrido de árboles
Recorrido de árbol binario
Recorrido de árboles en una estructura de datos