Búsqueda en profundidad

La búsqueda en profundidad ( DFS ) es un algoritmo para recorrer o buscar estructuras de datos en forma de árbol o gráfico . El algoritmo comienza en el nodo raíz (seleccionando un nodo arbitrario como nodo raíz en el caso de un gráfico) y explora lo más lejos posible a lo largo de cada rama antes de volver atrás. Se necesita memoria adicional, generalmente una pila , para realizar un seguimiento de los nodos descubiertos hasta el momento a lo largo de una rama específica, lo que ayuda a volver atrás en el gráfico.

En el siglo XIX, el matemático francés Charles Pierre Trémaux ^[1] investigó una versión de la búsqueda en profundidad como estrategia para resolver laberintos . ^[2]^[3]

Propiedades

El análisis temporal y espacial de DFS difiere según su área de aplicación. En informática teórica, DFS se utiliza normalmente para recorrer un grafo entero y lleva tiempo , ^[4] donde es el número de vértices y el número de aristas . Esto es lineal en el tamaño del grafo. En estas aplicaciones también utiliza espacio en el peor de los casos para almacenar la pila de vértices en la ruta de búsqueda actual, así como el conjunto de vértices ya visitados. Por tanto, en este entorno, los límites temporales y espaciales son los mismos que para la búsqueda en amplitud y la elección de cuál de estos dos algoritmos utilizar depende menos de su complejidad y más de las diferentes propiedades de los ordenamientos de vértices que producen los dos algoritmos. $O(|V|+|E|)$ ${\estilo de visualización |V|}$ ${\estilo de visualización |E|}$ $O(|V|)$

Para las aplicaciones de DFS en relación con dominios específicos, como la búsqueda de soluciones en inteligencia artificial o rastreo web, el gráfico que se debe recorrer es a menudo demasiado grande para visitarlo en su totalidad o infinito (DFS puede sufrir de no terminación ). En tales casos, la búsqueda solo se realiza a una profundidad limitada ; debido a los recursos limitados, como la memoria o el espacio en disco, normalmente no se utilizan estructuras de datos para realizar un seguimiento del conjunto de todos los vértices visitados anteriormente. Cuando la búsqueda se realiza a una profundidad limitada, el tiempo sigue siendo lineal en términos del número de vértices y aristas expandidas (aunque este número no es el mismo que el tamaño de todo el gráfico porque algunos vértices pueden buscarse más de una vez y otros no en absoluto), pero la complejidad espacial de esta variante de DFS es solo proporcional al límite de profundidad y, como resultado, es mucho menor que el espacio necesario para buscar a la misma profundidad utilizando la búsqueda en amplitud. Para tales aplicaciones, DFS también se presta mucho mejor a los métodos heurísticos para elegir una rama de aspecto probable. Cuando no se conoce a priori un límite de profundidad adecuado, la búsqueda iterativa de profundización en profundidad aplica DFS repetidamente con una secuencia de límites crecientes. En el modo de análisis de inteligencia artificial, con un factor de ramificación mayor que uno, la profundización iterativa aumenta el tiempo de ejecución solo en un factor constante en el caso en el que se conoce el límite de profundidad correcto debido al crecimiento geométrico del número de nodos por nivel.

El DFS también se puede utilizar para recopilar una muestra de nodos de gráficos. Sin embargo, el DFS incompleto, de manera similar al BFS incompleto , está sesgado hacia los nodos de alto grado .

Ejemplo

Para el siguiente gráfico:

una búsqueda en profundidad que comienza en el nodo A, suponiendo que los bordes izquierdos en el gráfico mostrado se eligen antes que los bordes derechos, y suponiendo que la búsqueda recuerda los nodos visitados previamente y no los repetirá (ya que este es un gráfico pequeño), visitará los nodos en el siguiente orden: A, B, D, F, E, C, G. Los bordes recorridos en esta búsqueda forman un árbol Trémaux , una estructura con importantes aplicaciones en la teoría de grafos . Realizar la misma búsqueda sin recordar los nodos visitados previamente da como resultado visitar los nodos en el orden A, B, D, F, E, A, B, D, F, E, etc. para siempre, atrapado en el ciclo A, B, D, F, E y nunca llegando a C o G.

La profundización iterativa es una técnica para evitar este bucle infinito y alcanzaría todos los nodos.

Salida de una búsqueda en profundidad

El resultado de una búsqueda en profundidad de un grafo se puede describir convenientemente en términos de un árbol de expansión de los vértices alcanzados durante la búsqueda. Con base en este árbol de expansión, las aristas del grafo original se pueden dividir en tres clases: aristas delanteras , que apuntan desde un nodo del árbol a uno de sus descendientes, aristas traseras , que apuntan desde un nodo a uno de sus ancestros, y aristas cruzadas , que no hacen ninguna de las dos cosas. A veces, las aristas del árbol , aristas que pertenecen al propio árbol de expansión, se clasifican por separado de las aristas delanteras. Si el grafo original no está dirigido, entonces todas sus aristas son aristas del árbol o aristas traseras.

Ordenamientos de vértices

También es posible utilizar la búsqueda en profundidad para ordenar linealmente los vértices de un gráfico o árbol. Hay cuatro formas posibles de hacerlo:

Un preordenamiento es una lista de los vértices en el orden en que fueron visitados por primera vez por el algoritmo de búsqueda en profundidad. Esta es una forma compacta y natural de describir el progreso de la búsqueda, como se hizo anteriormente en este artículo. Un preordenamiento de un árbol de expresión es la expresión en notación polaca .
Un postordenamiento es una lista de los vértices en el orden en que fueron visitados por última vez por el algoritmo. Un postordenamiento de un árbol de expresión es la expresión en notación polaca inversa .
Un preordenamiento inverso es lo inverso de un preordenamiento, es decir, una lista de vértices en el orden opuesto a su primera visita. El preordenamiento inverso no es lo mismo que el posordenamiento.
Un postordenamiento inverso es lo inverso de un postordenamiento, es decir, una lista de vértices en el orden opuesto a su última visita. El postordenamiento inverso no es lo mismo que el preordenamiento.

Para los árboles binarios existe además el ordenamiento interno y el ordenamiento inverso .

Por ejemplo, al buscar el gráfico dirigido que se muestra a continuación comenzando en el nodo A, la secuencia de recorridos es ABDBACA o ACDCABA (la elección de visitar primero B o C desde A depende del algoritmo). Tenga en cuenta que las visitas repetidas en forma de retroceso a un nodo, para verificar si aún tiene vecinos sin visitar, se incluyen aquí (incluso si se descubre que no tiene ninguno). Por lo tanto, los posibles preordenamientos son ABDC y ACDB, mientras que los posibles posordenamientos son DBCA y DCBA, y los posibles posordenamientos inversos son ACBD y ABC D.

Un gráfico dirigido con aristas AB, BD, AC, CD

El ordenamiento posterior inverso produce una clasificación topológica de cualquier gráfico acíclico dirigido . Este ordenamiento también es útil en el análisis del flujo de control , ya que a menudo representa una linealización natural de los flujos de control. El gráfico anterior podría representar el flujo de control en el fragmento de código siguiente, y es natural considerar este código en el orden ABCD o ACBD, pero no es natural usar el orden ABDC o ACD B.

si ( A ) entonces { B} demás { do}D

Pseudocódigo

Una implementación recursiva de DFS: ^[5]

procedimiento DFS( G , v ) es etiqueta v como descubierto para todos los bordes dirigidos desde v hasta w que están  en  G.adjacentEdges ( v ) si el vértice w no está etiquetado como descubierto, entonces  llama recursivamente a DFS( G , w )

Una implementación no recursiva de DFS con la complejidad espacial del peor caso , con la posibilidad de vértices duplicados en la pila: ^[6] $O(|E|)$

procedimiento DFS_iterative( G , v ) es dejar que S sea una pila S .push( v ) mientras  S no esté vacía hacer  v = S .pop() si  v no está etiquetado como descubierto entonces etiquetar v como descubierto para todos los bordes desde v hasta w  en  G .adjacentEdges( v ) hacer  S .push( w )

Un gráfico no dirigido con aristas AB, BD, BF, FE, AC, CG, AE — El gráfico de ejemplo, copiado de arriba

Estas dos variantes de DFS visitan a los vecinos de cada vértice en orden opuesto entre sí: el primer vecino de v visitado por la variante recursiva es el primero en la lista de aristas adyacentes, mientras que en la variante iterativa el primer vecino visitado es el último en la lista de aristas adyacentes. La implementación recursiva visitará los nodos del gráfico de ejemplo en el siguiente orden: A, B, D, F, E, C, G. La implementación no recursiva visitará los nodos como: A, E, F, B, D, C, G.

La implementación no recursiva es similar a la búsqueda en amplitud, pero se diferencia de ella en dos formas:

Utiliza una pila en lugar de una cola, y
Retrasa la comprobación de si se ha descubierto un vértice hasta que el vértice se extrae de la pila en lugar de realizar esta comprobación antes de agregar el vértice.

Si $G$ es un árbol , reemplazar la cola del algoritmo de búsqueda en amplitud por una pila producirá un algoritmo de búsqueda en profundidad. Para los grafos generales, reemplazar la pila de la implementación iterativa de búsqueda en profundidad por una cola también produciría un algoritmo de búsqueda en amplitud, aunque uno un tanto no estándar. ^[7]

Otra posible implementación de la búsqueda en profundidad iterativa utiliza una pila de iteradores de la lista de vecinos de un nodo, en lugar de una pila de nodos. Esto produce el mismo recorrido que la búsqueda en profundidad recursiva. ^[8]

El procedimiento DFS_iterative( G , v ) es dejar que S sea una pila etiqueta v como descubierta S .push(iterador de G .adjacentEdges( v )) mientras  S no esté vacío hacer  si  S .peek().hasNext() entonces  w = S .peek().next() si  w no está etiquetado como descubierto entonces etiqueta w como descubierto S .push(iterador de G .adjacentEdges( w )) de lo contrario  S .pop()

Aplicaciones

Algoritmo aleatorio similar a la búsqueda en profundidad utilizado para generar un laberinto.

Los algoritmos que utilizan la búsqueda en profundidad como elemento fundamental incluyen:

Encontrar componentes conectados .
Ordenamiento topológico .
Encontrar componentes conexos mediante 2 (aristas o vértices).
Encontrar componentes conexos por 3 aristas o vértices.
Encontrar los puentes de un grafo.
Generar palabras para graficar el conjunto límite de un grupo .
Encontrar componentes fuertemente conectados .
Determinar si una especie está más cerca de una especie u otra en un árbol filogenético.
Prueba de planaridad . ^[9]^[10]
Resolver acertijos con una sola solución, como laberintos . (DFS se puede adaptar para encontrar todas las soluciones de un laberinto incluyendo únicamente los nodos de la ruta actual en el conjunto visitado).
La generación de laberintos puede utilizar un DFS aleatorio.
Encontrar biconectividad en grafos .
Sucesión al trono compartida por los reinos de la Commonwealth . ^[11]

Complejidad

La complejidad computacional de DFS fue investigada por John Reif . Más precisamente, dado un gráfico , sea el orden calculado por el algoritmo DFS recursivo estándar. Este orden se llama ordenamiento de búsqueda en profundidad lexicográfica. John Reif consideró la complejidad de calcular el ordenamiento de búsqueda en profundidad lexicográfica, dado un gráfico y una fuente. Una versión de decisión del problema (probar si algún vértice $u$ ocurre antes de algún vértice $v$ en este orden) es P -completa , ^[12] lo que significa que es "una pesadilla para el procesamiento paralelo ". ^[13]^{: 189} ${\estilo de visualización G}$ $O=(v_{1},\puntos ,v_{n})$

Se puede calcular un ordenamiento de búsqueda en profundidad (no necesariamente lexicográfico) mediante un algoritmo paralelo aleatorio en la clase de complejidad RNC . ^[14] Hasta 1997, seguía sin saberse si se podía construir un recorrido en profundidad mediante un algoritmo paralelo determinista, en la clase de complejidad NC . ^[15]

Véase también

Recorrido de árboles (para obtener detalles sobre recorridos en profundidad en preorden, en orden y postorden)
Búsqueda en amplitud
Búsqueda en profundidad iterativa y de profundización
Juego de búsqueda

Notas

↑ Charles Pierre Trémaux (1859–1882) École polytechnique de Paris (X:1876), ingeniero francés del telégrafo
en Conferencia pública, 2 de diciembre de 2010 – por el profesor Jean Pelletier-Thibert en la Académie de Macon (Borgoña – Francia) – (Resumen publicado en Anales académicos, marzo de 2011 – ISSN 0980-6032)
^ Incluso, Shimon (2011), Algoritmos de gráficos (2.ª ed.), Cambridge University Press, págs. 46-48, ISBN 978-0-521-73653-4.
^ Sedgewick, Robert (2002), Algoritmos en C++: Algoritmos de gráficos (3.ª ed.), Pearson Education, ISBN 978-0-201-36118-6.
^ Cormen, Thomas H., Charles E. Leiserson y Ronald L. Rivest. p.606
^ Goodrich y Tamassia; Cormen, Leiserson, Rivest y Stein
^ Página 93, Diseño de algoritmos, Kleinberg y Tardos
^ "Recorrido de grafos basado en pila ≠ búsqueda en profundidad". 11011110.github.io . Consultado el 10 de junio de 2020 .
^ Sedgewick, Robert (2010). Algoritmos en Java. Addison-Wesley. ISBN 978-0-201-36121-6.OCLC 837386973 .
^ Hopcroft, John ; Tarjan, Robert E. (1974), "Pruebas de planaridad eficientes" (PDF) , Revista de la Asociación de Maquinaria Informática , 21 (4): 549–568, doi :10.1145/321850.321852, hdl : 1813/6011 , S2CID 6279825.
^ de Fraysseix, H.; Ossona de Mendez, P .; Rosenstiehl, P. (2006), "Árboles de Trémaux y planaridad", International Journal of Foundations of Computer Science , 17 (5): 1017–1030, arXiv : math/0610935 , Bibcode :2006math.....10935D, doi :10.1142/S0129054106004248, S2CID 40107560.
^ Baccelli, Francois; Haji-Mirsadeghi, Mir-Omid; Khezeli, Ali (2018), "Árboles genealógicos eternos y dinámica en grafos aleatorios unimodulares", en Sobieczky, Florian (ed.), Unimodularidad en grafos generados aleatoriamente: Sesión especial de la AMS, 8 y 9 de octubre de 2016, Denver, Colorado , Contemporary Mathematics, vol. 719, Providence, Rhode Island: American Mathematical Society, págs. 85–127, arXiv : 1608.05940 , doi : 10.1090/conm/719/14471, MR 3880014, S2CID 119173820; véase el ejemplo 3.7, pág. 93
^ Reif, John H. (1985). "La búsqueda en profundidad es inherentemente secuencial". Information Processing Letters . 20 (5): 229–234. doi :10.1016/0020-0190(85)90024-9.
^ Mehlhorn, Kurt ; Sanders, Peter (2008). Algoritmos y estructuras de datos: la caja de herramientas básica (PDF) . Springer. Archivado (PDF) desde el original el 8 de septiembre de 2015.
^ Aggarwal, A.; Anderson, RJ (1988), "Un algoritmo NC aleatorio para búsqueda en profundidad", Combinatorica , 8 (1): 1–12, doi :10.1007/BF02122548, MR 0951989, S2CID 29440871.
^ Karger, David R. ; Motwani, Rajeev (1997), "Un algoritmo NC para cortes mínimos", SIAM Journal on Computing , 26 (1): 255–272, CiteSeerX 10.1.1.33.1701 , doi :10.1137/S0097539794273083, MR 1431256 .

Referencias

Thomas H. Cormen , Charles E. Leiserson , Ronald L. Rivest y Clifford Stein . Introducción a los algoritmos , segunda edición. MIT Press y McGraw-Hill, 2001. ISBN 0-262-03293-7 . Sección 22.3: Búsqueda en profundidad, págs. 540–549.
Goodrich, Michael T .; Tamassia, Roberto (2001), Diseño de algoritmos: fundamentos, análisis y ejemplos de Internet , Wiley, ISBN 0-471-38365-1
Kleinberg, Jon ; Tardos, Éva (2006), Diseño de algoritmos , Addison Wesley, págs. 92–94
Knuth, Donald E. (1997), El arte de la programación informática, vol. 1, 3.ª ed., Boston: Addison-Wesley, ISBN 0-201-89683-4, OCLC 155842391, archivado desde el original el 4 de septiembre de 2008 , consultado el 12 de febrero de 2008

Enlaces externos

Wikimedia Commons alberga una categoría multimedia sobre Búsqueda en profundidad .

Estructuras de datos abiertas - Sección 12.3.2 - Búsqueda en profundidad, Pat Morin
Biblioteca de gráficos Boost de C++: búsqueda en profundidad
Animación de búsqueda en profundidad (para un gráfico dirigido)
Búsqueda en profundidad y en amplitud: explicación y código
Explicación ilustrada del algoritmo de búsqueda en profundidad (implementaciones en Java y C++)
YAGSBPL: una biblioteca C++ basada en plantillas para la búsqueda y planificación de gráficos