A* (pronunciado "A-star") es un algoritmo de recorrido de grafos y búsqueda de rutas , que se utiliza en muchos campos de la informática debido a su completitud, optimalidad y eficiencia óptima. [1] Dado un grafo ponderado , un nodo de origen y un nodo de destino, el algoritmo encuentra la ruta más corta (con respecto a los pesos dados) desde el origen hasta el destino.
Una desventaja práctica importante es su complejidad espacial, donde d es la profundidad de la solución (la longitud del camino más corto) y b es el factor de ramificación (el número promedio de sucesores por estado), ya que almacena todos los nodos generados en la memoria. Por lo tanto, en los sistemas prácticos de enrutamiento de viajes , generalmente es superado por algoritmos que pueden preprocesar el gráfico para lograr un mejor rendimiento, [2] así como por enfoques limitados por la memoria; sin embargo, A* sigue siendo la mejor solución en muchos casos. [3]
Peter Hart , Nils Nilsson y Bertram Raphael del Stanford Research Institute (ahora SRI International ) publicaron por primera vez el algoritmo en 1968. [4] Puede verse como una extensión del algoritmo de Dijkstra . A* logra un mejor rendimiento al usar heurísticas para guiar su búsqueda.
En comparación con el algoritmo de Dijkstra, el algoritmo A* solo encuentra la ruta más corta desde una fuente específica hasta un objetivo específico, y no el árbol de rutas más cortas desde una fuente específica hasta todos los objetivos posibles. Esta es una compensación necesaria para usar una heurística dirigida a un objetivo específico. Para el algoritmo de Dijkstra, dado que se genera todo el árbol de rutas más cortas, cada nodo es un objetivo y no puede haber una heurística dirigida a un objetivo específico.
A* fue creado como parte del proyecto Shakey , que tenía el objetivo de construir un robot móvil que pudiera planificar sus propias acciones. Nils Nilsson propuso originalmente usar el algoritmo Graph Traverser [5] para la planificación de rutas de Shakey. [6] Graph Traverser está guiado por una función heurística h ( n ) , la distancia estimada desde el nodo n hasta el nodo objetivo: ignora por completo g ( n ) , la distancia desde el nodo de inicio hasta n . Bertram Raphael sugirió usar la suma, g ( n ) + h ( n ) . [7] Peter Hart inventó los conceptos que ahora llamamos admisibilidad y consistencia de las funciones heurísticas. A* fue diseñado originalmente para encontrar rutas de menor costo cuando el costo de una ruta es la suma de sus costos, pero se ha demostrado que A* se puede usar para encontrar rutas óptimas para cualquier problema que satisfaga las condiciones de un álgebra de costos. [8]
El artículo original de A* de 1968 [4] contenía un teorema que afirmaba que ningún algoritmo similar a A* [a] podría expandir menos nodos que A* si la función heurística es consistente y la regla de desempate de A* se elige adecuadamente. Unos años más tarde se publicó una "corrección" [9] que afirmaba que no se requería consistencia, pero se demostró que esto era falso en 1985 en el estudio definitivo de Dechter y Pearl sobre la optimalidad de A* (ahora llamada eficiencia óptima), que dio un ejemplo de A* con una heurística que era admisible pero no consistente al expandir arbitrariamente más nodos que un algoritmo alternativo similar a A*. [10]
A* es un algoritmo de búsqueda informado , o una búsqueda del tipo "mejor primero" , lo que significa que está formulado en términos de gráficos ponderados : a partir de un nodo de inicio específico de un gráfico, tiene como objetivo encontrar una ruta hacia el nodo objetivo dado que tenga el menor costo (menor distancia recorrida, menor tiempo, etc.). Lo hace manteniendo un árbol de rutas que se originan en el nodo de inicio y extendiendo esas rutas un borde a la vez hasta que se alcanza el nodo objetivo.
En cada iteración de su bucle principal, A* debe determinar cuál de sus caminos extender. Lo hace en función del costo del camino y de una estimación del costo necesario para extender el camino hasta el objetivo. En concreto, A* selecciona el camino que minimiza
donde n es el siguiente nodo en la ruta, g ( n ) es el costo de la ruta desde el nodo de inicio hasta n , y h ( n ) es una función heurística que estima el costo de la ruta más barata desde n hasta el objetivo. La función heurística es específica del problema. Si la función heurística es admisible , es decir, nunca sobreestima el costo real para llegar al objetivo, se garantiza que A* devolverá una ruta de menor costo desde el inicio hasta el objetivo.
Las implementaciones típicas de A* utilizan una cola de prioridad para realizar la selección repetida de nodos de costo mínimo (estimado) para expandir. Esta cola de prioridad se conoce como conjunto abierto , franja o frontera . En cada paso del algoritmo, el nodo con el valor f ( x ) más bajo se elimina de la cola, los valores f y g de sus vecinos se actualizan en consecuencia y estos vecinos se agregan a la cola. El algoritmo continúa hasta que un nodo eliminado (por lo tanto, el nodo con el valor f más bajo de todos los nodos de franja) es un nodo objetivo. [b] El valor f de ese objetivo es entonces también el costo de la ruta más corta, ya que h en el objetivo es cero en una heurística admisible.
El algoritmo descrito hasta ahora sólo proporciona la longitud de la ruta más corta. Para encontrar la secuencia real de pasos, el algoritmo se puede revisar fácilmente de modo que cada nodo de la ruta mantenga un registro de su predecesor. Después de ejecutar este algoritmo, el nodo final apuntará a su predecesor, y así sucesivamente, hasta que el predecesor de algún nodo sea el nodo inicial.
Por ejemplo, al buscar la ruta más corta en un mapa, h ( x ) puede representar la distancia en línea recta hasta el objetivo, ya que es la distancia física más pequeña posible entre dos puntos. Para un mapa de cuadrícula de un videojuego, resulta mejor utilizar la distancia de taxi o la distancia de Chebyshev según el conjunto de movimientos disponibles (de 4 u 8 direcciones).
Si la heurística h satisface la condición adicional h ( x ) ≤ d ( x , y ) + h ( y ) para cada arista ( x , y ) del grafo (donde d denota la longitud de esa arista), entonces h se llama monótona o consistente . Con una heurística consistente, se garantiza que A* encuentre una ruta óptima sin procesar ningún nodo más de una vez y A* es equivalente a ejecutar el algoritmo de Dijkstra con el costo reducido d' ( x , y ) = d ( x , y ) + h ( y ) − h ( x ) . [11]
El siguiente pseudocódigo describe el algoritmo:
función reconstruir_ruta ( caminodesde , actual ) ruta_total := {actual} mientras actual en caminódesde . Claves : actual := caminódesde [ actual ] ruta_total . prepend ( actual ) devolver ruta_total // A* encuentra una ruta desde el inicio hasta la meta. // h es la función heurística. h(n) estima el costo para alcanzar la meta desde el nodo n. function A_Star ( inicio , meta , h ) // El conjunto de nodos descubiertos que pueden necesitar ser (re)expandidos. // Inicialmente, solo se conoce el nodo de inicio. // Esto generalmente se implementa como un min-heap o una cola de prioridad en lugar de un conjunto hash. openSet := {start} // Para el nodo n, cameFrom[n] es el nodo inmediatamente anterior en la ruta más barata desde el inicio hasta n actualmente conocido. cameFrom := un mapa vacío // Para el nodo n, gScore[n] es el costo de la ruta más barata desde el inicio hasta n conocida actualmente. gScore := mapa con valor predeterminado de Infinity gScore [ inicio ] := 0 // Para el nodo n, fScore[n] := gScore[n] + h(n). fScore[n] representa nuestra mejor estimación actual de cuán barata podría ser una ruta desde el inicio hasta el final si pasa por n. fScore := mapa con valor predeterminado de Infinito fScore [ inicio ] := h ( inicio ) mientras openSet no esté vacío // Esta operación puede ocurrir en tiempo O(Log(N)) si openSet es un min-heap o una cola de prioridad actual := el nodo en openSet que tiene el valor fScore [] más bajo si actual = objetivo return reconstruct_path ( cameFrom , current ) openSet . Remove ( current ) para cada vecino de current // d(current,neighbor) es el peso del borde de current a neighbor // tentative_gScore es la distancia desde el inicio hasta el vecino a través de current tentative_gScore := gScore [ current ] + d ( current , neighbor ) if tentative_gScore < gScore [ neighbor ] // Esta ruta a neighbor es mejor que cualquier otra anterior. ¡Regístrala! cameFrom [ neighbor ] := current gScore [ neighbor ] := tentative_gScore fScore [ neighbor ] := tentative_gScore + h ( neighbor ) if neighbor not in openSet openSet . add ( neighbor ) // El conjunto abierto está vacío pero el objetivo nunca se alcanzó y se devolvió un error
Observación: En este pseudocódigo, si se llega a un nodo por una ruta, se lo elimina de openSet y, posteriormente, se lo alcanza por una ruta más barata, se lo agregará nuevamente a openSet. Esto es esencial para garantizar que la ruta devuelta sea óptima si la función heurística es admisible pero no consistente . Si la heurística es consistente, cuando se elimina un nodo de openSet, se garantiza que la ruta hacia él sea óptima, por lo que la prueba ' tentative_gScore < gScore[neighbor]
' siempre fallará si se llega nuevamente al nodo.
Un ejemplo de un algoritmo A* en acción donde los nodos son ciudades conectadas con carreteras y h(x) es la distancia en línea recta al punto objetivo:
Clave: verde: inicio; azul: objetivo; naranja: visitado
El algoritmo A* tiene aplicaciones en el mundo real. En este ejemplo, las aristas son vías de ferrocarril y h(x) es la distancia del círculo máximo (la distancia más corta posible en una esfera) hasta el objetivo. El algoritmo busca una ruta entre Washington, DC y Los Ángeles.
Hay una serie de optimizaciones simples o detalles de implementación que pueden afectar significativamente el rendimiento de una implementación A*. El primer detalle que se debe tener en cuenta es que la forma en que la cola de prioridad maneja los empates puede tener un efecto significativo en el rendimiento en algunas situaciones. Si se rompen los empates de modo que la cola se comporte de manera LIFO , A* se comportará como una búsqueda en profundidad entre rutas de igual costo (evitando explorar más de una solución igualmente óptima).
Cuando se requiere una ruta al final de la búsqueda, es común mantener con cada nodo una referencia al padre de ese nodo. Al final de la búsqueda, estas referencias se pueden usar para recuperar la ruta óptima. Si se mantienen estas referencias, puede ser importante que el mismo nodo no aparezca en la cola de prioridad más de una vez (cada entrada corresponde a una ruta diferente al nodo, y cada una con un costo diferente). Un enfoque estándar aquí es verificar si un nodo que está a punto de agregarse ya aparece en la cola de prioridad. Si lo hace, entonces los punteros de prioridad y padre se cambian para corresponder a la ruta de menor costo. Una cola de prioridad basada en montón binario estándar no admite directamente la operación de búsqueda de uno de sus elementos, pero se puede aumentar con una tabla hash que asigna elementos a su posición en el montón, lo que permite que esta operación de disminución de prioridad se realice en tiempo logarítmico. Alternativamente, un montón de Fibonacci puede realizar las mismas operaciones de disminución de prioridad en tiempo amortizado constante .
El algoritmo de Dijkstra , como otro ejemplo de un algoritmo de búsqueda de costo uniforme, puede verse como un caso especial de A* donde para todo x . [12] [13] La búsqueda en profundidad general se puede implementar usando A* considerando que hay un contador global C inicializado con un valor muy grande. Cada vez que procesamos un nodo, asignamos C a todos sus vecinos recién descubiertos. Después de cada asignación, disminuimos el contador C en uno. Por lo tanto, cuanto antes se descubra un nodo, mayor será su valor . Tanto el algoritmo de Dijkstra como la búsqueda en profundidad se pueden implementar de manera más eficiente sin incluir un valor en cada nodo.
En los grafos finitos con pesos de arista no negativos, se garantiza que A* terminará y será completo , es decir, siempre encontrará una solución (un camino desde el inicio hasta el objetivo) si existe una. En los grafos infinitos con un factor de ramificación finito y costos de arista que están acotados lejos de cero ( para algún valor fijo ), se garantiza que A* terminará solo si existe una solución. [1]
Se dice que un algoritmo de búsqueda es admisible si se garantiza que devolverá una solución óptima. Si la función heurística utilizada por A* es admisible , entonces A* es admisible. Una "prueba" intuitiva de esto es la siguiente:
Cuando A* termina su búsqueda, ha encontrado un camino desde el inicio hasta la meta cuyo costo real es menor que el costo estimado de cualquier camino desde el inicio hasta la meta a través de cualquier nodo abierto (el valor del nodo ). Cuando la heurística es admisible, esas estimaciones son optimistas (no del todo; véase el párrafo siguiente), por lo que A* puede ignorar esos nodos con seguridad porque no es posible que conduzcan a una solución más barata que la que ya tiene. En otras palabras, A* nunca pasará por alto la posibilidad de un camino de menor costo desde el inicio hasta la meta y, por lo tanto, continuará buscando hasta que no existan tales posibilidades.
La prueba real es un poco más complicada porque no se garantiza que los valores de los nodos abiertos sean optimistas incluso si la heurística es admisible. Esto se debe a que no se garantiza que los valores de los nodos abiertos sean óptimos, por lo que no se garantiza que la suma sea optimista.
El algoritmo A es óptimamente eficiente con respecto a un conjunto de algoritmos alternativos Alts en un conjunto de problemas P si para cada problema P en P y cada algoritmo A′ en Alts , el conjunto de nodos expandidos por A al resolver P es un subconjunto (posiblemente igual) del conjunto de nodos expandidos por A′ al resolver P. El estudio definitivo de la eficiencia óptima de A* se debe a Rina Dechter y Judea Pearl. [10] Consideraron una variedad de definiciones de Alts y P en combinación con la heurística de A* siendo meramente admisible o siendo consistente y admisible. El resultado positivo más interesante que demostraron es que A*, con una heurística consistente, es óptimamente eficiente con respecto a todos los algoritmos de búsqueda similares a A* admisibles en todos los problemas de búsqueda "no patológicos". En términos generales, su noción del problema no patológico es lo que ahora queremos decir con "hasta el desempate". Este resultado no se cumple si la heurística de A* es admisible pero no consistente. En ese caso, Dechter y Pearl demostraron que existen algoritmos admisibles similares a A* que pueden expandir arbitrariamente menos nodos que A* en algunos problemas no patológicos.
La eficiencia óptima se refiere al conjunto de nodos expandidos, no al número de expansiones de nodos (el número de iteraciones del bucle principal de A*). Cuando la heurística que se utiliza es admisible pero no consistente, es posible que un nodo sea expandido por A* muchas veces, un número exponencial de veces en el peor de los casos. [14] En tales circunstancias, el algoritmo de Dijkstra podría superar a A* por un amplio margen. Sin embargo, investigaciones más recientes encontraron que este caso patológico solo ocurre en ciertas situaciones artificiales donde el peso de la arista del gráfico de búsqueda es exponencial en el tamaño del gráfico y que ciertas heurísticas inconsistentes (pero admisibles) pueden llevar a un número reducido de expansiones de nodos en búsquedas A*. [15] [16]
Si bien el criterio de admisibilidad garantiza una ruta de solución óptima, también significa que A* debe examinar todas las rutas igualmente meritorias para encontrar la ruta óptima. Para calcular rutas más cortas aproximadas, es posible acelerar la búsqueda a expensas de la optimalidad relajando el criterio de admisibilidad. A menudo queremos limitar esta relajación, de modo que podamos garantizar que la ruta de solución no sea peor que (1 + ε ) veces la ruta de solución óptima. Esta nueva garantía se conoce como ε -admisible.
Hay varios algoritmos ε -admisibles:
La complejidad temporal de A* depende de la heurística. En el peor caso de un espacio de búsqueda ilimitado, la cantidad de nodos expandidos es exponencial en la profundidad de la solución (la ruta más corta) d : O ( b d ) , donde b es el factor de ramificación (la cantidad promedio de sucesores por estado). [24] Esto supone que existe un estado objetivo y que se puede alcanzar desde el estado inicial; si no es así y el espacio de estados es infinito, el algoritmo no terminará.
La función heurística tiene un efecto importante en el rendimiento práctico de la búsqueda A*, ya que una buena heurística permite a A* eliminar muchos de los nodos b d que una búsqueda no informada expandiría. Su calidad se puede expresar en términos del factor de ramificación efectivo b * , que se puede determinar empíricamente para una instancia de problema midiendo la cantidad de nodos generados por la expansión, N , y la profundidad de la solución, y luego resolviendo [25]
Las buenas heurísticas son aquellas con un factor de ramificación efectivo bajo (siendo el óptimo b * = 1 ).
La complejidad temporal es polinómica cuando el espacio de búsqueda es un árbol, hay un único estado objetivo y la función heurística h cumple la siguiente condición:
donde h * es la heurística óptima, el coste exacto para llegar desde x al objetivo. En otras palabras, el error de h no crecerá más rápido que el logaritmo de la "heurística perfecta" h * que devuelve la distancia real desde x al objetivo. [18] [24]
La complejidad espacial de A* es aproximadamente la misma que la de todos los demás algoritmos de búsqueda de gráficos, ya que mantiene todos los nodos generados en la memoria. [1] En la práctica, este resulta ser el mayor inconveniente de la búsqueda A*, lo que lleva al desarrollo de búsquedas heurísticas limitadas por la memoria, como Iterative deepening A* , memory-bounded A* y SMA* .
A* se utiliza a menudo para el problema común de búsqueda de rutas en aplicaciones como los videojuegos, pero originalmente fue diseñado como un algoritmo general de recorrido de gráficos. [4] Encuentra aplicaciones en diversos problemas, incluido el problema del análisis sintáctico mediante gramáticas estocásticas en PNL . [26] Otros casos incluyen una búsqueda de información con aprendizaje en línea. [27]
Lo que diferencia a A* de un algoritmo de búsqueda codicioso de "lo mejor primero" es que tiene en cuenta el costo/distancia ya recorrida, g ( n ) .
Algunas variantes comunes del algoritmo de Dijkstra pueden verse como un caso especial de A* donde la heurística para todos los nodos; [12] [13] a su vez, tanto Dijkstra como A* son casos especiales de programación dinámica . [28] A* en sí mismo es un caso especial de una generalización de rama y límite . [29]
A* es similar a la búsqueda de haz excepto que la búsqueda de haz mantiene un límite en la cantidad de caminos que debe explorar. [30]
A* también se puede adaptar a un algoritmo de búsqueda bidireccional , pero se debe tener especial cuidado con el criterio de detención. [34]
secuencia de "puntos de referencia" que Shakey pudiera usar para navegar de un lugar a otro. […] El problema de navegación de Shakey es un problema de búsqueda, similar a los que he mencionado antes.
Bertram Raphael, que dirigía el trabajo sobre Shakey en ese momento, observó que un mejor valor para la puntuación sería la suma de la distancia recorrida hasta el momento desde la posición inicial más mi estimación heurística de la distancia que debía recorrer el robot.