D*

D* (se pronuncia "D estrella") es cualquiera de los siguientes tres algoritmos de búsqueda incremental relacionados :

El D* original, ^[1] de Anthony Stentz, es un algoritmo de búsqueda incremental informado.
Focused D* ^[2] es un algoritmo de búsqueda heurística incremental informado de Anthony Stentz que combina ideas de A* ^[3] y el D* original. Focused D* es el resultado de un desarrollo posterior del D* original.
D* Lite ^[4] es un algoritmo de búsqueda heurística incremental de Sven Koenig y Maxim Likhachev que se basa en LPA* , ^[5] un algoritmo de búsqueda heurística incremental que combina ideas de A* y Dynamic SWSF-FP. ^[6]

Los tres algoritmos de búsqueda resuelven los mismos problemas de planificación de rutas basados en suposiciones, incluida la planificación con la suposición de espacio libre ^[7] , donde un robot tiene que navegar hacia coordenadas de destino dadas en un terreno desconocido. Hace suposiciones sobre la parte desconocida del terreno (por ejemplo: que no contiene obstáculos) y encuentra una ruta más corta desde sus coordenadas actuales hasta las coordenadas de destino bajo estas suposiciones. El robot luego sigue la ruta. Cuando observa nueva información del mapa (como obstáculos previamente desconocidos), agrega la información a su mapa y, si es necesario, vuelve a planificar una nueva ruta más corta desde sus coordenadas actuales hasta las coordenadas de destino dadas. Repite el proceso hasta que alcanza las coordenadas de destino o determina que no se pueden alcanzar las coordenadas de destino. Al atravesar un terreno desconocido, es posible que se descubran nuevos obstáculos con frecuencia, por lo que esta replanificación debe ser rápida. Los algoritmos de búsqueda incremental (heurística) aceleran las búsquedas de secuencias de problemas de búsqueda similares al usar la experiencia con los problemas anteriores para acelerar la búsqueda del problema actual. Suponiendo que las coordenadas del objetivo no cambian, los tres algoritmos de búsqueda son más eficientes que las búsquedas A* repetidas.

El D* y sus variantes se han utilizado ampliamente para la navegación de robots móviles y vehículos autónomos . Los sistemas actuales se basan típicamente en el D* Lite en lugar del D* original o Focused D*. De hecho, incluso el laboratorio de Stentz utiliza el D* Lite en lugar del D* en algunas implementaciones. ^[8] Dichos sistemas de navegación incluyen un sistema prototipo probado en los exploradores marcianos Opportunity y Spirit y el sistema de navegación del ganador del DARPA Urban Challenge , ambos desarrollados en la Universidad Carnegie Mellon .

El D* original fue introducido por Anthony Stentz en 1994. El nombre D* proviene del término "A* dinámico", ^[9] porque el algoritmo se comporta como A* excepto que los costos del arco pueden cambiar a medida que se ejecuta el algoritmo.

Operación

A continuación se describe el funcionamiento básico de D*.

Al igual que el algoritmo de Dijkstra y A*, D* mantiene una lista de nodos para evaluar, conocida como la "lista ABIERTA". Los nodos se marcan según su estado:

NUEVO, lo que significa que nunca ha sido incluido en la lista ABIERTA
ABIERTO, lo que significa que actualmente está en la lista ABIERTA
CERRADO, lo que significa que ya no está en la lista ABIERTA
RAISE, indicando que su costo es mayor que la última vez que estuvo en la lista ABIERTA
MÁS BAJO, indicando que su costo es menor que la última vez que estuvo en la lista ABIERTA

Expansión

El algoritmo funciona seleccionando iterativamente un nodo de la lista ABIERTA y evaluándolo. Luego propaga los cambios del nodo a todos los nodos vecinos y los coloca en la lista ABIERTA. Este proceso de propagación se denomina "expansión". A diferencia del A* canónico, que sigue la ruta desde el principio hasta el final, D* comienza buscando hacia atrás desde el nodo objetivo. Esto significa que el algoritmo está calculando realmente la ruta óptima de A* para cada nodo de inicio posible. ^[10] Cada nodo expandido tiene un puntero hacia atrás que se refiere al siguiente nodo que conduce al objetivo, y cada nodo conoce el costo exacto para el objetivo. Cuando el nodo de inicio es el siguiente nodo que se va a expandir, el algoritmo está listo y la ruta hacia el objetivo se puede encontrar simplemente siguiendo los punteros hacia atrás.

Expansión en proceso. El nodo de finalización (amarillo) está en el medio de la fila superior de puntos, el nodo de inicio está en el medio de la fila inferior. El rojo indica un obstáculo; el negro/azul indica nodos expandidos (el brillo indica el costo). El verde indica nodos que se están expandiendo.
Expansión finalizada. El camino está indicado en cian.

Manejo de obstáculos

Cuando se detecta una obstrucción a lo largo de la ruta prevista, todos los puntos afectados se colocan de nuevo en la lista ABIERTA, esta vez marcada como ELEVADA. Sin embargo, antes de que un nodo ELEVADO aumente su coste, el algoritmo comprueba a sus vecinos y examina si puede reducir el coste del nodo. Si no, el estado ELEVADO se propaga a todos los descendientes de los nodos, es decir, los nodos que tienen punteros hacia atrás que lo apuntan. A continuación, se evalúan estos nodos y se transmite el estado ELEVADO, formando una onda. Cuando se puede reducir un nodo ELEVADO, se actualiza su puntero hacia atrás y se transmite el estado INFERIOR a sus vecinos. Estas ondas de estados ELEVADO y INFERIOR son el corazón de D*.

En este punto, toda una serie de otros puntos ya no pueden ser "tocados" por las ondas, por lo que el algoritmo sólo ha funcionado en los puntos que se ven afectados por el cambio de coste.

Se ha añadido un obstáculo (rojo) y los nodos están marcados como ELEVAR (amarillo).
Expansión en progreso. El color amarillo indica los nodos marcados como ELEVAR, el color verde indica los nodos marcados como BAJAR.

Se produce otro punto muerto

Esta vez, el punto muerto no se puede sortear de forma tan elegante. Ninguno de los puntos puede encontrar una nueva ruta a través de un vecino hasta el destino. Por lo tanto, continúan propagando su aumento de costes. Solo se pueden encontrar puntos fuera del canal que puedan llevar al destino a través de una ruta viable. Así es como se desarrollan dos ondas inferiores, que se expanden como puntos marcados como inalcanzables con nueva información de ruta.

Canal bloqueado por obstáculos adicionales (rojo)
Expansión en progreso (Onda ascendente en amarillo, Onda descendente en verde)
Nueva ruta encontrada (cian)

Pseudocódigo

mientras ( ! openList . isEmpty ()) { punto = openList . getFirst (); expandir ( punto ); }

Expandir

void expand ( currentPoint ) { boolean isRaise = isRaise ( currentPoint ) ; double cost ; for each ( vecino en currentPoint.getNeighbors ( ) ) { if ( isRaise ) { if ( vecino.nextPoint == currentPoint ) { vecino.setNextPointAndUpdateCost ( currentPoint ) ; openList.add ( vecino ) ; } else { cost = vecino.calculateCostVia ( currentPoint ) ; if ( costo < vecino.getCost ( ) ) { currentPoint.setMinimumCostToCurrentCost ( ) ; openList.add ( currentPoint ) ; } } } else { cost = vecino.calculateCostVia ( currentPoint ) ; if ( costo < vecino.getCost ( ) ) { vecino.setNextPointAndUpdateCost ( currentPoint ) ; openList.add ( vecino ) ; } } }

Comprobar si hay aumento

boolean isRaise ( punto ) { double costo ; si ( punto.getCurrentCost ( ) > punto.getMinimumCost ( ) ) { para cada ( vecino en punto.getNeighbors ( ) ) { costo = punto.calculateCostVia ( vecino ) ; si ( costo < punto.getCurrentCost ( ) ) { punto.setNextPointAndUpdateCost ( vecino ) ; } } } devuelve punto.getCurrentCost ( ) > punto.getMinimumCost ( ) ; }

Variantes

D* enfocado

Como su nombre lo sugiere, Focused D* es una extensión de D* que utiliza una heurística para enfocar la propagación de RAISE y LOWER hacia el robot. De esta manera, solo se actualizan los estados que importan, de la misma manera que A* solo calcula los costos para algunos de los nodos.

D*Lite

D* Lite no se basa en el D* original ni en Focused D*, pero implementa el mismo comportamiento. Es más sencillo de entender y se puede implementar en menos líneas de código, de ahí el nombre "D* Lite". En cuanto al rendimiento, es tan bueno como Focused D* o mejor. D* Lite se basa en Lifelong Planning A* , que fue introducido por Koenig y Likhachev unos años antes. D* Lite

Coste mínimo versus coste actual

Para D*, es importante distinguir entre los costos actuales y los mínimos. El primero solo es importante en el momento de la recopilación y el segundo es fundamental porque ordena la OpenList. La función que devuelve el costo mínimo es siempre el costo más bajo hasta el punto actual, ya que es la primera entrada de la OpenList.

Referencias

^ Stentz, Anthony (1994), "Planificación de rutas óptima y eficiente para entornos parcialmente conocidos", Actas de la Conferencia internacional sobre robótica y automatización : 3310–3317, CiteSeerX 10.1.1.15.3683
^ Stentz, Anthony (1995), "El algoritmo D* enfocado para la replanificación en tiempo real", Actas de la Conferencia conjunta internacional sobre inteligencia artificial : 1652-1659, CiteSeerX 10.1.1.41.8257
^ Hart, P.; Nilsson, N.; Raphael, B. (1968), "Una base formal para la determinación heurística de caminos de costo mínimo", IEEE Transactions on Systems Science and Cybernetics , SSC-4 (2): 100–107, doi :10.1109/TSSC.1968.300136
^ Koenig, S.; Likhachev, M. (2005), "Replanificación rápida para navegación en terreno desconocido", IEEE Transactions on Robotics , 21 (3): 354–363, CiteSeerX 10.1.1.65.5979 , doi :10.1109/tro.2004.838026, S2CID 15664344
^ Koenig, S.; Likhachev, M.; Furcy, D. (2004), "Planificación de por vida A*", Inteligencia artificial , 155 (1–2): 93–146, doi :10.1016/j.artint.2003.12.001
^ Ramalingam, G.; Reps, T. (1996), "Un algoritmo incremental para una generalización del problema del camino más corto", Journal of Algorithms , 21 (2): 267–305, CiteSeerX 10.1.1.3.7926 , doi :10.1006/jagm.1996.0046
^ Koenig, S.; Smirnov, Y.; Tovey, C. (2003), "Límites de rendimiento para la planificación en terreno desconocido", Inteligencia artificial , 147 (1–2): 253–279, doi : 10.1016/s0004-3702(03)00062-6
^ Wooden, D. (2006). Planificación de rutas basada en gráficos para robots móviles (tesis). Instituto Tecnológico de Georgia.
^ Stentz, Anthony (1995), "El algoritmo D* enfocado para la replanificación en tiempo real", Actas de la Conferencia conjunta internacional sobre inteligencia artificial : 1652-1659, CiteSeerX 10.1.1.41.8257
^ Murphy, Robin R. (2019). Introducción a la robótica con IA (2.ª ed.). Bradford Books. Párrafo 14.5.2. ISBN 978-0262038485.

Enlaces externos

Página web de Sven Koenig
Página web de Anthony Stentz