En robótica , el problema de exploración se ocupa del uso de un robot para maximizar el conocimiento sobre un área en particular. El problema de exploración surge en situaciones de mapeo robótico y de búsqueda y rescate , donde un entorno puede ser peligroso o inaccesible para los humanos. [1]
El problema de la exploración surge naturalmente en situaciones en las que se utiliza un robot para inspeccionar un área que es peligrosa o inaccesible para los humanos. El campo de las exploraciones robóticas se nutre de diversos campos de recopilación de información y teoría de la toma de decisiones , y se ha estudiado desde la década de 1950.
Los primeros trabajos en exploración robótica se realizaron en el contexto de autómatas de estados finitos simples conocidos como bandidos, donde se diseñaron algoritmos para distinguir y mapear diferentes estados en un autómata de estados finitos . Desde entonces, el énfasis principal se ha desplazado al dominio del desarrollo de sistemas robóticos, donde se han utilizado robots guiados por algoritmos de exploración para inspeccionar volcanes, [2] búsqueda y rescate y mapeo de minas abandonadas. [3] El estado actual del sistema de última generación incluye técnicas avanzadas de localización activa, exploración basada en localización y mapeo simultáneos (SLAM) y exploración cooperativa de múltiples agentes.
El concepto clave en el problema de exploración es la noción de ganancia de información, es decir, la cantidad de conocimiento adquirido al ampliar las fronteras. Una medida probabilística de la ganancia de información se define por la entropía
La función se maximiza si p es una distribución uniforme y se minimiza cuando p es una distribución de masa puntual. Al minimizar la entropía esperada de la creencia, la ganancia de información se maximiza como