Programa DARPA LAGR

El programa Aprendizaje Aplicado a Vehículos Terrestres (LAGR) , que se desarrolló entre 2004 y 2008, tenía como objetivo acelerar el progreso en la navegación todoterreno autónoma, basada en la percepción, en vehículos terrestres no tripulados (UGV) robóticos. LAGR fue financiado por DARPA , una agencia de investigación del Departamento de Defensa de los Estados Unidos .

Historia y antecedentes

Si bien los robots móviles existían desde la década de 1960 ( por ejemplo, Shakey ), el progreso en la creación de robots que pudieran navegar por sí solos, al aire libre, fuera de la carretera, en terrenos irregulares y llenos de obstáculos había sido lento. De hecho, no existían métricas claras para medir el progreso. ^[1] Una comprensión básica de las capacidades todoterreno comenzó a surgir con el programa DARPA PerceptOR ^[2] en el que equipos de investigación independientes utilizaron vehículos robóticos en pruebas gubernamentales no ensayadas que midieron la velocidad promedio y el número de intervenciones requeridas del operador en un recorrido fijo en una amplia zona. puntos de referencia espaciados . Estas pruebas expusieron los desafíos extremos de la navegación todoterreno. Si bien los vehículos PerceptOR estaban equipados con sensores y algoritmos de última generación para principios del siglo XXI, el alcance limitado de su tecnología de percepción hizo que quedaran atrapados en callejones sin salida naturales . Además, su dependencia de comportamientos preestablecidos no les permitió adaptarse a circunstancias inesperadas. El resultado general fue que, excepto en terrenos esencialmente abiertos con obstáculos mínimos, o a lo largo de caminos de tierra, los vehículos PerceptOR no podían navegar sin la intervención repetida y numerosa del operador.

El programa LAGR fue diseñado para aprovechar la metodología iniciada en PerceptOR mientras buscaba superar los desafíos técnicos expuestos por las pruebas de PerceptOR.

Objetivos del LAGR

El objetivo principal de LAGR era acelerar el progreso en la navegación fuera de los UGV. Los objetivos sinérgicos adicionales incluyeron (1) establecer una metodología de evaluación comparativa para medir el progreso de los robots autónomos que operan en entornos no estructurados, (2) avanzar en la visión artificial y así permitir la percepción de largo alcance, y (3) aumentar el número de instituciones e individuos que pudieron contribuir a la investigación de vanguardia en UGV.

Estructura y justificación del programa LAGR

El programa LAGR fue diseñado ^[3] para centrarse en el desarrollo de nueva ciencia para la percepción y el control de robots en lugar de centrarse en nuevo hardware . Por lo tanto, se decidió crear una flota de robots idénticos y relativamente simples que se suministrarían a los investigadores del LAGR, que eran miembros de equipos competitivos, liberándolos para concentrarse en el desarrollo de algoritmos. Cada equipo recibió dos robots de diseño estándar. Desarrollaron un nuevo software en estos robots y luego enviaron el código a un equipo de prueba del gobierno que luego probó ese código en robots del gobierno en varios cursos de prueba. Estos cursos estaban ubicados en todo Estados Unidos y los equipos no los conocían previamente. De esta manera, el código de todos los equipos podría probarse en circunstancias esencialmente idénticas. Después de un período de inicio inicial, el ciclo de desarrollo/prueba del código se repitió aproximadamente una vez al mes.

El robot estándar fue diseñado y construido por el Centro Nacional de Ingeniería Robótica de la Universidad Carnegie Mellon (CMU NREC). Las computadoras de los vehículos estaban precargadas con un sistema modular de percepción y navegación "Baseline" que era esencialmente el mismo sistema que CMU NREC había creado para el programa PerceptOR y se consideraba que representaba lo último en tecnología al inicio de LAGR. La naturaleza modular del sistema Baseline permitió a los investigadores reemplazar partes del código Baseline con sus propios módulos y aún tener un sistema funcional completo sin tener que crear un sistema de navegación completo desde cero. Así, por ejemplo, pudieron comparar el rendimiento de su propio módulo de detección de obstáculos con el del código Baseline, manteniendo todo lo demás fijo. El código Baseline también sirvió como referencia fija: en cualquier entorno y en cualquier momento del programa, el código de los equipos se podía comparar con el código Baseline. Este ciclo rápido brindó al equipo gubernamental y a los equipos de ejecución una retroalimentación rápida y permitió al equipo gubernamental diseñar cursos de prueba que desafiaron a los ejecutores en tareas de percepción específicas y cuya dificultad probablemente desafió, pero no abrumó, las capacidades actuales de los ejecutores. Los equipos no estaban obligados a enviar código nuevo para cada prueba, pero normalmente lo hacían. A pesar de este margen de maniobra, algunos equipos encontraron que el ciclo de prueba rápido distraía su progreso a largo plazo y hubieran preferido un intervalo más largo entre las pruebas.

Fase II

Para avanzar a la Fase II, cada equipo tuvo que modificar el código Baseline de modo que en las 3 pruebas finales de la Fase I de las pruebas gubernamentales, los robots que ejecutaban el código del equipo fueran en promedio al menos un 10% más rápidos que un vehículo que ejecutaba el código Baseline original. Se eligió esta métrica bastante modesta de “Adelante/No Avanzando” para permitir a los equipos elegir enfoques arriesgados, pero prometedores, que podrían no desarrollarse completamente en los primeros 18 meses del programa. Los 8 equipos lograron esta métrica, y algunos anotaron más del doble de la velocidad de la línea de base en las pruebas posteriores, que era el objetivo de la Fase II. Tenga en cuenta que la métrica de la Fase I Ir/No Ir era tal que los equipos no estaban completos entre sí para un número limitado de espacios en la Fase II: cualquier número de equipos, de ocho a cero, podía lograr la calificación. Esta estrategia de DARPA fue diseñada para fomentar la cooperación e incluso el intercambio de códigos entre los equipos.

Los equipos del LAGR

Se seleccionaron ocho equipos como participantes en la Fase I, los primeros 18 meses de LAGR. Los equipos eran de Applied Perception (investigador principal [PI] Mark Ollis), Georgia Tech (PI Tucker Balch), Jet Propulsion Laboratory (PI Larry Matthies), Net-Scale Technologies (PI Urs Muller), NIST (PI James Albus ), Universidad de Stanford (PI Sebastian Thrun ), SRI International (PI Robert Bolles) y Universidad de Pensilvania (PI Daniel Lee).

El equipo de Stanford dimitió al finalizar la Fase I para centrar sus esfuerzos en el DARPA Grand Challenge ; fue reemplazado por un equipo de la Universidad de Colorado , Boulder (PI Greg Grudic). También en la Fase II, el equipo del NIST suspendió su participación en la competencia y en su lugar se concentró en ensamblar los mejores elementos de software de cada equipo en un solo sistema. Roger Bostelman se convirtió en investigador principal de ese esfuerzo.

El vehículo LAGR

El vehículo LAGR, que tenía aproximadamente el tamaño de un carrito de compras de supermercado, fue diseñado para ser fácil de controlar. (Un programa complementario de DARPA, Learning Locomotion, ^[4] abordó el control motor complejo). Funcionaba con baterías y tenía dos motores de silla de ruedas accionados independientemente en la parte delantera y dos ruedas giratorias en la parte trasera. Cuando las ruedas delanteras giraban en la misma dirección, el robot avanzaba o retrocedía. Cuando estas ruedas eran movidas en direcciones opuestas, el robot giraba.

El coste de ~ 30.000 dólares del vehículo LAGR significó que se podía construir una flota y distribuirla a varios equipos que se expandían en el campo de investigadores que tradicionalmente habían participado en programas de robótica DARPA. La velocidad máxima del vehículo de aproximadamente 3 millas por hora y su peso relativamente modesto de ~100 kg significaron que representaba un riesgo de seguridad mucho menor en comparación con los vehículos utilizados en programas anteriores en vehículos terrestres no tripulados y, por lo tanto, redujo aún más el presupuesto requerido para que cada equipo lo administrara. su robot.

Sin embargo, los vehículos LAGR eran máquinas sofisticadas. Su conjunto de sensores incluía 2 pares de cámaras estéreo , un acelerómetro , un sensor de parachoques, codificadores de ruedas y un GPS . El vehículo también tenía tres computadoras programables por el usuario.

Resultados científicos

Una piedra angular del programa fue la incorporación de comportamientos aprendidos en los robots. Además, el programa utilizó sistemas ópticos pasivos para realizar análisis de escenas de largo alcance.

La dificultad de probar la navegación del UGV en entornos todoterreno no estructurados hizo que la medición precisa y objetiva del progreso fuera una tarea desafiante. Si bien no se había definido una medida absoluta de desempeño en LAGR, la comparación relativa del código de un equipo con el código de referencia en un curso determinado demostró si se estaban logrando avances en ese entorno. Al finalizar el programa, las pruebas mostraron que muchos de los artistas habían logrado avances en su desempeño. En particular, las velocidades medias autónomas se multiplicaron por 3 y la percepción visual útil se amplió a distancias de hasta 100 metros. ^[5]

Si bien LAGR logró ampliar el rango útil de percepción visual, esto se logró principalmente mediante análisis de textura o color basado en píxeles o parches. El reconocimiento de objetos no se abordó directamente.

Aunque el vehículo LAGR tenía un GPS WAAS , su posición nunca se determinó hasta el ancho del vehículo, por lo que fue difícil para los sistemas reutilizar mapas de obstáculos de áreas que los robots habían atravesado previamente, ya que el GPS se desviaba continuamente. La deriva era especialmente grave si había una cubierta forestal. Algunos equipos desarrollaron algoritmos de odometría visual que esencialmente eliminaron esta desviación.

LAGR también tenía el objetivo de ampliar el número de artistas y eliminar la necesidad de una gran integración de sistemas para que la comunidad en general pudiera reconocer y luego adoptar valiosas piezas de tecnología creadas por equipos pequeños.

Algunos equipos desarrollaron métodos rápidos para aprender con un maestro humano: un humano podría operar el robot por Radio Control (RC) y dar señales especificando áreas “seguras” y “no seguras” y el robot podría adaptarse y navegar rápidamente con la misma política. Esto se demostró cuando se le enseñó al robot a ser agresivo al conducir sobre malezas muertas mientras evitaba los arbustos o, alternativamente, se le enseñó a ser tímido y conducir solo por caminos cortados.

LAGR se gestionó en conjunto con el vehículo de combate terrestre no tripulado DARPA - Programa de integración PerceptOR (UPI) CMU NREC UPI sitio web. UPI combinó percepción avanzada con un vehículo de extrema movilidad. Los mejores algoritmos estéreo y la odometría visual de LAGR se transfirieron a UPI. Además, las interacciones entre los PI de LAGR y el equipo de UPI dieron como resultado la incorporación de tecnología adaptativa al código base de UPI con una mejora resultante en el rendimiento de los robots "Crusher" de UPI .

Gestión de programas

LAGR fue administrado por la Oficina de Tecnología de Procesamiento de Información de DARPA. Larry Jackel concibió el programa y fue su director de 2004 a 2007. Eric Krotkov, Michael Perschbacher y James Pippine contribuyeron a la concepción y gestión del LAGR. Charles Sullivan jugó un papel importante en las pruebas LAGR. Tom Wagner fue el director del programa desde mediados de 2007 hasta su conclusión a principios de 2008.

Referencias

^ Véase especialmente el apéndice C, Consejo Nacional de Investigación de las Academias Nacionales, “Desarrollo tecnológico para vehículos terrestres no tripulados del ejército”, National Academies Press, Washington, DC, 2002.
^ E. Krotkov, S. Fish, L. Jackel, M. Perschbacher y J. Pippine, "Los experimentos de evaluación de DARPA PerceptOR". Robots autónomos, 22 (1): páginas 19-35, 2007.
^ LD Jackel, Douglass Hackett, Eric Krotkov, Michael Perschbacher, James Pippine y Charles Sullivan. “Cómo DARPA estructura sus programas de robótica para mejorar la locomoción y la navegación”. Comunicaciones de la ACM, 50(11): páginas 55-59, 2007.
^ James Pippine, Douglas Hackett, Adam Watson, "Una descripción general del programa de locomoción de aprendizaje de la Agencia de Proyectos de Investigación Avanzada de Defensa", Revista Internacional de Investigación Robótica, Vol 30, Núm. 2, páginas 141-144, 2011
^ Para una discusión detallada de los resultados de LAGR, consulte los números especiales de Journal of Field Robotics, Vol. 23, números 11/12 de 2006 y Vol. 26, número 1/2 de 2009.