Aprendizaje fuera de línea

En el aprendizaje automático , los sistemas que emplean aprendizaje fuera de línea no cambian su aproximación de la función objetivo cuando se ha completado la fase de entrenamiento inicial. ^[1]

Mientras que en el aprendizaje en línea solo se conoce el conjunto de elementos posibles, en el aprendizaje fuera de línea el alumno conoce la identidad de los elementos así como el orden en que se presentan. ^[2]

Aplicaciones para el control de la robótica

La capacidad de los robots para aprender es igual a la de crear una tabla (información) que se llena con valores. Una opción para hacerlo es la programación por demostración . En este caso, la tabla se llena con valores por un profesor humano. La demostración se proporciona como una política de control numérico directo que es igual a una trayectoria, o como una función objetivo indirecta que se proporciona de antemano. ^[3]

El aprendizaje fuera de línea funciona en modo por lotes . En el paso 1, se demuestra la tarea y se almacena en la tabla, y en el paso 2, el robot la reproduce. ^[4] El proceso es lento e ineficiente porque hay una demora entre la demostración del comportamiento y la repetición de la habilidad. ^[5]^[6]

Un breve ejemplo ayudará a entender la idea. Supongamos que el robot debe aprender una tarea de seguimiento de la pared y la tabla interna del robot está vacía. Antes de que el robot se active en el modo de repetición, el demostrador humano tiene que enseñar el comportamiento. Está controlando el robot con teleoperación y durante el paso de aprendizaje se genera la tabla de habilidades. El proceso se llama fuera de línea, porque el software de control del robot no hace nada, pero el operador humano utiliza el dispositivo como un dispositivo de señalización para conducir a lo largo de la pared. ^[6]

Véase también

Aprendizaje en línea , el modelo opuesto
Aprendizaje incremental , un modelo de aprendizaje para la extensión incremental del conocimiento

Referencias

^ Bishop, Christopher M. (17 de agosto de 2006). Reconocimiento de patrones y aprendizaje automático . Nueva York: Springer. ISBN 978-0-387-31073-2.
^ Ben-David, Shai; Kushilevitz, Eyal; Mansour, Yishay (1 de octubre de 1997). "Aprendizaje en línea versus aprendizaje fuera de línea". Aprendizaje automático . 29 (1): 45–63. doi : 10.1023/A:1007465907571 . ISSN 0885-6125.
^ Bajcsy, Andrea y Losey, Dylan P y O'Malley, Marcia K y Dragan, Anca D (2017). "Objetivos de aprendizaje de robots a partir de la interacción física humana". Actas de investigación sobre aprendizaje automático . 78 . PMLR: 217–226.{{cite journal}}: CS1 maint: varios nombres: lista de autores ( enlace )
^ Meyer-Delius, Daniel y Beinhofer, Maximilian y Burgard, Wolfram (2012). Modelos de cuadrícula de ocupación para el mapeo de robots en entornos cambiantes . Vigésima sexta conferencia AAAI sobre inteligencia artificial.{{cite conference}}: CS1 maint: varios nombres: lista de autores ( enlace )
^ Luka Peternel y Erhan Oztop y Jan Babic (2016). Un método de control compartido para el aprendizaje de robots en línea con intervención humana basado en regresión ponderada localmente . Conferencia internacional IEEE/RSJ de 2016 sobre robots y sistemas inteligentes (IROS). IEEE. doi :10.1109/iros.2016.7759574.
^ ab Jun, Li y Duckett, Tom (2003). Aprendizaje del comportamiento de los robots con una red RBF dinámicamente adaptativa: experimentos en aprendizaje en línea y fuera de línea . Proc. 2 Intern. Conf. sobre inteligencia computacional, robótica y sistemas autónomos, CIRAS. Citador.{{cite conference}}: CS1 maint: varios nombres: lista de autores ( enlace )