En el aprendizaje automático , los sistemas que emplean aprendizaje fuera de línea no cambian su aproximación de la función objetivo cuando se ha completado la fase de entrenamiento inicial. [1]
Mientras que en el aprendizaje en línea solo se conoce el conjunto de elementos posibles, en el aprendizaje fuera de línea el alumno conoce la identidad de los elementos así como el orden en que se presentan. [2]
La capacidad de los robots para aprender es igual a la de crear una tabla (información) que se llena con valores. Una opción para hacerlo es la programación por demostración . En este caso, la tabla se llena con valores por un profesor humano. La demostración se proporciona como una política de control numérico directo que es igual a una trayectoria, o como una función objetivo indirecta que se proporciona de antemano. [3]
El aprendizaje fuera de línea funciona en modo por lotes . En el paso 1, se demuestra la tarea y se almacena en la tabla, y en el paso 2, el robot la reproduce. [4] El proceso es lento e ineficiente porque hay una demora entre la demostración del comportamiento y la repetición de la habilidad. [5] [6]
Un breve ejemplo ayudará a entender la idea. Supongamos que el robot debe aprender una tarea de seguimiento de la pared y la tabla interna del robot está vacía. Antes de que el robot se active en el modo de repetición, el demostrador humano tiene que enseñar el comportamiento. Está controlando el robot con teleoperación y durante el paso de aprendizaje se genera la tabla de habilidades. El proceso se llama fuera de línea, porque el software de control del robot no hace nada, pero el operador humano utiliza el dispositivo como un dispositivo de señalización para conducir a lo largo de la pared. [6]
{{cite journal}}
: CS1 maint: varios nombres: lista de autores ( enlace ){{cite conference}}
: CS1 maint: varios nombres: lista de autores ( enlace ){{cite conference}}
: CS1 maint: varios nombres: lista de autores ( enlace )