Aprendizaje por imitación (inteligencia artificial)

En la inteligencia artificial, el aprendizaje a partir de la demostración o aprendizaje por imitación (en inglés: apprenticeship learning) es el proceso de aprender observando a un experto.

[1]​ Por ejemplo, en 2002 los investigadores utilizaron este enfoque para enseñarle las habilidades básicas de fútbol a un robot AIBO.

[5]​ El escenario puede modelarse como un "juego cooperativo de aprendizaje por refuerzo inverso", en el que un jugador "persona" y un jugador "robot" cooperan para asegurar los objetivos implícitos de la persona, a pesar de que estos objetivos no sean conocidos explícitamente ni por la persona ni por el robot.

Los investigadores encontraron pruebas de que las técnicas pueden ser económicamente escalables a sistemas modernos.

Esta tarea puede parecer fácil a primera vista, pero una función de recompensa trivial puede no converger con la política deseada.

Mientras que las trayectorias simples se pueden derivar intuitivamente, las tareas complicadas como las acrobacias aéreas para espectáculos han tenido éxito.

Entre ellas se incluyen maniobras acrobáticas como volteretas, giros, bucles, huracanes e incluso aterrizajes con autorrotación.

Este trabajo fue desarrollado por Pieter Abbeel, Adam Coates y Andrew Ng - "Autonomous Helicopter Aerobatics through Apprenticeship Learning".

[2]​ El sistema aprende reglas para asociar condiciones previas y posteriores a cada acción.