La adquisición evolutiva de topologías neuronales ( EANT / EANT2 ) es un método de aprendizaje de refuerzo evolutivo que evoluciona tanto la topología como los pesos de las redes neuronales artificiales . Está estrechamente relacionado con los trabajos de Angeline et al. [1] y Stanley y Miikkulainen. [2] Al igual que el trabajo de Angeline et al., el método utiliza un tipo de mutación paramétrica que proviene de las estrategias de evolución y la programación evolutiva (ahora utilizando la forma más avanzada de las estrategias de evolución CMA-ES en EANT2), en la que se utilizan tamaños de paso adaptativos para optimizar los pesos de las redes neuronales. Similar al trabajo de Stanley ( NEAT ), el método comienza con estructuras mínimas que ganan complejidad a lo largo del camino de la evolución.
A pesar de compartir estas dos propiedades, el método tiene las siguientes características importantes que lo distinguen de trabajos anteriores en neuroevolución .
Introduce una codificación genética denominada codificación genética común (CGE) que maneja tanto la codificación directa como la indirecta de redes neuronales dentro del mismo marco teórico. La codificación tiene propiedades importantes que la hacen adecuada para la evolución de las redes neuronales:
Estas propiedades han sido demostradas formalmente. [3]
Para desarrollar la estructura y los pesos de las redes neuronales, se utiliza un proceso evolutivo, en el que la exploración de las estructuras se ejecuta en una escala de tiempo mayor (exploración estructural) y la explotación de las estructuras existentes se realiza en una escala de tiempo menor (explotación estructural). En la fase de exploración estructural, se desarrollan nuevas estructuras neuronales añadiendo gradualmente nuevas estructuras a una red inicialmente mínima que se utiliza como punto de partida. En la fase de explotación estructural, los pesos de las estructuras actualmente disponibles se optimizan utilizando una estrategia de evolución .
Se ha probado EANT en algunos problemas de referencia, como el problema de equilibrio de doble polo [4] y el problema de control remoto de RoboCup [5] . En todas las pruebas, se ha comprobado que EANT funciona muy bien. Además, se ha probado una versión más nueva de EANT, llamada EANT2, en una tarea de servocontrol visual y se ha comprobado que supera a NEAT y al método iterativo tradicional de Gauss-Newton [6] . Otros experimentos incluyen resultados sobre un problema de clasificación [7]
{{cite web}}
: CS1 maint: copia archivada como título ( enlace )