stringtranslate.com

Neuroevolución

La neuroevolución , o neuroevolución , es una forma de inteligencia artificial que utiliza algoritmos evolutivos para generar redes neuronales artificiales (RNA), parámetros y reglas. [1] Se aplica más comúnmente en la vida artificial , los juegos en general [2] y la robótica evolutiva . El principal beneficio es que la neuroevolución se puede aplicar más ampliamente que los algoritmos de aprendizaje supervisado , que requieren un programa de pares de entrada-salida correctos. Por el contrario, la neuroevolución solo requiere una medida del rendimiento de una red en una tarea. Por ejemplo, el resultado de un juego (es decir, si un jugador ganó o perdió) se puede medir fácilmente sin proporcionar ejemplos etiquetados de estrategias deseadas. La neuroevolución se usa comúnmente como parte del paradigma de aprendizaje de refuerzo y se puede contrastar con las técnicas convencionales de aprendizaje profundo que utilizan retropropagación ( descenso de gradiente en una red neuronal) con una topología fija.

Características

Se han definido muchos algoritmos de neuroevolución . Una distinción común es entre algoritmos que solo desarrollan la fuerza de los pesos de conexión para una topología de red fija (a veces llamados neuroevolución convencional) y algoritmos que desarrollan tanto la topología de la red como sus pesos (llamados TWEANN, por Topology and Weight Evolving Artificial Neural Network algorithms).

Se puede hacer una distinción separada entre los métodos que desarrollan la estructura de las ANN en paralelo a sus parámetros (aquellos que aplican algoritmos evolutivos estándar) y aquellos que los desarrollan por separado (a través de algoritmos meméticos ). [3]

Comparación con el descenso de gradiente

La mayoría de las redes neuronales utilizan el descenso de gradientes en lugar de la neuroevolución. Sin embargo, alrededor de 2017, los investigadores de Uber afirmaron que habían descubierto que los algoritmos de neuroevolución estructural simples eran competitivos con los sofisticados algoritmos de aprendizaje profundo de descenso de gradientes estándar de la industria moderna , en parte porque se descubrió que la neuroevolución tenía menos probabilidades de quedarse estancada en mínimos locales. En Science , el periodista Matthew Hutson especuló que parte de la razón por la que la neuroevolución está teniendo éxito donde antes había fracasado se debe al aumento de la potencia computacional disponible en la década de 2010. [4]

Se puede demostrar que existe una correspondencia entre la neuroevolución y el descenso del gradiente. [5]

Codificación directa e indirecta

Los algoritmos evolutivos operan sobre una población de genotipos (también denominados genomas ). En la neuroevolución, un genotipo se asigna a un fenotipo de una red neuronal que se evalúa en alguna tarea para derivar su aptitud .

En los esquemas de codificación directa , el genotipo se corresponde directamente con el fenotipo, es decir, cada neurona y conexión de la red neuronal se especifica directa y explícitamente en el genotipo. Por el contrario, en los esquemas de codificación indirecta , el genotipo especifica indirectamente cómo debe generarse esa red. [6]

Las codificaciones indirectas se utilizan a menudo para lograr varios objetivos: [6] [7] [8] [9] [10]

Taxonomía de sistemas embriogénicos para codificación indirecta

Tradicionalmente, las codificaciones indirectas que emplean la embriogenia artificial (también conocida como desarrollo artificial ) se han categorizado según el enfoque gramatical frente al enfoque de la química celular . [11] El primero desarrolla conjuntos de reglas en forma de sistemas de reescritura gramatical. El segundo intenta imitar cómo surgen las estructuras físicas en biología a través de la expresión genética. Los sistemas de codificación indirecta a menudo utilizan aspectos de ambos enfoques.

Stanley y Miikkulainen [11] proponen una taxonomía para los sistemas embriogénicos que pretende reflejar sus propiedades subyacentes. La taxonomía identifica cinco dimensiones continuas, a lo largo de las cuales se puede ubicar cualquier sistema embriogénico:

Ejemplos

Ejemplos de métodos de neuroevolución (aquellos con codificaciones directas son necesariamente no embriogénicos):

Véase también

Referencias

  1. ^ Stanley, Kenneth O. (13 de julio de 2017). «Neuroevolución: un tipo diferente de aprendizaje profundo». O'Reilly Media . Consultado el 4 de septiembre de 2017 .
  2. ^ Risi, Sebastian; Togelius, Julian (2017). "Neuroevolución en juegos: estado del arte y desafíos abiertos". IEEE Transactions on Computational Intelligence and AI in Games . 9 : 25–41. arXiv : 1410.7326 . doi :10.1109/TCIAIG.2015.2494596. S2CID  11245845.
  3. ^ Togelius, Julian; Schaul, Tom; Schmidhuber, Jürgen; Gomez, Faustino (2008). "Contrarrestar entradas venenosas con neuroevolución memética". Resolución de problemas paralelos a partir de la naturaleza – PPSN X . Apuntes de clase en informática. Vol. 5199. págs. 610–619. doi :10.1007/978-3-540-87700-4_61. ISBN 978-3-540-87699-1.
  4. ^ Hutson, Matthew (11 de enero de 2018). «La inteligencia artificial puede 'evolucionar' para resolver problemas». Science . doi :10.1126/science.aas9715.
  5. ^ Whitelam, Stephen; Selin, Viktor; Park, Sang-Won; Tamblyn, Isaac (2 de noviembre de 2021). "Correspondencia entre la neuroevolución y el descenso del gradiente". Nature Communications . 12 (1): 6317. arXiv : 2008.06643 . Bibcode :2021NatCo..12.6317W. doi :10.1038/s41467-021-26568-2. PMC 8563972 . PMID  34728632. 
  6. ^ abc Kassahun, Yohannes; Sommer, Gerald; Edgington, Mark; Metzen, Jan Hendrik; Kirchner, Frank (2007), "Codificación genética común para codificaciones directas e indirectas de redes", Conferencia sobre computación genética y evolutiva , ACM Press, págs. 1029–1036, CiteSeerX 10.1.1.159.705 
  7. ^ ab Gauci, Stanley (2007), "Generación de redes neuronales a gran escala mediante el descubrimiento de regularidades geométricas" (PDF) , Conferencia sobre computación genética y evolutiva , Nueva York, NY: ACM
  8. ^ ab Gruau, Frédéric; Yo, L'universite Claude Bernard-lyon; Doctorat, Of A. Diplome De; Demongeot, M. Jacques; Cosnard, Examinadores M. Michel; Mazoyer, M. Jacques; Peretto, M. Pierre; Whitley, M. Darell (1994). Síntesis de redes neuronales utilizando codificación celular y el algoritmo genético . CiteSeerX 10.1.1.29.5939 . 
  9. ^ Clune, J.; Stanley, Kenneth O.; Pennock, RT; Ofria, C. (junio de 2011). "Sobre el rendimiento de la codificación indirecta en el continuo de regularidad". IEEE Transactions on Evolutionary Computation . 15 (3): 346–367. CiteSeerX 10.1.1.375.6731 . doi :10.1109/TEVC.2010.2104157. ISSN  1089-778X. S2CID  3008628. 
  10. ^ ab Risi, Sebastian; Stanley, Kenneth O. (octubre de 2012). "Una codificación basada en hipercubos mejorada para desarrollar la ubicación, la densidad y la conectividad de las neuronas". Vida artificial . 18 (4): 331–363. doi : 10.1162/ARTL_a_00071 . PMID  22938563. S2CID  3256786.
  11. ^ ab Stanley, Kenneth O.; Miikkulainen, Risto (abril de 2003). "Una taxonomía para la embriogenia artificial". Vida artificial . 9 (2): 93–130. doi :10.1162/106454603322221487. PMID  12906725. S2CID  2124332.
  12. ^ Ronald, Edmund; Schoenauer, March (1994), "Genetic Lander: Un experimento en control neurogenético preciso", PPSN III 1994 Parallel Programming Solving from Nature , pp. 452–461, CiteSeerX 10.1.1.56.3139 
  13. ^ Angeline, PJ; Saunders, GM; Pollack, JB (enero de 1994). "Un algoritmo evolutivo que construye redes neuronales recurrentes". IEEE Transactions on Neural Networks . 5 (1): 54–65. CiteSeerX 10.1.1.64.1853 . doi :10.1109/72.265960. PMID  18267779. S2CID  44767. 
  14. ^ Yao, X.; Liu, Y. (mayo de 1997). "Un nuevo sistema evolutivo para la evolución de redes neuronales artificiales". IEEE Transactions on Neural Networks . 8 (3): 694–713. doi :10.1109/72.572107. PMID  18255671.
  15. ^ Stanley, Kenneth O.; Bryant, Bobby D.; Miikkulainen, Risto (diciembre de 2005). "Neuroevolución en tiempo real en el videojuego NERO" (PDF) .
  16. ^ Stanley, Kenneth O.; Miikkulainen, Risto (junio de 2002). "Evolución de redes neuronales mediante el aumento de topologías". Computación evolutiva . 10 (2): 99–127. CiteSeerX 10.1.1.638.3910 . doi :10.1162/106365602320169811. PMID  12180173. S2CID  498161. 
  17. ^ Kassahun, Yohannes; Sommer, Gerald (abril de 2005), "Aprendizaje de refuerzo eficiente mediante la adquisición evolutiva de topologías neuronales" (PDF) , 13.º Simposio Europeo sobre Redes Neuronales Artificiales , Brujas, Bélgica, págs. 259-266{{citation}}: Mantenimiento de CS1: falta la ubicación del editor ( enlace )
  18. ^ Siebel, Nils T.; Sommer, Gerald (17 de octubre de 2007). "Aprendizaje de refuerzo evolutivo de redes neuronales artificiales". Revista internacional de sistemas inteligentes híbridos . 4 (3): 171–183. doi :10.3233/his-2007-4304.
  19. ^ Rempis, Christian Wilhelm (2012). Neurocontroladores complejos en evolución con neuroevolución interactivamente restringida (tesis).
  20. ^ Sher, Gene I. (2013). Manual de neuroevolución a través de Erlang . doi :10.1007/978-1-4614-4463-3. ISBN 978-1-4614-4462-6. Número de identificación del sujeto  21777855.
  21. ^ Vargas, Danilo Vasconcellos; Murata, Junichi (2019). "Neuroevolución de espectro diverso con modelos neuronales unificados". IEEE Transactions on Neural Networks and Learning Systems . 28 (8): 1759–1773. arXiv : 1902.06703 . Bibcode :2019arXiv190206703V. doi :10.1109/TNNLS.2016.2551748. PMID  28113564. S2CID  206757620.
  22. ^ Edlund, Jeffrey; Chaumont, Nicolas; Hintze, Arend; Koch, Christof; Tononi, Giulio; Adami, Christoph (2011). "Información integrada aumenta con la aptitud en la evolución de los animats". PLOS Computational Biology . 7 (10): e1002236. arXiv : 1103.1791 . Bibcode :2011PLSCB...7E2236E. doi : 10.1371/journal.pcbi.1002236 . PMC 3197648 . PMID  22028639. 
  23. ^ Rostami, Shahin; Neri, Ferrante (junio de 2017). "Un mecanismo de selección rápido impulsado por hipervolumen para problemas de optimización de múltiples objetivos". Swarm and Evolutionary Computation . 34 : 50–67. doi :10.1016/j.swevo.2016.12.002. hdl : 2086/13102 .
  24. ^ Shenfield, Alex; Rostami, Shahin (2017). "Evolución multiobjetivo de redes neuronales artificiales en problemas de diagnóstico médico multiclase con desequilibrio de clases" (PDF) . Conferencia IEEE de 2017 sobre inteligencia computacional en bioinformática y biología computacional (CIBCB) . pp. 1–8. doi :10.1109/CIBCB.2017.8058553. ISBN . 978-1-4673-8988-4.S2CID22674515  .​
  25. ^ Di Biasi, Luigi; De Marco, Fabiola; Auriemma Citarella, Alessia; Barra, Paola; Piotto Piotto, Stefano; Tortora, Genoveffa (2023). "Enfoque híbrido para el diseño de CNNS utilizando algoritmos genéticos para la clasificación del melanoma". En Rousseau, Jean-Jacques; Kapralos, Bill (eds.). Reconocimiento de patrones, visión artificial y procesamiento de imágenes. Talleres y desafíos internacionales ICPR 2022. Apuntes de conferencias en informática. Vol. 13643. Cham: Springer Nature Switzerland. págs. 514–528. doi :10.1007/978-3-031-37660-3_36. ISBN 978-3-031-37660-3.
  26. ^ Assunção, Filipe; Lourenço, Nuño; Ribeiro, Bernardete; Machado, Penousal (junio 2021). "Fast-DENSER: representación estructurada de red evolutiva profunda y rápida". SoftwareX . 14 : 100694. Código Bib : 2021SoftX..1400694A. doi : 10.1016/j.softx.2021.100694. hdl : 10316/100856 .
  27. ^ Vinhas, Adriano; Correia, João; Machado, Penousal (20 de junio de 2024), Hacia la evolución de las redes neuronales profundas mediante el aprendizaje autosupervisado contrastivo, arXiv : 2406.14525 , consultado el 21 de junio de 2024
  28. ^ Cortés, Gabriel; Lourenço, Nuño; Machado, Penousal (2024), Smith, Stephen; Correia, João; Cintrano, Christian (eds.), "Hacia la plausibilidad física en los sistemas de neuroevolución", Aplicaciones de la computación evolutiva , vol. 14635, Cham: Springer Nature Suiza, págs. 76–90, doi :10.1007/978-3-031-56855-8_5, ISBN 978-3-031-56854-1, consultado el 21 de junio de 2024
  29. ^ Lourenço, Nuno; Assunção, Filipe; Pereira, Francisco B.; Costa, Ernesto; Machado, Penousal (2018), Ryan, Conor; O'Neill, Michael; Collins, JJ (eds.), "Evolución gramatical estructurada: un enfoque dinámico", Manual de evolución gramatical , Cham: Springer International Publishing, págs. 137-161, doi :10.1007/978-3-319-78717-6_6, ISBN 978-3-319-78717-6, consultado el 21 de junio de 2024

Enlaces externos