stringtranslate.com

Neuroevolución

La neuroevolución , o neuroevolución , es una forma de inteligencia artificial que utiliza algoritmos evolutivos para generar redes neuronales artificiales (RNA), parámetros y reglas. [1] Se aplica más comúnmente en la vida artificial , los juegos en general [2] y la robótica evolutiva . El principal beneficio es que la neuroevolución se puede aplicar más ampliamente que los algoritmos de aprendizaje supervisado , que requieren un programa de estudios de pares entrada-salida correctos. Por el contrario, la neuroevolución requiere sólo una medida del desempeño de una red en una tarea. Por ejemplo, el resultado de un juego (es decir, si un jugador ganó o perdió) puede medirse fácilmente sin proporcionar ejemplos etiquetados de las estrategias deseadas. La neuroevolución se utiliza comúnmente como parte del paradigma del aprendizaje por refuerzo y se puede contrastar con las técnicas convencionales de aprendizaje profundo que utilizan retropropagación ( descenso de gradiente en una red neuronal) con una topología fija.

Características

Se han definido muchos algoritmos de neuroevolución. Una distinción común es entre algoritmos que evolucionan sólo la fuerza de los pesos de conexión para una topología de red fija (a veces llamado neuroevolución convencional) y algoritmos que evolucionan tanto la topología de la red como sus pesos (llamados TWEANN, por Topología y Peso que Evolucionan Artificialmente). Algoritmos de redes neuronales).

Se puede hacer una distinción separada entre los métodos que evolucionan la estructura de las RNA en paralelo a sus parámetros (los que aplican algoritmos evolutivos estándar) y los que los desarrollan por separado (a través de algoritmos meméticos ). [3]

Comparación con el descenso de gradiente

La mayoría de las redes neuronales utilizan el descenso de gradientes en lugar de la neuroevolución. Sin embargo, alrededor de 2017, los investigadores de Uber declararon que habían descubierto que los algoritmos de neuroevolución estructural simples eran competitivos con los sofisticados algoritmos modernos de aprendizaje profundo de descenso de gradientes estándar de la industria , en parte porque se descubrió que era menos probable que la neuroevolución se quedara estancada en los mínimos locales. En Science , el periodista Matthew Hutson especuló que parte de la razón por la que la neuroevolución está teniendo éxito donde antes había fracasado se debe al mayor poder computacional disponible en la década de 2010. [4]

Se puede demostrar que existe una correspondencia entre la neuroevolución y el descenso de gradiente. [5]

Codificación directa e indirecta.

Los algoritmos evolutivos operan sobre una población de genotipos (también denominados genomas ). En la neuroevolución, un genotipo se asigna a un fenotipo de red neuronal que se evalúa en alguna tarea para derivar su aptitud .

En los esquemas de codificación directa , el genotipo se asigna directamente al fenotipo. Es decir, cada neurona y conexión de la red neuronal se especifica directa y explícitamente en el genotipo. Por el contrario, en los esquemas de codificación indirecta el genotipo especifica indirectamente cómo debe generarse esa red. [6]

Las codificaciones indirectas se utilizan a menudo para lograr varios objetivos: [6] [7] [8] [9] [10]

Taxonomía de sistemas embriogénicos para codificación indirecta.

Tradicionalmente, las codificaciones indirectas que emplean embriogenia artificial (también conocida como desarrollo artificial ) se han clasificado según las líneas de un enfoque gramatical versus un enfoque de química celular . [11] El primero desarrolla conjuntos de reglas en forma de sistemas de reescritura gramatical. Este último intenta imitar cómo surgen las estructuras físicas en biología a través de la expresión genética. Los sistemas de codificación indirecta suelen utilizar aspectos de ambos enfoques.

Stanley y Mükkulainen [11] proponen una taxonomía para sistemas embriogénicos que pretende reflejar sus propiedades subyacentes. La taxonomía identifica cinco dimensiones continuas, a lo largo de las cuales se puede ubicar cualquier sistema embriogénico:

Ejemplos

Ejemplos de métodos de neuroevolución (aquellos con codificaciones directas son necesariamente no embriogénicos):

Ver también

Referencias

  1. ^ Stanley, Kenneth O. (13 de julio de 2017). "Neuroevolución: un tipo diferente de aprendizaje profundo". Medios O'Reilly . Consultado el 4 de septiembre de 2017 .
  2. ^ Risi, Sebastián; Togelius, Julián (2017). "Neuroevolución en los juegos: estado del arte y desafíos abiertos". Transacciones IEEE sobre inteligencia computacional e inteligencia artificial en juegos . 9 : 25–41. arXiv : 1410.7326 . doi :10.1109/TCIAIG.2015.2494596. S2CID  11245845.
  3. ^ Togelius, Julián; Schaul, Tom; Schmidhuber, Jürgen; Gómez, Faustino (2008). "Contrarrestar los aportes venenosos con la neuroevolución memética". Resolución de problemas paralelos desde la naturaleza – PPSN X. Apuntes de conferencias sobre informática. vol. 5199, págs. 610–619. doi :10.1007/978-3-540-87700-4_61. ISBN 978-3-540-87699-1.
  4. ^ Hutson, Matthew (11 de enero de 2018). "La inteligencia artificial puede 'evolucionar' para resolver problemas". Ciencia . doi : 10.1126/ciencia.aas9715.
  5. ^ Whitelam, Stephen; Selin, Víktor; Park, Sang-Won; Tamblyn, Isaac (2 de noviembre de 2021). "Correspondencia entre neuroevolución y descenso de gradiente". Comunicaciones de la naturaleza . 12 (1): 6317. arXiv : 2008.06643 . Código Bib : 2021NatCo..12.6317W. doi :10.1038/s41467-021-26568-2. PMC 8563972 . PMID  34728632. 
  6. ^ abc Kassahun, Yohannes; Sommer, Gerald; Edgington, marca; Metzen, Jan Hendrik; Kirchner, Frank (2007), "Codificación genética común para codificaciones directas e indirectas de redes", Conferencia sobre Computación Genética y Evolutiva , ACM Press, págs. 1029-1036, CiteSeerX 10.1.1.159.705 
  7. ^ ab Gauci, Stanley (2007), "Generación de redes neuronales a gran escala mediante el descubrimiento de regularidades geométricas" (PDF) , Conferencia sobre computación genética y evolutiva , Nueva York, NY: ACM
  8. ^ ab Gruau, Frédéric; Yo, la Universidad Claude Bernard-lyon; Doctorado, De A. Diplome De; Demongeot, M. Jacques; Cosnard, examinadores M. Michel; Mazoyer, M. Jacques; Peretto, M. Pierre; Whitley, M. Darell (1994). "Síntesis de redes neuronales mediante codificación celular y algoritmo genético" . CiteSeerX 10.1.1.29.5939 . 
  9. ^ Clune, J.; Stanley, Kenneth O.; Pennock, RT; Ofría, C. (junio de 2011). "Sobre el rendimiento de la codificación indirecta a lo largo del continuo de regularidad". Transacciones IEEE sobre computación evolutiva . 15 (3): 346–367. CiteSeerX 10.1.1.375.6731 . doi :10.1109/TEVC.2010.2104157. ISSN  1089-778X. S2CID  3008628. 
  10. ^ ab Risi, Sebastián; Stanley, Kenneth O. (octubre de 2012). "Una codificación mejorada basada en hipercubo para evolucionar la ubicación, la densidad y la conectividad de las neuronas". Vida artificial . 18 (4): 331–363. doi : 10.1162/ARTL_a_00071 . PMID  22938563. S2CID  3256786.
  11. ^ ab Stanley, Kenneth O.; Míikkulainen, Risto (abril de 2003). "Una taxonomía para la embriogenia artificial". Vida artificial . 9 (2): 93-130. doi :10.1162/106454603322221487. PMID  12906725. S2CID  2124332.
  12. ^ Ronald, Edmundo; Schoenauer, March (1994), "Genetic Lander: An experiment in precision neuro-genetic control", PPSN III 1994 Parallel Programming Solving from Nature , págs. 452–461, CiteSeerX 10.1.1.56.3139 
  13. ^ Angeline, PJ; Saunders, gerente general; Pollack, JB (enero de 1994). "Un algoritmo evolutivo que construye redes neuronales recurrentes". Transacciones IEEE en redes neuronales . 5 (1): 54–65. CiteSeerX 10.1.1.64.1853 . doi :10.1109/72.265960. PMID  18267779. S2CID  44767. 
  14. ^ Yao, X.; Liu, Y. (mayo de 1997). "Un nuevo sistema evolutivo para la evolución de redes neuronales artificiales". Transacciones IEEE en redes neuronales . 8 (3): 694–713. doi : 10.1109/72.572107. PMID  18255671.
  15. ^ Stanley, Kenneth O.; Bryant, Bobby D.; Míikkulainen, Risto (diciembre de 2005). «Neuroevolución en tiempo real en el videojuego NERO» (PDF) .
  16. ^ Stanley, Kenneth O.; Míikkulainen, Risto (junio de 2002). "Evolución de redes neuronales mediante topologías aumentadas". Computación Evolutiva . 10 (2): 99-127. CiteSeerX 10.1.1.638.3910 . doi :10.1162/106365602320169811. PMID  12180173. S2CID  498161. 
  17. ^ Kassahun, Yohannes; Sommer, Gerald (abril de 2005), "Aprendizaje por refuerzo eficiente mediante la adquisición evolutiva de topologías neuronales" (PDF) , 13º Simposio europeo sobre redes neuronales artificiales , Brujas, Bélgica, págs.{{citation}}: Mantenimiento CS1: falta el editor de la ubicación ( enlace )
  18. ^ Siebel, Nils T.; Sommer, Gerald (17 de octubre de 2007). "Aprendizaje evolutivo por refuerzo de redes neuronales artificiales". Revista internacional de sistemas inteligentes híbridos . 4 (3): 171–183. doi :10.3233/his-2007-4304.
  19. ^ Rempis, Christian Wilhelm (2012). Neurocontroladores complejos en evolución con neuroevolución restringida interactivamente (Tesis).
  20. ^ Sher, gen I. (2013). Manual de neuroevolución a través de Erlang . doi :10.1007/978-1-4614-4463-3. ISBN 978-1-4614-4462-6. S2CID  21777855.
  21. ^ Vargas, Danilo Vasconcellos; Murata, Junichi (2019). "Neuroevolución de espectro diverso con modelos neuronales unificados". Transacciones IEEE sobre redes neuronales y sistemas de aprendizaje . 28 (8): 1759-1773. arXiv : 1902.06703 . Código Bib : 2019arXiv190206703V. doi :10.1109/TNNLS.2016.2551748. PMID  28113564. S2CID  206757620.
  22. ^ Edlund, Jeffrey; Chaumont, Nicolás; Hintze, Arend; Koch, Christof; Tononi, Julio; Adami, Christoph (2011). "La información integrada aumenta con la aptitud en la evolución de los animats". PLOS Biología Computacional . 7 (10): e1002236. arXiv : 1103.1791 . Código Bib : 2011PLSCB...7E2236E. doi : 10.1371/journal.pcbi.1002236 . PMC 3197648 . PMID  22028639. 
  23. ^ Rostami, Shahin; Neri, Ferrante (junio de 2017). "Un mecanismo de selección rápido impulsado por hipervolumen para problemas de optimización de muchos objetivos". Enjambre y computación evolutiva . 34 : 50–67. doi :10.1016/j.swevo.2016.12.002. hdl : 2086/13102 .
  24. ^ Shenfield, Alex; Rostami, Shahin (2017). "Evolución multiobjetivo de redes neuronales artificiales en problemas de diagnóstico médico multiclase con desequilibrio de clases" (PDF) . Conferencia IEEE 2017 sobre Inteligencia Computacional en Bioinformática y Biología Computacional (CIBCB) . págs. 1–8. doi :10.1109/CIBCB.2017.8058553. ISBN 978-1-4673-8988-4. S2CID  22674515.
  25. ^ Di Biasi, Luigi; De Marco, Fabiola; Auriemma Citarella, Alessia; Barra, Paola; Piotto Piotto, Stefano; Tortora, Genoveffa (2023). "Enfoque híbrido para el diseño de CNNS utilizando algoritmos genéticos para la clasificación del melanoma". En Rousseau, Jean-Jacques; Kapralos, Bill (eds.). Reconocimiento de patrones, visión por computadora y procesamiento de imágenes. ICPR 2022 Talleres y desafíos internacionales . Apuntes de conferencias sobre informática. vol. 13643. Cham: Springer Nature Suiza. págs. 514–528. doi :10.1007/978-3-031-37660-3_36. ISBN 978-3-031-37660-3.
  26. ^ Assunção, Filipe; Lourenço, Nuño; Ribeiro, Bernardete; Machado, Penousal (junio 2021). "Fast-DENSER: representación estructurada de red evolutiva profunda y rápida". SoftwareX . 14 : 100694. Código Bib : 2021SoftX..1400694A. doi : 10.1016/j.softx.2021.100694. hdl : 10316/100856 .
  27. ^ Vinhas, Adriano; Correia, João; Machado, Penousal (20 de junio de 2024), Hacia la evolución de las redes neuronales profundas mediante el aprendizaje autosupervisado contrastivo, arXiv : 2406.14525 , consultado el 21 de junio de 2024
  28. ^ Cortés, Gabriel; Lourenço, Nuño; Machado, Penousal (2024), Smith, Stephen; Correia, João; Cintrano, Christian (eds.), "Hacia la plausibilidad física en los sistemas de neuroevolución", Aplicaciones de la computación evolutiva , vol. 14635, Cham: Springer Nature Suiza, págs. 76–90, doi :10.1007/978-3-031-56855-8_5, ISBN 978-3-031-56854-1, recuperado el 21 de junio de 2024
  29. ^ Lourenço, Nuno; Assunção, Filipe; Pereira, Francisco B.; Costa, Ernesto; Machado, Penousal (2018), Ryan, Conor; O'Neill, Michael; Collins, JJ (eds.), "Evolución gramatical estructurada: un enfoque dinámico", Manual de evolución gramatical , Cham: Springer International Publishing, págs. 137-161, doi :10.1007/978-3-319-78717-6_6, ISBN 978-3-319-78717-6, recuperado el 21 de junio de 2024

enlaces externos