Identificación automatizada de especies.

La identificación automatizada de especies es un método para poner la experiencia de los taxónomos a disposición de ecólogos, parataxonomistas y otros a través de tecnología digital e inteligencia artificial . Hoy en día, la mayoría de los sistemas de identificación automatizados se basan en imágenes que representan la especie para la identificación. ^[1] A partir de imágenes identificadas con precisión de una especie, se entrena un clasificador . Una vez expuesto a una cantidad suficiente de datos de entrenamiento, este clasificador puede identificar las especies entrenadas en imágenes nunca antes vistas.

Introducción

La identificación automatizada de objetos biológicos como insectos (individuos) y/o grupos (por ejemplo, especies , gremios, personajes) ha sido un sueño entre los sistemáticos durante siglos. El objetivo de algunos de los primeros métodos biométricos multivariados era abordar el eterno problema de la discriminación grupal y la caracterización intergrupal. A pesar de mucho trabajo preliminar en las décadas de 1950 y 1960, el progreso en el diseño e implementación de sistemas prácticos para la identificación biológica de objetos totalmente automatizada ha resultado frustrantemente lento. Tan recientemente como 2004 Dan Janzen ^[2] actualizó el sueño para una nueva audiencia:

La nave espacial aterriza. Él sale. Lo señala a su alrededor. Dice "amigable-antipático-comestible-venenoso-seguro-peligroso-vivo-inanimado". En el siguiente barrido dice ' Quercus oleoides—Homo sapiens—Spondias mombin—Solanum nigrum—Crotalus durissus—Morpho peleides —serpentine”. Esto ha estado en mi cabeza desde que leí ciencia ficción en noveno grado hace medio siglo. ^{[ se necesita aclaración ]}

El problema de la identificación de especies.

La solución preferida de Janzen a este problema clásico consistía en construir máquinas para identificar especies a partir de su ADN . Sin embargo, los recientes desarrollos en arquitecturas informáticas, así como las innovaciones en el diseño de software, han puesto las herramientas necesarias para hacer realidad la visión de Janzen en manos de la comunidad de sistemática e informática , no dentro de varios años, sino ahora; y no sólo para crear códigos de barras de ADN , sino también para identificación basada en imágenes digitales .

Una encuesta publicada en 2004 ^[3] estudia por qué la identificación automatizada de especies no se había utilizado ampliamente en este momento y si sería una opción realista para el futuro. Los autores descubrieron que "un número pequeño pero creciente de estudios buscaba desarrollar sistemas automatizados de identificación de especies basados en caracteres morfológicos". Una descripción general de 20 estudios que analizan las estructuras de las especies, como células, polen, alas y genitales, muestra tasas de éxito de identificación entre el 40% y el 100% en conjuntos de entrenamiento con 1 a 72 especies. Sin embargo, también identificaron cuatro problemas fundamentales con estos sistemas: (1) los conjuntos de entrenamiento eran demasiado pequeños (5-10 especímenes por especie) y su extensión, especialmente para especies raras, puede ser difícil; (2) errores en la identificación: no son lo suficientemente estudiados para manejarlos y encontrar sistemas sistemáticos, (3) escalamiento: los estudios consideran solo un pequeño número de especies (<200 especies), y (4) especies nuevas: los sistemas están restringidos a las especies para las que han sido entrenados y clasificarán cualquier nueva especie. observación como una de las especies conocidas.

Una encuesta publicada en 2017 ^[4] compara y analiza sistemáticamente los avances y hallazgos hacia la identificación automatizada de especies de plantas en la última década (2005-2015). Durante este tiempo se han publicado 120 estudios primarios en lugares de alta calidad, principalmente por autores con experiencia en informática. Estos estudios proponen una gran cantidad de enfoques de visión por computadora , es decir, características que reducen la alta dimensionalidad de los datos de imágenes basadas en píxeles y al mismo tiempo preservan la información característica, así como los métodos de clasificación. La gran mayoría de estos estudios analiza las hojas para su identificación, mientras que sólo 13 estudios proponen métodos para la identificación basada en flores . La razón es que las hojas se pueden recolectar y obtener imágenes más fácilmente y están disponibles durante la mayor parte del año. Las características propuestas capturan características genéricas del objeto, es decir, forma , textura y color , así como características específicas de la hoja, es decir, venación y margen. La mayoría de los estudios todavía utilizaban conjuntos de datos para la evaluación que no contenían más de 250 especies . Sin embargo, hay avances en este sentido, un estudio utiliza un conjunto de datos con >2k ^[5] y otro con >20k ^[6] especies .

Un sistema desarrollado en 2022 ^[7] demostró que la identificación automatizada logra una precisión suficientemente alta para ser utilizada en un sistema automatizado de vigilancia de insectos mediante trampas electrónicas. Al entrenar a los clasificadores en unos pocos cientos de imágenes, identificó correctamente las moscas de la fruta y puede usarse para un monitoreo continuo destinado a detectar la invasión de especies o el brote de plagas. Varios aspectos contribuyen al éxito de este sistema. Principalmente, el uso de trampas electrónicas proporciona una configuración estandarizada, lo que significa que, aunque se implementen en diferentes países y regiones, se controla la variabilidad visual, en términos de tamaño, ángulo de visión e iluminación. Esto sugiere que los sistemas basados en trampas pueden ser más fáciles de desarrollar que los sistemas de visualización libre para la identificación automática de plagas.

Hay una escasez de especialistas que puedan identificar la biodiversidad cuya preservación se ha convertido en una preocupación mundial. Al comentar este problema en paleontología en 1993, Roger Kaesler ^[8] reconoció:

"... nos estamos quedando sin paleontólogos sistemáticos que tengan algo parecido a un conocimiento sinóptico de un grupo importante de organismos... Es poco probable que los paleontólogos del próximo siglo puedan darse el lujo de tratar en profundidad los problemas taxonómicos... La paleontología tendrá mantener su nivel de entusiasmo sin la ayuda de los sistemáticos, que tanto han contribuido a su éxito".

Esta deficiencia de experiencia afecta tanto a aquellas industrias comerciales que dependen de identificaciones precisas (por ejemplo, agricultura , bioestratigrafía ) como a una amplia gama de programas de investigación pura y aplicada (por ejemplo, conservación , oceanografía biológica , climatología , ecología ). También se reconoce comúnmente, aunque informalmente, que la literatura técnica y taxonómica de todos los grupos de organismos está plagada de ejemplos de identificaciones inconsistentes e incorrectas. Esto se debe a una variedad de factores, incluyendo taxónomos que no están suficientemente capacitados y capacitados para hacer identificaciones (por ejemplo, usando diferentes reglas generales para reconocer los límites entre grupos similares), descripciones y/o ilustraciones originales de grupos insuficientemente detalladas, acceso inadecuado hasta monografías actuales y colecciones bien seleccionadas y, por supuesto, taxónomos que tienen opiniones diferentes con respecto a conceptos de grupo. La revisión por pares sólo elimina los errores más obvios de comisión u omisión en esta área, y sólo cuando un autor proporciona representaciones adecuadas (por ejemplo, ilustraciones, grabaciones y secuencias genéticas) de los especímenes en cuestión.

La sistemática también tiene mucho que ganar con el desarrollo y uso de sistemas de identificación automatizados. Para atraer personal y recursos, la sistemática debe transformarse en una "gran empresa científica internacional coordinada". ^[9] Muchos han identificado el uso de Internet , especialmente a través de la World Wide Web , como el medio a través del cual se puede realizar esta transformación. Si bien el establecimiento de un sistema virtual, similar al GenBank , para acceder a datos morfológicos , clips de audio, archivos de vídeo, etc., sería un paso importante en la dirección correcta, un mejor acceso a información de observación y/o descripciones basadas en texto por sí solo no solucionará ninguno de los dos problemas. el impedimento taxonómico o problemas de baja reproducibilidad de identificación con éxito. En cambio, la inevitable subjetividad asociada con la toma de decisiones críticas sobre la base de criterios cualitativos debe reducirse o, al menos, integrarse dentro de un contexto analítico más formal.

Imágenes de gel de proteína SDS de orugas de polilla esfinge. Se puede utilizar de forma similar a la toma de huellas dactilares de ADN.

Los sistemas de identificación automatizados, flexibles y robustos, adecuadamente diseñados, organizados en torno a arquitecturas informáticas distribuidas y referenciados a colecciones de datos de conjuntos de entrenamiento identificados con autoridad (por ejemplo, imágenes y secuencias de genes ) pueden, en principio, proporcionar a todos los sistemáticos acceso a los datos electrónicos. archivos y las herramientas analíticas necesarias para manejar identificaciones rutinarias de taxones comunes. Los sistemas correctamente diseñados también pueden reconocer cuando sus algoritmos no pueden realizar una identificación fiable y derivar esa imagen a un especialista (a cuya dirección se puede acceder desde otra base de datos). Estos sistemas también pueden incluir elementos de inteligencia artificial y mejorar así su rendimiento cuanto más se utilicen. Una vez que se han desarrollado modelos morfológicos (o moleculares) de una especie y se ha demostrado que son precisos, se pueden consultar estos modelos para determinar qué aspectos de los patrones de variación observados y los límites de variación se están utilizando para lograr la identificación, abriendo así el camino para el descubrimiento de caracteres taxonómicos nuevos y (potencialmente) más fiables.

iNaturalist es un proyecto global de ciencia ciudadana y una red social de naturalistas que incorpora la identificación humana y automática de plantas, animales y otras criaturas vivientes a través de un navegador o aplicaciones móviles. ^[10]
Pl@ntNet es un proyecto global de ciencia ciudadana que proporciona una app y un sitio web para la identificación de plantas a través de fotografías, basado en aprendizaje automático
Leaf Snap es una aplicación para iOS desarrollada por el Instituto Smithsonian que utiliza software de reconocimiento visual para identificar especies de árboles de América del Norte a partir de fotografías de hojas. ^{[ cita necesaria ]}
Google Fotos puede identificar automáticamente varias especies en fotografías. ^[11]
Plant.id es una aplicación web y una API creada por la empresa FlowerChecker que utiliza una red neuronal entrenada con fotografías de la aplicación móvil FlowerChecker. ^[12]^[13]

Ver también

Clave de acceso múltiple : tipo de clave de identificación que permite a los usuarios evaluar las características en un orden no establecido
Sistema de identificación automatizado digital : sistema automatizado de identificación de especies

Referencias citadas

^ Waldchen, Jana; Mäder, Patrick (noviembre de 2018). Cooper, Natalie (ed.). "Aprendizaje automático para la identificación de especies basada en imágenes". Métodos en Ecología y Evolución . 9 (11): 2216–2225. doi : 10.1111/2041-210X.13075 . S2CID 91666577.
^ Janzen, Daniel H. (22 de marzo de 2004). "Ahora es el momento". Transacciones filosóficas de la Royal Society de Londres . B. 359 (1444): 731–732. doi :10.1098/rstb.2003.1444. PMC 1693358 . PMID 15253359.
^ Gastón, Kevin J.; O'Neill, Mark A. (22 de marzo de 2004). "Reconocimiento automatizado de especies: ¿por qué no?". Transacciones filosóficas de la Royal Society de Londres . B. 359 (1444): 655–667. doi :10.1098/rstb.2003.1442. PMC 1693351 . PMID 15253351.
^ Waldchen, Jana; Mäder, Patrick (7 de enero de 2017). "Identificación de especies de plantas mediante técnicas de visión por computadora: una revisión sistemática de la literatura". Archivos de métodos computacionales en ingeniería . 25 (2): 507–543. doi :10.1007/s11831-016-9206-z. ISSN 1134-3060. PMC 6003396 . PMID 29962832.
^ Joly, Alexis; Goëau, Hervé; Bonnet, Pierre; Bakić, Vera; Barba, Julien; Selmi, Souheil; Yahiaoui, Itheri; Carré, Jennifer; Mouysset, Elise (1 de septiembre de 2014). "Identificación interactiva de plantas basada en datos de imágenes sociales". Informática Ecológica . Número especial sobre multimedia en ecología y medio ambiente. 23 : 22–34. doi : 10.1016/j.ecoinf.2013.07.006 .
^ Wu, Huisi; Wang, Lei; Zhang, Feng; Wen, Zhenkun (1 de agosto de 2015). "Reconocimiento automático de hojas a partir de una gran base de datos de imágenes jerárquicas". Revista Internacional de Sistemas Inteligentes . 30 (8): 871–886. doi : 10.1002/int.21729 . ISSN 1098-111X. S2CID 12917626.
^ Diller, Yoshua; Shamsian, Aviv; Sacudido, Ben; Altman, ñame; Danziger, Bat-Chen; Manrakhan, Aruna; Serfontein, Leani; Bali, Elma; Wernicke, Matías; Egartner, Alois; Colacci, Marco; Sciarretta, Andrea; Chechik, Gal; Alchanatis, Víctor; Papadopoulos, Nikos T. (28 de junio de 2022). «Un sistema de vigilancia remota en tiempo real para moscas de la fruta de importancia económica: análisis de sensibilidad y imágenes» (PDF) . Revista de ciencia de plagas . 96 (2): 611–622. doi : 10.1007/s10340-022-01528-x . ISSN 1612-4766. S2CID 250127830.
^ Kaesler, Roger L. (1993). "Una ventana de oportunidad: asomarse a un nuevo siglo de paleontología". Revista de Paleontología . 67 (3): 329–333. Código Bib : 1993JPal...67..329K. doi :10.1017/S0022336000036805. JSTOR 1306022. S2CID 133097253.
^ Wheeler, Quentin D. (2003). "Transformar la taxonomía" (PDF) (22). El sistemático: 3–5. {{cite journal}}: Citar diario requiere |journal=( ayuda )
^ "Exploraciones de visión por computadora de iNaturalist". iNaturalist.org . 2017-07-27 . Consultado el 12 de agosto de 2017 .
^ "Cómo Google Fotos diferencia entre perros, gatos, osos y cualquier otro animal en tus fotos". 2015-06-04.
^ MLMU.cz - FlowerChecker: emocionante viaje de una startup de aprendizaje automático: O. Veselý y J. Řihák , consultado el 12 de enero de 2022
^ "Tvůrci FlowerCheckeru spouštějí Shazam pro kytky. Plant.id staví na AI". 7 de mayo de 2018. Archivado desde el original el 12 de mayo de 2018 . Consultado el 11 de mayo de 2018 .

enlaces externos

Aquí hay algunos enlaces a las páginas de inicio de los sistemas de identificación de especies. Los sistemas SPIDA y DAISY son esencialmente genéricos y capaces de clasificar cualquier material de imagen presentado. El sistema ABIS y DrawWing están restringidos a insectos con alas membranosas, ya que funcionan haciendo coincidir un conjunto específico de caracteres según la venación de las alas.

El sistema SPIDA
ABIS
MARGARITA
dibujarala
LeafSnap Archivado el 20 de mayo de 2013 en la Wayback Machine.
Pl@ntNet