Informática de la biodiversidad

La informática de la biodiversidad es la aplicación de técnicas informáticas a la información sobre biodiversidad , como la taxonomía , la biogeografía o la ecología . Se define como la aplicación de tecnologías de la información a la gestión, exploración algorítmica, análisis e interpretación de datos primarios sobre la vida, en particular a nivel de organización de especies. ^[1] Las técnicas informáticas modernas pueden producir nuevas formas de ver y analizar la información existente, así como predecir situaciones futuras (véase modelado de nichos ). La informática de la biodiversidad es un término que se acuñó recién alrededor de 1992 pero que con el rápido aumento de los conjuntos de datos se ha vuelto útil en numerosos estudios y aplicaciones, como la construcción de bases de datos taxonómicas o sistemas de información geográfica . La informática de la biodiversidad contrasta con la " bioinformática ", que a menudo se utiliza como sinónimo del manejo informático de datos en el área especializada de la biología molecular .

Descripción general

La informática de la biodiversidad (diferente pero vinculada a la bioinformática) es la aplicación de métodos de tecnología de la información a los problemas de organización, acceso, visualización y análisis de datos primarios de biodiversidad. Los datos primarios de biodiversidad están compuestos por nombres, observaciones y registros de especímenes, y datos genéticos y morfológicos asociados a un espécimen. La informática de la biodiversidad también puede tener que lidiar con la gestión de información de taxones sin nombre, como la producida por el muestreo ambiental y la secuenciación de muestras de campos mixtos. El término informática de la biodiversidad también se utiliza para cubrir los problemas computacionales específicos de los nombres de entidades biológicas, como el desarrollo de algoritmos para lidiar con representaciones variantes de identificadores como nombres de especies y autoridades, y los múltiples esquemas de clasificación dentro de los cuales estas entidades pueden residir de acuerdo con las preferencias de diferentes trabajadores en el campo, así como la sintaxis y la semántica mediante las cuales el contenido de las bases de datos taxonómicas puede hacerse consultable por máquina e interoperable para fines de informática de la biodiversidad...

Historia de la disciplina

Se puede considerar que la informática de la biodiversidad comenzó con la construcción de las primeras bases de datos taxonómicas computarizadas a principios de la década de 1970 y progresó a través del posterior desarrollo de herramientas de búsqueda distribuidas hacia fines de la década de 1990, incluido el Species Analyst de la Universidad de Kansas, la Red de Información sobre Biodiversidad de América del Norte (NABIN), CONABIO en México, INBio en Costa Rica y otros, ^[2] el establecimiento de la Facilidad Mundial de Información sobre Biodiversidad en 2001 y el desarrollo paralelo de una variedad de modelos de nicho y otras herramientas para operar con datos de biodiversidad digitalizados desde mediados de la década de 1980 en adelante (por ejemplo, consulte ^[3] ). En septiembre de 2000, la revista estadounidense Science dedicó un número especial a "Bioinformática para la biodiversidad", ^[4] la revista Biodiversity Informatics comenzó a publicarse en 2004, y varias conferencias internacionales a lo largo de la década de 2000 han reunido a profesionales de la informática de la biodiversidad, incluida la conferencia e-Biosphere de Londres en junio de 2009. Un suplemento de la revista BMC Bioinformatics (volumen 10, suplemento 14 ^[5] ) publicado en noviembre de 2009 también trata sobre la informática de la biodiversidad.

Historia del término

Según la correspondencia reproducida por Walter Berendsohn, ^[6] el término "Informática de la Biodiversidad" fue acuñado por John Whiting en 1992 para cubrir las actividades de una entidad conocida como el Consorcio Canadiense de Informática de la Biodiversidad, un grupo involucrado en la fusión de información básica sobre biodiversidad con economía ambiental e información geoespacial en forma de GPS y SIG . Posteriormente, parece haber perdido toda conexión obligada con el mundo GPS/SIG y estar asociado con la gestión computarizada de cualquier aspecto de la información sobre biodiversidad (por ejemplo, consulte ^[7] ).

Taxonomía digital (sistemática)

Lista global de todas las especies

Uno de los principales objetivos de la informática de la biodiversidad es la creación de una lista maestra completa de las especies actualmente reconocidas del mundo . Este objetivo se ha logrado en gran medida gracias al proyecto Catálogo de la Vida , que incluye más de 2 millones de especies en su Lista Anual de 2022. ^[8] Un esfuerzo similar para los taxones fósiles, la Base de Datos de Paleobiología ^[9] documenta más de 100.000 nombres de especies fósiles, de un número total desconocido.

Nombres científicos de géneros y especies como identificadores únicos

La aplicación del sistema linneano de nomenclatura binomial para las especies y uninominal para los géneros y rangos superiores ha traído consigo muchas ventajas, pero también problemas con los homónimos (el mismo nombre que se utiliza para varios taxones, ya sea de forma inadvertida o legítima en varios reinos), los sinónimos (múltiples nombres para el mismo taxón), así como las representaciones variantes del mismo nombre debido a diferencias ortográficas, pequeños errores de ortografía, variación en la forma de citar los nombres de los autores y las fechas, y más. Además, los nombres pueden cambiar a través del tiempo debido a cambios en las opiniones taxonómicas (por ejemplo, la colocación genérica correcta de una especie o la elevación de una subespecie al rango de especie o viceversa), y también la circunscripción de un taxón puede cambiar según los conceptos taxonómicos de diferentes autores. Una solución propuesta a este problema es el uso de identificadores de ciencias de la vida ( LSID ) para fines de comunicación máquina-máquina, aunque hay tanto defensores como oponentes de este enfoque.

Una clasificación consensuada de organismos

Los organismos pueden clasificarse de múltiples maneras (ver página principal Clasificación biológica ), lo que puede crear problemas de diseño para los sistemas de Informática de la Biodiversidad que apuntan a incorporar una clasificación única o múltiple para satisfacer las necesidades de los usuarios, o para guiarlos hacia un único sistema "preferido". Si un único sistema de clasificación de consenso puede lograrse es probablemente una pregunta abierta, sin embargo, el Catálogo de la Vida ha encargado una actividad en esta área ^[10] que ha sido reemplazada por un sistema publicado propuesto en 2015 por M. Ruggiero y colaboradores. ^[11]

Mapas de biodiversidad

Los mapas de biodiversidad proporcionan una representación cartográfica de los datos espaciales sobre biodiversidad. ^[12] Estos datos se pueden utilizar junto con las listas de especies para ayudar con los esfuerzos de conservación de la biodiversidad . Los mapas de biodiversidad pueden ayudar a revelar patrones de distribución de especies y cambios en el rango. Esto puede reflejar pérdida de biodiversidad, degradación del hábitat o cambios en la composición de las especies . Combinados con datos de desarrollo urbano , los mapas pueden informar la gestión de la tierra al modelar escenarios que podrían afectar la biodiversidad.

Los mapas de biodiversidad se pueden producir de diversas maneras: tradicionalmente, los mapas de distribución se dibujaban a mano basándose en informes de la literatura, pero cada vez más se utilizan datos a gran escala, por ejemplo, de proyectos de ciencia ciudadana (por ejemplo, iNaturalist ) y colecciones de museos digitalizadas (por ejemplo, VertNet). Las herramientas SIG como ArcGIS o los paquetes R como dismo pueden ayudar específicamente en el modelado de la distribución de especies (modelado de nicho ecológico) e incluso predecir los impactos del cambio ecológico en la biodiversidad. ^[13] GBIF , OBIS y la UICN son grandes repositorios basados en la web de datos espacio-temporales de especies que sirven de fuente a muchos mapas de biodiversidad existentes.

Movilización de información primaria sobre biodiversidad

La información "primaria" sobre la biodiversidad puede considerarse como los datos básicos sobre la presencia y diversidad de especies (o, de hecho, cualquier taxón reconocible), comúnmente asociados con información sobre su distribución en el espacio, el tiempo o ambos. Dicha información puede presentarse en forma de especímenes conservados e información asociada, por ejemplo, tal como se reúne en las colecciones de historia natural de museos y herbarios , o como registros de observación, por ejemplo, ya sea de estudios formales de fauna o florística realizados por biólogos profesionales y estudiantes, o como observaciones amateurs y otras observaciones planificadas o no planificadas, incluidas las que cada vez más se incluyen en el ámbito de la ciencia ciudadana . Proporcionar acceso digital coherente en línea a esta vasta colección de datos primarios dispares es una función central de la informática de la biodiversidad que está en el corazón de las redes de datos de biodiversidad regionales y globales, ejemplos de esto último incluyen OBIS y GBIF .

Como fuente secundaria de datos sobre biodiversidad, la literatura científica relevante puede ser analizada por humanos o (potencialmente) por algoritmos especializados de recuperación de información para extraer la información primaria relevante sobre biodiversidad que se informa en ella, a veces en forma agregada/resumida pero con frecuencia como observaciones primarias en forma narrativa o tabular. Los elementos de dicha actividad (como la extracción de identificadores taxonómicos clave, palabras clave/ términos de índice , etc.) se han practicado durante muchos años a un nivel superior por bases de datos académicas seleccionadas y motores de búsqueda . Sin embargo, para el máximo valor de la informática de la biodiversidad, los datos de ocurrencia primarios reales idealmente deberían recuperarse y luego ponerse a disposición en una forma o formas estandarizadas; por ejemplo, los proyectos Plazi e INOTAXA están transformando la literatura taxonómica en formatos XML que luego pueden ser leídos por aplicaciones cliente, el primero usando TaxonX-XML ^[15] y el segundo usando el formato taXMLit. La Biblioteca del Patrimonio de la Biodiversidad también está logrando avances significativos en su objetivo de digitalizar porciones sustanciales de la literatura taxonómica fuera de derechos de autor, que luego se somete a reconocimiento óptico de caracteres (OCR) para poder procesarla posteriormente mediante herramientas informáticas de la biodiversidad.

Normas y protocolos

Al igual que otras disciplinas relacionadas con los datos, la informática de la biodiversidad se beneficia de la adopción de estándares y protocolos adecuados para respaldar la transmisión de información entre máquinas y la interoperabilidad de la información dentro de su dominio particular. Algunos ejemplos de estándares relevantes incluyen el esquema Darwin Core XML para datos de biodiversidad basados en especímenes y observaciones desarrollado a partir de 1998, más extensiones del mismo, el esquema de transferencia de conceptos taxonómicos ^[16] , más los estándares para datos descriptivos estructurados ^[17] y el acceso a datos de colecciones biológicas (ABCD); ^[18] mientras que los protocolos de recuperación y transferencia de datos incluyen DiGIR (ahora en su mayoría reemplazado) y TAPIR (TDWG Access Protocol for Information Retrieval). ^[19] Muchos de estos estándares y protocolos son mantenidos actualmente, y su desarrollo supervisado, por Biodiversity Information Standards (TDWG) .

Actividades actuales

En la conferencia e-Biosphere de 2009 en el Reino Unido, ^[20] se adoptaron los siguientes temas, que son indicativos de una amplia gama de actividades actuales en materia de informática de la biodiversidad y de cómo podrían clasificarse:

Aplicación: Conservación / Agricultura / Pesca / Industria / Silvicultura
Solicitud: Especies exóticas invasoras
Aplicación: Biología Sistemática y Evolutiva
Aplicación: Taxonomía y sistemas de identificación
Nuevas herramientas, servicios y estándares para la gestión y el acceso a los datos
- Nuevas herramientas de modelado
- Nuevas herramientas para la integración de datos
- Nuevos enfoques para la infraestructura de la biodiversidad
- Nuevos enfoques para la identificación de especies
- Nuevos enfoques para el mapeo de la biodiversidad
Bases de datos y redes nacionales y regionales sobre biodiversidad

Un taller posterior a la conferencia de personas clave con importantes roles actuales en informática de la biodiversidad también dio como resultado una Resolución del taller que destacó, entre otros aspectos, la necesidad de crear registros globales duraderos para los recursos que son básicos para la informática de la biodiversidad (por ejemplo, repositorios, colecciones); completar la construcción de una infraestructura taxonómica sólida; y crear ontologías para datos de biodiversidad. ^[21]

Proyectos de ejemplo

Global:

La Infraestructura Mundial de Información sobre Biodiversidad (GBIF) y el Sistema de Información Biogeográfica Oceánica (OBIS) (para especies marinas)
Los proyectos Species 2000 , ITIS (Sistema Integrado de Información Taxonómica) y Catalogue of Life
Nombres globales
EOL , Proyecto Enciclopedia de la Vida
El Consorcio para el proyecto Código de Barras de la Vida
El proyecto Mapa de la Vida
El proyecto de base de datos de reptiles
El proyecto AmphibiaWeb
El indexador y organizador biológico universal uBio, del Laboratorio de Biología Marina Woods Hole
El índice de nombres de organismos (ION) de Clarivate Analytics, que proporciona acceso a los nombres científicos de taxones de numerosas revistas indexadas en el Registro zoológico
El Registro Provisional de Géneros Marinos y No Marinos (IRMNG)
ZooBank , el registro de actos nomenclaturales y literatura sistemática relevante en zoología
El Index Nominum Genericorum, compilación de nombres genéricos publicados para organismos cubiertos por el Código Internacional de Nomenclatura Botánica , mantenido en el Instituto Smithsonian en los EE.UU.
Índice internacional de nombres de plantas
MycoBank , documentando nuevos nombres y combinaciones para hongos
Lista de nombres procariotas con relevancia en la nomenclatura ( LPSN ): registro oficial de nombres válidos para bacterias y arqueas , tal como se rige por el Código internacional de nomenclatura de bacterias
Proyecto Biblioteca del Patrimonio de la Biodiversidad : digitalización de la literatura sobre biodiversidad
Wikispecies , compilación de información taxonómica de código abierto (editable por la comunidad), proyecto complementario de Wikipedia
TaxonConcept.org, un proyecto de datos vinculados que conecta bases de datos de especies dispares
Instituto de Ciencias Naturales. Universidad Nacional de Colombia. Unidad de Colecciones Virtuales e Informática de la Biodiversidad
ANTABIF. El Centro de Información sobre Biodiversidad Antártica (ANTABIF) ofrece acceso libre y gratuito a los datos sobre biodiversidad antártica, en el espíritu del Tratado Antártico.
Genesys , base de datos de recursos fitogenéticos mantenidos en bancos de genes nacionales, regionales e internacionales
VertNet, acceso a datos de presencia primaria de vertebrados desde conjuntos de datos de todo el mundo.

Proyectos regionales/nacionales:

Fauna europea
Atlas de Australia Viva
Infraestructura de directorios paneuropeos de especies (PESI)
Simbiontes
iDigBio , colecciones biológicas digitalizadas integradas (EE. UU.)
Proyecto i4Life
Sistema de Información sobre Biodiversidad de Colombia
Portal de biodiversidad de la India (IBP)
Portal de la biodiversidad de Bután (BBP)
Identificación y conocimiento de las malezas en el océano Índico occidental (WIKWIO)
LifeWatch es propuesto por ESFRI como una infraestructura de investigación electrónica paneuropea para apoyar la investigación y la formulación de políticas sobre biodiversidad.
Atlas de la vida de Vermont

En la base de datos "Proyectos de información sobre biodiversidad del mundo" del TDWG se puede encontrar una lista de más de 600 actividades actuales relacionadas con la informática sobre biodiversidad. ^[22]

Véase también

Referencias

^ Soberón, J., y Peterson, AT (2004). Informática de la biodiversidad: gestión y aplicación de datos primarios sobre biodiversidad. Philosophical Transactions of the Royal Society B: Biological Sciences, 359(1444), 689–698.
^ Krishtalka L, Humphrey PS (2000). "¿Pueden los museos de historia natural captar el futuro?". BioScience . 50 (7): 611–617. doi : 10.1641/0006-3568(2000)050[0611:CNHMCT]2.0.CO;2 . hdl : 1808/16508 .
^ Peterson AT, Vieglais D (2001). "Predicción de invasiones de especies mediante el modelado de nichos ecológicos: nuevos enfoques de la bioinformática para abordar un problema acuciante" (PDF) . BioScience . 51 (5): 363–371. doi : 10.1641/0006-3568(2001)051[0363:PSIUEN]2.0.CO;2 . Archivado desde el original (PDF) el 2016-08-07 . Consultado el 2009-10-09 .
^ "¿Bioinformática para la biodiversidad?". Science . 289 : 2229–2440. 2000.
^ "Informática de la biodiversidad". BMC Bioinformatics . 10 Suppl 14. 2009. Archivado desde el original el 27 de enero de 2010 . Consultado el 15 de noviembre de 2009 .
^ ""Informática de la biodiversidad", el término" . Consultado el 6 de agosto de 2009 .
^ Bisby FA; et al. (2000). "La revolución silenciosa: informática de la biodiversidad e Internet". Science . 289 (5488): 2309–2312. Bibcode :2000Sci...289.2309B. doi :10.1126/science.289.5488.2309. PMID 11009408. S2CID 31852825.
^ "Catálogo de la vida - Lista de verificación anual 2016: Lista de verificación anual 2016". www.catalogueoflife.org . Consultado el 8 de septiembre de 2021 .
^ "Base de datos de paleobiología" . Consultado el 6 de agosto de 2009 .
^ "Hacia una jerarquía de gestión (clasificación) para el Catálogo de la Vida. Documento de discusión preliminar por el Dr. Dennis P. Gordon, mayo de 2009". Archivado desde el original el 8 de agosto de 2009. Consultado el 6 de agosto de 2009 .
^ Ruggiero, MA; Gordon, DP; Orrell, TM; Bailly, N.; Bourgoin, T.; Brusca, RC; et al. (2015). "Una clasificación de nivel superior de todos los organismos vivos". PLOS ONE . 10 (4): e0119248. Bibcode :2015PLoSO..1019248R. doi : 10.1371/journal.pone.0119248 . PMC 4418965 . PMID 25923521.
^ "Mapas de biodiversidad: transformación de datos en herramientas visuales para la conservación de la biodiversidad". 2016-11-30 . Consultado el 2022-05-05 .
^ Elith, Jane; Franklin, Janet (2013), "Modelado de distribución de especies", Enciclopedia de la biodiversidad , Elsevier, págs. 692-705, doi :10.1016/b978-0-12-384719-5.00318-x, ISBN 978-0-12-384720-1, S2CID 82987545 , consultado el 5 de mayo de 2022
^ Jetz, Walter; McPherson, Jana M.; Guralnick, Robert P. (2012). "Integración del conocimiento sobre la distribución de la biodiversidad: hacia un mapa global de la vida". Tendencias en ecología y evolución . 27 (3): 151–159. doi : 10.1016/j.tree.2011.09.007 . PMID 22019413.
^ "TaxonX". SourceForge . Consultado el 8 de septiembre de 2021 .
^ "Esquema de transferencia de conceptos taxonómicos (TCS)". Estándares de información sobre biodiversidad (TDWG).
^ "Datos descriptivos estructurados". Estándares de información sobre biodiversidad (TDWG).
^ "Acceso a datos de colecciones biológicas (ABCD)". Estándares de información sobre biodiversidad (TDWG).
^ "GitHub - tdwg/tapir: Protocolo de acceso TDWG para recuperación de información (TAPIR)". GitHub . 16 de junio de 2020 . Consultado el 8 de septiembre de 2021 .
^ "Inicio". e-biosphere09.org .
^ "Copia archivada" (PDF) . www.e-biosphere09.org . Archivado desde el original (PDF) el 26 de febrero de 2012 . Consultado el 12 de enero de 2022 .{{cite web}}: CS1 maint: copia archivada como título ( enlace )
^ "TDWG: Proyectos de información sobre biodiversidad del mundo". www.tdwg.org . Archivado desde el original el 14 de julio de 2009 . Consultado el 12 de enero de 2022 .

Lectura adicional

OECD Megascience Forum Working Group on Biological Informatics (1999). Informe final del OECD Megascience Forum Working Group on Biological Informatics, enero de 1999. págs. 1–74. Archivado desde el original el 2009-03-05 . Consultado el 2018-03-21 .
Canhos, VP; Souza, S.; Giovanni, R. y Canhos, DAL (2004). "Informática de la biodiversidad global: sentando las bases para un "nuevo mundo" de modelado ecológico". Informática de la biodiversidad . 1 : 1–13. doi : 10.17161/bi.v1i0.3 .
Soberón, J. y Peterson, AT (2004). "Informática de la biodiversidad: gestión y aplicación de datos primarios de biodiversidad". Phil. Trans. R. Soc. Lond . B359 (1444): 689–698. doi :10.1098/rstb.2003.1439. PMC 1693343. PMID 15253354 .
Chapman, AD (2005). Usos de datos de ocurrencia de especies primarias (PDF) . Copenhague: Global Biodiversity Information Facility. pp. 1–106. Archivado desde el original (PDF) el 2010-02-16 . Consultado el 2009-08-12 .
Johnson, NF (2007). "Informática de la biodiversidad". Revista anual de entomología . 52 : 421–438. doi :10.1146/annurev.ento.52.110405.091259. PMID 16956323.
Sarkar, IN (2007). "Informática de la biodiversidad: organización y vinculación de la información a lo largo del espectro de la vida". Briefings in Bioinformatics . 8 (5): 347–357. doi : 10.1093/bib/bbm037 . hdl : 1912/1781 . PMID 17704120.
Guralnick, RP; Hill, A (2009). "Informática de la biodiversidad: enfoques automatizados para documentar patrones y procesos de biodiversidad global". Bioinformática . 25 (4): 421–428. doi : 10.1093/bioinformatics/btn659 . PMID 19129210.

Enlaces externos

Informática de la biodiversidad (revista)