La informática de la biodiversidad es la aplicación de técnicas informáticas a la información sobre biodiversidad , como la taxonomía , la biogeografía o la ecología . Se define como la aplicación de tecnologías de la información a la gestión, exploración algorítmica, análisis e interpretación de datos primarios sobre la vida, en particular a nivel de organización de especies. [1] Las técnicas informáticas modernas pueden producir nuevas formas de ver y analizar la información existente, así como predecir situaciones futuras (véase modelado de nichos ). La informática de la biodiversidad es un término que se acuñó recién alrededor de 1992 pero que con el rápido aumento de los conjuntos de datos se ha vuelto útil en numerosos estudios y aplicaciones, como la construcción de bases de datos taxonómicas o sistemas de información geográfica . La informática de la biodiversidad contrasta con la " bioinformática ", que a menudo se utiliza como sinónimo del manejo informático de datos en el área especializada de la biología molecular .
La informática de la biodiversidad (diferente pero vinculada a la bioinformática) es la aplicación de métodos de tecnología de la información a los problemas de organización, acceso, visualización y análisis de datos primarios de biodiversidad. Los datos primarios de biodiversidad están compuestos por nombres, observaciones y registros de especímenes, y datos genéticos y morfológicos asociados a un espécimen. La informática de la biodiversidad también puede tener que lidiar con la gestión de información de taxones sin nombre, como la producida por el muestreo ambiental y la secuenciación de muestras de campos mixtos. El término informática de la biodiversidad también se utiliza para cubrir los problemas computacionales específicos de los nombres de entidades biológicas, como el desarrollo de algoritmos para lidiar con representaciones variantes de identificadores como nombres de especies y autoridades, y los múltiples esquemas de clasificación dentro de los cuales estas entidades pueden residir de acuerdo con las preferencias de diferentes trabajadores en el campo, así como la sintaxis y la semántica mediante las cuales el contenido de las bases de datos taxonómicas puede hacerse consultable por máquina e interoperable para fines de informática de la biodiversidad...
Se puede considerar que la informática de la biodiversidad comenzó con la construcción de las primeras bases de datos taxonómicas computarizadas a principios de la década de 1970 y progresó a través del posterior desarrollo de herramientas de búsqueda distribuidas hacia fines de la década de 1990, incluido el Species Analyst de la Universidad de Kansas, la Red de Información sobre Biodiversidad de América del Norte (NABIN), CONABIO en México, INBio en Costa Rica y otros, [2] el establecimiento de la Facilidad Mundial de Información sobre Biodiversidad en 2001 y el desarrollo paralelo de una variedad de modelos de nicho y otras herramientas para operar con datos de biodiversidad digitalizados desde mediados de la década de 1980 en adelante (por ejemplo, consulte [3] ). En septiembre de 2000, la revista estadounidense Science dedicó un número especial a "Bioinformática para la biodiversidad", [4] la revista Biodiversity Informatics comenzó a publicarse en 2004, y varias conferencias internacionales a lo largo de la década de 2000 han reunido a profesionales de la informática de la biodiversidad, incluida la conferencia e-Biosphere de Londres en junio de 2009. Un suplemento de la revista BMC Bioinformatics (volumen 10, suplemento 14 [5] ) publicado en noviembre de 2009 también trata sobre la informática de la biodiversidad.
Según la correspondencia reproducida por Walter Berendsohn, [6] el término "Informática de la Biodiversidad" fue acuñado por John Whiting en 1992 para cubrir las actividades de una entidad conocida como el Consorcio Canadiense de Informática de la Biodiversidad, un grupo involucrado en la fusión de información básica sobre biodiversidad con economía ambiental e información geoespacial en forma de GPS y SIG . Posteriormente, parece haber perdido toda conexión obligada con el mundo GPS/SIG y estar asociado con la gestión computarizada de cualquier aspecto de la información sobre biodiversidad (por ejemplo, consulte [7] ).
Uno de los principales objetivos de la informática de la biodiversidad es la creación de una lista maestra completa de las especies actualmente reconocidas del mundo . Este objetivo se ha logrado en gran medida gracias al proyecto Catálogo de la Vida , que incluye más de 2 millones de especies en su Lista Anual de 2022. [8] Un esfuerzo similar para los taxones fósiles, la Base de Datos de Paleobiología [9] documenta más de 100.000 nombres de especies fósiles, de un número total desconocido.
La aplicación del sistema linneano de nomenclatura binomial para las especies y uninominal para los géneros y rangos superiores ha traído consigo muchas ventajas, pero también problemas con los homónimos (el mismo nombre que se utiliza para varios taxones, ya sea de forma inadvertida o legítima en varios reinos), los sinónimos (múltiples nombres para el mismo taxón), así como las representaciones variantes del mismo nombre debido a diferencias ortográficas, pequeños errores de ortografía, variación en la forma de citar los nombres de los autores y las fechas, y más. Además, los nombres pueden cambiar a través del tiempo debido a cambios en las opiniones taxonómicas (por ejemplo, la colocación genérica correcta de una especie o la elevación de una subespecie al rango de especie o viceversa), y también la circunscripción de un taxón puede cambiar según los conceptos taxonómicos de diferentes autores. Una solución propuesta a este problema es el uso de identificadores de ciencias de la vida ( LSID ) para fines de comunicación máquina-máquina, aunque hay tanto defensores como oponentes de este enfoque.
Los organismos pueden clasificarse de múltiples maneras (ver página principal Clasificación biológica ), lo que puede crear problemas de diseño para los sistemas de Informática de la Biodiversidad que apuntan a incorporar una clasificación única o múltiple para satisfacer las necesidades de los usuarios, o para guiarlos hacia un único sistema "preferido". Si un único sistema de clasificación de consenso puede lograrse es probablemente una pregunta abierta, sin embargo, el Catálogo de la Vida ha encargado una actividad en esta área [10] que ha sido reemplazada por un sistema publicado propuesto en 2015 por M. Ruggiero y colaboradores. [11]
Los mapas de biodiversidad proporcionan una representación cartográfica de los datos espaciales sobre biodiversidad. [12] Estos datos se pueden utilizar junto con las listas de especies para ayudar con los esfuerzos de conservación de la biodiversidad . Los mapas de biodiversidad pueden ayudar a revelar patrones de distribución de especies y cambios en el rango. Esto puede reflejar pérdida de biodiversidad, degradación del hábitat o cambios en la composición de las especies . Combinados con datos de desarrollo urbano , los mapas pueden informar la gestión de la tierra al modelar escenarios que podrían afectar la biodiversidad.
Los mapas de biodiversidad se pueden producir de diversas maneras: tradicionalmente, los mapas de distribución se dibujaban a mano basándose en informes de la literatura, pero cada vez más se utilizan datos a gran escala, por ejemplo, de proyectos de ciencia ciudadana (por ejemplo, iNaturalist ) y colecciones de museos digitalizadas (por ejemplo, VertNet). Las herramientas SIG como ArcGIS o los paquetes R como dismo pueden ayudar específicamente en el modelado de la distribución de especies (modelado de nicho ecológico) e incluso predecir los impactos del cambio ecológico en la biodiversidad. [13] GBIF , OBIS y la UICN son grandes repositorios basados en la web de datos espacio-temporales de especies que sirven de fuente a muchos mapas de biodiversidad existentes.
La información "primaria" sobre la biodiversidad puede considerarse como los datos básicos sobre la presencia y diversidad de especies (o, de hecho, cualquier taxón reconocible), comúnmente asociados con información sobre su distribución en el espacio, el tiempo o ambos. Dicha información puede presentarse en forma de especímenes conservados e información asociada, por ejemplo, tal como se reúne en las colecciones de historia natural de museos y herbarios , o como registros de observación, por ejemplo, ya sea de estudios formales de fauna o florística realizados por biólogos profesionales y estudiantes, o como observaciones amateurs y otras observaciones planificadas o no planificadas, incluidas las que cada vez más se incluyen en el ámbito de la ciencia ciudadana . Proporcionar acceso digital coherente en línea a esta vasta colección de datos primarios dispares es una función central de la informática de la biodiversidad que está en el corazón de las redes de datos de biodiversidad regionales y globales, ejemplos de esto último incluyen OBIS y GBIF .
Como fuente secundaria de datos sobre biodiversidad, la literatura científica relevante puede ser analizada por humanos o (potencialmente) por algoritmos especializados de recuperación de información para extraer la información primaria relevante sobre biodiversidad que se informa en ella, a veces en forma agregada/resumida pero con frecuencia como observaciones primarias en forma narrativa o tabular. Los elementos de dicha actividad (como la extracción de identificadores taxonómicos clave, palabras clave/ términos de índice , etc.) se han practicado durante muchos años a un nivel superior por bases de datos académicas seleccionadas y motores de búsqueda . Sin embargo, para el máximo valor de la informática de la biodiversidad, los datos de ocurrencia primarios reales idealmente deberían recuperarse y luego ponerse a disposición en una forma o formas estandarizadas; por ejemplo, los proyectos Plazi e INOTAXA están transformando la literatura taxonómica en formatos XML que luego pueden ser leídos por aplicaciones cliente, el primero usando TaxonX-XML [15] y el segundo usando el formato taXMLit. La Biblioteca del Patrimonio de la Biodiversidad también está logrando avances significativos en su objetivo de digitalizar porciones sustanciales de la literatura taxonómica fuera de derechos de autor, que luego se somete a reconocimiento óptico de caracteres (OCR) para poder procesarla posteriormente mediante herramientas informáticas de la biodiversidad.
Al igual que otras disciplinas relacionadas con los datos, la informática de la biodiversidad se beneficia de la adopción de estándares y protocolos adecuados para respaldar la transmisión de información entre máquinas y la interoperabilidad de la información dentro de su dominio particular. Algunos ejemplos de estándares relevantes incluyen el esquema Darwin Core XML para datos de biodiversidad basados en especímenes y observaciones desarrollado a partir de 1998, más extensiones del mismo, el esquema de transferencia de conceptos taxonómicos [16] , más los estándares para datos descriptivos estructurados [17] y el acceso a datos de colecciones biológicas (ABCD); [18] mientras que los protocolos de recuperación y transferencia de datos incluyen DiGIR (ahora en su mayoría reemplazado) y TAPIR (TDWG Access Protocol for Information Retrieval). [19] Muchos de estos estándares y protocolos son mantenidos actualmente, y su desarrollo supervisado, por Biodiversity Information Standards (TDWG) .
En la conferencia e-Biosphere de 2009 en el Reino Unido, [20] se adoptaron los siguientes temas, que son indicativos de una amplia gama de actividades actuales en materia de informática de la biodiversidad y de cómo podrían clasificarse:
Un taller posterior a la conferencia de personas clave con importantes roles actuales en informática de la biodiversidad también dio como resultado una Resolución del taller que destacó, entre otros aspectos, la necesidad de crear registros globales duraderos para los recursos que son básicos para la informática de la biodiversidad (por ejemplo, repositorios, colecciones); completar la construcción de una infraestructura taxonómica sólida; y crear ontologías para datos de biodiversidad. [21]
Global:
Proyectos regionales/nacionales:
En la base de datos "Proyectos de información sobre biodiversidad del mundo" del TDWG se puede encontrar una lista de más de 600 actividades actuales relacionadas con la informática sobre biodiversidad. [22]
{{cite web}}
: CS1 maint: copia archivada como título ( enlace )