El código de barras de ADN es un método de identificación de especies que utiliza una pequeña sección de ADN de un gen o genes específicos. La premisa del código de barras de ADN es que, en comparación con una biblioteca de referencia de dichas secciones de ADN (también llamadas " secuencias "), una secuencia individual puede utilizarse para identificar de forma única un organismo por especie, de la misma manera que un escáner de supermercado utiliza las conocidas rayas negras del código de barras UPC para identificar un artículo en su stock en relación con su base de datos de referencia. [1] Estos "códigos de barras" a veces se utilizan en un esfuerzo por identificar especies o partes desconocidas de un organismo, simplemente para catalogar tantos taxones como sea posible, o para comparar con la taxonomía tradicional en un esfuerzo por determinar los límites de las especies. [2]
Se utilizan diferentes regiones genéticas para identificar los diferentes grupos de organismos mediante códigos de barras. La región de código de barras más utilizada para animales y algunos protistas es una porción del gen de la citocromo c oxidasa I (COI o COX1 ), que se encuentra en el ADN mitocondrial . Otros genes adecuados para el código de barras del ADN son el ARNr espaciador transcrito interno (ITS) , que se utiliza a menudo para los hongos, y el RuBisCO, que se utiliza para las plantas. [3] [4] [5] Los microorganismos se detectan utilizando diferentes regiones genéticas. El gen del ARNr 16S , por ejemplo, se utiliza ampliamente en la identificación de procariotas, mientras que el gen del ARNr 18S se utiliza principalmente para detectar eucariotas microbianos . Estas regiones genéticas se eligen porque tienen menos variación intraespecífica (dentro de las especies) que la variación interespecífica (entre especies), lo que se conoce como "brecha de código de barras". [6]
Algunas aplicaciones del código de barras de ADN incluyen: identificar hojas de plantas incluso cuando no hay flores o frutos disponibles; identificar polen recolectado en los cuerpos de animales polinizadores; identificar larvas de insectos que pueden tener menos caracteres diagnósticos que los adultos; o investigar la dieta de un animal basándose en el contenido de su estómago, saliva o heces. [7] Cuando se utiliza el código de barras para identificar organismos a partir de una muestra que contiene ADN de más de un organismo, se utiliza el término metacodificación de barras de ADN , [8] [9] por ejemplo, metacodificación de barras de ADN de comunidades de diatomeas en ríos y arroyos, que se utiliza para evaluar la calidad del agua. [10]
Las técnicas de código de barras de ADN se desarrollaron a partir de trabajos tempranos de secuenciación de ADN en comunidades microbianas utilizando el gen ARNr 5S. [11] En 2003, se propusieron métodos específicos y terminología de código de barras de ADN moderno como un método estandarizado para identificar especies, así como potencialmente asignar secuencias desconocidas a taxones superiores como órdenes y filos, en un artículo de Paul DN Hebert et al. de la Universidad de Guelph , Ontario , Canadá . [12] Hebert y sus colegas demostraron la utilidad del gen de la citocromo c oxidasa I (COI), utilizado por primera vez por Folmer et al. en 1994, utilizando sus cebadores de ADN publicados como una herramienta para análisis filogenéticos a nivel de especie [12] como una herramienta discriminatoria adecuada entre invertebrados metazoarios. [13] La "región Folmer" del gen COI se utiliza comúnmente para la distinción entre taxones en función de sus patrones de variación a nivel de ADN. La relativa facilidad de recuperación de la secuencia y la variabilidad combinada con la conservación entre especies son algunas de las ventajas de los COI. Hebert et al., que denominaron a los perfiles "códigos de barras", previeron el desarrollo de una base de datos de COI que podría servir de base para un "sistema de bioidentificación global".
La codificación por barras se puede realizar a partir de tejido de una muestra de interés, de una mezcla de organismos (muestra a granel) o de ADN presente en muestras ambientales (por ejemplo, agua o suelo). Los métodos de muestreo, conservación o análisis difieren entre los distintos tipos de muestra.
Muestras de tejido
Para codificar con código de barras una muestra de tejido de la muestra de destino, es probable que sea suficiente un pequeño trozo de piel, una escama, una pata o una antena (según el tamaño de la muestra). Para evitar la contaminación, es necesario esterilizar las herramientas utilizadas entre muestras. Se recomienda tomar dos muestras de una muestra, una para archivar y otra para el proceso de codificación con código de barras. La conservación de las muestras es fundamental para superar el problema de la degradación del ADN.
Muestras a granel
Una muestra a granel es un tipo de muestra ambiental que contiene varios organismos del grupo taxonómico en estudio. La diferencia entre las muestras a granel (en el sentido que se utiliza aquí) y otras muestras ambientales es que la muestra a granel suele proporcionar una gran cantidad de ADN de buena calidad. Entre los ejemplos de muestras a granel se incluyen las muestras de macroinvertebrados acuáticos recogidas con redes de pesca o las muestras de insectos recogidas con una trampa Malaise. Las muestras de agua filtradas o fraccionadas por tamaño que contienen organismos completos, como los eucariotas unicelulares, también se definen a veces como muestras a granel. Dichas muestras se pueden recoger mediante las mismas técnicas que se utilizan para obtener muestras tradicionales para la identificación basada en la morfología.
Muestras de eADN
El método de ADN ambiental (eDNA) es un método no invasivo para detectar e identificar especies a partir de restos celulares o ADN extracelular presente en muestras ambientales (por ejemplo, agua o suelo) a través de códigos de barras o metacódigos de barras. El método se basa en el hecho de que cada organismo vivo deja ADN en el medio ambiente, y este ADN ambiental se puede detectar incluso en organismos que se encuentran en muy baja abundancia. Por lo tanto, para el muestreo de campo, la parte más crucial es utilizar material y herramientas libres de ADN en cada sitio de muestreo o muestra para evitar la contaminación, si es probable que el ADN del organismo u organismos objetivo esté presente en bajas cantidades. Por otro lado, una muestra de eDNA siempre incluye el ADN de microorganismos vivos de células completas, que a menudo están presentes en grandes cantidades. Por lo tanto, las muestras de microorganismos tomadas en el entorno natural también se denominan muestras de eDNA, pero la contaminación es menos problemática en este contexto debido a la gran cantidad de organismos objetivo. El método de eDNA se aplica en la mayoría de los tipos de muestras, como agua, sedimento, suelo, heces de animales, contenido estomacal o sangre de, por ejemplo, sanguijuelas. [14]
La codificación de barras de ADN requiere que se extraiga el ADN de la muestra. Existen varios métodos de extracción de ADN diferentes y factores como el costo, el tiempo, el tipo de muestra y el rendimiento afectan la selección del método óptimo.
Cuando se amplifica ADN de muestras de organismos o de eADN mediante la reacción en cadena de la polimerasa (PCR), la reacción puede verse afectada negativamente por las moléculas inhibidoras contenidas en la muestra. [15] La eliminación de estos inhibidores es crucial para garantizar que haya ADN de alta calidad disponible para su posterior análisis.
La amplificación del ADN extraído es un paso necesario en la codificación del ADN. Normalmente, solo se secuencia un pequeño fragmento del material total de ADN (normalmente 400–800 pares de bases ) [16] para obtener el código de barras del ADN. La amplificación del material de eADN suele centrarse en fragmentos de menor tamaño (<200 pares de bases), ya que es más probable que el eADN esté fragmentado que el material de ADN de otras fuentes. Sin embargo, algunos estudios sostienen que no existe una relación entre el tamaño del amplicón y la tasa de detección de eADN. [17] [18]
Una vez amplificada la región marcadora del código de barras de ADN, el siguiente paso es secuenciar la región marcadora utilizando métodos de secuenciación de ADN . [19] Hay muchas plataformas de secuenciación diferentes disponibles y el desarrollo técnico avanza rápidamente.
Los marcadores utilizados para la codificación de ADN se denominan códigos de barras. Para caracterizar con éxito las especies basándose en códigos de barras de ADN, la selección de regiones de ADN informativas es crucial. Un buen código de barras de ADN debe tener una variabilidad intraespecífica baja y una variabilidad interespecífica alta [12] y poseer sitios flanqueantes conservados para desarrollar cebadores de PCR universales para una amplia aplicación taxonómica . El objetivo es diseñar cebadores que detecten y distingan la mayoría o todas las especies en el grupo de organismos estudiado (alta resolución taxonómica). La longitud de la secuencia del código de barras debe ser lo suficientemente corta para ser utilizada con la fuente de muestreo actual, la extracción de ADN , los métodos de amplificación y secuenciación . [20]
Lo ideal sería utilizar una única secuencia genética para todos los grupos taxonómicos, desde los virus hasta las plantas y los animales . Sin embargo, todavía no se ha encontrado una región genética de este tipo, por lo que se utilizan diferentes códigos de barras para distintos grupos de organismos, [ cita requerida ] o según la pregunta del estudio.
En el caso de los animales, el código de barras más utilizado es el locus mitocondrial de la citocromo C oxidasa I ( COI ). [21] También se utilizan otros genes mitocondriales, como Cytb , 12S o 16S . Los genes mitocondriales se prefieren a los genes nucleares debido a su falta de intrones , su modo de herencia haploide y su recombinación limitada . [21] [22] Además, cada célula tiene varias mitocondrias (hasta varios miles) y cada una de ellas contiene varias moléculas de ADN circulares . Por lo tanto, las mitocondrias pueden ofrecer una fuente abundante de ADN incluso cuando la muestra de tejido es limitada. [ cita requerida ]
En las plantas, sin embargo, los genes mitocondriales no son apropiados para el código de barras de ADN porque exhiben bajas tasas de mutación . [23] Se han encontrado algunos genes candidatos en el genoma del cloroplasto , siendo el más prometedor el gen de la madurasa K ( matK ) por sí solo o en asociación con otros genes. También se han utilizado marcadores de múltiples locus como los espaciadores transcritos internos ribosomales (ADN ITS) junto con matK , rbcL , trnH u otros genes para la identificación de especies. [ cita requerida ] La mejor discriminación entre especies de plantas se ha logrado al utilizar dos o más códigos de barras de cloroplasto. [24]
Para las bacterias , el gen de la subunidad pequeña del ARN ribosómico ( 16S ) se puede utilizar para diferentes taxones, ya que está altamente conservado. [25] Algunos estudios sugieren que el COI , [26] la chaperonina tipo II ( cpn60 ) [27] o la subunidad β de la ARN polimerasa ( rpoB ) [28] también podrían servir como códigos de barras de ADN bacteriano.
La codificación de barras de los hongos es más complicada y puede ser necesaria más de una combinación de cebadores. [29] El marcador COI funciona bien en ciertos grupos de hongos, [30] pero no tan bien en otros. [31] Por lo tanto, se están utilizando marcadores adicionales, como el ADNr ITS y la subunidad grande del ARN ribosómico nuclear (ARNr LSU 28S). [32]
Dentro del grupo de los protistos , se han propuesto varios códigos de barras, como las regiones D1–D2 o D2–D3 del gen 28S rDNA , la subregión V4 del gen 18S rRNA , el gen ITS rDNA y COI . Además, se pueden utilizar algunos códigos de barras específicos para los protistos fotosintéticos , por ejemplo, el gen de la subunidad grande de la ribulosa-1,5-bisfosfato carboxilasa-oxigenasa ( rbcL ) y el gen cloroplástico 23S rRNA . [ cita requerida ]
Las bibliotecas de referencia se utilizan para la identificación taxonómica, también llamada anotación, de secuencias obtenidas a partir de códigos de barras o metacodificación de barras. Estas bases de datos contienen los códigos de barras de ADN asignados a taxones previamente identificados. La mayoría de las bibliotecas de referencia no cubren todas las especies dentro de un grupo de organismos, y continuamente se crean nuevas entradas. En el caso de macro y muchos microorganismos (como las algas), estas bibliotecas de referencia requieren documentación detallada (ubicación y fecha de muestreo, persona que lo recolectó, imagen, etc.) e identificación taxonómica autorizada del espécimen de referencia, así como el envío de secuencias en un formato particular. Sin embargo, tales estándares se cumplen solo para un pequeño número de especies. El proceso también requiere el almacenamiento de especímenes de referencia en colecciones de museos, herbarios y otras instituciones colaboradoras. Tanto la cobertura taxonómicamente completa como la calidad del contenido son importantes para la precisión de la identificación. [33] En el mundo microbiano, no hay información de ADN para la mayoría de los nombres de especies, y muchas secuencias de ADN no se pueden asignar a ningún binomio linneano . [34] Existen varias bases de datos de referencia según el grupo de organismos y el marcador genético utilizado. Existen bases de datos nacionales más pequeñas (por ejemplo, FinBOL) y grandes consorcios como el Proyecto Internacional de Código de Barras de la Vida (iBOL). [35]
ATREVIDO
Lanzado en 2007, el Barcode of Life Data System (BOLD) [36] es una de las bases de datos más grandes, que contiene alrededor de 780 000 BIN (Barcode Index Numbers) en 2022. Es un repositorio de libre acceso para los registros de muestras y secuencias para estudios de códigos de barras, y también es un banco de trabajo que ayuda a la gestión, el control de calidad y el análisis de datos de códigos de barras. La base de datos contiene principalmente registros BIN para animales basados en el marcador genético COI. Para la identificación de plantas, BOLD acepta secuencias de matK y rbcL .
UNIR
La base de datos UNITE [37] se lanzó en 2003 y es una base de datos de referencia para la identificación molecular de especies fúngicas (y desde 2018 de todas las eucariotas) con la región marcadora genética del espaciador transcrito interno (ITS) del ribosoma nuclear. Esta base de datos se basa en el concepto de hipótesis de especies: usted elige el % en el que desea trabajar y las secuencias se ordenan en comparación con las secuencias obtenidas de especímenes de referencia identificados por expertos.
Diat.barcode [ enlace muerto permanente ]
La base de datos Diat.barcode [38] se publicó por primera vez con el nombre R-syst::diatom [39] en 2016, a partir de datos de dos fuentes: la colección de cultivos de Thonon (TCC) en la estación hidrobiológica del Instituto Nacional de Investigación Agrícola (INRA) de Francia, y de la base de datos de nucleótidos del NCBI (Centro Nacional de Información Biotecnológica). Diat.barcode proporciona datos para dos marcadores genéticos, rbc L (ribulosa-1,5-bisfosfato carboxilasa/oxigenasa) y 18S (ARN ribosómico 18S). La base de datos también incluye información adicional sobre las características de las especies, como características morfológicas (biovolumen, dimensiones de tamaño, etc.), formas de vida (movilidad, tipo de colonia, etc.) o características ecológicas (sensibilidad a la contaminación, etc.).
Para obtener datos bien estructurados, limpios e interpretables, los datos de secuenciación en bruto deben procesarse mediante análisis bioinformáticos. El archivo FASTQ con los datos de secuenciación contiene dos tipos de información: las secuencias detectadas en la muestra (archivo FASTA ) y un archivo de calidad con puntuaciones de calidad ( puntuaciones PHRED ) asociadas a cada nucleótido de cada secuencia de ADN. Las puntuaciones PHRED indican la probabilidad con la que el nucleótido asociado ha sido puntuado correctamente.
En general, la puntuación PHRED disminuye hacia el final de cada secuencia de ADN. Por ello, algunos procesos bioinformáticos simplemente cortan el final de las secuencias en un umbral definido.
Algunas tecnologías de secuenciación, como MiSeq, utilizan la secuenciación de extremos emparejados durante la cual la secuenciación se realiza desde ambas direcciones produciendo una mejor calidad. Las secuencias superpuestas se alinean luego en contigs y se fusionan. Por lo general, se agrupan varias muestras en una ejecución, y cada muestra se caracteriza por un fragmento de ADN corto, la etiqueta. En un paso de desmultiplexación, las secuencias se clasifican utilizando estas etiquetas para volver a ensamblar las muestras separadas. Antes de un análisis posterior, las etiquetas y otros adaptadores se eliminan del fragmento de ADN de la secuencia de código de barras. Durante el recorte, se eliminan las secuencias de mala calidad (puntuaciones PHRED bajas) o secuencias que son mucho más cortas o más largas que el código de barras de ADN objetivo. El siguiente paso de desreplicación es el proceso en el que todas las secuencias filtradas por calidad se colapsan en un conjunto de lecturas únicas (unidades de secuencia individuales ISU) con la información de su abundancia en las muestras. Después de eso, se detectan y eliminan las quimeras (es decir, secuencias compuestas formadas a partir de piezas de origen mixto). Finalmente, las secuencias se agrupan en OTU (Unidades Taxonómicas Operativas), utilizando una de las muchas estrategias de agrupamiento. Los programas bioinformáticos más utilizados incluyen Mothur, [40] Uparse, [41] Qiime, [42] Galaxy, [43] Obitools, [44] JAMP, [45] Barque, [46] y DADA2. [47]
Comparar la abundancia de lecturas, es decir, secuencias, entre diferentes muestras sigue siendo un desafío porque tanto el número total de lecturas en una muestra como la cantidad relativa de lecturas para una especie pueden variar entre muestras, métodos u otras variables. Para la comparación, se puede reducir el número de lecturas de cada muestra al número mínimo de lecturas de las muestras que se van a comparar, un proceso llamado rarefacción. Otra forma es utilizar la abundancia relativa de lecturas. [48]
La asignación taxonómica de las OTU a las especies se logra mediante la comparación de secuencias con bibliotecas de referencia. La herramienta de búsqueda de alineamiento local básico (BLAST) se utiliza comúnmente para identificar regiones de similitud entre secuencias mediante la comparación de lecturas de secuencias de la muestra con secuencias en bases de datos de referencia. [49] Si la base de datos de referencia contiene secuencias de las especies relevantes, entonces las secuencias de muestra se pueden identificar a nivel de especie. Si una secuencia no se puede comparar con una entrada de biblioteca de referencia existente, se puede utilizar el código de barras de ADN para crear una nueva entrada.
En algunos casos, debido a que las bases de datos de referencia son incompletas, la identificación solo se puede lograr en niveles taxonómicos superiores, como la asignación a una familia o clase. En algunos grupos de organismos, como las bacterias, la asignación taxonómica a nivel de especie a menudo no es posible. En tales casos, una muestra puede asignarse a una unidad taxonómica operativa (UTO) particular .
En algunos casos, los especímenes con códigos de barras de ADN idénticos (COI) pertenecen claramente a especies diferentes, por ejemplo, especies del género de peces Chromis . [50]
Las aplicaciones del código de barras de ADN incluyen la identificación de nuevas especies , la evaluación de la seguridad de los alimentos, la identificación y evaluación de especies crípticas, la detección de especies exóticas, la identificación de especies en peligro y amenazadas , [51] la vinculación de las etapas de huevo y larva con las especies adultas, la protección de los derechos de propiedad intelectual de los recursos biológicos, la elaboración de planes de gestión global para estrategias de conservación, la dilucidación de nichos de alimentación, [52] y la ciencia forense. [53] Los marcadores de código de barras de ADN se pueden aplicar para abordar cuestiones básicas en sistemática, ecología , biología evolutiva y conservación , incluido el ensamblaje de comunidades, redes de interacción de especies , descubrimiento taxonómico y evaluación de áreas prioritarias para la protección ambiental .
Las secuencias cortas específicas de ADN o marcadores de una región estandarizada del genoma pueden proporcionar un código de barras de ADN para identificar especies. [54] Los métodos moleculares son especialmente útiles cuando los métodos tradicionales no son aplicables. El código de barras de ADN tiene una gran aplicabilidad en la identificación de larvas para las que generalmente hay pocos caracteres diagnósticos disponibles, y en la asociación de diferentes etapas de vida (por ejemplo, larva y adulto) en muchos animales. [55] La identificación de especies incluidas en los apéndices de la Convención sobre el Comercio Internacional de Especies Amenazadas de Fauna y Flora Silvestres ( CITES ) mediante técnicas de código de barras se utiliza en el seguimiento del comercio ilegal. [56]
Las especies exóticas pueden detectarse mediante códigos de barras. [57] [58] Los códigos de barras pueden ser adecuados para la detección de especies, por ejemplo, en el control fronterizo, donde a menudo no es posible una identificación morfológica rápida y precisa debido a las similitudes entre diferentes especies, la falta de características diagnósticas suficientes [57] y/o la falta de experiencia taxonómica. Los códigos de barras y metacódigos de barras también pueden utilizarse para examinar los ecosistemas en busca de especies invasoras y para distinguir entre una especie invasora y una especie nativa morfológicamente similar. [59] Se demuestra la alta eficiencia de la identificación de ADN en relación con el seguimiento tradicional de las invasiones biológicas. [60]
El código de barras de ADN permite la identificación y el reconocimiento de especies crípticas . [61] Sin embargo, los resultados de los análisis de código de barras de ADN dependen de la elección de los métodos analíticos, por lo que el proceso de delimitación de especies crípticas mediante códigos de barras de ADN puede ser tan subjetivo como cualquier otra forma de taxonomía . Hebert et al. (2004) concluyeron que la mariposa Astraptes fulgerator en el noroeste de Costa Rica en realidad consta de 10 especies diferentes. [62] Sin embargo, estos resultados fueron posteriormente cuestionados por Brower (2006), quien señaló numerosos fallos graves en el análisis y concluyó que los datos originales no podían respaldar más que la posibilidad de tres a siete taxones crípticos en lugar de diez especies crípticas. [63] Smith et al. (2007) utilizaron códigos de barras de ADN de la citocromo c oxidasa I para la identificación de especies de las 20 morfoespecies de moscas parasitoides de Belvosia ( Diptera : Tachinidae ) criadas a partir de orugas ( Lepidoptera ) en el Área de Conservación Guanacaste (ACG), noroeste de Costa Rica. Estos autores descubrieron que los códigos de barras elevan el recuento de especies a 32, al revelar que cada una de las tres especies de parasitoides , previamente consideradas como generalistas, en realidad son conjuntos de especies crípticas altamente específicas del hospedador. [64] Para 15 morfoespecies de poliquetos dentro del bentos antártico profundo estudiados a través de códigos de barras de ADN, se encontró diversidad críptica en el 50% de los casos. Además, se detectaron 10 morfoespecies previamente pasadas por alto, lo que aumentó la riqueza total de especies en la muestra en un 233%. [65]
El código de barras de ADN y el metacódigo de barras pueden ser útiles en estudios de análisis de dietas, [66] y se utilizan típicamente si los especímenes de presas no pueden identificarse basándose en caracteres morfológicos. [67] [68] Hay una variedad de enfoques de muestreo en el análisis de dietas: el metacódigo de barras de ADN se puede realizar en el contenido del estómago, [69] heces, [68] [70] saliva [71] o análisis de cuerpo entero. [51] [72] En muestras fecales o contenido estomacal altamente digerido, a menudo no es posible distinguir el tejido de especies individuales y, por lo tanto, se puede aplicar el metacódigo de barras en su lugar. [68] [73] Las heces o la saliva representan enfoques de muestreo no invasivos, mientras que el análisis de cuerpo entero a menudo significa que el individuo necesita ser asesinado primero. Para organismos más pequeños, la secuenciación del contenido del estómago se realiza a menudo secuenciando el animal entero.
El código de barras de ADN representa una herramienta esencial para evaluar la calidad de los productos alimenticios. El objetivo es garantizar la trazabilidad de los alimentos, minimizar la piratería alimentaria y valorizar la producción agroalimentaria local y típica. Otro objetivo es salvaguardar la salud pública; por ejemplo, el metacódigo de barras ofrece la posibilidad de identificar meros causantes de la intoxicación por ciguatera a partir de restos de harina [74] , o de separar hongos venenosos de los comestibles (Ref).
Los códigos de barras de ADN se pueden utilizar para evaluar la presencia de especies en peligro de extinción para esfuerzos de conservación (Ref), o la presencia de especies indicadoras que reflejan condiciones ecológicas específicas (Ref), por ejemplo, exceso de nutrientes o niveles bajos de oxígeno.
El código de barras de ADN se utiliza a menudo para la identificación de especies en casos de ciencia forense . Se pueden encontrar, recolectar e identificar muestras de animales o plantas desconocidas en escenas del crimen, con la esperanza de vincularlas a un sospechoso y obtener una condena. [75] La caza furtiva , la matanza de especies en peligro de extinción y el maltrato animal son ejemplos de delitos en los que se utiliza el código de barras de ADN, ya que a menudo se encuentra ADN animal. [53] [76] Por otro lado, el ADN vegetal se utiliza generalmente como evidencia traza para vincular a un sospechoso con una escena del crimen. [77]
Los métodos tradicionales de bioevaluación están bien establecidos a nivel internacional y son útiles para la biomonitorización, como por ejemplo para la bioevaluación acuática dentro de las Directivas de la UE WFD y MSFD . Sin embargo, el código de barras de ADN podría mejorar los métodos tradicionales por las siguientes razones: el código de barras de ADN (i) puede aumentar la resolución taxonómica y armonizar la identificación de taxones que son difíciles de identificar o carecen de expertos, (ii) puede relacionar de manera más precisa los factores ambientales con taxones específicos (iii) puede aumentar la comparabilidad entre regiones, (iv) permite la inclusión de etapas tempranas de vida y especímenes fragmentados, (v) permite la delimitación de especies crípticas /raras (vi) permite el desarrollo de nuevos índices, por ejemplo, especies raras/crípticas que pueden ser sensibles/tolerantes a los factores estresantes , (vii) aumenta el número de muestras que se pueden procesar y reduce el tiempo de procesamiento, lo que resulta en un mayor conocimiento de la ecología de las especies, (viii) es una forma no invasiva de monitoreo cuando se utilizan métodos de eADN . [78]
El código de barras de ADN es más rápido que los métodos morfológicos tradicionales desde el entrenamiento hasta la asignación taxonómica. Se necesita menos tiempo para adquirir experiencia en métodos de ADN que para convertirse en un experto en taxonomía. Además, el flujo de trabajo del código de barras de ADN (es decir, desde la muestra hasta el resultado) es generalmente más rápido que el flujo de trabajo morfológico tradicional y permite el procesamiento de más muestras.
Los códigos de barras de ADN permiten la resolución de taxones desde niveles taxonómicos superiores (por ejemplo, familia) a inferiores (por ejemplo, especie), que de otro modo son demasiado difíciles de identificar utilizando métodos morfológicos tradicionales, como por ejemplo la identificación mediante microscopía. Por ejemplo, los quironómidos (el mosquito que no pica) están ampliamente distribuidos tanto en ecosistemas terrestres como de agua dulce. Su riqueza y abundancia los hacen importantes para los procesos y redes ecológicas, y son uno de los muchos grupos de invertebrados utilizados en el biomonitoreo. Las muestras de invertebrados pueden contener hasta 100 especies de quironómidos que a menudo constituyen hasta el 50% de una muestra. A pesar de esto, generalmente no se identifican por debajo del nivel de familia debido a la experiencia taxonómica y el tiempo requerido. [79] Esto puede dar como resultado diferentes especies de quironómidos con diferentes preferencias ecológicas agrupadas, lo que resulta en una evaluación inexacta de la calidad del agua.
El código de barras de ADN proporciona la oportunidad de resolver taxones y relacionar directamente los efectos de los factores estresantes con taxones específicos, como especies individuales de quironómidos. Por ejemplo, Beermann et al. (2018) codificaron con barras de ADN a los quironómidos para investigar su respuesta a múltiples factores estresantes: reducción del flujo, aumento de los sedimentos finos y aumento de la salinidad. [80] Después del código de barras, se encontró que la muestra de quironómidos constaba de 183 unidades taxonómicas operativas (OTU), es decir, códigos de barras (secuencias) que a menudo son equivalentes a especies morfológicas. Estas 183 OTU mostraron 15 tipos de respuesta en lugar de los dos tipos de respuesta informados anteriormente [81] registrados cuando todos los quironómidos se agruparon en el mismo estudio de múltiples factores estresantes. Una tendencia similar se descubrió en un estudio de Macher et al. (2016) que descubrió una diversidad críptica dentro de la especie de efímera de Nueva Zelanda Deleatidium sp . Este estudio encontró diferentes patrones de respuesta de 12 OTU moleculares distintas a factores estresantes que pueden cambiar el consenso de que esta efímera es sensible a la contaminación. [82]
A pesar de las ventajas que ofrece el código de barras de ADN, también se ha sugerido que es mejor utilizarlo como complemento a los métodos morfológicos tradicionales. [78] Esta recomendación se basa en múltiples desafíos percibidos.
No es completamente sencillo relacionar los códigos de barras de ADN con las preferencias ecológicas del taxón en cuestión, como es necesario si se va a utilizar el código de barras para la biovigilancia. Por ejemplo, la detección de ADN objetivo en sistemas acuáticos depende de la concentración de moléculas de ADN en un sitio, que a su vez puede verse afectada por muchos factores. La presencia de moléculas de ADN también depende de la dispersión en un sitio, por ejemplo, la dirección o la fuerza de las corrientes. No se sabe realmente cómo se mueve el ADN en arroyos y lagos, lo que dificulta el muestreo. Otro factor podría ser el comportamiento de las especies objetivo, por ejemplo, los peces pueden tener cambios estacionales de movimientos, los cangrejos de río o los mejillones liberarán ADN en mayores cantidades solo en ciertos momentos de su vida (muda, desove). En cuanto al ADN en el suelo, se sabe aún menos sobre la distribución, la cantidad o la calidad.
La principal limitación del método de código de barras es que se basa en bibliotecas de referencia de código de barras para la identificación taxonómica de las secuencias. La identificación taxonómica es precisa solo si se dispone de una referencia confiable. Sin embargo, la mayoría de las bases de datos aún están incompletas, especialmente para organismos más pequeños, por ejemplo, hongos, fitoplancton, nematodos, etc. Además, las bases de datos actuales contienen identificaciones erróneas, errores ortográficos y otros errores. Existe un esfuerzo masivo de curación y finalización en torno a las bases de datos para todos los organismos necesarios, lo que implica grandes proyectos de código de barras (por ejemplo, el proyecto iBOL para la base de datos de referencia Barcode of Life Data Systems (BOLD)). [83] [84] Sin embargo, la finalización y la curación son difíciles y consumen mucho tiempo. Sin especímenes comprobados, no puede haber certeza sobre si la secuencia utilizada como referencia es correcta.
Las bases de datos de secuencias de ADN como GenBank contienen muchas secuencias que no están vinculadas a especímenes registrados (por ejemplo, especímenes de herbario, líneas celulares cultivadas o, a veces, imágenes). Esto es problemático de cara a cuestiones taxonómicas como si varias especies deben dividirse o combinarse, o si las identificaciones anteriores fueron correctas. La reutilización de secuencias, no vinculadas a especímenes registrados, de organismos inicialmente mal identificados puede respaldar conclusiones incorrectas y debe evitarse. [85] Por lo tanto, la mejor práctica para el código de barras de ADN es secuenciar especímenes registrados. [86] [87] Sin embargo, para muchos taxones puede ser difícil obtener especímenes de referencia, por ejemplo, con especímenes que son difíciles de capturar, los especímenes disponibles están mal conservados o falta experiencia taxonómica adecuada. [85]
Es importante destacar que los códigos de barras de ADN también se pueden utilizar para crear una taxonomía provisional, en cuyo caso las OTU se pueden utilizar como sustitutos de los binomios latinos tradicionales, lo que reduce significativamente la dependencia de bases de datos de referencia completamente pobladas. [88]
El código de barras de ADN también conlleva sesgo metodológico, desde el muestreo hasta el análisis de datos bioinformáticos . Además del riesgo de contaminación de la muestra de ADN por inhibidores de PCR, el sesgo de cebadores es una de las principales fuentes de errores en el código de barras de ADN. [89] [90] El aislamiento de un marcador de ADN eficiente y el diseño de cebadores es un proceso complejo y se ha realizado un esfuerzo considerable para desarrollar cebadores para el código de barras de ADN en diferentes grupos taxonómicos. [91] Sin embargo, los cebadores a menudo se unirán preferentemente a algunas secuencias, lo que lleva a una eficiencia y especificidad diferenciales del cebador y a una evaluación de comunidades no representativas e inflación de la riqueza. [92] Por lo tanto, la composición de las secuencias de las comunidades de la muestra se altera principalmente en el paso de PCR. Además, a menudo se requiere la replicación de PCR, pero conduce a un aumento exponencial del riesgo de contaminación. Varios estudios han destacado la posibilidad de utilizar muestras enriquecidas con mitocondrias [93] [94] o enfoques sin PCR para evitar estos sesgos, pero a partir de 2018 [actualizar], la técnica de metabarcoding de ADN todavía se basa en la secuenciación de amplicones. [91] Otros sesgos entran en escena durante la secuenciación y durante el procesamiento bioinformático de las secuencias, como la creación de quimeras.
Aunque el código de barras de ADN se utiliza y aplica más ampliamente, no hay acuerdo sobre los métodos de conservación o extracción de ADN, la elección de marcadores de ADN y conjuntos de cebadores, o protocolos de PCR. Los parámetros de los procesos bioinformáticos (por ejemplo, agrupamiento de OTU, algoritmos de asignación taxonómica o umbrales, etc.) son el origen de muchos debates entre los usuarios de códigos de barras de ADN. [91] Las tecnologías de secuenciación también están evolucionando rápidamente, junto con las herramientas para el análisis de las enormes cantidades de datos de ADN generados, y se necesita urgentemente la estandarización de los métodos para permitir la colaboración y el intercambio de datos a mayor escala espacial y temporal. Esta estandarización de los métodos de códigos de barras a escala europea forma parte de los objetivos de la Acción Europea COST DNAqua-net [95] y también está siendo abordada por el CEN (Comité Europeo de Normalización). [96]
Otra crítica al código de barras de ADN es su limitada eficiencia para la discriminación precisa por debajo del nivel de especie (por ejemplo, para distinguir entre variedades), para la detección de híbridos, y que puede verse afectado por las tasas evolutivas [ cita requerida ] .
Es importante saber que las listas de taxones derivadas por identificación convencional (morfológica) no son, y tal vez nunca lo serán, directamente comparables con las listas de taxones derivadas de la identificación basada en códigos de barras debido a varias razones. La causa más importante es probablemente la incompletitud y falta de precisión de las bases de datos de referencia molecular que impiden una asignación taxonómica correcta de las secuencias de eDNA. Los taxones que no están presentes en las bases de datos de referencia no serán encontrados por eDNA, y las secuencias vinculadas a un nombre incorrecto conducirán a una identificación incorrecta. [78] Otras causas conocidas son una escala y tamaño de muestreo diferentes entre una muestra tradicional y una molecular, el posible análisis de organismos muertos, que puede ocurrir de diferentes maneras para ambos métodos dependiendo del grupo de organismos, y la selección específica de identificación en cada método, es decir, la experiencia taxonómica variable o la posibilidad de identificar ciertos grupos de organismos, respectivamente, el sesgo de cebadores que conduce también a un posible análisis sesgado de taxones. [78]
La codificación de barras de ADN puede dar como resultado una sobreestimación o subestimación de la riqueza y diversidad de especies. Algunos estudios sugieren que los artefactos (identificación de especies no presentes en una comunidad) son una causa importante de la biodiversidad inflada. [97] [98] El problema más problemático son los taxones representados por un bajo número de lecturas de secuenciación. Estas lecturas suelen eliminarse durante el proceso de filtrado de datos, ya que diferentes estudios sugieren que la mayoría de estas lecturas de baja frecuencia pueden ser artefactos. [99] Sin embargo, pueden existir taxones realmente raros entre estas lecturas de baja abundancia. [100] Las secuencias raras pueden reflejar linajes únicos en las comunidades que las convierten en secuencias informativas y valiosas. Por lo tanto, existe una gran necesidad de algoritmos bioinformáticos más robustos que permitan la diferenciación entre lecturas informativas y artefactos. Las bibliotecas de referencia completas también permitirían una mejor prueba de los algoritmos bioinformáticos, al permitir un mejor filtrado de artefactos (es decir, la eliminación de secuencias que carecen de una contraparte entre las especies existentes) y, por lo tanto, sería posible obtener una asignación de especies más precisa. [101] La diversidad críptica también puede dar lugar a una biodiversidad inflada, ya que una especie morfológica puede en realidad dividirse en muchas secuencias moleculares distintas. [78] Esto contribuirá en gran medida a generar datos de referencia de ADN que son cruciales para el monitoreo de la biodiversidad basado en ADN ambiental .
Megabarcoding es un término utilizado para describir la codificación de barras de ADN basada en muestras de alto rendimiento, donde se pueden codificar miles de muestras simultáneamente para la identificación y el descubrimiento de especies. [102] [103] [104] [105] [106]
Esto es posible gracias al uso de plataformas de secuenciación de tercera generación , entre ellas PacBio (Sequel I/II) de Pacific Biosciences y MinION, PromethION de Oxford Nanopore Technology . En comparación con la secuenciación de Sanger , la codificación de barras de megabarras es más rápida y económica, lo que permite la generación a gran escala de códigos de barras de ADN para miles de especies. [107]
Los megacódigos de barras pueden ayudar a llenar el vacío de datos de referencia de códigos de barras de ADN de taxones oscuros para insectos y acelerar el descubrimiento de especies, [108] [109] comprender los patrones de diversidad de especies, [110] [111] [112] evaluar la riqueza de especies, [113] generar inventarios rápidos de especies de biodiversidad, [114] rastrear cambios de línea base, [115] y hacer coincidir etapas del ciclo de vida. [116]
El metabarcoding se define como el código de barras del ADN o eDNA (ADN ambiental) que permite la identificación simultánea de muchos taxones dentro de la misma muestra (ambiental), aunque a menudo dentro del mismo grupo de organismos. La principal diferencia entre los enfoques es que el metabarcoding, a diferencia del código de barras, no se centra en un organismo específico, sino que pretende determinar la composición de especies dentro de una muestra.
El procedimiento de metabarcoding, al igual que el código de barras general, cubre los pasos de extracción de ADN , amplificación por PCR , secuenciación y análisis de datos . Un código de barras consiste en una región genética variable corta (por ejemplo, ver diferentes marcadores/códigos de barras ) que es útil para la asignación taxonómica flanqueada por regiones genéticas altamente conservadas que se pueden usar para el diseño de cebadores . [117] Se utilizan diferentes genes dependiendo de si el objetivo es codificar con barras una sola especie o metabarcoding varias especies. En el último caso, se utiliza un gen más universal. Metabarcoding no utiliza ADN/ARN de una sola especie como punto de partida, sino ADN/ARN de varios organismos diferentes derivados de una muestra ambiental o masiva.
La metacodificación de barras tiene el potencial de complementar las medidas de biodiversidad, e incluso reemplazarlas en algunos casos, especialmente a medida que la tecnología avanza y los procedimientos gradualmente se vuelven más baratos, más optimizados y más generalizados. [118] [119]
Las aplicaciones de codificación de barras de ADN incluyen el monitoreo de la biodiversidad en ambientes terrestres y acuáticos, la paleontología y los ecosistemas antiguos, las interacciones planta-polinizador , el análisis de la dieta y la seguridad alimentaria.
Las ventajas y desventajas generales de los códigos de barras que se han analizado anteriormente también son válidas para los metacódigos de barras. Un inconveniente particular de los estudios de metacódigos de barras es que todavía no hay consenso sobre el diseño experimental óptimo y los criterios bioinformáticos que se deben aplicar en los metacódigos de barras de ADN ambiental. [120] Sin embargo, actualmente hay intentos conjuntos, como por ejemplo la red europea COST DNAqua-Net, de avanzar mediante el intercambio de experiencias y conocimientos para establecer estándares de mejores prácticas para la biomonitorización. [78]
En 2014, investigadores de la Escuela Politécnica Federal de Zúrich propusieron utilizar códigos de barras de ADN artificiales de tamaño submicrométrico como una "etiqueta invisible para el aceite". Los códigos de barras consisten en secuencias de ADN sintético dentro de partículas de sílice recuperables magnéticamente. Se pueden añadir al aceite comestible en una cantidad muy pequeña (hasta 1 ppb) como etiqueta y se pueden recuperar en cualquier momento para realizar una prueba de autenticidad mediante PCR/secuenciación. Este método se puede utilizar para comprobar si el aceite de oliva está adulterado. [121]
Subtemas:
Temas relacionados:
Consulte también la barra de navegación lateral en la parte superior del artículo.
{{cite book}}
: Mantenimiento de CS1: falta la ubicación del editor ( enlace )