El código de barras de ADN es un método de identificación de especies que utiliza una pequeña sección de ADN de un gen o genes específicos . La premisa de los códigos de barras de ADN es que, en comparación con una biblioteca de referencia de dichas secciones de ADN (también llamadas " secuencias "), se puede utilizar una secuencia individual para identificar de forma única un organismo con su especie, del mismo modo que un escáner de supermercado utiliza las conocidas franjas negras de el código de barras UPC para identificar un artículo en su stock con respecto a su base de datos de referencia. [1] Estos "códigos de barras" se utilizan a veces en un esfuerzo por identificar especies o partes de un organismo desconocidas, simplemente para catalogar tantos taxones como sea posible, o para comparar con la taxonomía tradicional en un esfuerzo por determinar los límites de las especies. [2]
Se utilizan diferentes regiones genéticas para identificar los diferentes grupos de organismos mediante códigos de barras. La región del código de barras más comúnmente utilizada por los animales y algunos protistas es una porción del gen de la citocromo c oxidasa I (COI o COX1 ), que se encuentra en el ADN mitocondrial . Otros genes adecuados para los códigos de barras de ADN son el ARNr del espaciador transcrito interno (ITS) que se usa a menudo para hongos y RuBisCO que se usa para plantas. [3] [4] [5] Los microorganismos se detectan utilizando diferentes regiones genéticas. El gen 16S rRNA, por ejemplo, se utiliza ampliamente en la identificación de procariotas, mientras que el gen 18S rRNA se utiliza principalmente para detectar eucariotas microbianos . Estas regiones genéticas se eligen porque tienen menos variación intraespecífica (dentro de la especie) que variación interespecífica (entre especies), lo que se conoce como "brecha de códigos de barras". [6]
Algunas aplicaciones de los códigos de barras de ADN incluyen: identificar hojas de plantas incluso cuando no hay flores o frutos disponibles; identificar el polen recogido en los cuerpos de los animales polinizadores; identificar larvas de insectos que pueden tener menos caracteres diagnósticos que los adultos; o investigar la dieta de un animal en función de su contenido estomacal, saliva o heces. [7] Cuando se utilizan códigos de barras para identificar organismos a partir de una muestra que contiene ADN de más de un organismo, se utiliza el término metacódigo de barras de ADN , [8] [9] por ejemplo, metacódigo de barras de ADN de comunidades de diatomeas en ríos y arroyos, que se utiliza para evaluar calidad del agua. [10]
Las técnicas de códigos de barras de ADN se desarrollaron a partir de trabajos iniciales de secuenciación de ADN en comunidades microbianas utilizando el gen 5S rRNA . [11] En 2003, se propusieron métodos y terminología específicos de códigos de barras de ADN modernos como un método estandarizado para identificar especies, así como para asignar potencialmente secuencias desconocidas a taxones superiores, como órdenes y filos, en un artículo de Paul DN Hebert et al. de la Universidad de Guelph , Ontario , Canadá . [12] Hebert y sus colegas demostraron la utilidad del gen de la citocromo c oxidasa I (COI), utilizado por primera vez por Folmer et al. en 1994, utilizando sus cebadores de ADN publicados como herramienta para análisis filogenéticos a nivel de especie [12] como herramienta discriminatoria adecuada entre invertebrados metazoos. [13] La "región Folmer" del gen COI se usa comúnmente para distinguir entre taxones en función de sus patrones de variación a nivel de ADN. La relativa facilidad de recuperar la secuencia y la variabilidad combinada con la conservación entre especies son algunos de los beneficios del COI. Llamando a los perfiles "códigos de barras", Hebert et al. previó el desarrollo de una base de datos sobre COI que podría servir como base para un "sistema global de bioidentificación".
La codificación de barras se puede realizar a partir de tejido de una muestra objetivo, de una mezcla de organismos (muestra masiva) o de ADN presente en muestras ambientales (por ejemplo, agua o suelo). Los métodos de muestreo, conservación o análisis difieren entre esos diferentes tipos de muestra.
Muestras de tejido
Para codificar una muestra de tejido de la muestra objetivo, es probable que sea suficiente un pequeño trozo de piel, una escama, una pata o una antena (dependiendo del tamaño de la muestra). Para evitar la contaminación, es necesario esterilizar las herramientas usadas entre muestras. Se recomienda recolectar dos muestras de un espécimen, una para archivar y otra para el proceso de codificación de barras. La preservación de las muestras es crucial para superar el problema de la degradación del ADN.
Muestras a granel
Una muestra global es un tipo de muestra ambiental que contiene varios organismos del grupo taxonómico en estudio. La diferencia entre las muestras globales (en el sentido utilizado aquí) y otras muestras ambientales es que la muestra global suele proporcionar una gran cantidad de ADN de buena calidad. Ejemplos de muestras a granel incluyen muestras de macroinvertebrados acuáticos recolectadas con redes o muestras de insectos recolectadas con una trampa Malaise. Las muestras de agua filtrada o fraccionada por tamaño que contienen organismos completos, como eucariotas unicelulares, a veces también se definen como muestras a granel. Estas muestras se pueden recolectar mediante las mismas técnicas utilizadas para obtener muestras tradicionales para la identificación basada en la morfología.
muestras de ADNe
El método de ADN ambiental (eDNA) es un enfoque no invasivo para detectar e identificar especies a partir de desechos celulares o ADN extracelular presentes en muestras ambientales (por ejemplo, agua o suelo) mediante códigos de barras o metacódigos de barras. El enfoque se basa en el hecho de que todo organismo vivo deja ADN en el medio ambiente, y este ADN ambiental puede detectarse incluso en organismos que se encuentran en una abundancia muy baja. Por lo tanto, para el muestreo de campo, la parte más crucial es utilizar material y herramientas libres de ADN en cada sitio de muestreo o muestra para evitar la contaminación, si es probable que el ADN del organismo objetivo esté presente en cantidades bajas. Por otro lado, una muestra de ADNe siempre incluye el ADN de microorganismos vivos de células completas, que a menudo están presentes en grandes cantidades. Por lo tanto, las muestras de microorganismos tomadas en el entorno natural también se denominan muestras de ADNe, pero la contaminación es menos problemática en este contexto debido a la gran cantidad de organismos objetivo. El método de ADNe se aplica a la mayoría de tipos de muestras, como agua, sedimentos, suelo, heces de animales, contenido estomacal o sangre de, por ejemplo, sanguijuelas. [14]
Los códigos de barras de ADN requieren que se extraiga el ADN de la muestra. Existen varios métodos diferentes de extracción de ADN y factores como el costo, el tiempo, el tipo de muestra y el rendimiento afectan la selección del método óptimo.
Cuando el ADN de muestras de organismos o de ADNe se amplifica mediante la reacción en cadena de la polimerasa (PCR), la reacción puede verse afectada negativamente por las moléculas inhibidoras contenidas en la muestra. [15] La eliminación de estos inhibidores es crucial para garantizar que haya ADN de alta calidad disponible para análisis posteriores.
La amplificación del ADN extraído es un paso necesario en los códigos de barras de ADN. Normalmente, sólo se secuencia un pequeño fragmento del material total de ADN (normalmente entre 400 y 800 pares de bases ) [16] para obtener el código de barras del ADN. La amplificación del material de ADNe generalmente se centra en fragmentos de menor tamaño (<200 pares de bases), ya que es más probable que el ADNe esté fragmentado que el material de ADN de otras fuentes. Sin embargo, algunos estudios sostienen que no existe relación entre el tamaño del amplicón y la tasa de detección de ADNe. [17] [18]
Cuando se ha amplificado la región marcadora del código de barras de ADN, el siguiente paso es secuenciar la región marcadora utilizando métodos de secuenciación de ADN . [19] Hay muchas plataformas de secuenciación diferentes disponibles y el desarrollo técnico avanza rápidamente.
Los marcadores utilizados para los códigos de barras de ADN se denominan códigos de barras. Para caracterizar con éxito especies basándose en códigos de barras de ADN, la selección de regiones de ADN informativas es crucial. Un buen código de barras de ADN debe tener una baja variabilidad intraespecífica y una alta variabilidad interespecífica [12] y poseer sitios flanqueantes conservados para desarrollar cebadores de PCR universales para una amplia aplicación taxonómica . El objetivo es diseñar cebadores que detecten y distingan la mayoría o todas las especies del grupo de organismos estudiado (alta resolución taxonómica). La longitud de la secuencia del código de barras debe ser lo suficientemente corta como para usarse con la fuente de muestreo actual, los métodos de extracción , amplificación y secuenciación de ADN . [20]
Lo ideal sería utilizar una secuencia genética para todos los grupos taxonómicos, desde virus hasta plantas y animales . Sin embargo, todavía no se ha encontrado dicha región genética, por lo que se utilizan diferentes códigos de barras para diferentes grupos de organismos, [ cita necesaria ] o según la pregunta del estudio.
Para los animales, el código de barras más utilizado es el locus mitocondrial de la citocromo C oxidasa I ( COI ). [21] También se utilizan otros genes mitocondriales, como Cytb , 12S o 16S . Se prefieren los genes mitocondriales a los nucleares debido a su falta de intrones , su modo de herencia haploide y su recombinación limitada . [21] [22] Además, cada célula tiene varias mitocondrias (hasta varios miles) y cada una de ellas contiene varias moléculas circulares de ADN . Por lo tanto, las mitocondrias pueden ofrecer una fuente abundante de ADN incluso cuando la muestra de tejido es limitada. [ cita necesaria ]
En las plantas, sin embargo, los genes mitocondriales no son apropiados para los códigos de barras del ADN porque exhiben bajas tasas de mutación . [23] Se han encontrado algunos genes candidatos en el genoma del cloroplasto , siendo el más prometedor el gen de la madurasa K ( matK ) solo o en asociación con otros genes. Para la identificación de especies también se han utilizado marcadores multilocus , como los espaciadores transcritos internos ribosómicos (ADN ITS), junto con matK , rbcL , trnH u otros genes. [ cita necesaria ] La mejor discriminación entre especies de plantas se ha logrado cuando se utilizan dos o más códigos de barras de cloroplasto. [24]
Para las bacterias , la subunidad pequeña del gen del ARN ribosómico ( 16S ) se puede utilizar para diferentes taxones, ya que está altamente conservada. [25] Algunos estudios sugieren que COI , [26] la chaperonina tipo II ( cpn60 ) [27] o la subunidad β de la ARN polimerasa ( rpoB ) [28] también podrían servir como códigos de barras de ADN bacteriano.
Los hongos con códigos de barras son más desafiantes y es posible que se requiera más de una combinación de cebadores. [29] El marcador COI funciona bien en ciertos grupos de hongos, [30] pero no igual de bien en otros. [31] Por lo tanto, se están utilizando marcadores adicionales, como ITS rDNA y la subunidad grande del ARN ribosomal nuclear (28S LSU rRNA). [32]
Dentro del grupo de los protistas se han propuesto diversos códigos de barras, como las regiones D1–D2 o D2–D3 del 28S rDNA , la subregión V4 del gen 18S rRNA , ITS rDNA y COI . Además, se pueden utilizar algunos códigos de barras específicos para los protistas fotosintéticos , por ejemplo, la subunidad grande del gen de la ribulosa-1,5-bifosfato carboxilasa-oxigenasa ( rbcL ) y el gen cloroplástico 23S rRNA . [ cita necesaria ]
Las bibliotecas de referencia se utilizan para la identificación taxonómica, también llamada anotación, de secuencias obtenidas a partir de códigos de barras o metacódigos de barras. Estas bases de datos contienen los códigos de barras de ADN asignados a taxones previamente identificados. La mayoría de las bibliotecas de referencia no cubren todas las especies dentro de un grupo de organismos y continuamente se crean nuevas entradas. En el caso de macro y muchos microorganismos (como las algas), estas bibliotecas de referencia requieren documentación detallada (lugar y fecha del muestreo, persona que lo recopiló, imagen, etc.) y una identificación taxonómica autorizada del espécimen del comprobante, así como la presentación. de secuencias en un formato particular. Sin embargo, dichas normas sólo se cumplen para un pequeño número de especies. El proceso también requiere el almacenamiento de especímenes comprobantes en colecciones de museos, herbarios y otras instituciones colaboradoras. Tanto la cobertura taxonómicamente exhaustiva como la calidad del contenido son importantes para la precisión de la identificación. [33] En el mundo microbiano, no hay información de ADN para la mayoría de los nombres de especies, y muchas secuencias de ADN no pueden asignarse a ningún binomio de Linneo . [34] Existen varias bases de datos de referencia según el grupo de organismos y el marcador genético utilizado. Hay bases de datos nacionales más pequeñas (por ejemplo, FinBOL) y grandes consorcios como el Proyecto Internacional Código de Barras de la Vida (iBOL). [35]
ATREVIDO
Lanzado en 2007, el Barcode of Life Data System (BOLD) [36] es una de las bases de datos más grandes y contiene alrededor de 780 000 BIN (números de índice de códigos de barras) en 2022. Es un depósito de acceso gratuito para los registros de muestras y secuencias de códigos de barras. estudios, y también es un banco de trabajo que ayuda a la gestión, control de calidad y análisis de datos de códigos de barras. La base de datos contiene principalmente registros BIN para animales basados en el marcador genético COI. Para la identificación de plantas, BOLD acepta secuencias de matK y rbcL .
UNIR
La base de datos UNITE [37] se lanzó en 2003 y es una base de datos de referencia para la identificación molecular de especies de hongos (y desde 2018 de todas las eucariotas) con la región marcadora genética del espaciador transcrito interno (ITS) del ribosoma nuclear. Esta base de datos se basa en el concepto de hipótesis de especies: usted elige el % en el que desea trabajar y las secuencias se clasifican en comparación con las secuencias obtenidas a partir de especímenes identificados por expertos.
Diat.barcode [ enlace muerto permanente ]
La base de datos Diat.barcode [38] se publicó por primera vez con el nombre R-syst::diatom [39] en 2016 a partir de datos de dos fuentes: la colección de cultivos Thonon (TCC) en la estación hidrobiológica del Instituto Nacional Francés de Investigación Agrícola. (INRA), y de la base de datos de nucleótidos del NCBI (Centro Nacional de Información Biotecnológica). Diat.barcode proporciona datos para dos marcadores genéticos, rbc L (ribulosa-1,5-bisfosfato carboxilasa/oxigenasa) y 18S (ARN ribosómico 18S). La base de datos también incluye información adicional sobre rasgos de especies, como características morfológicas (biovolumen, dimensiones de tamaño, etc.), formas de vida (movilidad, tipo de colonia, etc.) o características ecológicas (sensibilidad a la contaminación, etc.).
Para obtener datos bien estructurados, limpios e interpretables, los datos de secuenciación sin procesar deben procesarse mediante análisis bioinformático. El archivo FASTQ con los datos de secuenciación contiene dos tipos de información: las secuencias detectadas en la muestra ( archivo FASTA ) y un archivo de calidad con puntuaciones de calidad ( puntuaciones PHRED ) asociadas a cada nucleótido de cada secuencia de ADN. Las puntuaciones PHRED indican la probabilidad con la que el nucleótido asociado ha sido puntuado correctamente.
En general, la puntuación PHRED disminuye hacia el final de cada secuencia de ADN. Por lo tanto, algunos procesos bioinformáticos simplemente cortan el final de las secuencias en un umbral definido.
Algunas tecnologías de secuenciación, como MiSeq, utilizan secuenciación de extremos emparejados durante la cual la secuenciación se realiza desde ambas direcciones, lo que produce una mejor calidad. Las secuencias superpuestas luego se alinean en contigs y se fusionan. Por lo general, se combinan varias muestras en una sola ejecución y cada muestra se caracteriza por un fragmento corto de ADN, la etiqueta. En un paso de demultiplexación, las secuencias se clasifican utilizando estas etiquetas para volver a ensamblar las muestras separadas. Antes de realizar más análisis, se eliminan las etiquetas y otros adaptadores del fragmento de ADN de la secuencia del código de barras. Durante el recorte, se eliminan las secuencias de mala calidad (puntuaciones PHRED bajas) o las secuencias que son mucho más cortas o más largas que el código de barras de ADN objetivo. El siguiente paso de desreplicación es el proceso en el que todas las secuencias filtradas por calidad se colapsan en un conjunto de lecturas únicas (unidades de secuencia individuales ISU) con la información de su abundancia en las muestras. Después de eso, se detectan y eliminan las quimeras (es decir, secuencias compuestas formadas a partir de fragmentos de origen mixto). Finalmente, las secuencias se agrupan en OTU (Unidades taxonómicas operativas), utilizando una de muchas estrategias de agrupación. El software bioinformático más utilizado incluye Mothur, [40] Uparse, [41] Qiime, [42] Galaxy, [43] Obitols, [44] JAMP, [45] Barque, [46] y DADA2. [47]
Comparar la abundancia de lecturas, es decir, secuencias, entre diferentes muestras sigue siendo un desafío porque tanto el número total de lecturas en una muestra como la cantidad relativa de lecturas para una especie pueden variar entre muestras, métodos u otras variables. A modo de comparación, se puede reducir el número de lecturas de cada muestra al número mínimo de lecturas de las muestras que se van a comparar, un proceso llamado rarefacción. Otra forma es utilizar la abundancia relativa de lecturas. [48]
La asignación taxonómica de las OTU a las especies se logra haciendo coincidir secuencias con bibliotecas de referencia. La herramienta de búsqueda de alineación local básica (BLAST) se usa comúnmente para identificar regiones de similitud entre secuencias comparando lecturas de secuencias de la muestra con secuencias en bases de datos de referencia. [49] Si la base de datos de referencia contiene secuencias de las especies relevantes, entonces las secuencias de muestra pueden identificarse a nivel de especie. Si una secuencia no puede coincidir con una entrada de biblioteca de referencia existente, se pueden utilizar códigos de barras de ADN para crear una nueva entrada.
En algunos casos, debido a lo incompleto de las bases de datos de referencia, la identificación sólo se puede lograr en niveles taxonómicos superiores, como la asignación a una familia o clase. En algunos grupos de organismos, como las bacterias, la asignación taxonómica a nivel de especie a menudo no es posible. En tales casos, se puede asignar una muestra a una unidad taxonómica operativa (OTU) particular .
En algunos casos, los especímenes con códigos de barras de ADN (COI) idénticos pertenecen claramente a especies diferentes, por ejemplo, especies del género de peces Chromis . [50]
Las aplicaciones de los códigos de barras de ADN incluyen la identificación de nuevas especies , la evaluación de la seguridad de los alimentos, la identificación y evaluación de especies crípticas, la detección de especies exóticas, la identificación de especies amenazadas y en peligro de extinción , [51] vinculación de los estadios de huevos y larvas con especies adultas, asegurando los derechos de propiedad intelectual. para recursos biológicos, formular planes de gestión globales para estrategias de conservación, dilucidar nichos de alimentación [52] y ciencia forense. [53] Los marcadores de códigos de barras de ADN se pueden aplicar para abordar cuestiones básicas en sistemática, ecología , biología evolutiva y conservación , incluida la asamblea comunitaria, redes de interacción de especies , descubrimiento taxonómico y evaluación de áreas prioritarias para la protección ambiental .
Secuencias de ADN cortas específicas o marcadores de una región estandarizada del genoma pueden proporcionar un código de barras de ADN para identificar especies. [54] Los métodos moleculares son especialmente útiles cuando los métodos tradicionales no son aplicables. Los códigos de barras de ADN tienen gran aplicabilidad en la identificación de larvas para las que generalmente hay pocos caracteres de diagnóstico disponibles, y en asociación de diferentes etapas de vida (por ejemplo, larvas y adultos) en muchos animales. [55] La identificación de especies incluidas en los apéndices de la Convención sobre el Comercio Internacional de Especies Amenazadas ( CITES ) mediante técnicas de códigos de barras se utiliza en el seguimiento del comercio ilegal. [56]
Las especies exóticas se pueden detectar mediante códigos de barras. [57] [58] Los códigos de barras pueden ser adecuados para la detección de especies, por ejemplo, en el control fronterizo, donde a menudo no es posible una identificación morfológica rápida y precisa debido a similitudes entre diferentes especies, falta de características de diagnóstico suficientes [57] y/o falta de información taxonómica. pericia. Los códigos de barras y los metacódigos de barras también se pueden utilizar para detectar ecosistemas en busca de especies invasoras y para distinguir entre una especie invasora y una especie nativa, morfológicamente similar. [59] La alta eficiencia de la identificación del ADN se muestra en relación con el seguimiento tradicional de las invasiones biológicas. [60]
Los códigos de barras de ADN permiten la identificación y el reconocimiento de especies crípticas . [61] Sin embargo, los resultados de los análisis de códigos de barras de ADN dependen de la elección de los métodos analíticos, por lo que el proceso de delimitación de especies crípticas utilizando códigos de barras de ADN puede ser tan subjetivo como cualquier otra forma de taxonomía . Hebert et al. (2004) concluyeron que la mariposa Astraptes fulgerator en el noroeste de Costa Rica en realidad consta de 10 especies diferentes. [62] Estos resultados, sin embargo, fueron cuestionados posteriormente por Brower (2006), quien señaló numerosos defectos graves en el análisis y concluyó que los datos originales no podían respaldar más que la posibilidad de que existieran entre tres y siete taxones crípticos en lugar de diez. especies. [63] Smith y otros. (2007) utilizaron códigos de barras de ADN de citocromo c oxidasa I para la identificación de 20 morfoespecies de moscas parasitoides Belvosia ( Diptera : Tachinidae ) criadas a partir de orugas ( Lepidoptera ) en el Área de Conservación Guanacaste (ACG), noroeste de Costa Rica. Estos autores descubrieron que los códigos de barras elevan el recuento de especies a 32, al revelar que cada una de las tres especies de parasitoides , anteriormente consideradas generalistas, en realidad son conjuntos de especies crípticas altamente específicas del huésped. [64] Para 15 morfoespecies de poliquetos dentro del bentos antártico profundo estudiados mediante códigos de barras de ADN, se encontró diversidad críptica en el 50% de los casos. Además, se detectaron 10 morfoespecies previamente pasadas por alto, lo que aumentó la riqueza total de especies en la muestra en un 233%. [sesenta y cinco]
Los códigos de barras y metabarras de ADN pueden ser útiles en estudios de análisis de dietas [66] y normalmente se utilizan si los especímenes de presas no pueden identificarse basándose en caracteres morfológicos. [67] [68] Existe una variedad de enfoques de muestreo en el análisis de la dieta: la metabarcodificación de ADN se puede realizar en el contenido del estómago, [69] heces, [68] [70] saliva [71] o análisis de todo el cuerpo. [51] [72] En muestras fecales o contenidos estomacales altamente digeridos, a menudo no es posible distinguir el tejido de una sola especie y, por lo tanto, se puede aplicar metabarcodes en su lugar. [68] [73] Las heces o la saliva representan enfoques de muestreo no invasivos, mientras que el análisis de todo el cuerpo a menudo significa que primero es necesario matar al individuo. Para organismos más pequeños, la secuenciación del contenido del estómago a menudo se realiza secuenciando todo el animal.
Los códigos de barras de ADN representan una herramienta esencial para evaluar la calidad de los productos alimenticios. El objetivo es garantizar la trazabilidad de los alimentos, minimizar la piratería de alimentos y valorar la producción agroalimentaria local y típica. Otro propósito es salvaguardar la salud pública; por ejemplo, la codificación de metabarras ofrece la posibilidad de identificar meros que causan la intoxicación por pescado con ciguatera a partir de restos de comida [74] o separar los hongos venenosos de los comestibles (Ref).
Los códigos de barras de ADN se pueden utilizar para evaluar la presencia de especies en peligro de extinción para los esfuerzos de conservación (Ref), o la presencia de especies indicadoras que reflejan condiciones ecológicas específicas (Ref), por ejemplo, exceso de nutrientes o bajos niveles de oxígeno.
Los códigos de barras de ADN se utilizan a menudo para la identificación de especies en casos de ciencia forense . Se pueden encontrar, recolectar e identificar muestras desconocidas de animales o plantas en la escena del crimen, con la esperanza de vincularlas con un sospechoso y obtener una condena. [75] La caza furtiva , la matanza de especies en peligro de extinción y el maltrato animal son ejemplos de delitos en los que se utilizan códigos de barras de ADN, ya que a menudo se encuentra ADN animal. [53] [76] Por otro lado, el ADN vegetal se utiliza generalmente como evidencia para vincular a un sospechoso con la escena del crimen. [77]
Los métodos tradicionales de bioevaluación están bien establecidos a nivel internacional y sirven bien para el biomonitoreo, como por ejemplo para la bioevaluación acuática dentro de las Directivas de la UE DMA y MSFD . Sin embargo, los códigos de barras de ADN podrían mejorar los métodos tradicionales por las siguientes razones; Los códigos de barras de ADN (i) pueden aumentar la resolución taxonómica y armonizar la identificación de taxones que son difíciles de identificar o carecen de expertos, (ii) pueden relacionar de manera más precisa los factores ambientales con taxones específicos (iii) pueden aumentar la comparabilidad entre regiones, (iv) permite la inclusión de etapas tempranas de la vida y especímenes fragmentados, (v) permite la delimitación de especies crípticas /raras (vi) permite el desarrollo de nuevos índices, por ejemplo, especies raras/crípticas que pueden ser sensibles/tolerantes a factores estresantes , (vii) aumenta la número de muestras que se pueden procesar y reduce el tiempo de procesamiento, lo que da como resultado un mayor conocimiento de la ecología de las especies, (viii) es una forma no invasiva de monitoreo cuando se utilizan métodos de ADNe . [78]
Los códigos de barras de ADN son más rápidos que los métodos morfológicos tradicionales desde el entrenamiento hasta la asignación taxonómica. Se necesita menos tiempo para adquirir experiencia en métodos de ADN que para convertirse en un experto en taxonomía. Además, el flujo de trabajo de códigos de barras de ADN (es decir, desde la muestra hasta el resultado) es generalmente más rápido que el flujo de trabajo morfológico tradicional y permite el procesamiento de más muestras.
Los códigos de barras de ADN permiten la resolución de taxones desde niveles taxonómicos superiores (por ejemplo, familia) a niveles inferiores (por ejemplo, especies), que de otro modo serían demasiado difíciles de identificar utilizando métodos morfológicos tradicionales, como, por ejemplo, la identificación mediante microscopía. Por ejemplo, Chironomidae (el mosquito que no pica) está ampliamente distribuido tanto en ecosistemas terrestres como de agua dulce. Su riqueza y abundancia los hacen importantes para los procesos y redes ecológicos, y son uno de los muchos grupos de invertebrados utilizados en el biomonitoreo. Las muestras de invertebrados pueden contener hasta 100 especies de quironómidos, que a menudo representan hasta el 50% de una muestra. A pesar de esto, generalmente no se identifican por debajo del nivel familiar debido a la experiencia taxonómica y al tiempo requerido. [79] Esto puede dar lugar a que se agrupen diferentes especies de quironómidos con diferentes preferencias ecológicas, lo que da lugar a una evaluación inexacta de la calidad del agua.
Los códigos de barras de ADN brindan la oportunidad de resolver taxones y relacionar directamente los efectos estresantes con taxones específicos, como especies de quironómidos individuales. Por ejemplo, Beermann et al. (2018) utilizaron códigos de barras de ADN de Chironomidae para investigar su respuesta a múltiples factores estresantes; flujo reducido, aumento de sedimentos finos y aumento de salinidad. [80] Después de los códigos de barras, se descubrió que la muestra de quironómidos constaba de 183 unidades taxonómicas operativas (OTU), es decir, códigos de barras (secuencias) que a menudo son equivalentes a especies morfológicas. Estas 183 OTU mostraron 15 tipos de respuesta en lugar de los dos tipos de respuesta informados anteriormente [81] registrados cuando todos los quironómidos se agruparon en el mismo estudio de múltiples factores estresantes. Una tendencia similar fue descubierta en un estudio de Macher et al. (2016) que descubrió una diversidad críptica dentro de la especie de efímera de Nueva Zelanda Deleatidium sp . Este estudio encontró diferentes patrones de respuesta de 12 OTU moleculares distintas a factores estresantes que pueden cambiar el consenso de que esta mosca efímera es sensible a la contaminación. [82]
A pesar de las ventajas que ofrecen los códigos de barras de ADN, también se ha sugerido que los códigos de barras de ADN se utilizan mejor como complemento de los métodos morfológicos tradicionales. [78] Esta recomendación se basa en múltiples desafíos percibidos.
No es del todo sencillo conectar los códigos de barras de ADN con las preferencias ecológicas del taxón codificado en cuestión, como es necesario si se van a utilizar códigos de barras para el biomonitoreo. Por ejemplo, la detección de ADN objetivo en sistemas acuáticos depende de la concentración de moléculas de ADN en un sitio, que a su vez puede verse afectada por muchos factores. La presencia de moléculas de ADN también depende de la dispersión en un sitio, por ejemplo, la dirección o la fuerza de las corrientes. No se sabe realmente cómo se mueve el ADN en arroyos y lagos, lo que dificulta el muestreo. Otro factor podría ser el comportamiento de las especies objetivo, por ejemplo, los peces pueden tener cambios estacionales de movimientos, los cangrejos o los mejillones liberarán ADN en mayores cantidades sólo en ciertos momentos de su vida (muda, desove). En el caso del ADN del suelo, se sabe aún menos sobre su distribución, cantidad o calidad.
La principal limitación del método de códigos de barras es que se basa en bibliotecas de referencia de códigos de barras para la identificación taxonómica de las secuencias. La identificación taxonómica es precisa sólo si se dispone de una referencia fiable. Sin embargo, la mayoría de las bases de datos aún están incompletas, especialmente para organismos más pequeños, por ejemplo hongos, fitoplancton, nematodos, etc. Además, las bases de datos actuales contienen identificaciones erróneas, faltas de ortografía y otros errores. Hay un esfuerzo masivo de curación y finalización en torno a las bases de datos para todos los organismos necesarios, lo que involucra grandes proyectos de códigos de barras (por ejemplo, el proyecto iBOL para la base de datos de referencia Barcode of Life Data Systems (BOLD)). [83] [84] Sin embargo, la finalización y la curación son difíciles y requieren mucho tiempo. Sin especímenes acreditados, no puede haber certeza sobre si la secuencia utilizada como referencia es correcta.
Las bases de datos de secuencias de ADN como GenBank contienen muchas secuencias que no están vinculadas a especímenes certificados (por ejemplo, especímenes de herbario, líneas celulares cultivadas o, a veces, imágenes). Esto es problemático frente a cuestiones taxonómicas como si varias especies deberían dividirse o combinarse, o si las identificaciones pasadas fueron sólidas. La reutilización de secuencias, no vinculadas a especímenes acreditados, de organismos inicialmente identificados erróneamente puede respaldar conclusiones incorrectas y debe evitarse. [85] Por lo tanto, la mejor práctica para los códigos de barras de ADN es secuenciar muestras certificadas. [86] [87] Sin embargo, para muchos taxones, puede resultar difícil obtener especímenes de referencia, por ejemplo, cuando los especímenes son difíciles de capturar, los especímenes disponibles están mal conservados o se carece de experiencia taxonómica adecuada. [85]
Es importante destacar que los códigos de barras de ADN también se pueden utilizar para crear una taxonomía provisional, en cuyo caso las OTU se pueden utilizar como sustitutos de los binomios latinos tradicionales, reduciendo así significativamente la dependencia de bases de datos de referencia completamente pobladas. [88]
Los códigos de barras de ADN también conllevan sesgos metodológicos, desde el muestreo hasta el análisis de datos bioinformáticos . Además del riesgo de contaminación de la muestra de ADN con inhibidores de la PCR, el sesgo de los cebadores es una de las principales fuentes de errores en los códigos de barras de ADN. [89] [90] El aislamiento de un marcador de ADN eficiente y el diseño de cebadores es un proceso complejo y se ha realizado un esfuerzo considerable para desarrollar cebadores para códigos de barras de ADN en diferentes grupos taxonómicos. [91] Sin embargo, los cebadores a menudo se unirán preferentemente a algunas secuencias, lo que lleva a una eficiencia y especificidad diferenciales de los cebadores y a una evaluación de comunidades no representativas y a una inflación de la riqueza. [92] Por lo tanto, la composición de las secuencias de las comunidades de la muestra se altera principalmente en el paso de la PCR. Además, la replicación de la PCR suele ser necesaria, pero conlleva un aumento exponencial del riesgo de contaminación. Varios estudios han destacado la posibilidad de utilizar muestras enriquecidas con mitocondrias [93] [94] o enfoques sin PCR para evitar estos sesgos, pero a día de hoy, la técnica de metabarcodificación de ADN todavía se basa en la secuenciación de amplicones. [91] Otros sesgos entran en escena durante la secuenciación y durante el procesamiento bioinformático de las secuencias, como la creación de quimeras.
Aunque los códigos de barras de ADN se utilizan y aplican cada vez más, no hay acuerdo sobre los métodos de conservación o extracción del ADN, las opciones de marcadores y cebadores de ADN ni los protocolos de PCR. Los parámetros de los procesos bioinformáticos (por ejemplo, agrupación de OTU, algoritmos o umbrales de asignación taxonómica, etc.) están en el origen de mucho debate entre los usuarios de códigos de barras de ADN. [91] Las tecnologías de secuenciación también están evolucionando rápidamente, junto con las herramientas para el análisis de las cantidades masivas de datos de ADN generados, y se necesita urgentemente la estandarización de los métodos para permitir la colaboración y el intercambio de datos a mayor escala espacial y temporal. Esta estandarización de los métodos de códigos de barras a escala europea forma parte de los objetivos de la acción europea COST DNAqua-net [95] y también es abordada por el CEN (el Comité Europeo de Normalización). [96]
Otra crítica a los códigos de barras de ADN es su eficiencia limitada para una discriminación precisa por debajo del nivel de especie (por ejemplo, para distinguir entre variedades), para la detección de híbridos y que puede verse afectado por tasas evolutivas [ cita necesaria ] .
Es importante saber que las listas de taxones derivadas de la identificación convencional (morfológica) no son, y tal vez nunca lo sean, directamente comparables con las listas de taxones derivadas de la identificación basada en códigos de barras por varias razones. La causa más importante es probablemente lo incompleto y la falta de precisión de las bases de datos de referencia molecular que impiden una asignación taxonómica correcta de las secuencias de ADNe. El eDNA no encontrará taxones que no estén presentes en las bases de datos de referencia, y las secuencias vinculadas a un nombre incorrecto conducirán a una identificación incorrecta. [78] Otras causas conocidas son una escala y tamaño de muestreo diferente entre una muestra tradicional y una molecular, el posible análisis de organismos muertos, que puede ocurrir de diferentes maneras para ambos métodos dependiendo del grupo de organismos, y la selección específica de identificación en cualquiera de los dos. método, es decir, experiencia taxonómica variable o posibilidad de identificar ciertos grupos de organismos, respectivamente, el sesgo del cebador conduce también a un análisis potencial sesgado de los taxones. [78]
Los códigos de barras de ADN pueden dar lugar a una sobreestimación o subestimación de la riqueza y diversidad de especies. Algunos estudios sugieren que los artefactos (identificación de especies no presentes en una comunidad) son una de las principales causas de la inflación de la biodiversidad. [97] [98] La cuestión más problemática son los taxones representados por un número bajo de lecturas de secuenciación. Estas lecturas suelen eliminarse durante el proceso de filtrado de datos, ya que diferentes estudios sugieren que la mayoría de estas lecturas de baja frecuencia pueden ser artefactos. [99] Sin embargo, pueden existir taxones realmente raros entre estas lecturas de baja abundancia. [100] Las secuencias raras pueden reflejar linajes únicos en comunidades, lo que las convierte en secuencias informativas y valiosas. Por lo tanto, existe una gran necesidad de algoritmos bioinformáticos más robustos que permitan la diferenciación entre lecturas informativas y artefactos. Bibliotecas de referencia completas también permitirían probar mejor los algoritmos bioinformáticos, al permitir un mejor filtrado de artefactos (es decir, la eliminación de secuencias que carecen de contraparte entre las especies existentes) y, por lo tanto, sería posible obtener una asignación de especies más precisa. [101] La diversidad críptica también puede resultar en una biodiversidad inflada, ya que una especie morfológica en realidad puede dividirse en muchas secuencias moleculares distintas. [78] Esto contribuirá en gran medida a generar datos de referencia de ADN, que son cruciales para el monitoreo de la biodiversidad ambiental basado en el ADN.
Megabarcoding es un término utilizado para describir códigos de barras de ADN de alto rendimiento basados en muestras, donde se pueden codificar miles de muestras simultáneamente para la identificación y el descubrimiento de especies. [102] [103] [104] [105] [106]
Esto es posible gracias al uso de plataformas de secuenciación de tercera generación, incluidas PacBio (Sequel I/II) de Pacific Biosciences y MinION, PromethION de Oxford Nanopore Technology . En comparación con la secuenciación de Sanger , la megacodificación es más rápida y económica, lo que permite la generación a gran escala de códigos de barras de ADN para miles de especies. [107]
Los megacódigos de barras pueden ayudar a llenar los taxones oscuros . Brecha de datos de referencia de códigos de barras de ADN para insectos y acelerar el descubrimiento de especies, [108] [109] comprender los patrones de diversidad de especies, [110] [111] [112] evaluar la riqueza de especies, [113] generar inventarios rápidos de especies de biodiversidad, [114] realizar un seguimiento de la línea de base turnos, [115] y etapas coincidentes de la historia de vida. [116]
El metacódigo de barras se define como el código de barras de ADN o ADNe (ADN ambiental) que permite la identificación simultánea de muchos taxones dentro de la misma muestra (ambiental), aunque a menudo dentro del mismo grupo de organismos. La principal diferencia entre los enfoques es que el metacódigo de barras, a diferencia del código de barras, no se centra en un organismo específico, sino que pretende determinar la composición de especies dentro de una muestra.
El procedimiento de metabarcodes, al igual que los códigos de barras generales, cubre los pasos de extracción de ADN , amplificación por PCR , secuenciación y análisis de datos . Un código de barras consta de una región genética variable corta (por ejemplo, consulte diferentes marcadores/códigos de barras ) que es útil para la asignación taxonómica, flanqueada por regiones genéticas altamente conservadas que pueden usarse para el diseño de cebadores . [117] Se utilizan diferentes genes dependiendo de si el objetivo es codificar con barras una sola especie o metacodificar varias especies. En este último caso, se utiliza un gen más universal. La metabarcodificación no utiliza ADN/ARN de una sola especie como punto de partida, sino ADN/ARN de varios organismos diferentes derivados de una muestra ambiental o masiva.
Los metabarcodes tienen el potencial de complementar las medidas sobre biodiversidad, e incluso reemplazarlas en algunos casos, especialmente a medida que la tecnología avanza y los procedimientos se vuelven gradualmente más baratos, más optimizados y más extendidos. [118] [119]
Las aplicaciones de metabarcodificación de ADN incluyen el monitoreo de la biodiversidad en ambientes terrestres y acuáticos, paleontología y ecosistemas antiguos, interacciones entre plantas y polinizadores , análisis de dietas y seguridad alimentaria.
Las ventajas y desventajas generales de los códigos de barras revisadas anteriormente son válidas también para los metacódigos de barras. Un inconveniente particular de los estudios de metabarcodificación es que aún no existe un consenso sobre el diseño experimental óptimo y los criterios bioinformáticos que se aplicarán en la metacodificación de ADNe. [120] Sin embargo, actualmente hay intentos conjuntos, como por ejemplo la red COST de la UE DNAqua-Net, de avanzar mediante el intercambio de experiencias y conocimientos para establecer estándares de mejores prácticas para el biomonitoreo. [78]
En 2014, investigadores de ETH Zurich propusieron utilizar códigos de barras de ADN artificiales de tamaño submicrométrico como una "etiqueta de aceite invisible". Los códigos de barras consisten en secuencias de ADN sintético dentro de partículas de sílice recuperables magnéticamente. Se pueden agregar al aceite alimentario en una cantidad muy pequeña (hasta 1 ppb) como etiqueta y se pueden recuperar en cualquier momento para una prueba de autenticidad mediante PCR/secuenciación. Este método se puede utilizar para comprobar si el aceite de oliva está adulterado. [121]
Subtemas:
Temas relacionados:
Consulte también la barra de navegación lateral en la parte superior del artículo.
{{cite book}}
: Mantenimiento CS1: falta el editor de la ubicación ( enlace )