Exploración del genoma

El skimming del genoma es un enfoque de secuenciación que utiliza una secuenciación superficial de paso bajo de un genoma (hasta un 5 %) para generar fragmentos de ADN, conocidos como skims del genoma . ^[1]^[2] Estos skims del genoma contienen información sobre la fracción de alta copia del genoma. ^[2] La fracción de alta copia del genoma consiste en el ADN ribosómico , el genoma del plástido ( plastoma ), el genoma mitocondrial ( mitogenoma ) y las repeticiones nucleares como los microsatélites y los elementos transponibles . ^[3] Emplea tecnología de secuenciación de última generación de alto rendimiento para generar estos skims. ^[1] Aunque estos skims son simplemente "la punta del iceberg genómico", el análisis filogenómico de ellos aún puede proporcionar información sobre la historia evolutiva y la biodiversidad a un menor costo y a mayor escala que los métodos tradicionales. ^[2]^[3]^[4] Debido a la pequeña cantidad de ADN requerida para el skimming del genoma, su metodología se puede aplicar en otros campos distintos de la genómica. Tareas como ésta incluyen determinar la trazabilidad de los productos en la industria alimentaria, hacer cumplir las regulaciones internacionales sobre biodiversidad y recursos biológicos y la ciencia forense . ^[5]

Usos actuales

Además del ensamblaje de los genomas de organelas más pequeñas, el desnatado del genoma también se puede utilizar para descubrir secuencias ortólogas conservadas para estudios filogenómicos . En los estudios filogenómicos de patógenos multicelulares , el desnatado del genoma se puede utilizar para encontrar genes efectores , descubrir endosimbiontes y caracterizar la variación genómica . ^[6]

ADN de alta copia

ADN ribosómico

Los espaciadores transcritos internos (ITS) son regiones no codificantes dentro del ADNr 18-5.8-28S en eucariotas y son una característica del ADNr que se ha utilizado en estudios de desnatado del genoma. ^[7] Los ITS se utilizan para detectar diferentes especies dentro de un género , debido a su alta variabilidad interespecies. ^[7] Estos tienen baja variabilidad individual, lo que impide la identificación de cepas o individuos distintos. ^[7] También están presentes en todos los eucariotas , tienen una alta tasa de evolución y se han utilizado en análisis filogenéticos entre y a través de especies. ^[7]

Cuando se apunta al ADNr nuclear, se sugiere que se logre una profundidad de secuenciación final mínima de 100X y que se enmascaren las secuencias con una profundidad inferior a 5X. ^[1]

Plastomas

El genoma del plástido , o plastoma, se ha utilizado ampliamente en estudios de identificación y evolución mediante el desnatado del genoma debido a su alta abundancia en las plantas (~3-5% del ADN celular), tamaño pequeño, estructura simple, mayor conservación de la estructura genética que los genes nucleares o mitocondriales. ^[8]^[9] Los estudios de plástidos se han visto limitados anteriormente por el número de regiones que se podían evaluar con los enfoques tradicionales. ^[9] Mediante el desnatado del genoma, la secuenciación de todo el genoma del plástido, o plastoma, se puede realizar a una fracción del coste y el tiempo necesarios para los enfoques de secuenciación típicos como la secuenciación de Sanger . ^[3] Se han sugerido los plastomas como un método para sustituir los códigos de barras de ADN tradicionales en las plantas, ^[3] como los genes de código de barras rbcL y matK . En comparación con el código de barras de ADN típico, el desnatado del genoma produce plastomas a una décima parte del coste por base. ^[5] Los usos recientes de los análisis de genomas de plastomas han permitido una mayor resolución de las filogenias, una mayor diferenciación de grupos específicos dentro de taxones y estimaciones más precisas de la biodiversidad. ^[9] Además, el plastoma se ha utilizado para comparar especies dentro de un género y observar los cambios evolutivos y la diversidad dentro de un grupo. ^[9]

Cuando se trabaja con plastomas, se recomienda lograr una profundidad de secuenciación final mínima de 30X para las regiones de copia única a fin de garantizar ensamblajes de alta calidad. Los polimorfismos de un solo nucleótido (SNP) con una profundidad inferior a 20X deben enmascararse. ^[1]

Mitogenomas

El genoma mitocondrial , o mitogenoma, se utiliza como marcador molecular en una gran variedad de estudios debido a su herencia materna , alto número de copias en la célula, falta de recombinación y alta tasa de mutación. A menudo se utiliza para estudios filogenéticos, ya que es muy uniforme en todos los grupos de metazoos, con una estructura de molécula de ADN circular de doble cadena, de aproximadamente 15 a 20 kilobases, con 37 genes de ARN ribosómico, 13 genes codificadores de proteínas y 22 genes de ARN de transferencia. Las secuencias de código de barras mitocondriales, como COI, NADH2 , 16S rRNA y 12S rRNA , también se pueden utilizar para la identificación taxonómica. ^[10] La mayor publicación de mitogenomas completos permite la inferencia de filogenias robustas en muchos grupos taxonómicos, y puede capturar eventos como reordenamientos genéticos y posicionamiento de elementos genéticos móviles. Utilizando el análisis genético para ensamblar mitogenomas completos, se puede resolver la historia filogenética y la biodiversidad de muchos organismos. ^[4]

Cuando se apunta a mitogenomas, no hay sugerencias específicas para la profundidad mínima de secuenciación final, ya que los mitogenomas son más variables en tamaño y más variables en complejidad en las especies vegetales, lo que aumenta la dificultad de ensamblar secuencias repetidas. Sin embargo, las secuencias codificantes altamente conservadas y las regiones flanqueantes no repetitivas se pueden ensamblar utilizando el ensamblaje guiado por referencia . Las secuencias deben enmascararse de manera similar a cuando se apunta a plastomas y ADN ribosómico nuclear. ^[1]

Repeticiones nucleares (satélites oelementos transponibles)

Las repeticiones nucleares en el genoma son una fuente de datos filogenéticos poco utilizada. Cuando se secuencia el genoma nuclear en un 5% del genoma, se encuentran presentes miles de copias de las repeticiones nucleares. Aunque las repeticiones secuenciadas solo serán representativas de las que se encuentran en todo el genoma, se ha demostrado que estas fracciones secuenciadas reflejan con precisión la abundancia genómica. Estas repeticiones se pueden agrupar de novo y se puede estimar su abundancia. La distribución y la aparición de estos tipos de repeticiones pueden ser filogenéticamente informativas y proporcionar información sobre la historia evolutiva de varias especies. ^[1]

ADN de bajo número de copias

El ADN de bajo número de copias puede resultar útil para estudios filogenéticos y de desarrollo evolutivo. ^[11] Se puede extraer de fracciones de alto número de copias de varias maneras, como desarrollar cebadores a partir de bases de datos que contienen genes ortólogos conservados , genes ortólogos conservados de copia única y genes de copia compartida. ^[11] Otro método es buscar sondas novedosas que se dirijan a genes de bajo número de copias utilizando transcriptómica a través de Hyb-Seq. ^[11] Si bien los genomas nucleares ensamblados mediante desnatado de genoma están extremadamente fragmentados, algunos genes nucleares de copia única de bajo número de copias se pueden ensamblar con éxito. ^[12]

ADN degradado en baja cantidad

Los métodos anteriores para intentar recuperar ADN degradado se basaban en la secuenciación de Sanger y dependían de grandes plantillas de ADN intactas, y se veían afectados por la contaminación y el método de conservación. Por otro lado, el descifrado del genoma se puede utilizar para extraer información genética de especies preservadas en herbarios y museos, donde el ADN suele estar muy degradado y queda muy poco. ^[4]^[13] Los estudios en plantas muestran que el ADN de hasta 80 años y con tan solo 500 pg de ADN degradado se puede utilizar con el descifrado del genoma para inferir información genómica. ^[13] En los herbarios , incluso con un bajo rendimiento y ADN de baja calidad, un estudio aún pudo producir "secuencias completas de ADN ribosómico y de cloroplastos de alta calidad" a gran escala para análisis posteriores. ^[14]

En los estudios de campo, los invertebrados se almacenan en etanol, que generalmente se descarta durante los estudios basados en ADN. ^[15] Se ha demostrado que la extracción del genoma detecta la baja cantidad de ADN de esta fracción de etanol y proporciona información sobre la biomasa de los especímenes en una fracción, la microbiota de las capas de tejido externas y el contenido intestinal (como presas) liberado por el reflejo del vómito. ^[15] Por lo tanto, la extracción del genoma puede proporcionar un método adicional para comprender la ecología a través del ADN de bajo número de copias. ^[15]

Flujo de trabajo

Extracción de ADN

Los protocolos de extracción de ADN varían según la fuente de la muestra (es decir, plantas, animales, etc.). Los siguientes protocolos de extracción de ADN se han utilizado en el análisis de genomas:

Preparación de la biblioteca

Los protocolos de preparación de bibliotecas dependerán de diversos factores: organismo, tipo de tejido, etc. En el caso de especímenes conservados, puede ser necesario realizar modificaciones específicas en los protocolos de preparación de bibliotecas. ^[1] Los siguientes protocolos de preparación de bibliotecas se han utilizado en el skimming del genoma:

Kit de preparación de muestras de ADN Illumina TruSeq ^[5]^[6]^[15]
Kit Illumina TruSeq sin PCR ^[7]^[21]
Kit de secuenciación de ADN NEXTFlex ^[18]
ADN NEBNext Ultra II ^[9]^[13]^[16]
Oligonucleótidos multiplexados NEBNext ^[16]
Kit de preparación de la biblioteca de ADN Nextera XT ^[4]
Kit de preparación de biblioteca de ADN LT de TruSeq Nano ^[14]^[17]
Kit de secuenciación rápida ^[10]

Secuenciación

La secuenciación con lecturas cortas o largas dependerá del genoma o los genes de destino. Los microsatélites en repeticiones nucleares requieren lecturas más largas. ^[23] Las siguientes plataformas de secuenciación se han utilizado en el skimming del genoma:

Plataforma Illumina HiSeq 2000 ^[5]^[18]^[24]^[25]
Plataforma Illumina HiSeq 2500 ^[8]^[9]^[14]^[20]^[17]^[26]
Plataforma Illumina HiSeq 4000 ^[19]
Plataforma Illumina HiSeq X Ten ^[7]^[13]^[19]
Plataforma Illumina MiSeq ^[4]^[6]^[15]^[16]^[21]^[23]
Plataforma Illumina NextSeq 550 ^[4]^[21]
Plataforma Illumina GAIIx ^[1]
Tecnologías nanoporosas de Oxford (ONT) MinION ^[10]

Algunos investigadores han elegido la plataforma Illumina MiSeq por su gran longitud de lectura para lecturas cortas. ^[6]

Asamblea

Después de la extracción del genoma, el ADN organelar de alto número de copias se puede ensamblar con una guía de referencia o ensamblarse de novo . Las repeticiones nucleares de alto número de copias se pueden agrupar de novo . ^[1] Los ensambladores elegidos dependerán del genoma de destino y de si se utilizan lecturas cortas o largas. Se han utilizado las siguientes herramientas para ensamblar genomas a partir de extracciones del genoma:

Otro

Genial ^[9]^[15]^[18]^[20]^[21]^[16]^[17]^[28]
Canu ^[10]
CVX ^[7]^[8]^[13]
Espadas ^[14]^[24]
Terciopelo ^[5]^[6]^[14]^[25]
MIRA ^[4]
SOAPdenovo2 ^[23]
SOAPdenovo-Trans ^[19]
Celera ^[15]
IDBA-UD ^[15]^[26]^[27]
Nuevo novate ^[15]
Rayo-Meta ^[15]
ASeMbler ^[14]
Alinear lecturas ^[1]

Anotación

La anotación se utiliza para identificar genes en los conjuntos de genomas. La herramienta de anotación elegida dependerá del genoma de destino y de las características de destino de ese genoma. Las siguientes herramientas de anotación se han utilizado en el análisis de genomas para anotar genomas de organelos:

Otro

Reconstrucción filogenética

Las secuencias ensambladas se alinean globalmente y luego se infieren los árboles filogenéticos utilizando un software de reconstrucción filogenética. El software elegido para la reconstrucción filogenética dependerá de si es apropiado un método de máxima verosimilitud (ML) , máxima parsimonia (MP) o inferencia bayesiana (BI) . Los siguientes programas de reconstrucción filogenética se han utilizado en el descifrado de genomas:

Herramientas y tuberías

Se han desarrollado varios protocolos, procesos y herramientas bioinformáticas para ayudar a automatizar los procesos posteriores del análisis del genoma.

secuenciación hibrida

Hyb-Seq es un nuevo protocolo para capturar genes nucleares de bajo número de copias que combina el enriquecimiento del objetivo y el desnatado del genoma. ^[29] El enriquecimiento del objetivo de los loci de bajo número de copias se logra a través de sondas de enriquecimiento diseñadas para exones de copia única específicos, pero requiere un borrador nuclear del genoma y el transcriptoma del organismo objetivo. Luego, las bibliotecas enriquecidas con el objetivo se secuencian y las lecturas resultantes se procesan, ensamblan e identifican. Usando lecturas fuera del objetivo, también se pueden ensamblar cistrones de ADNr y plastomas completos. A través de este proceso, Hyb-Seq puede producir conjuntos de datos a escala del genoma para la filogenómica .

Obtener orgánulo

GetOrganelle es un kit de herramientas que ensambla genomas de organelos mediante lecturas de desnatado del genoma. ^[30] Las lecturas asociadas a organelos se reclutan utilizando un enfoque modificado de "cebo y mapeo iterativo". Las lecturas que se alinean con el genoma objetivo, utilizando Bowtie2, ^[31] se denominan "lecturas semilla". Las lecturas semilla se utilizan como "cebos" para reclutar más lecturas asociadas a organelos a través de múltiples iteraciones de extensión. El algoritmo de extensión de lectura utiliza un enfoque de hash , donde las lecturas se cortan en subcadenas de ciertas longitudes, denominadas "palabras". En cada iteración de extensión, estas "palabras" se agregan a una tabla hash , denominada "grupo de cebos", que aumenta dinámicamente de tamaño con cada iteración. Debido a la baja cobertura de secuenciación de los desnatados del genoma, las lecturas no objetivo, incluso aquellas con alta similitud de secuencia con las lecturas objetivo, en gran medida no se reclutan. Utilizando las lecturas finales asociadas a los organelos reclutados, GetOrganelle lleva a cabo un ensamblaje de novo , utilizando SPAdes . ^[32] El gráfico de ensamblaje se filtra y desenreda, produciendo todas las rutas posibles del gráfico y, por lo tanto, todas las configuraciones de los genomas organelos circulares.

Esqueleto

Skmer es una herramienta que no requiere ensamblaje ni alineación para calcular distancias genómicas entre los fragmentos de genoma de consulta y de referencia. ^[33] Skmer utiliza un enfoque de dos etapas para calcular estas distancias. En primer lugar, genera un perfil de frecuencia de k-meros utilizando una herramienta llamada JellyFish ^[34] y luego estos k-meros se convierten en hashes. ^[33] Se selecciona un subconjunto aleatorio de estos hashes para formar un denominado "boceto". ^[33] Para su segunda etapa, Skmer utiliza Mash ^[35] para estimar el índice Jaccard de dos de estos bocetos. ^[33] La combinación de estas dos etapas se utiliza para estimar la distancia evolutiva. ^[33]

Ingenioso

Geneious es una plataforma de software integradora que permite a los usuarios realizar varios pasos en el análisis bioinformático, como ensamblaje , alineación y filogenética, incorporando otras herramientas dentro de una plataforma basada en GUI. ^[18]^[28]

Hierba filo

PhyloHerb es un sistema de procesamiento bioinformático escrito en Python . Utiliza una base de datos incorporada o una referencia especificada por el usuario para extraer secuencias ortólogas de regiones ribosómicas nucleares , mitocondriales y de plástidos mediante una búsqueda BLAST. ^[36]

En silicoExploración del genoma

Aunque el skimming del genoma suele elegirse como un método rentable para secuenciar genomas organelares, el skimming del genoma puede realizarse in silico si ya se han obtenido datos de secuenciación (profunda) de todo el genoma. Se ha demostrado que el skimming del genoma simplifica el ensamblaje del genoma organelar al submuestrear las lecturas del genoma nuclear mediante el skimming del genoma in silico . ^[37]^[38] Dado que los genomas organelares tendrán un alto número de copias en la célula, el skimming del genoma in silico esencialmente filtra las secuencias nucleares, dejando una mayor proporción de secuencias organelares a secuencias nucleares para el ensamblaje, lo que reduce la complejidad del paradigma de ensamblaje. El skimming del genoma in silico se realizó primero como una prueba de concepto, optimizando los parámetros para el tipo de lectura, la longitud de la lectura y la cobertura de la secuenciación. ^[1]

Otras aplicaciones

Además de los usos actuales enumerados anteriormente, el skimming del genoma también se ha aplicado a otras tareas, como la cuantificación de mezclas de polen, ^[19] el monitoreo y la conservación de ciertas poblaciones. ^[39] El skimming del genoma también se puede utilizar para la llamada de variantes, para examinar polimorfismos de un solo nucleótido en una especie. ^[22]

Ventajas

El desnatado del genoma es un método rentable, rápido y confiable para generar grandes conjuntos de datos superficiales, ^[5] ya que se generan varios conjuntos de datos (plástidos, mitocondriales, nucleares) por ejecución. ^[3] Es muy simple de implementar, requiere menos trabajo de laboratorio y optimización, y no requiere conocimiento a priori del organismo ni del tamaño de su genoma. ^[3] Esto proporciona una vía de bajo riesgo para la investigación biológica y la generación de hipótesis sin un gran compromiso de recursos. ^[6]

El skimming del genoma es un enfoque especialmente ventajoso en los casos en los que el ADN genómico puede ser antiguo y estar degradado por tratamientos químicos, como en el caso de especímenes de colecciones de herbarios y museos, ^[4] un recurso genómico en gran medida sin explotar. El skimming del genoma permite la caracterización molecular de especies raras o extintas. ^[5] Los procesos de conservación en etanol a menudo dañan el ADN genómico, lo que dificulta el éxito de los protocolos de PCR estándar ^[3] y otros enfoques basados en amplicones. ^[5] Esto presenta una oportunidad para secuenciar muestras con concentraciones de ADN muy bajas, sin la necesidad de enriquecimiento o amplificación del ADN. Se ha demostrado que la preparación de bibliotecas para skimming específico del genoma funciona con tan solo 37 ng de ADN (0,2 ng/ul), 135 veces menos de lo recomendado por Illumina. ^[1]

Aunque el desnatado del genoma se utiliza principalmente para extraer plastomas y mitogenomas con un alto número de copias, también puede proporcionar secuencias parciales de secuencias nucleares con un bajo número de copias. Estas secuencias pueden no ser lo suficientemente completas para el análisis filogenómico, pero pueden ser suficientes para diseñar cebadores y sondas de PCR para enfoques basados en hibridación. ^[1]

El skimming del genoma no depende de ningún cebador específico y no se ve afectado por los reordenamientos genéticos. ^[4]

Limitaciones

El análisis superficial del genoma solo alcanza para analizarlo superficialmente, por lo que no será suficiente para cuestiones biológicas que requieran predicción y anotación de genes. ^[6] Estos pasos posteriores son necesarios para realizar análisis más profundos y significativos.

Aunque las secuencias genómicas de plástidos son abundantes en los análisis del genoma, la presencia de pseudogenes mitocondriales y nucleares de origen plástido puede plantear problemas potenciales para los ensamblajes de plastomas. ^[1]

Una combinación de profundidad de secuenciación y tipo de lectura, así como el objetivo genómico (plastoma, mitogenoma, etc.), influirán en el éxito de los ensamblajes de un solo extremo y de extremos emparejados, por lo que estos parámetros deben elegirse con cuidado. ^[1]

Escalabilidad

Tanto la parte de laboratorio húmedo como la bioinformática del skimming del genoma tienen ciertos desafíos con la escalabilidad. Aunque el costo de la secuenciación en el skimming del genoma es asequible a $80 por 1 Gb en 2016, la preparación de la biblioteca para la secuenciación sigue siendo muy cara, al menos ~$200 por muestra (a partir de 2016). Además, la mayoría de los protocolos de preparación de bibliotecas aún no se han automatizado completamente con robótica. En el lado de la bioinformática, se deben diseñar bases de datos complejas y flujos de trabajo automatizados para manejar las grandes cantidades de datos resultantes del skimming del genoma. Se debe implementar la automatización de los siguientes procesos: ^[40]

Montaje de los códigos de barras estándar
Ensamblaje de ADN organelar (así como repeticiones en tándem ribosómico nuclear)
Anotación de los diferentes fragmentos reunidos
Eliminación de secuencias potencialmente contaminantes
Estimación de la cobertura de secuenciación para genes de copia única
Extracción de lecturas correspondientes a genes de copia única
Identificación de un espécimen desconocido a partir de una secuenciación de escopeta pequeña o cualquier fragmento de ADN
Identificación de diferentes organismos a partir de la secuenciación shotgun de ADN ambiental (metagenómica)

Algunos de estos desafíos de escalabilidad ya se han implementado, como se muestra arriba en la sección "Herramientas y pipelines".

Véase también

Referencias

^ abcdefghijklmno Straub, Shannon CK; Parks, Matthew; Weitemier, Kevin; Fishbein, Mark; Cronn, Richard C.; Liston, Aaron (febrero de 2012). "Navegando por la punta del iceberg genómico: secuenciación de próxima generación para la sistemática de plantas". American Journal of Botany . 99 (2): 349–364. doi :10.3732/ajb.1100335. PMID 22174336.
^ abc Dodsworth, Steven (septiembre de 2015). "Explosión genómica para el análisis de la biodiversidad de próxima generación". Tendencias en la ciencia vegetal . 20 (9): 525–527. doi :10.1016/j.tplants.2015.06.012. PMID 26205170.
^ abcdefg Dodsworth, Steven Andrew, autor. Análisis del genoma para la filogenómica . OCLC 1108700470. {{cite book}}: |last=tiene nombre genérico ( ayuda )Mantenimiento de CS1: varios nombres: lista de autores ( enlace )
^ abcdefghijklmnop Trevisan, Bruna; Alcantara, Daniel MC; Machado, Denis Jacob; Marques, Fernando PL; Lahr, Daniel JG (13 de septiembre de 2019). "El desnatado del genoma es una estrategia robusta y de bajo costo para ensamblar genomas mitocondriales completos a partir de especímenes preservados en etanol en estudios de biodiversidad". PeerJ . 7 : e7543. doi : 10.7717/peerj.7543 . ISSN 2167-8359. PMC 6746217 . PMID 31565556.
^ abcdefghijkl Malé, Pierre-Jean G.; Bardon, Léa; Besnard, Guillaume; Coissac, Eric; Delsuc, Frédéric; Engel, Julien; Lhuillier, Emeline; Scotti-Saintagne, Caroline; Tinaut, Alexandra; Chave, Jérôme (abril de 2014). "El análisis del genoma mediante secuenciación aleatoria ayuda a resolver la filogenia de una familia de árboles pantropicales". Recursos de ecología molecular . 14 (5): 966–75. doi :10.1111/1755-0998.12246. PMID 24606032. S2CID 26777683.
^ abcdefghi Denver, Dee R.; Brown, Amanda MV; Howe, Dana K.; Peetz, Amy B.; Zasada, Inga A. (4 de agosto de 2016). Round, June L. (ed.). "Exploración genómica: un enfoque rápido para obtener conocimientos biológicos diversos sobre patógenos multicelulares". PLOS Pathogens . 12 (8): e1005713. doi : 10.1371/journal.ppat.1005713 . ISSN 1553-7374. PMC 4973915 . PMID 27490201.
^ abcdefghijk Lin, Geng-Ming; Lai, Yu-Heng; Audira, Gilbert; Hsiao, Chung-Der (noviembre de 2017). "Un método simple para decodificar las unidades repetidas completas de ARNr 18-5.8-28S de algas verdes mediante desnatado del genoma". Revista internacional de ciencias moleculares . 18 (11): 2341. doi : 10.3390/ijms18112341 . PMC 5713310 . PMID 29113146.
^ abcdefg Liu, Luxian; Wang, Yuewen; He, Peizi; Li, Pan; Lee, Joongku; Soltis, Douglas E.; Fu, Chengxin (4 de abril de 2018). "Análisis del genoma de cloroplastos y desarrollo de recursos genómicos para los géneros hermanos epilíticos Oresitrophe y Mukdenia (Saxifragaceae), utilizando datos de desnatado del genoma". BMC Genomics . 19 (1): 235. doi : 10.1186/s12864-018-4633-x . ISSN 1471-2164. PMC 5885378 . PMID 29618324.
^ abcdefghijklm Hinsinger, Damien Daniel; Strijk, Joeri Sergej (10 de enero de 2019). "Plastoma de Quercus xanthoclada y comparación de la diversidad genómica entre especies seleccionadas de Quercus mediante descifrado del genoma". PhytoKeys (132): 75–89. doi : 10.3897/phytokeys.132.36365 . ISSN 1314-2003. PMC 6783484 . PMID 31607787.
^ abcdefghi Johri, Shaili; Solanki, Jitesh; Cantu, Vito Adrian; Fellows, Sam R.; Edwards, Robert A.; Moreno, Isabel; Vyas, Asit; Dinsdale, Elizabeth A. (diciembre de 2019). "'Exploración genómica' con el secuenciador portátil MinION identifica especies de tiburones incluidas en la CITES en el mercado de exportación de la India". Scientific Reports . 9 (1): 4476. Bibcode :2019NatSR...9.4476J. doi :10.1038/s41598-019-40940-9. ISSN 2045-2322. PMC 6418218 . PMID 30872700.
^ abc Berger, Brent A.; Han, Jiahong; Sessa, Emily B.; Gardner, Andrew G.; Shepherd, Kelly A.; Ricigliano, Vincent A.; Jabaily, Rachel S.; Howarth, Dianella G. (2017). "Las profundidades inesperadas de los datos de desnatado del genoma: un estudio de caso que examina los genes de simetría floral de Goodeniaceae1". Aplicaciones en Ciencias Vegetales . 5 (10): 1700042. doi :10.3732/apps.1700042. ISSN 2168-0450. PMC 5664964 . PMID 29109919.
^ Berger, Brent A.; Han, Jiahong; Sessa, Emily B.; Gardner, Andrew G.; Shepherd, Kelly A.; Ricigliano, Vincent A.; Jabaily, Rachel S.; Howarth, Dianella G. (octubre de 2017). "Las profundidades inesperadas de los datos de descifrado del genoma: un estudio de caso que examina los genes de simetría floral de Goodeniaceae". Aplicaciones en ciencias vegetales . 5 (10): 1700042. doi :10.3732/apps.1700042. ISSN 2168-0450. PMC 5664964 . PMID 29109919.
^ abcdefgh Zeng, Chun-Xia; Hollingsworth, Peter M.; Yang, Jing; He, Zheng-Shan; Zhang, Zhi-Rong; Li, De-Zhu; Yang, Jun-Bo (5 de junio de 2018). "Explosión genómica de especímenes de herbario para codificación de barras de ADN y filogenómica". Plant Methods . 14 (1): 43. doi : 10.1186/s13007-018-0300-0 . ISSN 1746-4811. PMC 5987614 . PMID 29928291.
^ abcdefghijk Nevill, Paul G.; Zhong, Xiao; Tonti-Filippini, Julian; Byrne, Margaret; Hislop, Michael; Thiele, Kevin; van Leeuwen, Stephen; Boykin, Laura M.; Small, Ian (4 de enero de 2020). "Extracción de genoma a gran escala de material de herbario para la identificación precisa de plantas y filogenómica". Plant Methods . 16 (1): 1. doi : 10.1186/s13007-019-0534-5 . ISSN 1746-4811. PMC 6942304 . PMID 31911810.
^ abcdefghijk Linard, B.; Arribas, P.; Andújar, C.; Crampton‐Platt, A.; Vogler, AP (2016). "Lecciones del desnatado del genoma de etanol preservador de artrópodos" (PDF) . Recursos de ecología molecular . 16 (6): 1365–1377. doi :10.1111/1755-0998.12539. hdl : 10044/1/49937 . ISSN 1755-0998. PMID 27235167. S2CID 22534026.
^ abcdefghi Liu, Shih-Hui; Edwards, Christine E.; Hoch, Peter C.; Raven, Peter H.; Barber, Janet C. (mayo de 2018). "El análisis del genoma proporciona una nueva perspectiva sobre las relaciones en la sección Macrocarpon de Ludwigia, un complejo poliploide". American Journal of Botany . 105 (5): 875–887. doi : 10.1002/ajb2.1086 . PMID 29791715.
^ abcdefgh Nauheimer, Lars; Cui, Lujing; Clarke, Charles; Crayn, Darren M.; Bourke, Greg; Nargar, Katharina (2019). "El análisis del genoma proporciona filogenias nucleares y de plástidos bien resueltas, que muestran patrones de evolución reticular profunda en el género de plantas carnívoras tropicales Nepenthes (Caryophyllales)". Botánica sistemática australiana . 32 (3): 243–254. doi :10.1071/SB18057. ISSN 1030-1887. S2CID 196680739.
^ abcdefghi Ripma, Lee A.; Simpson, Michael G.; Hasenstab-Lehman, Kristen (diciembre de 2014). "Geneious! Métodos simplificados de descifrado del genoma para estudios sistemáticos filogenéticos: un estudio de caso en Oreocarya (Boraginaceae)". Aplicaciones en Ciencias Vegetales . 2 (12): 1400062. doi :10.3732/apps.1400062. ISSN 2168-0450. PMC 4259456 . PMID 25506521.
^ abcdefgh Lang, Dandan; Tang, Min; Hu, Jiahui; Zhou, Xin (noviembre de 2019). "El análisis del genoma proporciona una cuantificación precisa de las mezclas de polen". Recursos de ecología molecular . 19 (6): 1433–1446. doi :10.1111/1755-0998.13061. ISSN 1755-098X. PMC 6900181 . PMID 31325909.
^ abcd Stoughton, Thomas R.; Kriebel, Ricardo; Jolles, Diana D.; O'Quinn, Robin L. (marzo de 2018). "Descubrimiento de linaje de próxima generación: un estudio de caso de Claytonia L. tuberosa". American Journal of Botany . 105 (3): 536–548. doi : 10.1002/ajb2.1061 . PMID 29672830.
^ abcdef Dodsworth, Steven; Guignard, Maïté S.; Christenhusz, Maarten JM; Cowan, Robyn S.; Knapp, Sandra; Maurin, Olivier; Struebig, Monika; Leitch, Andrew R.; Chase, Mark W.; Forest, Félix (29 de octubre de 2018). "Potencial de la herbariomía para estudiar el ADN repetitivo en las angiospermas". Fronteras en ecología y evolución . 6 : 174. doi : 10.3389/fevo.2018.00174 . hdl : 10547/623134 . ISSN 2296-701X.
^ abcd Jackson, David; Emslie, Steven D; van Tuinen, Marcel (2012). "El análisis del genoma identifica el polimorfismo en poblaciones y especies de charranes". BMC Research Notes . 5 (1): 94. doi : 10.1186/1756-0500-5-94 . ISSN 1756-0500. PMC 3292991 . PMID 22333071.
^ abc Xia, Yun; Luo, Wei; Yuan, Siqi; Zheng, Yuchi; Zeng, Xiaomao (diciembre de 2018). "Desarrollo de microsatélites a partir del desnatado del genoma y la secuenciación del transcriptoma: comparación de estrategias y lecciones aprendidas de especies de ranas". BMC Genomics . 19 (1): 886. doi : 10.1186/s12864-018-5329-y . ISSN 1471-2164. PMC 6286531 . PMID 30526480.
^ abcdefg Fonseca, Luiz Henrique M.; Lohmann, Lúcia G. (enero de 2020). "Explorando el potencial de los datos de secuenciación nuclear y mitocondrial generados a través del análisis del genoma para la filogenética de plantas: un estudio de caso de un clado de lianas neotropicales". Journal of Systematics and Evolution . 58 (1): 18–32. doi : 10.1111/jse.12533 . ISSN 1674-4918.
^ abcd Bock, Dan G.; Kane, Nolan C.; Ebert, Daniel P.; Rieseberg, Loren H. (febrero de 2014). "El análisis del genoma revela el origen de la especie de cultivo de tubérculos de alcachofa de Jerusalén: ni de Jerusalén ni de una alcachofa". New Phytologist . 201 (3): 1021–1030. doi : 10.1111/nph.12560 . PMID 24245977.
^ abcdef Richter, Sandy; Schwarz, Francine; Hering, Lars; Böggemann, Markus; Bleidorn, Christoph (diciembre de 2015). "La utilidad del desnatado del genoma para los análisis filogenómicos, como se ha demostrado para las relaciones entre glicéridos (Annelida, Glyceridae)". Genome Biology and Evolution . 7 (12): 3443–3462. doi :10.1093/gbe/evv224. ISSN 1759-6653. PMC 4700955 . PMID 26590213.
^ abcdefg Grandjean, Frederic; Tan, Mun Hua; Gan, Han Ming; Lee, Yin Peng; Kawai, Tadashi; Distefano, Robert J.; Blaha, Martin; Roles, Angela J.; Austin, Christopher M. (noviembre de 2017). "Recuperación rápida de genes nucleares y mitocondriales mediante desnatado del genoma de cangrejos de agua dulce del hemisferio norte". Zoologica Scripta . 46 (6): 718–728. doi :10.1111/zsc.12247. hdl : 11343/292783 . S2CID 90266891.
^ ab "Geneious – OSTR" . Consultado el 28 de febrero de 2020 .
^ Weitemier, Kevin; Straub, Shannon CK; Cronn, Richard C.; Fishbein, Mark; Schmickl, Roswitha; McDonnell, Angela; Liston, Aaron (septiembre de 2014). "Hyb-Seq: Combinación de enriquecimiento de objetivos y desnatado del genoma para la filogenómica de plantas". Aplicaciones en ciencias vegetales . 2 (9): 1400042. doi :10.3732/apps.1400042. ISSN 2168-0450. PMC 4162667 . PMID 25225629.
^ Jin, Jian-Jun; Yu, Wen-Bin; Yang, Jun-Bo; Song, Yu; dePamphilis, Claude W.; Yi, Ting-Shuang; Li, De-Zhu (9 de marzo de 2018). "GetOrganelle: un conjunto de herramientas rápido y versátil para el ensamblaje preciso de novo de genomas de orgánulos". doi : 10.1101/256479 . {{cite journal}}: Requiere citar revista |journal=( ayuda )
^ Langmead, Ben; Salzberg, Steven L (marzo de 2012). "Alineación rápida de lecturas con huecos con Bowtie 2". Nature Methods . 9 (4): 357–359. doi :10.1038/nmeth.1923. ISSN 1548-7091. PMC 3322381 . PMID 22388286.
^ Bankevich, Anton; Nurk, Sergey; Antipov, Dmitry; Gurevich, Alexey A.; Dvorkin, Mikhail; Kulikov, Alexander S.; Lesin, Valery M.; Nikolenko, Sergey I.; Pham, Son; Prjibelski, Andrey D.; Pyshkin, Alexey V. (mayo de 2012). "SPAdes: un nuevo algoritmo de ensamblaje del genoma y sus aplicaciones a la secuenciación de células individuales". Revista de biología computacional . 19 (5): 455–477. doi :10.1089/cmb.2012.0021. ISSN 1066-5277. PMC 3342519 . PMID 22506599.
^ abcde Sarmashghi, Shahab; Bohmann, Kristine; P. Gilbert, M. Thomas; Bafna, Vineet; Mirarab, Siavash (diciembre de 2019). "Skmer: identificación de muestras sin ensamblaje ni alineación mediante desnatado del genoma". Genome Biology . 20 (1): 34. doi : 10.1186/s13059-019-1632-4 . ISSN 1474-760X. PMC 6374904 . PMID 30760303.
^ Marçais, Guillaume; Kingsford, Carl (15 de marzo de 2011). "Un enfoque rápido y sin bloqueos para el recuento paralelo eficiente de ocurrencias de k-meros". Bioinformática . 27 (6): 764–770. doi :10.1093/bioinformatics/btr011. ISSN 1460-2059. PMC 3051319 . PMID 21217122.
^ Ondov, Brian D.; Treangen, Todd J.; Melsted, Páll; Mallonee, Adam B.; Bergman, Nicholas H.; Koren, Sergey; Phillippy, Adam M. (diciembre de 2016). "Mash: estimación rápida de la distancia entre el genoma y el metagenoma utilizando MinHash". Genome Biology . 17 (1): 132. doi : 10.1186/s13059-016-0997-x . ISSN 1474-760X. PMC 4915045 . PMID 27323842.
^ Cai, L., Zhang, H., Davis, CC (2022). "PhyloHerb: un proceso filogenómico de alto rendimiento para procesar datos de descifrado del genoma". Aplicaciones en ciencias vegetales . doi :10.1002/aps3.11475. PMC 9215275 .
^ Lin, Diana; Coombe, Lauren; Jackman, Shaun D.; Gagalova, Kristina K.; Warren, René L.; Hammond, S. Austin; Kirk, Heather; Pandoh, Pawan; Zhao, Yongjun; Moore, Richard A.; Mungall, Andrew J. (6 de junio de 2019). Rokas, Antonis (ed.). "Secuencia completa del genoma del cloroplasto de una pícea blanca (Picea glauca, genotipo WS77111) del este de Canadá". Anuncios de recursos de microbiología . 8 (23): e00381–19, /mra/8/23/MRA.00381–19.atom. doi :10.1128/MRA.00381-19. ISSN 2576-098X. PMC 6554609 . Número de modelo: PMID31171622.
^ Lin, Diana; Coombe, Lauren; Jackman, Shaun D.; Gagalova, Kristina K.; Warren, René L.; Hammond, S. Austin; McDonald, Helen; Kirk, Heather; Pandoh, Pawan; Zhao, Yongjun; Moore, Richard A. (13 de junio de 2019). Stajich, Jason E. (ed.). "Secuencia completa del genoma del cloroplasto de una pícea de Engelmann (Picea engelmannii, genotipo Se404-851) del oeste de Canadá". Anuncios de recursos de microbiología . 8 (24): e00382–19, /mra/8/24/MRA.00382–19.atom. doi :10.1128/MRA.00382-19. ISSN 2576-098X. PMC 6588038 . Número de modelo : PMID31196920.
^ Johri, Shaili; Doane, Michael; Allen, Lauren; Dinsdale, Elizabeth (29 de marzo de 2019). "Aprovechando la revolución genómica para el monitoreo y conservación de poblaciones de condrictios". Diversity . 11 (4): 49. doi : 10.3390/d11040049 . ISSN 1424-2818.
^ Coissac, Eric; Hollingsworth, Peter M.; Lavergne, Sébastien; Taberlet, Pierre (abril de 2016). "De los códigos de barras a los genomas: extendiendo el concepto de códigos de barras de ADN". Ecología molecular . 25 (7): 1423–1428. doi : 10.1111/mec.13549 . PMID 26821259.