stringtranslate.com

genómica

La genómica es un campo interdisciplinario de la biología que se centra en la estructura, función, evolución, mapeo y edición de genomas . Un genoma es el conjunto completo de ADN de un organismo , incluidos todos sus genes, así como su configuración estructural jerárquica y tridimensional. [1] [2] [3] [4] A diferencia de la genética , que se refiere al estudio de genes individuales y sus funciones en la herencia, la genómica apunta a la caracterización y cuantificación colectiva de todos los genes de un organismo, sus interrelaciones e influencia. sobre el organismo. [5] Los genes pueden dirigir la producción de proteínas con la ayuda de enzimas y moléculas mensajeras. A su vez, las proteínas forman estructuras corporales como órganos y tejidos, además de controlar reacciones químicas y transportar señales entre las células. La genómica también implica la secuenciación y el análisis de genomas mediante el uso de secuenciación de ADN de alto rendimiento y bioinformática para ensamblar y analizar la función y estructura de genomas completos. [6] [7] Los avances en genómica han desencadenado una revolución en la investigación basada en descubrimientos y en la biología de sistemas para facilitar la comprensión incluso de los sistemas biológicos más complejos, como el cerebro. [8]

El campo también incluye estudios de fenómenos intragenómicos (dentro del genoma) como la epistasis (efecto de un gen sobre otro), la pleiotropía (un gen que afecta a más de un rasgo), la heterosis (vigor híbrido) y otras interacciones entre loci y alelos dentro del genoma. el genoma. [9]

Historia

Etimología

Del griego ΓΕΝ [10] gen , "gen" (gamma, épsilon, nu, épsilon) que significa "llegar a ser, crear, creación, nacimiento", y variantes posteriores: genealogía, génesis, genética, genic, genómero, genotipo, género, etc. Mientras que la palabra genoma (del alemán Genom , atribuido a Hans Winkler ) se utilizaba en inglés ya en 1926, [11] el término genómica fue acuñado por Tom Roderick, genetista del Laboratorio Jackson ( Bar Harbor, Maine ) . , tomando cervezas con Jim Womack, Tom Shows y Stephen O'Brien en una reunión celebrada en Maryland sobre el mapeo del genoma humano en 1986. [12] Primero como nombre de una nueva revista y luego como una disciplina científica completamente nueva. [13]

Esfuerzos tempranos de secuenciación

Tras la confirmación de Rosalind Franklin de la estructura helicoidal del ADN, la publicación de James D. Watson y Francis Crick de la estructura del ADN en 1953 y la publicación de Fred Sanger de la secuencia de aminoácidos de la insulina en 1955, la secuenciación de ácidos nucleicos se volvió un objetivo importante de los primeros biólogos moleculares . [14] En 1964, Robert W. Holley y sus colegas publicaron la primera secuencia de ácido nucleico jamás determinada, la secuencia de ribonucleótidos del ARN de transferencia de alanina . [15] [16] Ampliando este trabajo, Marshall Nirenberg y Philip Leder revelaron la naturaleza triplete del código genético y pudieron determinar las secuencias de 54 de 64 codones en sus experimentos. [17] En 1972, Walter Fiers y su equipo en el Laboratorio de Biología Molecular de la Universidad de Gante ( Gante , Bélgica ) fueron los primeros en determinar la secuencia de un gen: el gen de la proteína de cubierta del bacteriófago MS2 . [18] El grupo de Fiers amplió su trabajo sobre la proteína de cubierta MS2, determinando la secuencia completa de nucleótidos del bacteriófago MS2-RNA (cuyo genoma codifica sólo cuatro genes en 3569 pares de bases [pb]) y el virus 40 del simio en 1976 y 1978, respectivamente. . [19] [20]

Desarrollada tecnología de secuenciación de ADN

Frederick Sanger y Walter Gilbert compartieron la mitad del Premio Nobel de Química de 1980 por desarrollar de forma independiente métodos para la secuenciación del ADN.

Además de su trabajo fundamental sobre la secuencia de aminoácidos de la insulina, Frederick Sanger y sus colegas desempeñaron un papel clave en el desarrollo de técnicas de secuenciación de ADN que permitieron el establecimiento de proyectos integrales de secuenciación del genoma. [9] En 1975, él y Alan Coulson publicaron un procedimiento de secuenciación utilizando ADN polimerasa con nucleótidos radiomarcados al que llamó técnica Más y Menos . [21] [22] Esto implicó dos métodos estrechamente relacionados que generaron oligonucleótidos cortos con extremos 3' definidos. Estos podrían fraccionarse mediante electroforesis en un gel de poliacrilamida (llamada electroforesis en gel de poliacrilamida) y visualizarse mediante autorradiografía. El procedimiento podía secuenciar hasta 80 nucleótidos de una sola vez y supuso una gran mejora, pero seguía siendo muy laborioso. Sin embargo, en 1977 su grupo pudo secuenciar la mayoría de los 5.386 nucleótidos del bacteriófago monocatenario φX174 , completando el primer genoma basado en ADN completamente secuenciado. [23] El refinamiento del método Más y Menos dio como resultado la terminación de cadena, o método Sanger (ver más abajo), que formó la base de las técnicas de secuenciación de ADN, mapeo del genoma, almacenamiento de datos y análisis bioinformático más ampliamente utilizados en el siguiente cuarto de siglo de investigación. [24] [25] En el mismo año, Walter Gilbert y Allan Maxam de la Universidad de Harvard desarrollaron de forma independiente el método Maxam-Gilbert (también conocido como método químico ) de secuenciación de ADN, que implica la escisión preferencial del ADN en bases conocidas, una forma menos eficiente. método. [26] [27] Por su trabajo innovador en la secuenciación de ácidos nucleicos, Gilbert y Sanger compartieron la mitad del Premio Nobel de Química de 1980 con Paul Berg ( ADN recombinante ).

Genomas completos

La llegada de estas tecnologías dio lugar a una rápida intensificación del alcance y la velocidad de finalización de los proyectos de secuenciación del genoma . La primera secuencia genómica completa de un orgánulo eucariótico , la mitocondria humana (16.568 pb, aproximadamente 16,6 kb [kilobase]), se informó en 1981, [28] y los primeros genomas de cloroplasto siguieron en 1986. [29] [30] En 1992 Se secuenció el primer cromosoma eucariota , el cromosoma III de la levadura de cerveza Saccharomyces cerevisiae (315 kb). [31] El primer organismo de vida libre que se secuenció fue el de Haemophilus influenzae (1,8 Mb [megabase]) en 1995. [32] Al año siguiente, un consorcio de investigadores de laboratorios de América del Norte , Europa y Japón anunció la finalización de la primera secuencia completa del genoma de un eucariota, S. cerevisiae (12,1 Mb), y desde entonces se han seguido secuenciando genomas a un ritmo exponencialmente creciente. [33] En octubre de 2011 , las secuencias completas están disponibles para: 2.719 virus , 1.115 arqueas y bacterias , y 36 eucariotas , de los cuales aproximadamente la mitad son hongos . [34] [35]

Gráfico "palo de hockey" que muestra el crecimiento exponencial de las bases de datos de secuencias públicas.
El número de proyectos de genoma ha aumentado a medida que las mejoras tecnológicas continúan reduciendo el costo de la secuenciación. (A) Crecimiento exponencial de las bases de datos de secuencias del genoma desde 1995. (B) El costo en dólares estadounidenses (USD) para secuenciar un millón de bases. (C) El costo en USD para secuenciar un genoma de 3000 Mb (de tamaño humano) en una escala logarítmica transformada.

La mayoría de los microorganismos cuyos genomas han sido completamente secuenciados son patógenos problemáticos , como Haemophilus influenzae , lo que ha dado lugar a un sesgo pronunciado en su distribución filogenética en comparación con la amplitud de la diversidad microbiana. [36] [37] De las otras especies secuenciadas, la mayoría fueron elegidas porque eran organismos modelo bien estudiados o prometían convertirse en buenos modelos. La levadura ( Saccharomyces cerevisiae ) ha sido durante mucho tiempo un importante organismo modelo para la célula eucariota , mientras que la mosca de la fruta Drosophila melanogaster ha sido una herramienta muy importante (especialmente en las primeras etapas de la genética premolecular ). El gusano Caenorhabditis elegans es un modelo simple de uso frecuente para organismos multicelulares . El pez cebra Brachydanio rerio se utiliza para muchos estudios de desarrollo a nivel molecular, y la planta Arabidopsis thaliana es un organismo modelo para plantas con flores. El pez globo japonés ( Takifugu rubripes ) y el pez globo verde manchado ( Tetraodon nigroviridis ) son interesantes por sus genomas pequeños y compactos, que contienen muy poco ADN no codificante en comparación con la mayoría de las especies. [38] [39] Los mamíferos perro ( Canis familiaris ), [40] la rata parda ( Rattus norvegicus ), el ratón ( Mus musculus ) y el chimpancé ( Pan troglodytes ) son animales modelo importantes en la investigación médica. [27]

El Proyecto Genoma Humano completó un borrador del genoma humano a principios de 2001, generando mucha fanfarria. [41] Este proyecto, completado en 2003, secuenció el genoma completo de una persona específica, y en 2007 esta secuencia fue declarada "terminada" (menos de un error en 20.000 bases y todos los cromosomas ensamblados). [41] En los años transcurridos desde entonces, se han secuenciado los genomas de muchos otros individuos, en parte bajo los auspicios del Proyecto 1000 Genomas , que anunció la secuenciación de 1.092 genomas en octubre de 2012. [42] La finalización de este proyecto fue posible por el desarrollo de tecnologías de secuenciación dramáticamente más eficientes y requirió el compromiso de importantes recursos bioinformáticos de una gran colaboración internacional. [43] El análisis continuo de datos genómicos humanos tiene profundas repercusiones políticas y sociales para las sociedades humanas. [44]

La revolución de las "ómicas"

Esquema general que muestra las relaciones del genoma , transcriptoma , proteoma y metaboloma ( lipidoma )

El neologismo en lengua inglesa ómica se refiere informalmente a un campo de estudio de la biología que termina en -ómica , como la genómica, la proteómica o la metabolómica . El sufijo relacionado -ome se utiliza para referirse a los objetos de estudio de dichos campos, como el genoma , el proteoma o el metaboloma ( lipidoma ), respectivamente. El sufijo -ome, tal como se utiliza en biología molecular, se refiere a una totalidad de algún tipo; De manera similar, la ómica ha llegado a referirse generalmente al estudio de conjuntos de datos biológicos grandes y completos. Si bien el crecimiento en el uso del término ha llevado a algunos científicos ( Jonathan Eisen , entre otros [45] ) a afirmar que se ha sobrevendido, [46] refleja el cambio de orientación hacia el análisis cuantitativo de resultados completos o casi completos. conjunto de todos los constituyentes de un sistema. [47] En el estudio de las simbiosis , por ejemplo, los investigadores que antes se limitaban al estudio de un solo producto genético ahora pueden comparar simultáneamente el complemento total de varios tipos de moléculas biológicas. [48] ​​[49]

Análisis del genoma

Una vez seleccionado un organismo, los proyectos genómicos implican tres componentes: la secuenciación del ADN, el ensamblaje de esa secuencia para crear una representación del cromosoma original y la anotación y análisis de esa representación. [9]

Descripción general de un proyecto genómico. En primer lugar, se debe seleccionar el genoma, lo que implica varios factores, incluidos el costo y la relevancia. En segundo lugar, la secuencia se genera y ensambla en un centro de secuenciación determinado (como BGI o DOE JGI ). En tercer lugar, la secuencia del genoma está anotada en varios niveles: ADN, proteínas, vías genéticas o comparativamente.

Secuenciación

Históricamente, la secuenciación se realizaba en centros de secuenciación , instalaciones centralizadas (que van desde grandes instituciones independientes como el Joint Genome Institute, que secuencia docenas de terabases al año, hasta instalaciones locales centrales de biología molecular) que contienen laboratorios de investigación con la costosa instrumentación y el apoyo técnico necesarios. Sin embargo, a medida que la tecnología de secuenciación continúa mejorando, una nueva generación de secuenciadores de sobremesa eficaces y de respuesta rápida se ha puesto al alcance del laboratorio académico promedio. [50] [51] En general, los enfoques de secuenciación del genoma se dividen en dos categorías amplias: secuenciación de escopeta y secuenciación de alto rendimiento (o de próxima generación ). [9]

Secuenciación de escopeta

Un analizador genético ABI PRISM 3100. Estos secuenciadores capilares automatizaron los primeros esfuerzos de secuenciación del genoma a gran escala.

La secuenciación de escopeta es un método de secuenciación diseñado para el análisis de secuencias de ADN de más de 1000 pares de bases, hasta cromosomas completos inclusive. [52] Se denomina así por analogía con el patrón de disparo casi aleatorio de una escopeta que se expande rápidamente . Dado que la secuenciación por electroforesis en gel solo se puede utilizar para secuencias bastante cortas (de 100 a 1000 pares de bases), las secuencias de ADN más largas deben dividirse en pequeños segmentos aleatorios que luego se secuencian para obtener lecturas . Se obtienen múltiples lecturas superpuestas para el ADN objetivo realizando varias rondas de esta fragmentación y secuenciación. Luego, los programas de computadora utilizan los extremos superpuestos de diferentes lecturas para ensamblarlas en una secuencia continua. [52] [53] La secuenciación directa es un proceso de muestreo aleatorio que requiere un sobremuestreo para garantizar que un nucleótido determinado esté representado en la secuencia reconstruida; el número promedio de lecturas mediante las cuales se sobremuestrea un genoma se denomina cobertura . [54]

Durante gran parte de su historia, la tecnología subyacente a la secuenciación shotgun fue el método clásico de terminación de cadena o ' método Sanger ', que se basa en la incorporación selectiva de didesoxinucleótidos terminales de cadena por la ADN polimerasa durante la replicación in vitro del ADN . [23] [55] Recientemente, la secuenciación directa ha sido reemplazada por métodos de secuenciación de alto rendimiento , especialmente para análisis genómicos automatizados a gran escala . Sin embargo, el método Sanger sigue utilizándose ampliamente, principalmente para proyectos de menor escala y para obtener lecturas de secuencias de ADN contiguas especialmente largas (>500 nucleótidos). [56] Los métodos de terminación de cadena requieren una plantilla de ADN monocatenario, un cebador de ADN , una ADN polimerasa , desoxinucleosidetrifosfatos normales (dNTP) y nucleótidos modificados (didesoxiNTP) que terminan el alargamiento de la cadena de ADN. Estos nucleótidos terminales de cadena carecen de un grupo 3'- OH necesario para la formación de un enlace fosfodiéster entre dos nucleótidos, lo que hace que la ADN polimerasa deje de extender el ADN cuando se incorpora un ddNTP. Los ddNTP pueden marcarse radiactiva o fluorescentemente para su detección en secuenciadores de ADN . [9] Normalmente, estas máquinas pueden secuenciar hasta 96 muestras de ADN en un solo lote (ejecución) en hasta 48 ejecuciones por día. [57]

Secuenciación de alto rendimiento

La gran demanda de secuenciación de bajo costo ha impulsado el desarrollo de tecnologías de secuenciación de alto rendimiento que paralelizan el proceso de secuenciación y producen miles o millones de secuencias a la vez. [58] [59] La secuenciación de alto rendimiento tiene como objetivo reducir el costo de la secuenciación de ADN más allá de lo que es posible con los métodos estándar de terminación de colorante. En la secuenciación de rendimiento ultraalto, se pueden ejecutar en paralelo hasta 500.000 operaciones de secuenciación por síntesis. [60] [61]

Sistema Illumina Genome Analyzer II. Las tecnologías de Illumina han establecido el estándar para la secuenciación masiva en paralelo de alto rendimiento. [50]

El método de secuenciación de tintes de Illumina se basa en terminadores de tintes reversibles y fue desarrollado en 1996 en el Instituto de Investigación Biomédica de Ginebra por Pascal Mayer y Laurent Farinelli. [62] En este método, las moléculas de ADN y los cebadores se unen primero a un portaobjetos y se amplifican con polimerasa para que se formen colonias clonales locales, inicialmente denominadas "colonias de ADN". Para determinar la secuencia, se añaden cuatro tipos de bases terminadoras reversibles (bases RT) y los nucleótidos no incorporados se eliminan por lavado. A diferencia de la pirosecuenciación, las cadenas de ADN se extienden un nucleótido a la vez y la adquisición de imágenes se puede realizar en un momento retrasado, lo que permite capturar conjuntos muy grandes de colonias de ADN mediante imágenes secuenciales tomadas con una sola cámara. Desacoplar la reacción enzimática y la captura de imágenes permite un rendimiento óptimo y una capacidad de secuenciación teóricamente ilimitada; Con una configuración óptima, el rendimiento final del instrumento depende únicamente de la tasa de conversión A/D de la cámara. La cámara toma imágenes de los nucleótidos marcados con fluorescencia y luego el tinte junto con el bloqueador terminal 3' se elimina químicamente del ADN, lo que permite el siguiente ciclo. [63]

Un enfoque alternativo, la secuenciación de semiconductores de iones, se basa en la química de replicación del ADN estándar. Esta tecnología mide la liberación de un ion hidrógeno cada vez que se incorpora una base. Un micropocillo que contiene ADN molde se inunda con un solo nucleótido ; si el nucleótido es complementario a la cadena molde, se incorporará y se liberará un ion hidrógeno. Esta liberación activa un sensor de iones ISFET . Si hay un homopolímero presente en la secuencia plantilla, se incorporarán múltiples nucleótidos en un único ciclo de inundación y la señal eléctrica detectada será proporcionalmente mayor. [64]

Asamblea

Se deben ensamblar múltiples lecturas de secuencias fragmentadas en función de sus áreas superpuestas.

El ensamblaje de secuencia se refiere a alinear y fusionar fragmentos de una secuencia de ADN mucho más larga para reconstruir la secuencia original. [9] Esto es necesario ya que la tecnología actual de secuenciación de ADN no puede leer genomas completos como una secuencia continua, sino que lee pequeños fragmentos de entre 20 y 1000 bases, dependiendo de la tecnología utilizada. Las tecnologías de secuenciación de tercera generación, como PacBio u Oxford Nanopore, generan habitualmente lecturas de secuenciación de >10 kb de longitud; sin embargo, tienen una alta tasa de error de aproximadamente el 15 por ciento. [65] [66] Por lo general, los fragmentos cortos, llamados lecturas, resultan de la secuenciación rápida de ADN genómico o transcripciones de genes ( EST ). [9]

Enfoques de montaje

El ensamblaje se puede clasificar en términos generales en dos enfoques: ensamblaje de novo , para genomas que no son similares a ninguno secuenciado en el pasado, y ensamblaje comparativo, que utiliza la secuencia existente de un organismo estrechamente relacionado como referencia durante el ensamblaje. [54] En relación con el ensamblaje comparativo, el ensamblaje de novo es computacionalmente difícil ( NP-hard ), lo que lo hace menos favorable para las tecnologías NGS de lectura corta. Dentro del paradigma de ensamblaje de novo existen dos estrategias principales para el ensamblaje, las estrategias de ruta euleriana y las estrategias de consenso de diseño de superposición (OLC). En última instancia, las estrategias OLC intentan crear una ruta hamiltoniana a través de un gráfico de superposición, lo cual es un problema NP difícil. Las estrategias de caminos eulerianos son computacionalmente más manejables porque intentan encontrar un camino euleriano a través de un gráfico de DeBruijn. [54]

Refinamiento

Los genomas terminados se definen como aquellos que tienen una única secuencia contigua sin ambigüedades que representen cada replicón . [67]

Anotación

El ensamblaje de la secuencia de ADN por sí solo tiene poco valor sin análisis adicionales. [9] La anotación del genoma es el proceso de adjuntar información biológica a secuencias y consta de tres pasos principales: [68]

  1. Identificar porciones del genoma que no codifican proteínas.
  2. identificar elementos en el genoma , un proceso llamado predicción genética , y
  3. adjuntando información biológica a estos elementos.

Las herramientas de anotación automática intentan realizar estos pasos in silico , a diferencia de la anotación manual (también conocida como curación), que implica experiencia humana y una posible verificación experimental. [69] Idealmente, estos enfoques coexisten y se complementan entre sí en el mismo proceso de anotación (ver también más abajo).

Tradicionalmente, el nivel básico de anotación consiste en utilizar BLAST para encontrar similitudes y luego anotar genomas basándose en homólogos. [9] Más recientemente, se agrega información adicional a la plataforma de anotaciones. La información adicional permite a los anotadores manuales desconvolucionar las discrepancias entre genes a los que se les asigna la misma anotación. Algunas bases de datos utilizan información del contexto del genoma, puntuaciones de similitud, datos experimentales e integraciones de otros recursos para proporcionar anotaciones del genoma a través de su enfoque de subsistemas. Otras bases de datos (por ejemplo, Ensembl ) se basan tanto en fuentes de datos seleccionadas como en una variedad de herramientas de software en su proceso de anotación automatizada del genoma. [70] La anotación estructural consiste en la identificación de elementos genómicos, principalmente ORF y su localización, o estructura genética. La anotación funcional consiste en adjuntar información biológica a elementos genómicos.

Secuenciación de canales y bases de datos.

La necesidad de reproducibilidad y gestión eficiente de la gran cantidad de datos asociados con los proyectos del genoma significa que los procesos computacionales tienen aplicaciones importantes en genómica. [71]

Áreas de investigación

Genómica funcional

La genómica funcional es un campo de la biología molecular que intenta hacer uso de la gran riqueza de datos producidos por proyectos genómicos (como los proyectos de secuenciación del genoma ) para describir funciones e interacciones de genes (y proteínas ). La genómica funcional se centra en los aspectos dinámicos como la transcripción , traducción y las interacciones proteína-proteína de genes , a diferencia de los aspectos estáticos de la información genómica como la secuencia o las estructuras del ADN . La genómica funcional intenta responder preguntas sobre la función del ADN a nivel de genes, transcripciones de ARN y productos proteicos. Una característica clave de los estudios de genómica funcional es su enfoque de todo el genoma para estas cuestiones, que generalmente implica métodos de alto rendimiento en lugar de un enfoque más tradicional "gen por gen".

Una rama importante de la genómica todavía se ocupa de la secuenciación de los genomas de diversos organismos, pero el conocimiento de los genomas completos ha creado la posibilidad para el campo de la genómica funcional , que se ocupa principalmente de los patrones de expresión genética durante diversas condiciones. Las herramientas más importantes aquí son los microarrays y la bioinformática .

Genómica estructural

Un ejemplo de estructura proteica determinada por el Centro de Genómica Estructural del Medio Oeste

La genómica estructural busca describir la estructura tridimensional de cada proteína codificada por un genoma determinado . [72] [73] Este enfoque basado en el genoma permite un método de alto rendimiento para la determinación de la estructura mediante una combinación de enfoques experimentales y de modelado . La principal diferencia entre la genómica estructural y la predicción estructural tradicional es que la genómica estructural intenta determinar la estructura de cada proteína codificada por el genoma, en lugar de centrarse en una proteína en particular. Con secuencias de genoma completo disponibles, la predicción de la estructura se puede hacer más rápidamente mediante una combinación de enfoques experimentales y de modelado, especialmente porque la disponibilidad de una gran cantidad de genomas secuenciados y estructuras de proteínas previamente resueltas permite a los científicos modelar la estructura de las proteínas a partir de estructuras de proteínas previamente resueltas. homólogos. La genómica estructural implica adoptar una gran cantidad de enfoques para la determinación de la estructura, incluidos métodos experimentales que utilizan secuencias genómicas o enfoques basados ​​en modelos basados ​​en la homología secuencial o estructural con una proteína de estructura conocida o basados ​​en principios químicos y físicos para una proteína sin homología con cualquier estructura conocida. A diferencia de la biología estructural tradicional , la determinación de la estructura de una proteína a través de un esfuerzo de genómica estructural a menudo (pero no siempre) ocurre antes de que se sepa algo sobre la función de la proteína. Esto plantea nuevos desafíos en bioinformática estructural , es decir, determinar la función de las proteínas a partir de su estructura tridimensional . [74]

Epigenómica

La epigenómica es el estudio del conjunto completo de modificaciones epigenéticas sobre el material genético de una célula, conocido como epigenoma . [75] Las modificaciones epigenéticas son modificaciones reversibles en el ADN o las histonas de una célula que afectan la expresión genética sin alterar la secuencia del ADN (Russell 2010 p. 475). Dos de las modificaciones epigenéticas más caracterizadas son la metilación del ADN y la modificación de histonas . [76] Las modificaciones epigenéticas desempeñan un papel importante en la expresión y regulación genética, y están implicadas en numerosos procesos celulares, como la diferenciación/desarrollo [77] y la tumorigénesis . [75] El estudio de la epigenética a nivel global ha sido posible sólo recientemente gracias a la adaptación de ensayos genómicos de alto rendimiento. [78]

Metagenómica

La secuenciación ambiental tipo escopeta (ESS) es una técnica clave en metagenómica. (A) Muestreo del hábitat; (B) filtrar partículas, normalmente por tamaño; (C) Lisis y extracción de ADN; (D) clonación y construcción de bibliotecas; (E) secuenciar los clones; (F) secuenciar el ensamblaje en contigs y andamios.

La metagenómica es el estudio de los metagenomas , material genético recuperado directamente de muestras ambientales . El campo amplio también puede denominarse genómica ambiental, ecogenómica o genómica comunitaria. Mientras que la microbiología tradicional y la secuenciación del genoma microbiano se basan en cultivos clonales cultivados , la secuenciación temprana de genes ambientales clonaba genes específicos (a menudo el gen 16S rRNA ) para producir un perfil de diversidad en una muestra natural. Dicho trabajo reveló que los métodos basados ​​en el cultivo habían pasado por alto la gran mayoría de la biodiversidad microbiana . [79] Estudios recientes utilizan secuenciación de Sanger "escopeta" o pirosecuenciación masiva paralela para obtener muestras en gran medida imparciales de todos los genes de todos los miembros de las comunidades muestreadas. [80] Debido a su poder para revelar la diversidad previamente oculta de la vida microscópica, la metagenómica ofrece una lente poderosa para ver el mundo microbiano que tiene el potencial de revolucionar la comprensión de todo el mundo vivo. [81] [82]

Sistemas modelo

Virus y bacteriófagos.

Los bacteriófagos han desempeñado y siguen desempeñando un papel clave en la genética bacteriana y la biología molecular . Históricamente, se utilizaron para definir la estructura genética y la regulación genética. Además, el primer genoma en ser secuenciado fue el de un bacteriófago . Sin embargo, la investigación sobre bacteriófagos no lideró la revolución genómica, que está claramente dominada por la genómica bacteriana. Sólo muy recientemente se ha vuelto prominente el estudio de los genomas de los bacteriófagos, lo que ha permitido a los investigadores comprender los mecanismos subyacentes a la evolución de los fagos . Las secuencias del genoma de los bacteriófagos se pueden obtener mediante secuenciación directa de bacteriófagos aislados, pero también se pueden derivar como parte de genomas microbianos. El análisis de genomas bacterianos ha demostrado que una cantidad sustancial de ADN microbiano consta de secuencias de profagos y elementos similares a profagos. [83] Una extracción detallada de la base de datos de estas secuencias ofrece información sobre el papel de los profagos en la configuración del genoma bacteriano: en general, este método verificó muchos grupos de bacteriófagos conocidos, lo que lo convierte en una herramienta útil para predecir las relaciones de los profagos a partir de genomas bacterianos. [84] [85]

Cianobacterias

En la actualidad hay 24 cianobacterias de las que se dispone de una secuencia genómica total. 15 de estas cianobacterias proceden del medio marino. Se trata de seis cepas de Proclorococcus , siete cepas marinas de Synechococcus , Trichodesmium erythraeum IMS101 y Crocosphaera watsonii WH8501. Varios estudios han demostrado cómo estas secuencias podrían usarse con mucho éxito para inferir importantes características ecológicas y fisiológicas de las cianobacterias marinas. Sin embargo, actualmente hay muchos más proyectos genómicos en marcha, entre ellos se encuentran otros aislamientos de Proclorococos y Synechococcus marinos , Acaryochloris y Procloron , las cianobacterias filamentosas fijadoras de N 2 Nodularia spumigena , Lyngbya aestuarii y Lyngbya majuscula , así como bacteriófagos que infectan cianobacerias marinas. . Por lo tanto, el creciente cuerpo de información sobre el genoma también puede aprovecharse de una manera más general para abordar problemas globales aplicando un enfoque comparativo. Algunos ejemplos nuevos y apasionantes de avances en este campo son la identificación de genes para los ARN reguladores, la comprensión del origen evolutivo de la fotosíntesis o la estimación de la contribución de la transferencia horizontal de genes a los genomas que se han analizado. [86]

Aplicaciones

Cariograma esquemático de un ser humano, que proporciona una descripción simplificada del genoma humano. Es una representación gráfica del cariotipo diploide humano idealizado , con bandas y subbandas anotadas . Muestra regiones oscuras y blancas en las bandas G. Cada fila está alineada verticalmente al nivel del centrómero . Muestra 22 pares de cromosomas autosómicos homólogos , tanto la versión femenina (XX) como la masculina (XY) de los dos cromosomas sexuales , así como el genoma mitocondrial (en la parte inferior izquierda).

La genómica ha proporcionado aplicaciones en muchos campos, incluida la medicina , la biotecnología , la antropología y otras ciencias sociales . [44]

medicina genómica

Las tecnologías genómicas de próxima generación permiten a los médicos e investigadores biomédicos aumentar drásticamente la cantidad de datos genómicos recopilados en grandes poblaciones de estudio. [87] Cuando se combina con nuevos enfoques informáticos que integran muchos tipos de datos con datos genómicos en la investigación de enfermedades, esto permite a los investigadores comprender mejor las bases genéticas de la respuesta a los medicamentos y las enfermedades. [88] [89] Los primeros esfuerzos para aplicar el genoma a la medicina incluyeron los de un equipo de Stanford dirigido por Euan Ashley , quien desarrolló las primeras herramientas para la interpretación médica de un genoma humano. [90] [91] [92] El programa de investigación Genomes2People en Brigham and Women's Hospital , Broad Institute y Harvard Medical School se estableció en 2012 para realizar investigaciones empíricas sobre la traducción de la genómica en salud. El Brigham and Women's Hospital abrió una Clínica de Genómica Preventiva en agosto de 2019, y el Hospital General de Massachusetts le siguió un mes después. [93] [94] El programa de investigación All of Us tiene como objetivo recopilar datos de secuencia del genoma de 1 millón de participantes para convertirse en un componente crítico de la plataforma de investigación de medicina de precisión. [95]

Biología sintética y bioingeniería.

El crecimiento del conocimiento genómico ha permitido aplicaciones cada vez más sofisticadas de la biología sintética . [96] En 2010, investigadores del Instituto J. Craig Venter anunciaron la creación de una especie de bacteria parcialmente sintética , Mycoplasma laboratorium , derivada del genoma de Mycoplasma genitalium . [97]

Genómica de poblaciones y conservación.

La genómica de poblaciones se ha convertido en un campo de investigación popular, donde se utilizan métodos de secuenciación genómica para realizar comparaciones a gran escala de secuencias de ADN entre poblaciones, más allá de los límites de los marcadores genéticos como los productos de PCR de corto alcance o los microsatélites utilizados tradicionalmente en genética de poblaciones . La genómica de poblaciones estudia los efectos en todo el genoma para mejorar nuestra comprensión de la microevolución , de modo que podamos conocer lahistoria filogenética y la demografía de una población. [98] Los métodos genómicos de poblaciones se utilizan en muchos campos diferentes, incluidos la biología evolutiva , la ecología , la biogeografía , la biología de la conservación y la ordenación pesquera . De manera similar, la genómica del paisaje se ha desarrollado a partir de la genética del paisaje para utilizar métodos genómicos para identificar relaciones entre patrones de variación ambiental y genética.

Los conservacionistas pueden utilizar la información recopilada mediante la secuenciación genómica para evaluar mejor los factores genéticos clave para la conservación de las especies, como la diversidad genética de una población o si un individuo es heterocigoto para un trastorno genético hereditario recesivo. [99] Al utilizar datos genómicos para evaluar los efectos de los procesos evolutivos y detectar patrones de variación en una población determinada, los conservacionistas pueden formular planes para ayudar a una especie determinada sin que queden tantas variables desconocidas como las que no abordan los enfoques genéticos estándar . [100]

Ver también

Referencias

  1. ^ Franklin RE, Gosling RG (abril de 1953). "Configuración molecular en timonucleato de sodio". Naturaleza . 171 (4356): 740–1. Código Bib :1953Natur.171..740F. doi :10.1038/171740a0. PMID  13054694. S2CID  4268222.
  2. ^ Satzinger H (marzo de 2008). "Theodor y Marcella Boveri: cromosomas y citoplasma en herencia y desarrollo". Reseñas de la naturaleza. Genética . 9 (3): 231–238. doi :10.1038/nrg2311. PMID  18268510. S2CID  15829893.
  3. ^ Cremer T, Cremer C (2006). "Auge, caída y resurrección de los territorios cromosómicos: una perspectiva histórica. Parte I. El ascenso de los territorios cromosómicos". Revista europea de histoquímica . 50 (3): 161-176. PMID  16920639.
  4. ^ Rossi, MJ; Kuntala, PK; Lai, WKM; Yamada, N; Badjatía, N; Mittal, C; Kuzu, G; Bocklund, K; Farrell, NP; Blanda, TR; Mairose, JD; Hilvanado, AV; Mistretta, KS; Rocco, DJ; Perkinson, ES; Kellogg, GD; Mahony, S; Pugh, BF (marzo de 2021). "Una arquitectura proteica de alta resolución del genoma de la levadura en ciernes". Naturaleza . 592 (7853): 309–314. Código Bib :2021Natur.592..309R. doi :10.1038/s41586-021-03314-8. PMC 8035251 . PMID  33692541. 
  5. ^ "Definiciones de genética y genómica de la OMS". Organización Mundial de la Salud. Archivado desde el original el 30 de junio de 2004.
  6. ^ Conceptos de genética (10ª ed.). San Francisco: Educación Pearson. 2012.ISBN 978-0-321-72412-0.
  7. ^ Culver KW, Labow MA (8 de noviembre de 2002). "Genómica" . En Robinson R (ed.). Genética . Biblioteca de Ciencias Macmillan. Referencia de Macmillan EE. UU. ISBN 978-0-02-865606-9.
  8. ^ Kadakkuzha BM, Puthanveettil SV (julio de 2013). "Genómica y proteómica en la resolución de la complejidad cerebral". Biosistemas moleculares . 9 (7): 1807–1821. doi :10.1039/C3MB25391K. PMC 6425491 . PMID  23615871. 
  9. ^ abcdefghi Pevsner J (2009). Bioinformática y genómica funcional (2ª ed.). Hoboken, Nueva Jersey: Wiley-Blackwell. ISBN 978-0-470-08585-1.
  10. ^ Liddell HG, Scott R (2013). Léxico griego-inglés intermedio . Libros finos de Martino. ISBN 978-1-61427-397-4.
  11. ^ "Genoma, norte". Diccionario de ingles Oxford (Tercera ed.). Prensa de la Universidad de Oxford. 2008 . Consultado el 1 de diciembre de 2012 .(requiere suscripción)
  12. ^ Yadav SP (diciembre de 2007). "La totalidad en el sufijo -ómicas, -omes y la palabra om". Revista de Técnicas Biomoleculares . 18 (5): 277. PMC 2392988 . PMID  18166670. 
  13. ^ O'Brien SJ (junio de 2022). "Una década de GigaScience: una perspectiva sobre la genética de la conservación". GigaCiencia . 11 . doi : 10.1093/gigascience/giac055. PMC 9197679 . PMID  35701371. 
  14. ^ Ankeny RA (junio de 2003). "Secuenciar el genoma del nematodo al humano: cambiar métodos, cambiar la ciencia". Empeño . 27 (2): 87–92. doi :10.1016/S0160-9327(03)00061-9. PMID  12798815.
  15. ^ Holley RW, Everett GA, Madison JT, Zamir A (mayo de 1965). "Secuencias de nucleótidos en la levadura alanina transfieren ácido ribonucleico". La Revista de Química Biológica . 240 (5): 2122–2128. doi : 10.1016/S0021-9258(18)97435-1 . PMID  14299636.
  16. ^ Holley RW, Apgar J, Everett GA, Madison JT, Marquisee M, Merrill SH, et al. (Marzo de 1965). "Estructura de un ácido ribonucleico". Ciencia . 147 (3664): 1462-1465. Código bibliográfico : 1965 Ciencia... 147.1462H. doi : 10.1126/ciencia.147.3664.1462. PMID  14263761. S2CID  40989800.
  17. ^ Nirenberg M, Leder P, Bernfield M, Brimacombe R, Trupin J, Rottman F, O'Neal C (mayo de 1965). "Palabras en clave de ARN y síntesis de proteínas, VII. Sobre la naturaleza general del código de ARN". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 53 (5): 1161-1168. Código bibliográfico : 1965PNAS...53.1161N. doi : 10.1073/pnas.53.5.1161 . PMC 301388 . PMID  5330357. 
  18. ^ Min Jou W, Haegeman G, Ysebaert M, Fiers W (mayo de 1972). "Secuencia de nucleótidos del gen que codifica la proteína de cubierta del bacteriófago MS2". Naturaleza . 237 (5350): 82–88. Código Bib :1972Natur.237...82J. doi :10.1038/237082a0. PMID  4555447. S2CID  4153893.
  19. ^ Fiers W, Contreras R, Duerinck F, Haegeman G, Iserentant D, Merregaert J, et al. (Abril de 1976). "Secuencia completa de nucleótidos del ARN del bacteriófago MS2: estructura primaria y secundaria del gen de la replicasa". Naturaleza . 260 (5551): 500–507. Código Bib :1976Natur.260..500F. doi :10.1038/260500a0. PMID  1264203. S2CID  4289674.
  20. ^ Fiers W, Contreras R, Haegemann G, Rogiers R, Van de Voorde A, Van Heuverswyn H, et al. (mayo de 1978). "Secuencia completa de nucleótidos del ADN de SV40". Naturaleza . 273 (5658): 113–120. Código Bib :1978Natur.273..113F. doi :10.1038/273113a0. PMID  205802. S2CID  1634424.
  21. ^ Tamarino RH (2004). Principios de genética (7 ed.). Londres: McGraw Hill. ISBN 978-0-07-124320-9.
  22. ^ Sanger F (1980). "Conferencia Nobel: Determinación de secuencias de nucleótidos en el ADN" (PDF) . Premio Nobel.org . Consultado el 18 de octubre de 2010 .
  23. ^ ab Sanger F, Air GM, Barrell BG, Brown NL, Coulson AR, Fiddes CA, et al. (febrero de 1977). "Secuencia de nucleótidos del ADN del bacteriófago phi X174". Naturaleza . 265 (5596): 687–695. Código Bib :1977Natur.265..687S. doi :10.1038/265687a0. PMID  870828. S2CID  4206886.
  24. ^ Kaiser O, Bartels D, Bekel T, Goesmann A, Kespohl S, Pühler A, Meyer F (diciembre de 2003). "Secuenciación de escopeta del genoma completo guiada por canales bioinformáticos: un enfoque optimizado para una técnica establecida". Revista de Biotecnología . 106 (2–3): 121–133. doi :10.1016/j.jbiotec.2003.08.008. PMID  14651855.
  25. ^ Sanger F, Nicklen S, Coulson AR (diciembre de 1977). "Secuenciación de ADN con inhibidores terminadores de cadena". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 74 (12): 5463–5467. Código bibliográfico : 1977PNAS...74.5463S. doi : 10.1073/pnas.74.12.5463 . PMC 431765 . PMID  271968. 
  26. ^ Maxam AM, Gilbert W (febrero de 1977). "Un nuevo método para secuenciar ADN". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 74 (2): 560–564. Código bibliográfico : 1977PNAS...74..560M. doi : 10.1073/pnas.74.2.560 . PMC 392330 . PMID  265521. 
  27. ^ ab Darden L, Tabery J (2010). "Biología Molecular". En Zalta ES (ed.). La Enciclopedia de Filosofía de Stanford (edición de otoño de 2010).
  28. ^ Anderson S, Bankier AT, Barrell BG, de Bruijn MH, Coulson AR, Drouin J, et al. (Abril de 1981). "Secuencia y organización del genoma mitocondrial humano". Naturaleza . 290 (5806): 457–465. Código Bib :1981Natur.290..457A. doi :10.1038/290457a0. PMID  7219534. S2CID  4355527.(requiere suscripción)
  29. ^ Shinozaki K, Ohme M, Tanaka M, Wakasugi T, Hayashida N, Matsubayashi T, et al. (Septiembre de 1986). "La secuencia completa de nucleótidos del genoma del cloroplasto del tabaco: su organización y expresión genética". La Revista EMBO . 5 (9): 2043-2049. doi :10.1002/j.1460-2075.1986.tb04464.x. PMC 1167080 . PMID  16453699. 
  30. ^ Ohyama K, Fukuzawa H, Kohchi T, Shirai H, Sano T, Sano S, et al. (1986). "Organización del gen del cloroplasto deducida de la secuencia completa del ADN del cloroplasto de la hepática Marchantia polymorpha". Naturaleza . 322 (6079): 572–574. Código Bib :1986Natur.322..572O. doi :10.1038/322572a0. S2CID  4311952.
  31. ^ Oliver SG , van der Aart QJ, Agostoni-Carbone ML, Aigle M, Alberghina L, Alexandraki D, et al. (mayo de 1992). "La secuencia completa de ADN del cromosoma III de la levadura". Naturaleza . 357 (6373): 38–46. Código Bib :1992Natur.357...38O. doi :10.1038/357038a0. PMID  1574125. S2CID  4271784.
  32. ^ Fleischmann RD, Adams MD, White O, Clayton RA, Kirkness EF, Kerlavage AR, et al. (Julio de 1995). "Secuenciación aleatoria y ensamblaje del genoma completo de Haemophilus influenzae Rd". Ciencia . 269 ​​(5223): 496–512. Código Bib : 1995 Ciencia... 269.. 496F. doi : 10.1126/ciencia.7542800. PMID  7542800. S2CID  10423613.
  33. ^ Goffeau A, Barrell BG, Bussey H, Davis RW, Dujon B, Feldmann H, et al. (octubre de 1996). "Vida con 6000 genes". Ciencia . 274 (5287): 546, 563–546, 567. Bibcode : 1996Sci...274..546G. doi : 10.1126/ciencia.274.5287.546. PMID  8849441. S2CID  211123134.(requiere suscripción)
  34. ^ "Genomas completos: virus". NCBI . 17 de noviembre de 2011 . Consultado el 18 de noviembre de 2011 .
  35. ^ "Estadísticas del proyecto Genoma". Proyecto Genoma Entrez . 7 de octubre de 2011 . Consultado el 18 de noviembre de 2011 .
  36. ^ Zimmer C (29 de diciembre de 2009). "Los científicos inician un catálogo genómico de los abundantes microbios de la Tierra". Los New York Times . ISSN  0362-4331 . Consultado el 21 de diciembre de 2012 .
  37. ^ Wu D, Hugenholtz P, Mavromatis K, Pukall R, Dalin E, Ivanova NN y col. (Diciembre de 2009). "Una enciclopedia genómica de bacterias y arqueas basada en la filogenia". Naturaleza . 462 (7276): 1056–1060. Código Bib : 2009Natur.462.1056W. doi : 10.1038/naturaleza08656. PMC 3073058 . PMID  20033048. 
  38. ^ "Se redujo drásticamente el número de genes humanos". BBC . 20 de octubre de 2004 . Consultado el 21 de diciembre de 2012 .
  39. ^ Yue GH, Lo LC, Zhu ZY, Lin G, Feng F (abril de 2006). "La secuencia completa de nucleótidos del genoma mitocondrial de Tetraodon nigroviridis". Secuencia de ADN . 17 (2): 115-121. doi :10.1080/10425170600700378. PMID  17076253. S2CID  21797344.
  40. ^ Instituto Nacional de Investigación del Genoma Humano (14 de julio de 2004). "Genoma del perro ensamblado: genoma canino ahora disponible para la comunidad de investigación de todo el mundo". Genoma.gov . Consultado el 20 de enero de 2012 .
  41. ^ ab McElheny V (2010). Dibujando el mapa de la vida: dentro del Proyecto Genoma Humano . Nueva York NY: Libros básicos. ISBN 978-0-465-04333-0.
  42. ^ Abecasis GR, Auton A, Brooks LD, DePristo MA, Durbin RM, Handsaker RE, et al. (Noviembre 2012). "Un mapa integrado de variación genética de 1.092 genomas humanos". Naturaleza . 491 (7422): 56–65. Código Bib :2012Natur.491...56T. doi : 10.1038/naturaleza11632. PMC 3498066 . PMID  23128226. 
  43. ^ Nielsen R (octubre de 2010). "Genómica: en busca de variantes humanas raras". Naturaleza . 467 (7319): 1050–1051. Código Bib : 2010Natur.467.1050N. doi : 10.1038/4671050a . PMID  20981085.
  44. ^ ab Barnes B, Dupré J (2008). Genomas y qué hacer con ellos . Chicago: Prensa de la Universidad de Chicago. ISBN 978-0-226-17295-8.
  45. ^ Eisen JA (julio de 2012). "Las palabras de badómica y el poder y el peligro del ome-meme". GigaCiencia . 1 (1): 6. doi : 10.1186/2047-217X-1-6 . PMC 3617454 . PMID  23587201. 
  46. ^ Hotz RL (13 de agosto de 2012). "Aquí hay un cuento ómico: los científicos descubren un sufijo que se propaga". Wall Street Journal . ISSN  0099-9660 . Consultado el 4 de enero de 2013 .
  47. ^ Scudellari M (1 de octubre de 2011). "Diluvio de datos". El científico . Consultado el 4 de enero de 2013 .
  48. ^ Chaston J, Douglas AE (agosto de 2012). "Aprovechar al máximo las" ómicas "para la investigación de simbiosis". El Boletín Biológico . 223 (1): 21–29. doi :10.1086/BBLv223n1p21. PMC 3491573 . PMID  22983030. 
  49. ^ McCutcheon JP, von Dohlen CD (agosto de 2011). "Un mosaico metabólico interdependiente en la simbiosis anidada de las cochinillas". Biología actual . 21 (16): 1366-1372. doi :10.1016/j.cub.2011.06.051. PMC 3169327 . PMID  21835622. 
  50. ^ ab Baker M (14 de septiembre de 2012). "Despacho de secuenciadores de sobremesa" (Blog) . Blog de noticias de naturaleza . Consultado el 22 de diciembre de 2012 .
  51. ^ Codorniz MA, Smith M, Coupland P, Otto TD, Harris SR, Connor TR, et al. (Julio de 2012). "Una historia de tres plataformas de secuenciación de próxima generación: comparación de los secuenciadores Ion Torrent, Pacific Biosciences e Illumina MiSeq". Genómica BMC . 13 : 341. doi : 10.1186/1471-2164-13-341 . PMC 3431227 . PMID  22827831. 
  52. ^ ab Staden R (junio de 1979). "Una estrategia de secuenciación de ADN empleando programas informáticos". Investigación de ácidos nucleicos . 6 (7): 2601–2610. doi :10.1093/nar/6.7.2601. PMC 327874 . PMID  461197. 
  53. ^ Anderson S (julio de 1981). "Secuenciación de ADN de escopeta utilizando fragmentos clonados generados por ADNasa I". Investigación de ácidos nucleicos . 9 (13): 3015–3027. doi :10.1093/nar/9.13.3015. PMC 327328 . PMID  6269069. 
  54. ^ abc Pop M (julio de 2009). "Renacimiento del ensamblaje del genoma: desafíos computacionales recientes". Sesiones informativas en Bioinformática . 10 (4): 354–366. doi : 10.1093/bib/bbp026. PMC 2691937 . PMID  19482960. 
  55. ^ Sanger F, Coulson AR (mayo de 1975). "Un método rápido para determinar secuencias de ADN mediante síntesis preparada con ADN polimerasa". Revista de biología molecular . 94 (3): 441–448. doi :10.1016/0022-2836(75)90213-2. PMID  1100841.
  56. ^ Mavromatis K, Land ML, Brettin TS, Quest DJ, Copeland A, Clum A, et al. (2012). Liu Z (ed.). "El panorama rápidamente cambiante de las tecnologías de secuenciación y su impacto en la anotación y los ensamblajes del genoma microbiano". MÁS UNO . 7 (12): e48837. Código Bib : 2012PLoSO...748837M. doi : 10.1371/journal.pone.0048837 . PMC 3520994 . PMID  23251337. 
  57. ^ Illumina, Inc. (28 de febrero de 2012). Introducción a la tecnología de secuenciación de próxima generación (PDF) . San Diego, California, EE. UU.: Illumina, Inc. pág. 12 . Consultado el 28 de diciembre de 2012 .
  58. ^ Salón N (mayo de 2007). "Tecnologías de secuenciación avanzadas y su impacto más amplio en microbiología". La Revista de Biología Experimental . 210 (parte 9): 1518-1525. doi : 10.1242/jeb.001370 . PMID  17449817.
  59. ^ Iglesia GM (enero de 2006). "Genomas para todos". Científico americano . 294 (1): 46–54. Código Bib : 2006SciAm.294a..46C. doi : 10.1038/scientificamerican0106-46. PMID  16468433. S2CID  28769137.
  60. ^ diez Bosch JR, Grody WW (noviembre de 2008). "Mantenerse al día con la próxima generación: secuenciación masiva paralela en el diagnóstico clínico". La revista de diagnóstico molecular . 10 (6): 484–492. doi :10.2353/jmoldx.2008.080027. PMC 2570630 . PMID  18832462. 
  61. ^ Tucker T, Marra M, Friedman JM (agosto de 2009). "Secuenciación masiva paralela: el próximo gran avance en medicina genética". Revista Estadounidense de Genética Humana . 85 (2): 142-154. doi :10.1016/j.ajhg.2009.06.022. PMC 2725244 . PMID  19679224. 
  62. ^ US 20050100900, Kawashima EH, Farinelli L, Mayer P, "Method of nucleic acid amplification", publicado el 12 de mayo de 2005, publicado el 26 de julio de 2011, asignado a Solexa Ltd Gran Bretaña. 
  63. ^ Mardis ER (2008). "Métodos de secuenciación de ADN de próxima generación" (PDF) . Revista Anual de Genómica y Genética Humana . 9 : 387–402. doi : 10.1146/annurev.genom.9.081307.164359. PMID  18576944. Archivado desde el original (PDF) el 18 de mayo de 2013 . Consultado el 4 de enero de 2013 .
  64. ^ Davies K (2011). "Impulsando la medicina preventiva". Bio-IT World (septiembre-octubre).
  65. ^ "Inicio". PacBio .
  66. ^ "casa". Tecnologías de nanoporos de Oxford .
  67. ^ Cadena PS, Grafham DV, Fulton RS, Fitzgerald MG, Hostetler J, Muzny D, et al. (octubre de 2009). "Genómica. Estándares del proyecto genoma en una nueva era de secuenciación". Ciencia . 326 (5950): 236–237. Código Bib : 2009 Ciencia... 326.. 236C. doi : 10.1126/ciencia.1180614. PMC 3854948 . PMID  19815760. 
  68. ^ Stein L (julio de 2001). "Anotación del genoma: de la secuencia a la biología". Reseñas de la naturaleza. Genética . 2 (7): 493–503. doi :10.1038/35080529. PMID  11433356. S2CID  12044602.
  69. ^ Brent SEÑOR (enero de 2008). "Progreso constante y avances recientes en la precisión de la anotación automatizada del genoma" (PDF) . Reseñas de la naturaleza. Genética . 9 (1): 62–73. doi :10.1038/nrg2220. PMID  18087260. S2CID  20412451. Archivado desde el original (PDF) el 29 de mayo de 2013 . Consultado el 4 de enero de 2013 .
  70. ^ Flicek P, Ahmed I, Amode MR, Barrell D, Beal K, Brent S, et al. (Enero 2013). "Conjunto 2013". Investigación de ácidos nucleicos . 41 (Problema de la base de datos): D48 – D55. doi : 10.1093/nar/gks1236. PMC 3531136 . PMID  23203987. 
  71. ^ Keith JM (2008). Keith JM (ed.). Bioinformática . Métodos en biología molecular. vol. 453. págs. v-vi. doi :10.1007/978-1-60327-429-6. ISBN 978-1-60327-428-9. PMID  18720577.
  72. ^ Marsden RL, Lewis TA, Orengo CA (marzo de 2007). "Hacia una cobertura estructural integral de genomas completos: un punto de vista de la genómica estructural". Bioinformática BMC . 8 : 86. doi : 10.1186/1471-2105-8-86 . PMC 1829165 . PMID  17349043. 
  73. ^ Brenner SE, Levitt M (enero de 2000). "Expectativas de la genómica estructural". Ciencia de las proteínas . 9 (1): 197–200. doi :10.1110/ps.9.1.197. PMC 2144435 . PMID  10739263. 
  74. ^ Brenner SE (octubre de 2001). "Un recorrido por la genómica estructural". Reseñas de la naturaleza. Genética . 2 (10): 801–809. doi :10.1038/35093574. PMID  11584296. S2CID  5656447.
  75. ^ ab Francis RC (2011). Epigenética: el misterio último de la herencia . Nueva York: WW Norton. ISBN 978-0-393-07005-7.
  76. ^ Gallego, LD; Schneider, M; Mittal, C; Romanuska, Anete; Gudiño Carrillo, RM; Schubert, T; Pugh, BF; Kohler, A (marzo de 2020). "La separación de fases dirige la ubiquitinación de los nucleosomas del cuerpo genético". Naturaleza . 579 (7800): 592–597. Código Bib : 2020Natur.579..592G. doi :10.1038/s41586-020-2097-z. PMC 7481934 . PMID  32214243. 
  77. ^ Sams, KL; Mukai, C; Marcos, Licenciatura en Letras; Mittal, C; Deméter, EA; Nelissen, S; Grenier, JK; Tate, AE; Ahmed, F; Coonrod, SA (octubre de 2022). "Retraso de la pubertad, anomalías de las gonadotropinas y subfertilidad en ratones macho con doble knockout Padi2/Padi4". Reprod Biol Endocrinol . 20 (1): 150. doi : 10.1186/s12958-022-01018-w . PMC 9555066 . PMID  36224627. 
  78. ^ Laird PW (marzo de 2010). "Principios y desafíos del análisis de metilación del ADN de todo el genoma". Reseñas de la naturaleza. Genética . 11 (3): 191–203. doi :10.1038/nrg2732. PMID  20125086. S2CID  6780101.
  79. ^ Hugenholtz P, Goebel BM, Pace NR (septiembre de 1998). "Impacto de los estudios independientes de la cultura en la visión filogenética emergente de la diversidad bacteriana". Revista de Bacteriología . 180 (18): 4765–4774. doi :10.1128/JB.180.18.4765-4774.1998. PMC 107498 . PMID  9733676. 
  80. ^ Eisen JA (marzo de 2007). "Secuenciación ambiental de escopeta: su potencial y desafíos para estudiar el mundo oculto de los microbios". Más biología . 5 (3): e82. doi : 10.1371/journal.pbio.0050082 . PMC 1821061 . PMID  17355177. 
  81. ^ Marco D, ed. (2010). Metagenómica: teoría, métodos y aplicaciones . Prensa académica Caister. ISBN 978-1-904455-54-7.
  82. ^ Marco D, ed. (2011). Metagenómica: innovaciones actuales y tendencias futuras . Prensa académica Caister . ISBN 978-1-904455-87-5.
  83. ^ Canchaya C, Proux C, Fournous G, Bruttin A, Brüssow H (junio de 2003). "Genómica del profago". Reseñas de Microbiología y Biología Molecular . 67 (2): 238–76, índice. doi :10.1128/MMBR.67.2.238-276.2003. PMC 156470 . PMID  12794192. 
  84. ^ McGrath S, van Sinderen D, eds. (2007). Bacteriófago: genética y biología molecular (1ª ed.). Prensa académica Caister. ISBN 978-1-904455-14-1.
  85. ^ Fouts DE (noviembre de 2006). "Phage_Finder: identificación y clasificación automatizadas de regiones de profagos en secuencias completas del genoma bacteriano". Investigación de ácidos nucleicos . 34 (20): 5839–5851. doi : 10.1093/nar/gkl732. PMC 1635311 . PMID  17062630. 
  86. ^ Herrero A, Flores E, eds. (2008). Las cianobacterias: biología molecular, genómica y evolución (1ª ed.). Prensa académica Caister. ISBN 978-1-904455-15-8.
  87. ^ Hudson KL (septiembre de 2011). "Genómica, salud y sociedad". El diario Nueva Inglaterra de medicina . 365 (11): 1033-1041. doi : 10.1056/NEJMra1010517 . PMID  21916641.
  88. ^ O'Donnell CJ, Nabel EG (diciembre de 2011). "Genómica de las enfermedades cardiovasculares". El diario Nueva Inglaterra de medicina . 365 (22): 2098-2109. doi : 10.1056/NEJMra1105239 . PMID  22129254.
  89. ^ Lu YF, Goldstein DB, Angrist M, Cavalleri G (julio de 2014). "Medicina personalizada y diversidad genética humana". Perspectivas de Cold Spring Harbor en medicina . 4 (9): a008581. doi : 10.1101/cshperspect.a008581. PMC 4143101 . PMID  25059740. 
  90. ^ Ashley EA, Butte AJ, Wheeler MT, Chen R, Klein TE, Dewey FE y otros. (mayo de 2010). "Evaluación clínica incorporando un genoma personal". Lanceta . 375 (9725): 1525-1535. doi :10.1016/S0140-6736(10)60452-7. PMC 2937184 . PMID  20435227. 
  91. ^ Dewey FE, Chen R, Cordero SP, Ormond KE, Caleshu C, Karczewski KJ, et al. (Septiembre de 2011). "Riesgo genético de todo el genoma por fases en un cuarteto familiar utilizando una secuencia de referencia de alelos principales". PLOS Genética . 7 (9): e1002280. doi : 10.1371/journal.pgen.1002280 . PMC 3174201 . PMID  21935354. 
  92. ^ Dewey FE, Grove ME, Pan C, Goldstein BA, Bernstein JA, Chaib H, et al. (Marzo del 2014). "Interpretación clínica e implicaciones de la secuenciación del genoma completo". JAMA . 311 (10): 1035-1045. doi :10.1001/jama.2014.1717. PMC 4119063 . PMID  24618965. 
  93. ^ Robbins R (16 de agosto de 2019). "Los principales centros médicos de EE. UU. implementan clínicas de secuenciación de ADN para clientes sanos (y a menudo ricos)". Noticias ESTADÍSTICAS .
  94. ^ "Dos sistemas de salud de Boston ingresan al creciente mercado de secuenciación genética directa al consumidor al abrir clínicas de genómica preventiva, pero ¿pueden los pacientes pagar el servicio?". Diario oscuro . El Grupo de Inteligencia Oscura. 3 de enero de 2020.
  95. ^ "Centros de genoma financiados por los NIH para acelerar los descubrimientos de la medicina de precisión". Institutos Nacionales de Salud: Programa de investigación Todos nosotros . Institutos Nacionales de Salud. 25 de septiembre de 2018.
  96. ^ Iglesia GM, Regis E (2012). Regénesis: cómo la biología sintética reinventará la naturaleza y a nosotros mismos . Nueva York: Libros básicos. ISBN 978-0-465-02175-8.
  97. ^ Panadero M (mayo de 2011). "Genomas sintéticos: el siguiente paso para el genoma sintético". Naturaleza . 473 (7347): 403, 405–403, 408. Bibcode : 2011Natur.473..403B. doi : 10.1038/473403a . PMID  21593873. S2CID  205064528.
  98. ^ Luikart G, RP Inglaterra, Tallmon D, Jordan S, Taberlet P (diciembre de 2003). "El poder y la promesa de la genómica de poblaciones: del genotipado a la tipificación del genoma". Reseñas de la naturaleza. Genética . 4 (12): 981–94. doi :10.1038/nrg1226. PMID  14631358. S2CID  8516357.
  99. ^ Frankham R (1 de septiembre de 2010). "Desafíos y oportunidades de los enfoques genéticos para la conservación biológica". Conservación biológica . 143 (9): 1922-1923. doi :10.1016/j.biocon.2010.05.011.
  100. ^ Allendorf FW, Hohenlohe PA, Luikart G (octubre de 2010). "Genómica y el futuro de la genética de la conservación". Reseñas de la naturaleza. Genética . 11 (10): 697–709. doi :10.1038/nrg2844. PMID  20847747. S2CID  10811958.

Otras lecturas

enlaces externos