stringtranslate.com

Genómica

La genómica es un campo interdisciplinario de la biología molecular que se centra en la estructura, función, evolución, mapeo y edición de genomas . Un genoma es el conjunto completo de ADN de un organismo , incluidos todos sus genes, así como su configuración estructural tridimensional jerárquica. [1] [2] [3] [4] A diferencia de la genética , que se refiere al estudio de genes individuales y sus funciones en la herencia, la genómica apunta a la caracterización y cuantificación colectiva de todos los genes de un organismo, sus interrelaciones e influencia en el organismo. [5] Los genes pueden dirigir la producción de proteínas con la ayuda de enzimas y moléculas mensajeras. A su vez, las proteínas forman estructuras corporales como órganos y tejidos, así como controlan reacciones químicas y transportan señales entre células. La genómica también implica la secuenciación y el análisis de genomas mediante el uso de secuenciación de ADN de alto rendimiento y bioinformática para ensamblar y analizar la función y la estructura de genomas completos. [6] [7] Los avances en genómica han desencadenado una revolución en la investigación basada en el descubrimiento y la biología de sistemas para facilitar la comprensión incluso de los sistemas biológicos más complejos, como el cerebro. [8]

El campo también incluye estudios de fenómenos intragenómicos (dentro del genoma) como la epistasis (efecto de un gen sobre otro), la pleiotropía (un gen que afecta a más de un rasgo), la heterosis (vigor híbrido) y otras interacciones entre loci y alelos dentro del genoma. [9]

Historia

Etimología

Del griego ΓΕΝ [10] gen , "gen" (gamma, epsilon, nu, epsilon) que significa "llegar a ser, crear, creación, nacimiento", y variantes posteriores: genealogía, génesis, genética, genic, genomere, genotipo, género, etc. Mientras que la palabra genoma (del alemán Genom , atribuida a Hans Winkler ) se utilizaba en inglés ya en 1926, [11] el término genómica fue acuñado por Tom Roderick, un genetista del Laboratorio Jackson ( Bar Harbor, Maine ), tomando unas cervezas con Jim Womack, Tom Shows y Stephen O'Brien en una reunión celebrada en Maryland sobre el mapeo del genoma humano en 1986. [12] Primero como nombre para una nueva revista y luego como una disciplina científica completamente nueva. [13]

Primeros esfuerzos de secuenciación

Tras la confirmación de la estructura helicoidal del ADN por parte de Rosalind Franklin , la publicación de la estructura del ADN por parte de James D. Watson y Francis Crick en 1953 y la publicación de la secuencia de aminoácidos de la insulina por parte de Fred Sanger en 1955, la secuenciación de ácidos nucleicos se convirtió en un objetivo importante de los primeros biólogos moleculares . [14] En 1964, Robert W. Holley y sus colegas publicaron la primera secuencia de ácidos nucleicos jamás determinada, la secuencia de ribonucleótidos del ARN de transferencia de alanina . [15] [16] Ampliando este trabajo, Marshall Nirenberg y Philip Leder revelaron la naturaleza triplete del código genético y pudieron determinar las secuencias de 54 de los 64 codones en sus experimentos. [17] En 1972, Walter Fiers y su equipo del Laboratorio de Biología Molecular de la Universidad de Gante ( Gante , Bélgica ) fueron los primeros en determinar la secuencia de un gen: el gen de la proteína de la cubierta del bacteriófago MS2 . [18] El grupo de Fiers amplió su trabajo sobre la proteína de cubierta MS2, determinando la secuencia de nucleótidos completa del ARN del bacteriófago MS2 (cuyo genoma codifica sólo cuatro genes en 3569 pares de bases [pb]) y del virus simio 40 en 1976 y 1978, respectivamente. [19] [20]

Se desarrolló una tecnología de secuenciación de ADN

Frederick Sanger y Walter Gilbert compartieron la mitad del Premio Nobel de Química de 1980 por desarrollar independientemente métodos para la secuenciación del ADN.

Además de su trabajo seminal sobre la secuencia de aminoácidos de la insulina, Frederick Sanger y sus colegas desempeñaron un papel clave en el desarrollo de técnicas de secuenciación de ADN que permitieron el establecimiento de proyectos integrales de secuenciación del genoma. [9] En 1975, él y Alan Coulson publicaron un procedimiento de secuenciación utilizando ADN polimerasa con nucleótidos radiomarcados que llamó la técnica Plus and Minus . [21] [22] Esto involucraba dos métodos estrechamente relacionados que generaban oligonucleótidos cortos con extremos 3' definidos. Estos podían fraccionarse por electroforesis en un gel de poliacrilamida (llamada electroforesis en gel de poliacrilamida) y visualizarse mediante autorradiografía. El procedimiento podía secuenciar hasta 80 nucleótidos de una sola vez y fue una gran mejora, pero todavía era muy laborioso. Sin embargo, en 1977 su grupo pudo secuenciar la mayoría de los 5.386 nucleótidos del bacteriófago monocatenario φX174 , completando el primer genoma basado en ADN completamente secuenciado. [23] El refinamiento del método Plus y Minus resultó en la terminación de cadena, o método Sanger (ver abajo), que formó la base de las técnicas de secuenciación de ADN, mapeo genómico, almacenamiento de datos y análisis bioinformático más ampliamente utilizadas en el siguiente cuarto de siglo de investigación. [24] [25] En el mismo año, Walter Gilbert y Allan Maxam de la Universidad de Harvard desarrollaron independientemente el método Maxam-Gilbert (también conocido como el método químico ) de secuenciación de ADN, que implica la escisión preferencial del ADN en bases conocidas, un método menos eficiente. [26] [27] Por su trabajo pionero en la secuenciación de ácidos nucleicos, Gilbert y Sanger compartieron la mitad del Premio Nobel de Química de 1980 con Paul Berg ( ADN recombinante ).

Genomas completos

La llegada de estas tecnologías dio lugar a una rápida intensificación del alcance y la velocidad de finalización de los proyectos de secuenciación genómica . La primera secuencia completa del genoma de un orgánulo eucariota , la mitocondria humana (16.568 pb, aproximadamente 16,6 kb [kilobase]), se informó en 1981, [28] y los primeros genomas de cloroplastos siguieron en 1986. [29] [30] En 1992, se secuenció el primer cromosoma eucariota , el cromosoma III de la levadura cervecera Saccharomyces cerevisiae (315 kb). [31] El primer organismo de vida libre en ser secuenciado fue el de Haemophilus influenzae (1,8 Mb [megabase]) en 1995. [32] Al año siguiente, un consorcio de investigadores de laboratorios de América del Norte , Europa y Japón anunció la finalización de la primera secuencia completa del genoma de un eucariota, S. cerevisiae (12,1 Mb), y desde entonces los genomas han seguido siendo secuenciados a un ritmo exponencialmente creciente. [33] A octubre de 2011 , las secuencias completas están disponibles para: 2.719 virus , 1.115 arqueas y bacterias , y 36 eucariotas , de los cuales aproximadamente la mitad son hongos . [34] [35]

Gráfico de "palo de hockey" que muestra el crecimiento exponencial de las bases de datos de secuencias públicas.
El número de proyectos genómicos ha aumentado a medida que las mejoras tecnológicas continúan reduciendo el costo de la secuenciación. (A) Crecimiento exponencial de las bases de datos de secuencias genómicas desde 1995. (B) El costo en dólares estadounidenses (USD) para secuenciar un millón de bases. (C) El costo en USD para secuenciar un genoma de 3000 Mb (tamaño humano) en una escala transformada logarítmicamente.

La mayoría de los microorganismos cuyos genomas han sido completamente secuenciados son patógenos problemáticos , como Haemophilus influenzae , lo que ha resultado en un sesgo pronunciado en su distribución filogenética en comparación con la amplitud de la diversidad microbiana. [36] [37] De las otras especies secuenciadas, la mayoría fueron elegidas porque eran organismos modelo bien estudiados o prometían convertirse en buenos modelos. La levadura ( Saccharomyces cerevisiae ) ha sido durante mucho tiempo un organismo modelo importante para la célula eucariota , mientras que la mosca de la fruta Drosophila melanogaster ha sido una herramienta muy importante (notablemente en la genética premolecular temprana ). El gusano Caenorhabditis elegans es un modelo simple a menudo utilizado para organismos multicelulares . El pez cebra Brachydanio rerio se utiliza para muchos estudios de desarrollo a nivel molecular, y la planta Arabidopsis thaliana es un organismo modelo para plantas con flores. El pez globo japonés ( Takifugu rubripes ) y el pez globo verde moteado ( Tetraodon nigroviridis ) son interesantes debido a sus genomas pequeños y compactos, que contienen muy poco ADN no codificante en comparación con la mayoría de las especies. [38] [39] Los mamíferos perro ( Canis familiaris ), [40] rata parda ( Rattus norvegicus ), ratón ( Mus musculus ) y chimpancé ( Pan troglodytes ) son todos animales modelo importantes en la investigación médica. [27]

A principios de 2001, el Proyecto Genoma Humano completó un borrador del genoma humano , lo que generó mucha fanfarria. [41] Este proyecto, completado en 2003, secuenció todo el genoma de una persona específica, y en 2007 esta secuencia se declaró "terminada" (menos de un error en 20.000 bases y todos los cromosomas ensamblados). [41] En los años transcurridos desde entonces, se han secuenciado los genomas de muchos otros individuos, en parte bajo los auspicios del Proyecto 1000 Genomas , que anunció la secuenciación de 1.092 genomas en octubre de 2012. [42] La finalización de este proyecto fue posible gracias al desarrollo de tecnologías de secuenciación mucho más eficientes y requirió el compromiso de importantes recursos bioinformáticos de una gran colaboración internacional. [43] El análisis continuo de los datos genómicos humanos tiene profundas repercusiones políticas y sociales para las sociedades humanas. [44]

La revolución "ómica"

Esquema general que muestra las relaciones entre el genoma , el transcriptoma , el proteoma y el metaboloma ( lipidoma )

El neologismo en inglés ómica se refiere informalmente a un campo de estudio en biología que termina en -ómica , como la genómica, la proteómica o la metabolómica . El sufijo relacionado -oma se utiliza para referirse a los objetos de estudio de dichos campos, como el genoma , el proteoma o el metaboloma ( lipidoma ), respectivamente. El sufijo -oma , tal como se utiliza en biología molecular, se refiere a una totalidad de algún tipo; de manera similar, ómica ha llegado a referirse en general al estudio de grandes conjuntos de datos biológicos completos. Si bien el crecimiento en el uso del término ha llevado a algunos científicos ( Jonathan Eisen , entre otros [45] ) a afirmar que se ha sobrevendido, [46] refleja el cambio de orientación hacia el análisis cuantitativo del surtido completo o casi completo de todos los constituyentes de un sistema. [47] En el estudio de las simbiosis , por ejemplo, los investigadores que antes estaban limitados al estudio de un único producto genético ahora pueden comparar simultáneamente el complemento total de varios tipos de moléculas biológicas. [48] [49]

Análisis del genoma

Una vez seleccionado un organismo, los proyectos genómicos implican tres componentes: la secuenciación del ADN, el ensamblaje de esa secuencia para crear una representación del cromosoma original y la anotación y análisis de esa representación. [9]

Descripción general de un proyecto de genoma. En primer lugar, se debe seleccionar el genoma, lo que implica varios factores, incluidos el costo y la relevancia. En segundo lugar, se genera y ensambla la secuencia en un centro de secuenciación determinado (como BGI o DOE JGI ). En tercer lugar, se anota la secuencia del genoma en varios niveles: ADN, proteínas, vías genéticas o comparativamente.

Secuenciación

Históricamente, la secuenciación se hacía en centros de secuenciación , instalaciones centralizadas (que van desde grandes instituciones independientes como el Joint Genome Institute , que secuencia docenas de terabases al año, hasta instalaciones centrales de biología molecular locales) que contienen laboratorios de investigación con la costosa instrumentación y el soporte técnico necesarios. Sin embargo, a medida que la tecnología de secuenciación continúa mejorando, una nueva generación de secuenciadores de sobremesa eficaces y de respuesta rápida se ha puesto al alcance del laboratorio académico promedio. [50] [51] En general, los enfoques de secuenciación del genoma se dividen en dos grandes categorías: secuenciación shotgun y secuenciación de alto rendimiento (o de próxima generación ). [9]

Secuenciación de escopeta

Un analizador genético ABI PRISM 3100. Estos secuenciadores capilares automatizaron los primeros esfuerzos de secuenciación genómica a gran escala.

La secuenciación por escopeta es un método de secuenciación diseñado para el análisis de secuencias de ADN de más de 1000 pares de bases, hasta cromosomas enteros inclusive. [52] Se denomina así por analogía con el patrón de disparo cuasialeatorio y de rápida expansión de una escopeta . Dado que la secuenciación por electroforesis en gel solo se puede utilizar para secuencias bastante cortas (de 100 a 1000 pares de bases), las secuencias de ADN más largas se deben dividir en pequeños segmentos aleatorios que luego se secuencian para obtener lecturas . Se obtienen múltiples lecturas superpuestas para el ADN objetivo realizando varias rondas de esta fragmentación y secuenciación. Luego, los programas de computadora utilizan los extremos superpuestos de diferentes lecturas para ensamblarlas en una secuencia continua. [52] [53] La secuenciación por escopeta es un proceso de muestreo aleatorio, que requiere un sobremuestreo para garantizar que un nucleótido dado esté representado en la secuencia reconstruida; el número promedio de lecturas por las que se sobremuestrea un genoma se conoce como cobertura . [54]

Durante gran parte de su historia, la tecnología subyacente a la secuenciación shotgun fue el método clásico de terminación de cadena o " método Sanger ", que se basa en la incorporación selectiva de didesoxinucleótidos de terminación de cadena por la ADN polimerasa durante la replicación de ADN in vitro . [23] [55] Recientemente, la secuenciación shotgun ha sido suplantada por métodos de secuenciación de alto rendimiento , especialmente para análisis genómicos automatizados a gran escala . Sin embargo, el método Sanger sigue siendo ampliamente utilizado, principalmente para proyectos de menor escala y para obtener lecturas de secuencias de ADN contiguas especialmente largas (>500 nucleótidos). [56] Los métodos de terminación de cadena requieren una plantilla de ADN monocatenario, un cebador de ADN , una ADN polimerasa , desoxinucleósidotrifosfatos normales (dNTP) y nucleótidos modificados (didesoxiNTP) que terminan la elongación de la cadena de ADN. Estos nucleótidos que terminan la cadena carecen de un grupo 3'- OH necesario para la formación de un enlace fosfodiéster entre dos nucleótidos, lo que hace que la ADN polimerasa detenga la extensión del ADN cuando se incorpora un ddNTP. Los ddNTP pueden marcarse radiactivamente o con fluorescencia para su detección en secuenciadores de ADN . [9] Por lo general, estas máquinas pueden secuenciar hasta 96 muestras de ADN en un solo lote (sesión) en hasta 48 ejecuciones al día. [57]

Secuenciación de alto rendimiento

La gran demanda de secuenciación de bajo costo ha impulsado el desarrollo de tecnologías de secuenciación de alto rendimiento que paralelizan el proceso de secuenciación, produciendo miles o millones de secuencias a la vez. [58] [59] La secuenciación de alto rendimiento tiene como objetivo reducir el costo de la secuenciación de ADN más allá de lo que es posible con los métodos estándar de terminación por colorante. En la secuenciación de ultra alto rendimiento, se pueden ejecutar hasta 500.000 operaciones de secuenciación por síntesis en paralelo. [60] [61]

Sistema Illumina Genome Analyzer II. Las tecnologías de Illumina han establecido el estándar para la secuenciación masiva en paralelo de alto rendimiento. [50]

El método de secuenciación por tinte Illumina se basa en terminadores de tinte reversibles y fue desarrollado en 1996 en el Instituto de Investigación Biomédica de Ginebra por Pascal Mayer y Laurent Farinelli. [62] En este método, las moléculas de ADN y los cebadores se adhieren primero a un portaobjetos y se amplifican con polimerasa para que se formen colonias clonales locales, inicialmente denominadas "colonias de ADN". Para determinar la secuencia, se añaden cuatro tipos de bases de terminación reversibles (bases RT) y se eliminan los nucleótidos no incorporados. A diferencia de la pirosecuenciación, las cadenas de ADN se extienden un nucleótido a la vez y la adquisición de imágenes se puede realizar en un momento diferido, lo que permite capturar conjuntos muy grandes de colonias de ADN mediante imágenes secuenciales tomadas con una sola cámara. La disociación de la reacción enzimática y la captura de imágenes permite un rendimiento óptimo y una capacidad de secuenciación teóricamente ilimitada; con una configuración óptima, el rendimiento final del instrumento depende únicamente de la tasa de conversión A/D de la cámara. La cámara toma imágenes de los nucleótidos marcados con fluorescencia , luego el tinte junto con el bloqueador terminal 3' se elimina químicamente del ADN, lo que permite el siguiente ciclo. [63]

Un enfoque alternativo, la secuenciación de semiconductores iónicos, se basa en la química estándar de replicación del ADN. Esta tecnología mide la liberación de un ion de hidrógeno cada vez que se incorpora una base. Un micropocillo que contiene ADN molde se inunda con un solo nucleótido ; si el nucleótido es complementario a la cadena molde, se incorporará y se liberará un ion de hidrógeno. Esta liberación activa un sensor de iones ISFET . Si hay un homopolímero presente en la secuencia molde, se incorporarán múltiples nucleótidos en un solo ciclo de inundación y la señal eléctrica detectada será proporcionalmente mayor. [64]

Asamblea

Las lecturas de secuencias múltiples y fragmentadas deben ensamblarse sobre la base de sus áreas superpuestas.

El ensamblaje de secuencias se refiere a la alineación y fusión de fragmentos de una secuencia de ADN mucho más larga para reconstruir la secuencia original. [9] Esto es necesario ya que la tecnología actual de secuenciación de ADN no puede leer genomas completos como una secuencia continua, sino que lee pequeños fragmentos de entre 20 y 1000 bases, dependiendo de la tecnología utilizada. Las tecnologías de secuenciación de tercera generación como PacBio u Oxford Nanopore generan rutinariamente lecturas de secuenciación de 10 a 100 kb de longitud; sin embargo, tienen una alta tasa de error de aproximadamente el 1 por ciento. [65] [66] Normalmente, los fragmentos cortos, llamados lecturas, resultan de la secuenciación shotgun de ADN genómico o transcripciones de genes ( EST ). [9]

Enfoques de la asamblea

El ensamblaje se puede categorizar ampliamente en dos enfoques: ensamblaje de novo , para genomas que no son similares a ninguno secuenciado en el pasado, y ensamblaje comparativo, que utiliza la secuencia existente de un organismo estrechamente relacionado como referencia durante el ensamblaje. [54] En relación con el ensamblaje comparativo, el ensamblaje de novo es computacionalmente difícil ( NP-hard ), lo que lo hace menos favorable para las tecnologías NGS de lectura corta. Dentro del paradigma de ensamblaje de novo hay dos estrategias principales para el ensamblaje, estrategias de ruta euleriana y estrategias de consenso de diseño de superposición (OLC). Las estrategias OLC en última instancia intentan crear una ruta hamiltoniana a través de un gráfico de superposición, que es un problema NP-hard. Las estrategias de ruta euleriana son computacionalmente más manejables porque intentan encontrar una ruta euleriana a través de un gráfico de DeBruijn. [54]

Refinamiento

Los genomas terminados se definen como aquellos que tienen una única secuencia contigua sin ambigüedades que representan cada replicón . [67]

Anotación

El ensamblaje de la secuencia de ADN por sí solo tiene poco valor sin un análisis adicional. [9] La anotación del genoma es el proceso de adjuntar información biológica a las secuencias y consta de tres pasos principales: [68]

  1. Identificar porciones del genoma que no codifican proteínas.
  2. identificar elementos en el genoma , un proceso llamado predicción genética , y
  3. adjuntando información biológica a estos elementos.

Las herramientas de anotación automática intentan realizar estos pasos in silico , a diferencia de la anotación manual (también conocida como curación) que involucra experiencia humana y una posible verificación experimental. [69] Idealmente, estos enfoques coexisten y se complementan entre sí en el mismo proceso de anotación (ver también a continuación).

Tradicionalmente, el nivel básico de anotación es el uso de BLAST para encontrar similitudes y luego anotar genomas basados ​​en homólogos. [9] Más recientemente, se agrega información adicional a la plataforma de anotación. La información adicional permite a los anotadores manuales deconvolucionar discrepancias entre genes que reciben la misma anotación. Algunas bases de datos utilizan información de contexto del genoma, puntajes de similitud, datos experimentales e integraciones de otros recursos para proporcionar anotaciones del genoma a través de su enfoque de subsistemas. Otras bases de datos (por ejemplo, Ensembl ) se basan tanto en fuentes de datos curadas como en una variedad de herramientas de software en su canalización de anotación automatizada del genoma. [70] La anotación estructural consiste en la identificación de elementos genómicos, principalmente ORFs y su localización, o estructura genética. La anotación funcional consiste en adjuntar información biológica a elementos genómicos.

Canalizaciones y bases de datos de secuenciación

La necesidad de reproducibilidad y gestión eficiente de la gran cantidad de datos asociados a los proyectos genómicos significa que los procesos computacionales tienen aplicaciones importantes en la genómica. [71]

Áreas de investigación

Genómica funcional

La genómica funcional es un campo de la biología molecular que intenta hacer uso de la gran cantidad de datos producidos por proyectos genómicos (como proyectos de secuenciación genómica ) para describir las funciones e interacciones de los genes (y las proteínas ). La genómica funcional se centra en los aspectos dinámicos, como la transcripción génica , la traducción y las interacciones proteína-proteína , en contraposición a los aspectos estáticos de la información genómica, como la secuencia o las estructuras del ADN. La genómica funcional intenta responder preguntas sobre la función del ADN a nivel de genes, transcripciones de ARN y productos proteicos. Una característica clave de los estudios de genómica funcional es su enfoque de todo el genoma para estas preguntas, que generalmente implica métodos de alto rendimiento en lugar de un enfoque más tradicional "gen por gen".

Una rama importante de la genómica sigue ocupándose de la secuenciación de los genomas de diversos organismos, pero el conocimiento de los genomas completos ha creado la posibilidad de que se desarrolle el campo de la genómica funcional , que se ocupa principalmente de los patrones de expresión genética en diversas condiciones. Las herramientas más importantes en este campo son los microarrays y la bioinformática .

Genómica estructural

Un ejemplo de una estructura de proteína determinada por el Centro de Genómica Estructural del Medio Oeste

La genómica estructural busca describir la estructura tridimensional de cada proteína codificada por un genoma dado . [72] [73] Este enfoque basado en el genoma permite un método de alto rendimiento para la determinación de la estructura mediante una combinación de enfoques experimentales y de modelado . La principal diferencia entre la genómica estructural y la predicción estructural tradicional es que la genómica estructural intenta determinar la estructura de cada proteína codificada por el genoma, en lugar de centrarse en una proteína en particular. Con secuencias de genoma completo disponibles, la predicción de la estructura se puede hacer más rápidamente a través de una combinación de enfoques experimentales y de modelado, especialmente porque la disponibilidad de grandes cantidades de genomas secuenciados y estructuras de proteínas resueltas previamente permite a los científicos modelar la estructura de las proteínas en las estructuras de homólogos resueltos previamente. La genómica estructural implica adoptar una gran cantidad de enfoques para la determinación de la estructura, incluidos métodos experimentales que utilizan secuencias genómicas o enfoques basados ​​en modelado basados ​​en la homología de secuencia o estructural con una proteína de estructura conocida o basados ​​en principios químicos y físicos para una proteína sin homología con ninguna estructura conocida. A diferencia de la biología estructural tradicional , la determinación de la estructura de una proteína mediante un esfuerzo de genómica estructural a menudo (pero no siempre) se produce antes de que se conozca nada sobre la función de la proteína. Esto plantea nuevos desafíos en la bioinformática estructural , es decir, la determinación de la función de la proteína a partir de su estructura 3D . [74]

Epigenómica

La epigenómica es el estudio del conjunto completo de modificaciones epigenéticas en el material genético de una célula, conocido como epigenoma . [75] Las modificaciones epigenéticas son modificaciones reversibles en el ADN o las histonas de una célula que afectan la expresión génica sin alterar la secuencia de ADN (Russell 2010 p. 475). Dos de las modificaciones epigenéticas más caracterizadas son la metilación del ADN y la modificación de las histonas . [76] Las modificaciones epigenéticas desempeñan un papel importante en la expresión y regulación génica, y están implicadas en numerosos procesos celulares como la diferenciación/desarrollo [77] y la tumorigénesis . [75] El estudio de la epigenética a nivel global ha sido posible solo recientemente gracias a la adaptación de ensayos genómicos de alto rendimiento. [78]

Metagenómica

La secuenciación ambiental por escopeta (ESS) es una técnica clave en metagenómica. (A) Muestreo del hábitat; (B) filtrado de partículas, generalmente por tamaño; (C) lisis y extracción de ADN; (D) clonación y construcción de bibliotecas; (E) secuenciación de clones; (F) ensamblaje de secuencias en contigs y andamiajes.

La metagenómica es el estudio de los metagenomas , material genético recuperado directamente de muestras ambientales . Este amplio campo también puede denominarse genómica ambiental, ecogenómica o genómica de comunidades. Mientras que la microbiología tradicional y la secuenciación del genoma microbiano se basan en cultivos clonales cultivados , la secuenciación temprana de genes ambientales clonó genes específicos (a menudo el gen ARNr 16S ) para producir un perfil de diversidad en una muestra natural. Este trabajo reveló que la gran mayoría de la biodiversidad microbiana se había pasado por alto con los métodos basados ​​en cultivos . [79] Estudios recientes utilizan la secuenciación de Sanger "shotgun" o la pirosecuenciación masiva paralela para obtener muestras en gran medida imparciales de todos los genes de todos los miembros de las comunidades muestreadas. [80] Debido a su poder para revelar la diversidad previamente oculta de la vida microscópica, la metagenómica ofrece una lente poderosa para ver el mundo microbiano que tiene el potencial de revolucionar la comprensión de todo el mundo viviente. [81] [82]

Sistemas modelo

Virus y bacteriófagos

Los bacteriófagos han desempeñado y siguen desempeñando un papel clave en la genética bacteriana y la biología molecular . Históricamente, se utilizaron para definir la estructura y la regulación de los genes . Además, el primer genoma en secuenciarse fue un bacteriófago . Sin embargo, la investigación sobre bacteriófagos no lideró la revolución genómica, que está claramente dominada por la genómica bacteriana. Solo muy recientemente se ha hecho prominente el estudio de los genomas de bacteriófagos, lo que permite a los investigadores comprender los mecanismos subyacentes a la evolución de los fagos . Las secuencias del genoma de los bacteriófagos se pueden obtener mediante la secuenciación directa de bacteriófagos aislados, pero también se pueden derivar como parte de genomas microbianos. El análisis de genomas bacterianos ha demostrado que una cantidad sustancial de ADN microbiano consiste en secuencias de profagos y elementos similares a profagos. [83] Una minería de datos detallada de estas secuencias ofrece información sobre el papel de los profagos en la conformación del genoma bacteriano: en general, este método verificó muchos grupos de bacteriófagos conocidos, lo que lo convierte en una herramienta útil para predecir las relaciones de los profagos a partir de genomas bacterianos. [84] [85]

Cianobacterias

En la actualidad, hay 24 cianobacterias para las que se dispone de una secuencia genómica completa. Quince de estas cianobacterias proceden del entorno marino. Se trata de seis cepas de Prochlorococcus , siete cepas de Synechococcus marino , Trichodesmium erythraeum IMS101 y Crocosphaera watsonii WH8501. Varios estudios han demostrado cómo estas secuencias podrían utilizarse con mucho éxito para inferir importantes características ecológicas y fisiológicas de las cianobacterias marinas. Sin embargo, hay muchos más proyectos genómicos en curso, entre los que se encuentran otros aislados de Prochlorococcus y Synechococcus marino, Acaryochloris y Prochloron , las cianobacterias filamentosas fijadoras de N 2 Nodularia spumigena , Lyngbya aestuarii y Lyngbya majuscula , así como bacteriófagos que infectan a las cianobacterias marinas. Por tanto, el creciente conjunto de información genómica también puede aprovecharse de una forma más general para abordar problemas globales aplicando un enfoque comparativo. Algunos ejemplos nuevos y apasionantes de progreso en este campo son la identificación de genes para ARN reguladores, conocimientos sobre el origen evolutivo de la fotosíntesis o la estimación de la contribución de la transferencia horizontal de genes a los genomas que se han analizado. [86]

Aplicaciones

Cariograma esquemático de un ser humano, que ofrece una visión general simplificada del genoma humano. Es una representación gráfica del cariotipo diploide humano idealizado , con bandas y subbandas anotadas . Muestra regiones oscuras y blancas en las bandas G. Cada fila está alineada verticalmente a nivel del centrómero . Muestra 22 pares de cromosomas autosómicos homólogos , tanto las versiones femeninas (XX) como masculinas (XY) de los dos cromosomas sexuales , así como el genoma mitocondrial (en la parte inferior izquierda).

La genómica ha proporcionado aplicaciones en muchos campos, incluida la medicina , la biotecnología , la antropología y otras ciencias sociales . [44]

Medicina genómica

Las tecnologías genómicas de próxima generación permiten a los médicos e investigadores biomédicos aumentar drásticamente la cantidad de datos genómicos recopilados en grandes poblaciones de estudio. [87] Cuando se combina con nuevos enfoques informáticos que integran muchos tipos de datos con datos genómicos en la investigación de enfermedades, esto permite a los investigadores comprender mejor las bases genéticas de la respuesta a los medicamentos y la enfermedad. [88] [89] Los primeros esfuerzos para aplicar el genoma a la medicina incluyeron los de un equipo de Stanford dirigido por Euan Ashley , quien desarrolló las primeras herramientas para la interpretación médica de un genoma humano. [90] [91] [92] El programa de investigación Genomes2People en el Brigham and Women's Hospital , Broad Institute y Harvard Medical School se estableció en 2012 para realizar investigaciones empíricas en la traducción de la genómica en salud. El Brigham and Women's Hospital abrió una Clínica de Genómica Preventiva en agosto de 2019, y el Massachusetts General Hospital lo siguió un mes después. [93] [94] El programa de investigación All of Us tiene como objetivo recopilar datos de secuencias del genoma de 1 millón de participantes para convertirse en un componente crítico de la plataforma de investigación de medicina de precisión. [95]

Biología sintética y bioingeniería

El crecimiento del conocimiento genómico ha permitido aplicaciones cada vez más sofisticadas de la biología sintética . [96] En 2010, investigadores del Instituto J. Craig Venter anunciaron la creación de una especie parcialmente sintética de bacteria , Mycoplasma laboratorium , derivada del genoma de Mycoplasma genitalium . [97]

Genómica de poblaciones y conservación

La genómica de poblaciones se ha desarrollado como un campo popular de investigación, donde los métodos de secuenciación genómica se utilizan para realizar comparaciones a gran escala de secuencias de ADN entre poblaciones, más allá de los límites de los marcadores genéticos como los productos de PCR de corto alcance o los microsatélites utilizados tradicionalmente en la genética de poblaciones . La genómica de poblaciones estudia los efectos de todo el genoma para mejorar nuestra comprensión de la microevolución, de modo que podamos aprender lahistoria filogenética y la demografía de una población. [98] Los métodos genómicos de poblaciones se utilizan para muchos campos diferentes, incluidos la biología evolutiva , la ecología , la biogeografía , la biología de la conservación y la gestión pesquera . De manera similar, la genómica del paisaje se ha desarrollado a partir de la genética del paisaje para utilizar métodos genómicos para identificar relaciones entre patrones de variación ambiental y genética.

Los conservacionistas pueden utilizar la información recopilada mediante la secuenciación genómica para evaluar mejor los factores genéticos clave para la conservación de las especies, como la diversidad genética de una población o si un individuo es heterocigoto para un trastorno genético hereditario recesivo. [99] Al utilizar datos genómicos para evaluar los efectos de los procesos evolutivos y detectar patrones de variación en una población determinada, los conservacionistas pueden formular planes para ayudar a una especie determinada sin dejar tantas variables desconocidas como las que no se abordan con los enfoques genéticos estándar . [100]

Véase también

Referencias

  1. ^ Franklin RE, Gosling RG (abril de 1953). "Configuración molecular en el timonucleato de sodio". Nature . 171 (4356): 740–1. Código Bibliográfico :1953Natur.171..740F. doi :10.1038/171740a0. PMID  13054694. S2CID  4268222.
  2. ^ Satzinger H (marzo de 2008). "Theodor y Marcella Boveri: cromosomas y citoplasma en la herencia y el desarrollo". Nature Reviews. Genética . 9 (3): 231–238. doi :10.1038/nrg2311. PMID  18268510. S2CID  15829893.
  3. ^ Cremer T, Cremer C (2006). "Auge, caída y resurrección de los territorios cromosómicos: una perspectiva histórica. Parte I. El auge de los territorios cromosómicos". Revista Europea de Histoquímica . 50 (3): 161–176. PMID  16920639.
  4. ^ Rossi, MJ; Kuntala, PK; Lai, WKM; Yamada, N; Badjatia, N; Mittal, C; Kuzu, G; Bocklund, K; Farrell, NP; Blanda, TR; Mairose, JD; Basting, AV; Mistretta, KS; Rocco, DJ; Perkinson, ES; Kellogg, GD; Mahony, S; Pugh, BF (marzo de 2021). "Una arquitectura proteica de alta resolución del genoma de la levadura en ciernes". Nature . 592 (7853): 309–314. Bibcode :2021Natur.592..309R. doi :10.1038/s41586-021-03314-8. PMC 8035251 . PMID  33692541. 
  5. ^ "Definiciones de genética y genómica de la OMS". Organización Mundial de la Salud. Archivado desde el original el 30 de junio de 2004.
  6. ^ Conceptos de genética (10.ª ed.). San Francisco: Pearson Education. 2012. ISBN 978-0-321-72412-0.
  7. ^ Culver KW, Labow MA (8 de noviembre de 2002). "Genomics" . En Robinson R (ed.). Genética . Biblioteca de Ciencias Macmillan. Macmillan Reference USA. ISBN 978-0-02-865606-9.
  8. ^ Kadakkuzha BM, Puthanveettil SV (julio de 2013). "Genómica y proteómica para resolver la complejidad cerebral". Molecular BioSystems . 9 (7): 1807–1821. doi :10.1039/C3MB25391K. PMC 6425491 . PMID  23615871. 
  9. ^ abcdefghi Pevsner J (2009). Bioinformática y genómica funcional (2.ª ed.). Hoboken, Nueva Jersey: Wiley-Blackwell. ISBN 978-0-470-08585-1.
  10. ^ Liddell HG, Scott R (2013). Léxico intermedio griego-inglés . Martino Fine Books. ISBN 978-1-61427-397-4.
  11. ^ "Genoma, n". Oxford English Dictionary (tercera edición). Oxford University Press. 2008. Consultado el 1 de diciembre de 2012 .(se requiere suscripción)
  12. ^ Yadav SP (diciembre de 2007). "La totalidad en el sufijo -ómico, -omas y la palabra om". Journal of Biomolecular Techniques . 18 (5): 277. PMC 2392988 . PMID  18166670. 
  13. ^ O'Brien SJ (junio de 2022). "Una década de gigaciencia: una perspectiva sobre la genética de la conservación". GigaScience . 11 . doi :10.1093/gigascience/giac055. PMC 9197679 . PMID  35701371. 
  14. ^ Ankeny RA (junio de 2003). "Secuenciación del genoma desde el nematodo hasta el ser humano: cambiar los métodos, cambiar la ciencia". Endeavour . 27 (2): 87–92. doi :10.1016/S0160-9327(03)00061-9. PMID  12798815.
  15. ^ Holley RW, Everett GA, Madison JT, Zamir A (mayo de 1965). "Secuencias de nucleótidos en el ácido ribonucleico de transferencia de alanina de levadura". The Journal of Biological Chemistry . 240 (5): 2122–2128. doi : 10.1016/S0021-9258(18)97435-1 . PMID  14299636.
  16. ^ Holley RW, Apgar J, Everett GA, Madison JT, Marquisee M, Merrill SH, et al. (marzo de 1965). "Estructura de un ácido ribonucleico". Science . 147 (3664): 1462–1465. Bibcode :1965Sci...147.1462H. doi :10.1126/science.147.3664.1462. PMID  14263761. S2CID  40989800.
  17. ^ Nirenberg M, Leder P, Bernfield M, Brimacombe R, Trupin J, Rottman F, O'Neal C (mayo de 1965). "Palabras clave del ARN y síntesis de proteínas, VII. Sobre la naturaleza general del código del ARN". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 53 (5): 1161–1168. Bibcode :1965PNAS...53.1161N. doi : 10.1073/pnas.53.5.1161 . PMC 301388 . PMID  5330357. 
  18. ^ Min Jou W, Haegeman G, Ysebaert M, Fiers W (mayo de 1972). "Secuencia de nucleótidos del gen que codifica la proteína de la capa del bacteriófago MS2". Nature . 237 (5350): 82–88. Bibcode :1972Natur.237...82J. doi :10.1038/237082a0. PMID  4555447. S2CID  4153893.
  19. ^ Fiers W, Contreras R, Duerinck F, Haegeman G, Iserentant D, Merregaert J, et al. (abril de 1976). "Secuencia completa de nucleótidos del ARN del bacteriófago MS2: estructura primaria y secundaria del gen de la replicasa". Nature . 260 (5551): 500–507. Bibcode :1976Natur.260..500F. doi :10.1038/260500a0. PMID  1264203. S2CID  4289674.
  20. ^ Fiers W, Contreras R, Haegemann G, Rogiers R, Van de Voorde A, Van Heuverswyn H, et al. (mayo de 1978). "Secuencia completa de nucleótidos del ADN de SV40". Naturaleza . 273 (5658): 113–120. Código Bib :1978Natur.273..113F. doi :10.1038/273113a0. PMID  205802. S2CID  1634424.
  21. ^ Tamarin RH (2004). Principios de genética (7.ª ed.). Londres: McGraw Hill. ISBN 978-0-07-124320-9.
  22. ^ Sanger F (1980). «Conferencia Nobel: determinación de secuencias de nucleótidos en el ADN» (PDF) . Nobelprize.org . Consultado el 18 de octubre de 2010 .
  23. ^ ab Sanger F, Air GM, Barrell BG, Brown NL, Coulson AR, Fiddes CA, et al. (febrero de 1977). "Secuencia de nucleótidos del ADN del bacteriófago phi X174". Nature . 265 (5596): 687–695. Bibcode :1977Natur.265..687S. doi :10.1038/265687a0. PMID  870828. S2CID  4206886.
  24. ^ Kaiser O, Bartels D, Bekel T, Goesmann A, Kespohl S, Pühler A, Meyer F (diciembre de 2003). "Secuenciación shotgun del genoma completo guiada por procesos bioinformáticos: un enfoque optimizado para una técnica establecida". Journal of Biotechnology . 106 (2–3): 121–133. doi :10.1016/j.jbiotec.2003.08.008. PMID  14651855.
  25. ^ Sanger F, Nicklen S, Coulson AR (diciembre de 1977). "Secuenciación de ADN con inhibidores de terminación de cadena". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 74 (12): 5463–5467. Bibcode :1977PNAS...74.5463S. doi : 10.1073/pnas.74.12.5463 . PMC 431765 . PMID  271968. 
  26. ^ Maxam AM, Gilbert W (febrero de 1977). "Un nuevo método para secuenciar ADN". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 74 (2): 560–564. Bibcode :1977PNAS...74..560M. doi : 10.1073/pnas.74.2.560 . PMC 392330 . PMID  265521. 
  27. ^ ab Darden L, Tabery J (2010). "Biología molecular". En Zalta EN (ed.). The Stanford Encyclopedia of Philosophy (edición de otoño de 2010).
  28. ^ Anderson S, Bankier AT, Barrell BG, de Bruijn MH, Coulson AR, Drouin J, et al. (abril de 1981). "Secuencia y organización del genoma mitocondrial humano". Nature . 290 (5806): 457–465. Bibcode :1981Natur.290..457A. doi :10.1038/290457a0. PMID  7219534. S2CID  4355527.(se requiere suscripción)
  29. ^ Shinozaki K, Ohme M, Tanaka M, Wakasugi T, Hayashida N, Matsubayashi T, et al. (septiembre de 1986). "La secuencia completa de nucleótidos del genoma del cloroplasto del tabaco: su organización y expresión génica". The EMBO Journal . 5 (9): 2043–2049. doi :10.1002/j.1460-2075.1986.tb04464.x. PMC 1167080 . PMID  16453699. 
  30. ^ Ohyama K, Fukuzawa H, Kohchi T, Shirai H, Sano T, Sano S, et al. (1986). "Organización de genes de cloroplastos deducida a partir de la secuencia completa de ADN de cloroplastos de la hepática Marchantia polymorpha". Nature . 322 (6079): 572–574. Bibcode :1986Natur.322..572O. doi :10.1038/322572a0. S2CID  4311952.
  31. ^ Oliver SG , van der Aart QJ, Agostoni-Carbone ML, Aigle M, Alberghina L, Alexandraki D, et al. (mayo de 1992). "La secuencia completa de ADN del cromosoma III de la levadura". Nature . 357 (6373): 38–46. Bibcode :1992Natur.357...38O. doi :10.1038/357038a0. PMID  1574125. S2CID  4271784.
  32. ^ Fleischmann RD, Adams MD, White O, Clayton RA, Kirkness EF, Kerlavage AR, et al. (julio de 1995). "Secuenciación aleatoria de todo el genoma y ensamblaje de Haemophilus influenzae Rd". Science . 269 (5223): 496–512. Bibcode :1995Sci...269..496F. doi :10.1126/science.7542800. PMID  7542800. S2CID  10423613.
  33. ^ Goffeau A, Barrell BG, Bussey H, Davis RW, Dujon B, Feldmann H, et al. (octubre de 1996). "La vida con 6000 genes". Science . 274 (5287): 546, 563–546, 567. Bibcode :1996Sci...274..546G. doi :10.1126/science.274.5287.546. PMID  8849441. S2CID  211123134.(se requiere suscripción)
  34. ^ "Genomas completos: virus". NCBI . 17 de noviembre de 2011 . Consultado el 18 de noviembre de 2011 .
  35. ^ "Estadísticas del Proyecto Genoma". Entrez Genome Project . 7 de octubre de 2011. Consultado el 18 de noviembre de 2011 .
  36. ^ Zimmer C (29 de diciembre de 2009). "Los científicos comienzan a crear un catálogo genómico de los microbios abundantes en la Tierra". The New York Times . ISSN  0362-4331 . Consultado el 21 de diciembre de 2012 .
  37. ^ Wu D, Hugenholtz P, Mavromatis K, Pukall R, Dalin E, Ivanova NN, et al. (diciembre de 2009). "Una enciclopedia genómica impulsada por la filogenia de bacterias y arqueas". Nature . 462 (7276): 1056–1060. Bibcode :2009Natur.462.1056W. doi :10.1038/nature08656. PMC 3073058 . PMID  20033048. 
  38. ^ "Se ha reducido el número de genes humanos". BBC . 20 de octubre de 2004 . Consultado el 21 de diciembre de 2012 .
  39. ^ Yue GH, Lo LC, Zhu ZY, Lin G, Feng F (abril de 2006). "La secuencia completa de nucleótidos del genoma mitocondrial de Tetraodon nigroviridis". Secuencia de ADN . 17 (2): 115–121. doi :10.1080/10425170600700378. PMID  17076253. S2CID  21797344.
  40. ^ Instituto Nacional de Investigación del Genoma Humano (14 de julio de 2004). "Dog Genome Assembled: Canine Genome Now Available to Research Community Worldwide" (Genoma canino ahora disponible para la comunidad de investigación de todo el mundo). Genome.gov . Consultado el 20 de enero de 2012 .
  41. ^ ab McElheny V (2010). Dibujando el mapa de la vida: dentro del Proyecto Genoma Humano . Nueva York, NY: Basic Books. ISBN 978-0-465-04333-0.
  42. ^ Abecasis GR, Auton A, Brooks LD, DePristo MA, Durbin RM, Handsaker RE, et al. (noviembre de 2012). "Un mapa integrado de la variación genética de 1.092 genomas humanos". Nature . 491 (7422): 56–65. Bibcode :2012Natur.491...56T. doi :10.1038/nature11632. PMC 3498066 . PMID  23128226. 
  43. ^ Nielsen R (octubre de 2010). «Genómica: en busca de variantes humanas raras». Nature . 467 (7319): 1050–1051. Bibcode :2010Natur.467.1050N. doi : 10.1038/4671050a . PMID  20981085.
  44. ^ ab Barnes B, Dupré J (2008). Genomas y qué hacer con ellos . Chicago: University of Chicago Press. ISBN 978-0-226-17295-8.
  45. ^ Eisen JA (julio de 2012). "Palabras badomics y el poder y el peligro del ome-meme". GigaScience . 1 (1): 6. doi : 10.1186/2047-217X-1-6 . PMC 3617454 . PMID  23587201. 
  46. ^ Hotz RL (13 de agosto de 2012). "Aquí hay una historia ómica: los científicos descubren un sufijo que se propaga". Wall Street Journal . ISSN  0099-9660 . Consultado el 4 de enero de 2013 .
  47. ^ Scudellari M (1 de octubre de 2011). "Data Deluge". The Scientist . Consultado el 4 de enero de 2013 .
  48. ^ Chaston J, Douglas AE (agosto de 2012). "Aprovechar al máximo la "ómica" para la investigación de la simbiosis". The Biological Bulletin . 223 (1): 21–29. doi :10.1086/BBLv223n1p21. PMC 3491573 . PMID  22983030. 
  49. ^ McCutcheon JP, von Dohlen CD (agosto de 2011). "Un mosaico metabólico interdependiente en la simbiosis anidada de las cochinillas". Current Biology . 21 (16): 1366–1372. Bibcode :2011CBio...21.1366M. doi :10.1016/j.cub.2011.06.051. PMC 3169327 . PMID  21835622. 
  50. ^ ab Baker M (14 de septiembre de 2012). "Los secuenciadores de sobremesa se envían" (Blog) . Nature News Blog . Consultado el 22 de diciembre de 2012 .
  51. ^ Quail MA, Smith M, Coupland P, Otto TD, Harris SR, Connor TR, et al. (julio de 2012). "Una historia de tres plataformas de secuenciación de próxima generación: comparación de los secuenciadores Ion Torrent, Pacific Biosciences e Illumina MiSeq". BMC Genomics . 13 : 341. doi : 10.1186/1471-2164-13-341 . PMC 3431227 . PMID  22827831. 
  52. ^ ab Staden R (junio de 1979). "Una estrategia de secuenciación de ADN empleando programas informáticos". Nucleic Acids Research . 6 (7): 2601–2610. doi :10.1093/nar/6.7.2601. PMC 327874 . PMID  461197. 
  53. ^ Anderson S (julio de 1981). "Secuenciación de ADN shotgun utilizando fragmentos clonados generados por DNasa I". Nucleic Acids Research . 9 (13): 3015–3027. doi :10.1093/nar/9.13.3015. PMC 327328 . PMID  6269069. 
  54. ^ abc Pop M (julio de 2009). "El renacimiento del ensamblaje del genoma: desafíos computacionales recientes". Briefings in Bioinformatics . 10 (4): 354–366. doi :10.1093/bib/bbp026. PMC 2691937 . PMID  19482960. 
  55. ^ Sanger F, Coulson AR (mayo de 1975). "Un método rápido para determinar secuencias en ADN mediante síntesis preparada con ADN polimerasa". Journal of Molecular Biology . 94 (3): 441–448. doi :10.1016/0022-2836(75)90213-2. PMID  1100841.
  56. ^ Mavromatis K, Land ML, Brettin TS, Quest DJ, Copeland A, Clum A, et al. (2012). Liu Z (ed.). "El panorama rápidamente cambiante de las tecnologías de secuenciación y su impacto en los ensamblajes y la anotación del genoma microbiano". PLOS ONE . ​​7 (12): e48837. Bibcode :2012PLoSO...748837M. doi : 10.1371/journal.pone.0048837 . PMC 3520994 . PMID  23251337. 
  57. ^ Illumina, Inc. (28 de febrero de 2012). Introducción a la tecnología de secuenciación de próxima generación (PDF) . San Diego, California, EE. UU.: Illumina, Inc. p. 12. Archivado desde el original (PDF) el 2013-04-11 . Consultado el 28 de diciembre de 2012 .
  58. ^ Hall N (mayo de 2007). "Tecnologías de secuenciación avanzadas y su impacto más amplio en la microbiología". The Journal of Experimental Biology . 210 (Pt 9): 1518–1525. doi : 10.1242/jeb.001370 . PMID  17449817.
  59. ^ Church GM (enero de 2006). "Genomas para todos". Scientific American . 294 (1): 46–54. Bibcode :2006SciAm.294a..46C. doi :10.1038/scientificamerican0106-46. PMID  16468433. S2CID  28769137.
  60. ^ ten Bosch JR, Grody WW (noviembre de 2008). "Mantenerse al día con la próxima generación: secuenciación masiva paralela en diagnósticos clínicos". The Journal of Molecular Diagnostics . 10 (6): 484–492. doi :10.2353/jmoldx.2008.080027. PMC 2570630 . PMID  18832462. 
  61. ^ Tucker T, Marra M, Friedman JM (agosto de 2009). "Secuenciación masivamente paralela: el próximo gran avance en medicina genética". American Journal of Human Genetics . 85 (2): 142–154. doi :10.1016/j.ajhg.2009.06.022. PMC 2725244 . PMID  19679224. 
  62. ^ US 20050100900, Kawashima EH, Farinelli L, Mayer P, "Método de amplificación de ácidos nucleicos", publicado el 12 de mayo de 2005, emitido el 26 de julio de 2011, asignado a Solexa Ltd Gran Bretaña. 
  63. ^ Mardis ER (2008). "Métodos de secuenciación de ADN de próxima generación" (PDF) . Revisión anual de genómica y genética humana . 9 : 387–402. doi :10.1146/annurev.genom.9.081307.164359. PMID  18576944. Archivado desde el original (PDF) el 2013-05-18 . Consultado el 2013-01-04 .
  64. ^ Davies K (2011). "Powering Preventative Medicine". Bio-IT World (septiembre-octubre). Archivado desde el original el 6 de junio de 2016. Consultado el 17 de diciembre de 2014 .
  65. ^ "Inicio". PacBio .
  66. ^ "Inicio". Tecnologías de nanoporos de Oxford .
  67. ^ Chain PS, Grafham DV, Fulton RS, Fitzgerald MG, Hostetler J, Muzny D, et al. (octubre de 2009). "Genómica. Estándares del proyecto Genoma en una nueva era de secuenciación". Science . 326 (5950): 236–237. Bibcode :2009Sci...326..236C. doi :10.1126/science.1180614. PMC 3854948 . PMID  19815760. 
  68. ^ Stein L (julio de 2001). "Anotación del genoma: de la secuencia a la biología". Nature Reviews. Genética . 2 (7): 493–503. doi :10.1038/35080529. PMID  11433356. S2CID  12044602.
  69. ^ Brent MR (enero de 2008). "Progreso constante y avances recientes en la precisión de la anotación automatizada del genoma" (PDF) . Nature Reviews. Genetics . 9 (1): 62–73. doi :10.1038/nrg2220. PMID  18087260. S2CID  20412451. Archivado desde el original (PDF) el 29 de mayo de 2013 . Consultado el 4 de enero de 2013 .
  70. ^ Flicek P, Ahmed I, Amode MR, Barrell D, Beal K, Brent S, et al. (enero de 2013). "Ensembl 2013". Nucleic Acids Research . 41 (número de la base de datos): D48–D55. doi :10.1093/nar/gks1236. PMC 3531136 . PMID  23203987. 
  71. ^ Keith JM (2008). Keith JM (ed.). Bioinformática . Métodos en biología molecular. Vol. 453. págs. v–vi. doi :10.1007/978-1-60327-429-6. ISBN 978-1-60327-428-9. Número de identificación personal  18720577.
  72. ^ Marsden RL, Lewis TA, Orengo CA (marzo de 2007). "Hacia una cobertura estructural integral de genomas completos: un punto de vista de genómica estructural". BMC Bioinformatics . 8 : 86. doi : 10.1186/1471-2105-8-86 . PMC 1829165 . PMID  17349043. 
  73. ^ Brenner SE, Levitt M (enero de 2000). "Expectativas de la genómica estructural". Protein Science . 9 (1): 197–200. doi :10.1110/ps.9.1.197. PMC 2144435 . PMID  10739263. 
  74. ^ Brenner SE (octubre de 2001). "Un recorrido por la genómica estructural". Nature Reviews. Genética . 2 (10): 801–809. doi :10.1038/35093574. PMID  11584296. S2CID  5656447.
  75. ^ ab Francis RC (2011). Epigenética: el misterio último de la herencia . Nueva York: WW Norton. ISBN 978-0-393-07005-7.
  76. ^ Gallego, LD; Schneider, M; Mittal, C; Romanuska, Anete; Gudino Carrillo, RM; Schubert, T; Pugh, BF; Kohler, A (marzo de 2020). "La separación de fases dirige la ubiquitinación de los nucleosomas del cuerpo del gen". Nature . 579 (7800): 592–597. Bibcode :2020Natur.579..592G. doi :10.1038/s41586-020-2097-z. PMC 7481934 . PMID  32214243. 
  77. ^ Sams, KL; Mukai, C; Marks, BA; Mittal, C; Demeter, EA; Nelissen, S; Grenier, JK; Tate, AE; Ahmed, F; Coonrod, SA (octubre de 2022). "Pubertad retrasada, anomalías de gonadotropina y subfertilidad en ratones machos con doble knock-out Padi2/Padi4". Reprod Biol Endocrinol . 20 (1): 150. doi : 10.1186/s12958-022-01018-w . PMC 9555066 . PMID  36224627. 
  78. ^ Laird PW (marzo de 2010). "Principios y desafíos del análisis de metilación del ADN en todo el genoma". Nature Reviews. Genetics . 11 (3): 191–203. doi :10.1038/nrg2732. PMID  20125086. S2CID  6780101.
  79. ^ Hugenholtz P, Goebel BM, Pace NR (septiembre de 1998). "Impacto de los estudios independientes del cultivo en la visión filogenética emergente de la diversidad bacteriana". Journal of Bacteriology . 180 (18): 4765–4774. doi :10.1128/JB.180.18.4765-4774.1998. PMC 107498 . PMID  9733676. 
  80. ^ Eisen JA (marzo de 2007). "Secuenciación shotgun ambiental: su potencial y desafíos para estudiar el mundo oculto de los microbios". PLOS Biology . 5 (3): e82. doi : 10.1371/journal.pbio.0050082 . PMC 1821061 . PMID  17355177. 
  81. ^ Marco D, ed. (2010). Metagenómica: teoría, métodos y aplicaciones . Caister Academic Press. ISBN 978-1-904455-54-7.
  82. ^ Marco D, ed. (2011). Metagenómica: innovaciones actuales y tendencias futuras . Caister Academic Press . ISBN 978-1-904455-87-5.
  83. ^ Canchaya C, Proux C, Fournous G, Bruttin A, Brüssow H (junio de 2003). "Genómica de profagos". Microbiology and Molecular Biology Reviews . 67 (2): 238–76, tabla de contenidos. doi :10.1128/MMBR.67.2.238-276.2003. PMC 156470 . PMID  12794192. 
  84. ^ McGrath S, van Sinderen D, eds. (2007). Bacteriófago: genética y biología molecular (1.ª ed.). Caister Academic Press. ISBN 978-1-904455-14-1.
  85. ^ Fouts DE (noviembre de 2006). "Phage_Finder: identificación y clasificación automatizadas de regiones de profagos en secuencias completas del genoma bacteriano". Nucleic Acids Research . 34 (20): 5839–5851. doi :10.1093/nar/gkl732. PMC 1635311 . PMID  17062630. 
  86. ^ Herrero A, Flores E, eds. (2008). Las cianobacterias: biología molecular, genómica y evolución (1.ª ed.). Caister Academic Press. ISBN 978-1-904455-15-8.
  87. ^ Hudson KL (septiembre de 2011). "Genómica, atención médica y sociedad". The New England Journal of Medicine . 365 (11): 1033–1041. doi : 10.1056/NEJMra1010517 . PMID  21916641.
  88. ^ O'Donnell CJ, Nabel EG (diciembre de 2011). "Genómica de la enfermedad cardiovascular". The New England Journal of Medicine . 365 (22): 2098–2109. doi : 10.1056/NEJMra1105239 . PMID  22129254.
  89. ^ Lu YF, Goldstein DB, Angrist M, Cavalleri G (julio de 2014). "Medicina personalizada y diversidad genética humana". Cold Spring Harbor Perspectives in Medicine . 4 (9): a008581. doi :10.1101/cshperspect.a008581. PMC 4143101 . PMID  25059740. 
  90. ^ Ashley EA, Butte AJ, Wheeler MT, Chen R, Klein TE, Dewey FE, et al. (mayo de 2010). "Evaluación clínica que incorpora un genoma personal". Lancet . 375 (9725): 1525–1535. doi :10.1016/S0140-6736(10)60452-7. PMC 2937184 . PMID  20435227. 
  91. ^ Dewey FE, Chen R, Cordero SP, Ormond KE, Caleshu C, Karczewski KJ, et al. (septiembre de 2011). "Riesgo genético de todo el genoma en fases en un cuarteto familiar utilizando una secuencia de referencia de alelos principales". PLOS Genetics . 7 (9): e1002280. doi : 10.1371/journal.pgen.1002280 . PMC 3174201 . PMID  21935354. 
  92. ^ Dewey FE, Grove ME, Pan C, Goldstein BA, Bernstein JA, Chaib H, et al. (marzo de 2014). "Interpretación clínica e implicaciones de la secuenciación del genoma completo". JAMA . 311 (10): 1035–1045. doi :10.1001/jama.2014.1717. PMC 4119063 . PMID  24618965. 
  93. ^ Robbins R (16 de agosto de 2019). "Los principales centros médicos de EE. UU. lanzan clínicas de secuenciación de ADN para clientes saludables (y a menudo ricos)". STAT News .
  94. ^ "Dos sistemas de salud de Boston ingresan al creciente mercado de secuenciación genética directa al consumidor al abrir clínicas de genómica preventiva, pero ¿pueden los pacientes pagar el servicio?". Dark Daily . The Dark Intelligence Group. 3 de enero de 2020.
  95. ^ "Centros de genoma financiados por los NIH para acelerar los descubrimientos en medicina de precisión". Institutos Nacionales de Salud: Programa de Investigación All of Us . Institutos Nacionales de Salud. 25 de septiembre de 2018.
  96. ^ Church GM, Regis E (2012). Regenesis: cómo la biología sintética reinventará la naturaleza y a nosotros mismos . Nueva York: Basic Books. ISBN 978-0-465-02175-8.
  97. ^ Baker M (mayo de 2011). "Genomas sintéticos: el siguiente paso para el genoma sintético". Nature . 473 (7347): 403, 405–403, 408. Bibcode :2011Natur.473..403B. doi : 10.1038/473403a . PMID  21593873. S2CID  205064528.
  98. ^ Luikart G, England PR, Tallmon D, Jordan S, Taberlet P (diciembre de 2003). "El poder y la promesa de la genómica de poblaciones: desde la genotipificación hasta la tipificación del genoma". Nature Reviews. Genetics . 4 (12): 981–94. doi :10.1038/nrg1226. PMID  14631358. S2CID  8516357.
  99. ^ Frankham R (1 de septiembre de 2010). "Desafíos y oportunidades de los enfoques genéticos para la conservación biológica". Conservación biológica . 143 (9): 1922–1923. Bibcode :2010BCons.143.1919F. doi :10.1016/j.biocon.2010.05.011.
  100. ^ Allendorf FW, Hohenlohe PA, Luikart G (octubre de 2010). "Genómica y el futuro de la genética de la conservación". Nature Reviews. Genética . 11 (10): 697–709. doi :10.1038/nrg2844. PMID  20847747. S2CID  10811958.

Lectura adicional

Enlaces externos