stringtranslate.com

Genoma humano

El genoma humano es un conjunto completo de secuencias de ácido nucleico para humanos , codificadas como ADN dentro de los 23 pares de cromosomas en los núcleos celulares y en una pequeña molécula de ADN que se encuentra dentro de las mitocondrias individuales . Generalmente se tratan por separado como genoma nuclear y genoma mitocondrial . [2] Los genomas humanos incluyen tanto secuencias de ADN que codifican proteínas como varios tipos de ADN que no codifican proteínas . Esta última es una categoría diversa que incluye ADN que codifica ARN no traducido, como el ARN ribosómico , ARN de transferencia , ribozimas , ARN nucleares pequeños y varios tipos de ARN reguladores . También incluye promotores y sus elementos reguladores de genes asociados , ADN que desempeña funciones estructurales y replicativas, como regiones de andamiaje , telómeros , centrómeros y orígenes de replicación , además de un gran número de elementos transponibles , ADN viral insertado , pseudogenes no funcionales y genes simples. Secuencias muy repetitivas . Los intrones constituyen un gran porcentaje del ADN no codificante . Parte de este ADN no codificante es ADN basura no funcional , como los pseudogenes, pero no existe un consenso firme sobre la cantidad total de ADN basura.

Los genomas humanos haploides , que están contenidos en las células germinales (las células gametas del óvulo y el espermatozoide creadas en la fase de meiosis de la reproducción sexual antes de la fertilización ) constan de 3.054.815.472 pares de bases de ADN (si se utiliza el cromosoma X), [3] mientras que los genomas diploides femeninos ( que se encuentran en las células somáticas ) tienen el doble de contenido de ADN.

Si bien existen diferencias significativas entre los genomas de los individuos humanos (del orden del 0,1% debido a variantes de un solo nucleótido [4] y del 0,6% cuando se consideran los indeles ), [5] estas son considerablemente menores que las diferencias entre los humanos y sus seres más cercanos. parientes vivos, los bonobos y los chimpancés (~1,1% de variantes fijas de un solo nucleótido [6] y 4% si se incluyen los indeles). [7] El tamaño en los pares de bases también puede variar; la longitud de los telómeros disminuye después de cada ronda de replicación del ADN .

Aunque la secuencia del genoma humano se ha determinado completamente mediante la secuenciación del ADN en 2022 (incluida la metilación ), [3] aún no se comprende completamente. La mayoría de los genes , pero no todos, han sido identificados mediante una combinación de enfoques bioinformáticos y experimentales de alto rendimiento , pero aún queda mucho trabajo por hacer para dilucidar aún más las funciones biológicas de sus productos proteicos y de ARN (en particular, la anotación del código CHM13v2 completo). .0 la secuencia aún está en curso [8] ).

En 2003, los científicos informaron de la secuenciación del 85% de todo el genoma humano, pero en 2020 todavía faltaba al menos el 8%. [ cita necesaria ] En 2021, los científicos informaron haber secuenciado el genoma femenino completo (es decir, sin el cromosoma Y). [9] Esta secuencia identificó 19.969 secuencias codificantes de proteínas , que representan aproximadamente el 1,5% del genoma, y ​​63.494 genes en total, la mayoría de ellos genes de ARN no codificantes . [3] El genoma consta de secuencias reguladoras de ADN , LINE , SINE , intrones y secuencias para las que aún no se ha determinado ninguna función . El cromosoma Y humano , que consta de 62.460.029 pares de bases de una línea celular diferente y que se encuentra en todos los varones, se secuenció por completo en enero de 2022. [10] [11]

En 2023, se publicó un borrador de referencia del pangenoma humano. [12] Se basa en 47 genomas de personas de variada etnia. [12] Hay planes en marcha para una referencia mejorada que capture aún más biodiversidad a partir de una muestra aún más amplia. [12]

Secuenciación

Las primeras secuencias del genoma humano fueron publicadas en forma de borrador casi completo en febrero de 2001 por el Proyecto Genoma Humano [13] y Celera Corporation . [14] La finalización del esfuerzo de secuenciación del Proyecto Genoma Humano se anunció en 2004 con la publicación de un borrador de secuencia del genoma, dejando solo 341 espacios en la secuencia, que representan ADN altamente repetitivo y otro que no se pudo secuenciar con la tecnología disponible en ese momento. . [15] El genoma humano fue el primero de todos los vertebrados en ser secuenciado casi completamente y, a partir de 2018, los genomas diploides de más de un millón de humanos individuales se habían determinado mediante secuenciación de próxima generación . [dieciséis]

Estos datos se utilizan en todo el mundo en ciencias biomédicas , antropología , ciencia forense y otras ramas de la ciencia. Estos estudios genómicos han dado lugar a avances en el diagnóstico y tratamiento de enfermedades y a nuevos conocimientos en muchos campos de la biología, incluida la evolución humana . [ cita necesaria ]

En 2018, el número total de genes se había elevado a al menos 46 831, [17] más otros 2300 genes de microARN . [18] Una encuesta de población de 2018 encontró otros 300 millones de bases del genoma humano que no estaban en la secuencia de referencia. [19] Antes de la adquisición de la secuencia completa del genoma, las estimaciones del número de genes humanos oscilaban entre 50.000 y 140.000 (con vaguedad ocasional sobre si estas estimaciones incluían genes no codificantes de proteínas). [20] A medida que mejoraron la calidad de la secuencia del genoma y los métodos para identificar genes codificadores de proteínas, [15] el recuento de genes codificadores de proteínas reconocidos se redujo a 19.000-20.000. [21]

En junio de 2016, los científicos anunciaron formalmente HGP-Write , un plan para sintetizar el genoma humano. [22] [23]

En 2022, el consorcio Telomere-to-Telomere (T2T) informó la secuencia completa de un genoma femenino humano, [3] llenando todos los vacíos en el cromosoma X (2020) y los 22 autosomas (mayo de 2021). [3] [24] Las partes no secuenciadas previamente contienen genes de respuesta inmune que ayudan a adaptarse y sobrevivir a las infecciones, así como genes que son importantes para predecir la respuesta a los medicamentos . [25] La secuencia completa del genoma humano también proporcionará una mejor comprensión de la formación humana como organismo individual y cómo los humanos varían entre sí y entre otras especies. [25]

Lograr la integridad

Aunque la "finalización" del proyecto del genoma humano se anunció en 2001, [26] seguían existiendo cientos de lagunas, y entre un 5% y un 10% de la secuencia total seguía sin determinarse. La información genética que faltaba se encontraba principalmente en regiones heterocromáticas repetitivas y cerca de los centrómeros y telómeros , pero también en algunas regiones eucromáticas que codifican genes . [27] Quedaban 160 espacios eucromáticos en 2015 cuando se determinaron las secuencias que abarcaban otras 50 regiones anteriormente no secuenciadas. [28] Recién en 2020 se determinó la primera secuencia verdaderamente completa de telómero a telómero de un cromosoma humano, concretamente del cromosoma X. [29] La primera secuencia completa de telómero a telómero de un cromosoma autosómico humano, el cromosoma 8 , se produjo un año después. [30] El genoma humano completo (sin cromosoma Y) se publicó en 2021, mientras que con cromosoma Y en enero de 2022. [3] [9] [31]

En 2023, se publicó un borrador de referencia del pangenoma humano. [12] Se basa en 47 genomas de personas de variada etnia. [12] Hay planes en marcha para una referencia mejorada que capture aún más biodiversidad a partir de una muestra aún más amplia. [12]

Organización molecular y contenido genético.

La longitud total del genoma humano de referencia no representa la secuencia de ningún individuo específico. El genoma está organizado en 22 cromosomas pares, denominados autosomas , más el par 23 de cromosomas sexuales (XX) en la mujer y (XY) en el hombre. Todos estos cromosomas son grandes moléculas de ADN lineales contenidas dentro del núcleo celular. La versión actual del genoma humano de referencia incluye una copia de cada uno de los autosomas más una copia de los dos cromosomas sexuales (X e Y). La cantidad total de ADN es de 3,1 mil millones de pares de bases (3,1 Mb). [32]

Contenido de informacion

La versión actual del genoma humano de referencia contiene casi 20.000 genes codificadores de proteínas y alrededor de 26.000 genes no codificantes. Es un hecho ampliamente aceptado que existen alrededor de 20.000 genes que codifican proteínas. Los genes no codificantes realizan varias funciones celulares. [33] [34] [35] [36] Hay menos acuerdo sobre el número total de genes no codificantes porque algunos autores creen que muchas de las transcripciones no tienen una función. [37]

ADN codificante versus ADN no codificante

El contenido del genoma humano se divide comúnmente en secuencias de ADN codificantes y no codificantes. El ADN codificante se define como aquellas secuencias que pueden transcribirse en ARNm y traducirse en proteínas durante el ciclo de vida humano; estas secuencias ocupan sólo una pequeña fracción del genoma (<2%). El ADN no codificante está formado por todas aquellas secuencias (aproximadamente el 98% del genoma) que no se utilizan para codificar proteínas. [ cita necesaria ]

Parte del ADN no codificante contiene genes para moléculas de ARN con importantes funciones biológicas ( ARN no codificante , por ejemplo, ARN ribosómico y ARN de transferencia ). La exploración de la función y el origen evolutivo del ADN no codificante es un objetivo importante de la investigación genómica contemporánea, incluido el proyecto ENCODE (Encyclopedia of DNA Elements), cuyo objetivo es estudiar todo el genoma humano, utilizando una variedad de herramientas experimentales cuyos resultados son indicativos. de actividad molecular. Sin embargo, se discute si la actividad molecular (transcripción de ADN en ARN) por sí sola implica que el ARN producido tiene una función biológica significativa, ya que los experimentos han demostrado que el ADN aleatorio no funcional también reclutará de manera reproducible factores de transcripción que resultarán en la transcripción en ARN no funcional. [38]

No hay consenso sobre qué constituye un elemento "funcional" en el genoma, ya que los genetistas, los biólogos evolutivos y los biólogos moleculares emplean definiciones y métodos diferentes. [39] [40] Debido a la ambigüedad en la terminología, han surgido diferentes escuelas de pensamiento. [41] En las definiciones evolutivas, el ADN "funcional", ya sea codificante o no codificante, contribuye a la aptitud del organismo y, por lo tanto, se mantiene mediante presión evolutiva negativa, mientras que el ADN "no funcional" no tiene ningún beneficio para el organismo. y por lo tanto está bajo presión selectiva neutral. Este tipo de ADN se ha descrito como ADN basura [42] [43] En las definiciones genéticas, el ADN "funcional" está relacionado con la forma en que los segmentos de ADN se manifiestan por fenotipo y "no funcional" está relacionado con los efectos de pérdida de función en el organismo. [39] En las definiciones bioquímicas, el ADN "funcional" se relaciona con secuencias de ADN que especifican productos moleculares (por ejemplo, ARN no codificantes) y actividades bioquímicas con funciones mecanicistas en la regulación de genes o genoma (es decir, secuencias de ADN que impactan la actividad a nivel celular, como el tipo de célula, la condición y procesos moleculares). [44] [39] No existe consenso en la literatura sobre la cantidad de ADN funcional ya que, dependiendo de cómo se entienda "función", se han estimado rangos de hasta el 90% del genoma humano que probablemente sea ADN no funcional (ADN basura). ) [45] hasta un 80% del genoma probablemente sea funcional. [46] También es posible que el ADN basura adquiera una función en el futuro y, por lo tanto, pueda desempeñar un papel en la evolución, [47] pero es probable que esto ocurra sólo en muy raras ocasiones. [42] Finalmente, el ADN que es perjudicial para el organismo y está bajo presión selectiva negativa se llama ADN basura. [43]

Debido a que el ADN no codificante supera en gran medida al ADN codificante, el concepto de genoma secuenciado se ha convertido en un concepto analítico más centrado que el concepto clásico de gen codificante de ADN. [48] ​​[49]

Secuencias codificantes (genes codificadores de proteínas)

Genes humanos categorizados por la función de las proteínas transcritas, dados como número de genes codificantes y porcentaje de todos los genes [50]

Las secuencias codificantes de proteínas representan el componente más estudiado y mejor comprendido del genoma humano. Estas secuencias conducen en última instancia a la producción de todas las proteínas humanas , aunque varios procesos biológicos (por ejemplo, reordenamientos del ADN y empalmes alternativos de pre-ARNm ) pueden conducir a la producción de muchas más proteínas únicas que la cantidad de genes que codifican proteínas. La capacidad modular completa de codificación de proteínas del genoma está contenida dentro del exoma y consta de secuencias de ADN codificadas por exones que pueden traducirse en proteínas. Debido a su importancia biológica y al hecho de que constituye menos del 2% del genoma, la secuenciación del exoma fue el primer hito importante del Proyecto Genoma Humano. [ cita necesaria ]

Número de genes codificadores de proteínas . Unas 20.000 proteínas humanas han sido anotadas en bases de datos como Uniprot . [51] Históricamente, las estimaciones del número de genes de proteínas han variado ampliamente, alcanzando hasta 2.000.000 a finales de la década de 1960, [52] pero varios investigadores señalaron a principios de la década de 1970 que la carga mutacional estimada de mutaciones nocivas establecía un límite superior de aproximadamente 40.000 para el número total de loci funcionales (esto incluye genes codificantes de proteínas y genes no codificantes funcionales). [53] El número de genes que codifican proteínas humanas no es significativamente mayor que el de muchos organismos menos complejos, como el gusano redondo y la mosca de la fruta . Esta diferencia puede ser el resultado del uso extensivo de empalme de pre-ARNm alternativo en humanos, que proporciona la capacidad de construir una gran cantidad de proteínas modulares mediante la incorporación selectiva de exones.

Capacidad de codificación de proteínas por cromosoma . Los genes que codifican proteínas se distribuyen de manera desigual en los cromosomas, desde unas pocas docenas hasta más de 2000, con una densidad genética especialmente alta dentro de los cromosomas 1, 11 y 19. Cada cromosoma contiene varias regiones ricas y pobres en genes, que puede estar correlacionado con bandas cromosómicas y contenido de GC . [54] La importancia de estos patrones no aleatorios de densidad genética no se comprende bien. [55]

Tamaño de los genes codificadores de proteínas . El tamaño de los genes que codifican proteínas dentro del genoma humano muestra una enorme variabilidad. Por ejemplo, el gen de la histona H1a (HIST1HIA) es relativamente pequeño y simple, carece de intrones y codifica un ARNm de 781 nucleótidos de longitud que produce una proteína de 215 aminoácidos a partir de su marco de lectura abierto de 648 nucleótidos . La distrofina (DMD) fue el gen codificador de proteínas más grande en el genoma humano de referencia de 2001, abarcando un total de 2,2 millones de nucleótidos, [56] mientras que un metanálisis sistemático más reciente de datos actualizados del genoma humano identificó un gen codificador de proteínas aún más grande, RBFOX1 (proteína de unión a ARN, homólogo 1 de fox-1), que abarca un total de 2,47 millones de nucleótidos. [57] La ​​titina (TTN) tiene la secuencia codificante más larga (114.414 nucleótidos), el mayor número de exones (363), [56] y el exón único más largo (17.106 nucleótidos). Según lo estimado en base a un conjunto seleccionado de genes codificadores de proteínas en todo el genoma, el tamaño medio es de 26.288 nucleótidos (media = 66.577), el tamaño medio del exón, 133 nucleótidos (media = 309), el número medio de exones, 8 ( media = 11), y la proteína codificada mediana tiene 425 aminoácidos (media = 553) de longitud. [57]

ADN no codificante (ADNnc)

El ADN no codificante se define como todas las secuencias de ADN dentro de un genoma que no se encuentran dentro de los exones que codifican proteínas y, por lo tanto, nunca están representadas dentro de la secuencia de aminoácidos de las proteínas expresadas. Según esta definición, más del 98% de los genomas humanos están compuestos de ncDNA. [ cita necesaria ]

Se han identificado numerosas clases de ADN no codificante, incluidos genes para ARN no codificante (p. ej., ARNt y ARNr), pseudogenes, intrones, regiones no traducidas de ARNm, secuencias de ADN reguladoras, secuencias de ADN repetitivas y secuencias relacionadas con elementos genéticos móviles. [ cita necesaria ]

Numerosas secuencias que se incluyen dentro de los genes también se definen como ADN no codificante. Estos incluyen genes para ARN no codificante (por ejemplo, ARNt, ARNr) y componentes no traducidos de genes codificadores de proteínas (por ejemplo, intrones y regiones 5' y 3' no traducidas de ARNm).

Las secuencias codificantes de proteínas (específicamente, exones codificantes ) constituyen menos del 1,5% del genoma humano. [26] Además, alrededor del 26% del genoma humano son intrones . [59] Aparte de los genes (exones e intrones) y las secuencias reguladoras conocidas (8-20%), el genoma humano contiene regiones de ADN no codificante. La cantidad exacta de ADN no codificante que desempeña un papel en la fisiología celular ha sido objeto de acalorados debates. Un análisis del proyecto ENCODE indica que el 80% de todo el genoma humano se transcribe, se une a proteínas reguladoras o está asociado con alguna otra actividad bioquímica. [60]

Sin embargo, sigue siendo controvertido si toda esta actividad bioquímica contribuye a la fisiología celular o si una parte sustancial de ella es el resultado del ruido transcripcional y bioquímico, que el organismo debe filtrar activamente. [61] [37] Excluyendo las secuencias codificantes de proteínas, los intrones y las regiones reguladoras, gran parte del ADN no codificante está compuesto por: Muchas secuencias de ADN que no desempeñan un papel en la expresión génica tienen funciones biológicas importantes. Los estudios de genómica comparada indican que alrededor del 5% del genoma contiene secuencias de ADN no codificante que están altamente conservadas , a veces en escalas de tiempo que representan cientos de millones de años, lo que implica que estas regiones no codificantes están bajo una fuerte presión evolutiva y selección purificadora . [62]

Muchas de estas secuencias regulan la estructura de los cromosomas limitando las regiones de formación de heterocromatina y regulando características estructurales de los cromosomas, como los telómeros y centrómeros . Otras regiones no codificantes sirven como orígenes de la replicación del ADN . Finalmente, varias regiones se transcriben en ARN no codificante funcional que regula la expresión de genes codificadores de proteínas (por ejemplo [63] ), la traducción y estabilidad del ARNm (ver miARN ), la estructura de la cromatina (incluidas las modificaciones de histonas , por ejemplo [64] ), el ADN. metilación (por ejemplo [65] ), recombinación de ADN (por ejemplo [66] ) y regulación cruzada de otros ARN no codificantes (por ejemplo [67] ). También es probable que muchas regiones no codificantes transcritas no cumplan ninguna función y que esta transcripción sea producto de la actividad de la ARN polimerasa no específica . [61]

Pseudogenes

Los pseudogenes son copias inactivas de genes codificadores de proteínas, a menudo generados por duplicación de genes , que han dejado de funcionar debido a la acumulación de mutaciones inactivadoras. El número de pseudogenes en el genoma humano es del orden de 13.000, [68] y en algunos cromosomas es casi el mismo que el número de genes funcionales que codifican proteínas. La duplicación de genes es un mecanismo importante a través del cual se genera nuevo material genético durante la evolución molecular .

Por ejemplo, la familia de genes del receptor olfativo es uno de los ejemplos mejor documentados de pseudogenes en el genoma humano. Más del 60 por ciento de los genes de esta familia son pseudogenes no funcionales en humanos. En comparación, sólo el 20 por ciento de los genes de la familia de genes del receptor olfativo del ratón son pseudogenes. Las investigaciones sugieren que esta es una característica específica de cada especie, ya que los primates más estrechamente relacionados tienen proporcionalmente menos pseudogenes. Este descubrimiento genético ayuda a explicar el sentido del olfato menos agudo en los humanos en comparación con otros mamíferos. [69]

Genes para ARN no codificante (ncRNA)

Las moléculas de ARN no codificantes desempeñan muchas funciones esenciales en las células, especialmente en las numerosas reacciones de síntesis de proteínas y procesamiento de ARN . El ARN no codificante incluye ARNt , ARN ribosómico , microARN , ARNsn y otros genes de ARN no codificante, incluidos aproximadamente 60.000 ARN no codificantes de largo (lncRNA). [60] [70] [71] [72] Aunque el número de genes de lncRNA informados continúa aumentando y el número exacto en el genoma humano aún no se ha definido, se argumenta que muchos de ellos no son funcionales. [73]

Muchos ncRNA son elementos críticos en la regulación y expresión de genes. El ARN no codificante también contribuye a la epigenética, la transcripción, el empalme del ARN y la maquinaria de traducción. El papel del ARN en la regulación genética y las enfermedades ofrece un nuevo nivel potencial de complejidad genómica inexplorada. [74]

Intrones y regiones no traducidas de ARNm

Además de las moléculas de ARNnc codificadas por genes discretos, las transcripciones iniciales de genes codificantes de proteínas suelen contener secuencias extensas no codificantes, en forma de intrones , regiones 5' no traducidas (5'-UTR) y regiones 3' no traducidas. (3'-UTR). En la mayoría de los genes codificadores de proteínas del genoma humano, la longitud de las secuencias de intrones es de 10 a 100 veces la longitud de las secuencias de exones. [ cita necesaria ]

Secuencias reguladoras de ADN.

El genoma humano tiene muchas secuencias reguladoras diferentes que son cruciales para controlar la expresión genética . Las estimaciones conservadoras indican que estas secuencias constituyen el 8% del genoma, [75] sin embargo, las extrapolaciones del proyecto ENCODE dan que el 20 [76] -40% [77] del genoma es una secuencia reguladora de genes. Algunos tipos de ADN no codificante son "interruptores" genéticos que no codifican proteínas, pero sí regulan cuándo y dónde se expresan los genes (llamados potenciadores ). [78]

Las secuencias regulatorias se conocen desde finales de los años 1960. [79] La primera identificación de secuencias reguladoras en el genoma humano se basó en la tecnología del ADN recombinante. [80] Más tarde, con la llegada de la secuenciación genómica, la identificación de estas secuencias podría inferirse mediante conservación evolutiva. La rama evolutiva entre los primates y el ratón , por ejemplo, se produjo hace 70 a 90 millones de años. [81] Por lo tanto, las comparaciones por computadora de secuencias genéticas que identifican secuencias no codificantes conservadas serán una indicación de su importancia en tareas como la regulación genética. [82]

Se han secuenciado otros genomas con la misma intención de ayudar a los métodos guiados por la conservación, por ejemplo el genoma del pez globo . [83] Sin embargo, las secuencias reguladoras desaparecen y vuelven a evolucionar durante la evolución a un ritmo elevado. [84] [85] [86]

A partir de 2012, los esfuerzos se han desplazado hacia la búsqueda de interacciones entre el ADN y las proteínas reguladoras mediante la técnica ChIP-Seq , o espacios donde el ADN no está empaquetado por histonas ( sitios hipersensibles a la ADNasa ), los cuales indican dónde hay secuencias reguladoras activas en el tipo de célula investigada. [75]

Secuencias de ADN repetitivas

Las secuencias repetitivas de ADN comprenden aproximadamente el 50% del genoma humano. [87]

Aproximadamente el 8% del genoma humano consta de conjuntos de ADN en tándem o repeticiones en tándem, secuencias repetidas de baja complejidad que tienen múltiples copias adyacentes (por ejemplo, "CAGCAGCAG..."). [88] Las secuencias en tándem pueden tener longitudes variables, desde dos nucleótidos hasta decenas de nucleótidos. Estas secuencias son muy variables, incluso entre individuos estrechamente relacionados, por lo que se utilizan para pruebas de ADN genealógico y análisis forense de ADN . [89]

Las secuencias repetidas de menos de diez nucleótidos (por ejemplo, la repetición de dinucleótido (AC) n ) se denominan secuencias de microsatélites. Entre las secuencias de microsatélites, las repeticiones de trinucleótidos son de particular importancia, ya que a veces ocurren dentro de las regiones codificantes de genes para proteínas y pueden conducir a trastornos genéticos. Por ejemplo, la enfermedad de Huntington resulta de una expansión de la repetición de trinucleótido (CAG) n dentro del gen de Huntingtina en el cromosoma 4 humano. Los telómeros (los extremos de los cromosomas lineales) terminan con una repetición de hexanucleótido microsatélite de la secuencia (TTAGGG) n . [ cita necesaria ]

Las repeticiones en tándem de secuencias más largas (conjuntos de secuencias repetidas de 10 a 60 nucleótidos de longitud) se denominan minisatélites . [90]

Elementos genéticos móviles (transposones) y sus reliquias.

Los elementos genéticos transponibles , secuencias de ADN que pueden replicarse e insertar copias de sí mismas en otras ubicaciones dentro del genoma del huésped, son un componente abundante en el genoma humano. El linaje de transposones más abundante, Alu , tiene alrededor de 50.000 copias activas [91] y puede insertarse en regiones intragénicas e intergénicas. [92] Otro linaje, LINE-1, tiene alrededor de 100 copias activas por genoma (el número varía entre personas). [93] Junto con reliquias no funcionales de transposones antiguos, representan más de la mitad del ADN humano total. [94] A veces llamados "genes saltarines", los transposones han desempeñado un papel importante en la escultura del genoma humano. Algunas de estas secuencias representan retrovirus endógenos , copias de ADN de secuencias virales que se han integrado permanentemente en el genoma y ahora se transmiten a las generaciones siguientes.

Los elementos móviles dentro del genoma humano se pueden clasificar en retrotransposones LTR (8,3% del genoma total), SINE (13,1% del genoma total), incluidos elementos Alu , LINE (20,4% del genoma total), SVA (SINE- VNTR -Alu) y Transposones de ADN de clase II (2,9% del genoma total).

Variación genómica en humanos.

Genoma humano de referencia

Con la excepción de los gemelos idénticos, todos los humanos muestran una variación significativa en las secuencias de ADN genómico. El genoma humano de referencia (HRG) se utiliza como secuencia de referencia estándar.

Hay varios puntos importantes sobre el genoma humano de referencia:

El Consorcio de Referencia del Genoma es responsable de actualizar el HRG. La versión 38 se publicó en diciembre de 2013. [95]

Medición de la variación genética humana

La mayoría de los estudios sobre la variación genética humana se han centrado en los polimorfismos de un solo nucleótido (SNP), que son sustituciones en bases individuales a lo largo de un cromosoma. La mayoría de los análisis estiman que los SNP se encuentran en 1 de cada 1000 pares de bases, en promedio, en el genoma humano eucromatico , aunque no se presentan con una densidad uniforme. De ahí se sigue la afirmación popular de que "todos somos, independientemente de la raza , genéticamente iguales en un 99,9%", [96] aunque esto sería algo matizado por la mayoría de los genetistas. Por ejemplo, ahora se cree que una fracción mucho mayor del genoma está involucrada en la variación del número de copias . [97] El Proyecto Internacional HapMap está llevando a cabo un esfuerzo de colaboración a gran escala para catalogar las variaciones de SNP en el genoma humano . [ cita necesaria ]

Los loci genómicos y la longitud de ciertos tipos de pequeñas secuencias repetitivas son muy variables de persona a persona, lo cual es la base de las tecnologías de huellas dactilares de ADN y pruebas de paternidad de ADN . También se cree que las porciones heterocromáticas del genoma humano, que suman varios cientos de millones de pares de bases, son bastante variables dentro de la población humana (son tan repetitivas y tan largas que no pueden secuenciarse con precisión con la tecnología actual). Estas regiones contienen pocos genes y no está claro si algún efecto fenotípico significativo resulta de la variación típica en las repeticiones o la heterocromatina.

La mayoría de las mutaciones genómicas importantes en las células germinales de los gametos probablemente den como resultado embriones inviables; sin embargo, varias enfermedades humanas están relacionadas con anomalías genómicas a gran escala. El síndrome de Down , el síndrome de Turner y varias otras enfermedades son el resultado de la falta de disyunción de cromosomas completos. Las células cancerosas frecuentemente tienen aneuploidía de cromosomas y brazos cromosómicos, aunque no se ha establecido una relación de causa y efecto entre aneuploidía y cáncer.

Mapeo de la variación genómica humana

Mientras que una secuencia del genoma enumera el orden de cada base de ADN en un genoma, un mapa del genoma identifica los puntos de referencia. Un mapa del genoma es menos detallado que una secuencia del genoma y ayuda a navegar por el genoma. [98] [99]

Un ejemplo de mapa de variación es el HapMap desarrollado por el Proyecto Internacional HapMap . El HapMap es un mapa de haplotipos del genoma humano, "que describirá los patrones comunes de variación de la secuencia del ADN humano". [100] Cataloga los patrones de variaciones a pequeña escala en el genoma que involucran letras o bases de ADN individuales.

Los investigadores publicaron el primer mapa basado en secuencias de variación estructural a gran escala en todo el genoma humano en la revista Nature en mayo de 2008. [101] [102] Las variaciones estructurales a gran escala son diferencias en el genoma entre personas que van desde unos pocos miles a unos pocos millones de bases de ADN; algunos son ganancias o pérdidas de tramos de secuencia del genoma y otros aparecen como reordenamientos de tramos de secuencia. Estas variaciones incluyen diferencias en el número de copias que tienen los individuos de un gen particular, deleciones, translocaciones e inversiones.

Variación estructural

La variación estructural se refiere a variantes genéticas que afectan segmentos más grandes del genoma humano, a diferencia de las mutaciones puntuales . A menudo, las variantes estructurales (SV) se definen como variantes de 50 pares de bases (pb) o más, como deleciones, duplicaciones, inserciones, inversiones y otros reordenamientos. Alrededor del 90% de las variantes estructurales son deleciones no codificantes, pero la mayoría de las personas tienen más de mil de este tipo de deleciones; el tamaño de las eliminaciones varía desde docenas de pares de bases hasta decenas de miles de pb. [103] En promedio, los individuos portan ~3 variantes estructurales raras que alteran las regiones codificantes, por ejemplo, eliminan exones . Alrededor del 2% de las personas portan variantes estructurales ultrararas a escala de megabase, especialmente reordenamientos. Es decir, millones de pares de bases pueden estar invertidos dentro de un cromosoma; Ultrararos significa que sólo se encuentran en individuos o en miembros de sus familias y, por lo tanto, han surgido muy recientemente. [103]

Frecuencia de SNP en todo el genoma humano.

Los polimorfismos de un solo nucleótido (SNP) no ocurren de manera homogénea en todo el genoma humano. De hecho, existe una enorme diversidad en la frecuencia de SNP entre genes, lo que refleja diferentes presiones selectivas sobre cada gen, así como diferentes tasas de mutación y recombinación en todo el genoma. Sin embargo, los estudios sobre SNP están sesgados hacia regiones codificantes; es poco probable que los datos generados a partir de ellos reflejen la distribución general de SNP en todo el genoma. Por lo tanto, el protocolo del Consorcio SNP se diseñó para identificar los SNP sin sesgo hacia las regiones codificantes y los 100.000 SNP del Consorcio generalmente reflejan la diversidad de secuencias en los cromosomas humanos. El Consorcio SNP pretende ampliar el número de SNP identificados en todo el genoma a 300 000 para finales del primer trimestre de 2001. [104]

Distribución de TSC SNP a lo largo del brazo largo del cromosoma 22 (de https://web.archive.org/web/20130903043223/http://snp.cshl.org/). Cada columna representa un intervalo de 1 Mb; la posición citogenética aproximada se da en el eje x. Se pueden observar picos y valles claros de densidad de SNP, que posiblemente reflejan diferentes tasas de mutación, recombinación y selección.

Los cambios en la secuencia no codificante y los cambios sinónimos en la secuencia codificante son generalmente más comunes que los cambios no sinónimos, lo que refleja una mayor presión selectiva que reduce la diversidad en las posiciones que dictan la identidad de los aminoácidos. Los cambios transicionales son más comunes que las transversiones, y los dinucleótidos CpG muestran la tasa de mutación más alta, presumiblemente debido a la desaminación. [ cita necesaria ]

Genomas personales

Una secuencia de genoma personal es una secuencia (casi) completa de los pares de bases químicas que forman el ADN de una sola persona. Debido a que los tratamientos médicos tienen diferentes efectos en diferentes personas debido a variaciones genéticas como los polimorfismos de un solo nucleótido (SNP), el análisis de genomas personales puede conducir a un tratamiento médico personalizado basado en genotipos individuales. [105]

La primera secuencia del genoma personal que se determinó fue la de Craig Venter en 2007. Los genomas personales no habían sido secuenciados en el Proyecto Genoma Humano público para proteger la identidad de los voluntarios que proporcionaron muestras de ADN. Esa secuencia se derivó del ADN de varios voluntarios de una población diversa. [106] Sin embargo, al principio del esfuerzo de secuenciación del genoma de Celera Genomics dirigido por Venter , se tomó la decisión de pasar de la secuenciación de una muestra compuesta al uso de ADN de un solo individuo, que luego se reveló que era el propio Venter. Así, la secuencia del genoma humano de Celera publicada en 2000 era en gran medida la de un hombre. La sustitución posterior de los primeros datos derivados de compuestos y la determinación de la secuencia diploide, que representa ambos conjuntos de cromosomas , en lugar de una secuencia haploide informada originalmente, permitió la liberación del primer genoma personal. [107] En abril de 2008, también se completó el de James Watson . En 2009, Stephen Quake publicó su propia secuencia del genoma derivada de un secuenciador de su propio diseño, el Heliscope. [108] Un equipo de Stanford dirigido por Euan Ashley publicó un marco para la interpretación médica de los genomas humanos implementado en el genoma de Quake y tomó decisiones médicas informadas sobre el genoma completo por primera vez. [109] Ese equipo amplió aún más el enfoque a la familia West, la primera familia secuenciada como parte del programa de secuenciación del genoma personal de Illumina. [110] Desde entonces se han publicado cientos de secuencias de genomas personales, [111] incluidas las de Desmond Tutu , [112] [113] y las de un paleoesquimal . [114] En 2012, se hicieron públicas las secuencias completas del genoma de dos tríos familiares entre 1092 genomas. [4] En noviembre de 2013, una familia española puso a disposición del público cuatro conjuntos de datos de exomas personales (aproximadamente el 1% del genoma) bajo una licencia de dominio público Creative Commons . [115] [116] El Proyecto Genoma Personal (iniciado en 2005) es uno de los pocos que pone a disposición del público tanto las secuencias del genoma como los fenotipos médicos correspondientes. [117] [118]

La secuenciación de genomas individuales reveló aún más niveles de complejidad genética que no se habían apreciado antes. La genómica personal ayudó a revelar el nivel significativo de diversidad en el genoma humano atribuido no sólo a los SNP sino también a las variaciones estructurales. Sin embargo, la aplicación de tales conocimientos al tratamiento de enfermedades y en el campo médico está sólo en sus inicios. [119] La secuenciación del exoma se ha vuelto cada vez más popular como herramienta para ayudar en el diagnóstico de enfermedades genéticas porque el exoma contribuye solo con el 1% de la secuencia genómica pero representa aproximadamente el 85% de las mutaciones que contribuyen significativamente a la enfermedad. [120]

knockouts humanos

En los seres humanos, los genes knockout se producen naturalmente como knockouts de genes heterocigotos u homocigotos con pérdida de función . Estos knockouts suelen ser difíciles de distinguir, especialmente dentro de entornos genéticos heterogéneos . También son difíciles de encontrar porque se producen en bajas frecuencias.

Las poblaciones con un alto nivel de relación con los padres dan como resultado un mayor número de genes knockout homocigotos en comparación con las poblaciones exógenas. [121]

Las poblaciones con altas tasas de consanguinidad , como los países con altas tasas de matrimonios entre primos hermanos, muestran las frecuencias más altas de genes knockout homocigotos. Estas poblaciones incluyen Pakistán, Islandia y las poblaciones amish. Estas poblaciones con un alto nivel de relación con los padres han sido objeto de investigaciones de eliminación de genes en humanos que han ayudado a determinar la función de genes específicos en humanos. Al distinguir knockouts específicos, los investigadores pueden utilizar análisis fenotípicos de estos individuos para ayudar a caracterizar el gen que ha sido desactivado.

Un pedigrí que muestra un apareamiento entre primos hermanos (ambos portadores llevan knockouts heterocigotos que se aparean marcados por una línea doble) que da lugar a una descendencia que posee un gen knockout homocigoto.

Los knockouts en genes específicos pueden causar enfermedades genéticas, potencialmente tener efectos beneficiosos o incluso no producir ningún efecto fenotípico. Sin embargo, determinar el efecto fenotípico de un knockout en humanos puede resultar un desafío. Los desafíos para caracterizar e interpretar clínicamente los knockouts incluyen la dificultad para identificar variantes de ADN, determinar la interrupción de la función de las proteínas (anotación) y considerar la influencia que tiene el mosaicismo en el fenotipo. [121]

Un estudio importante que investigó los knockouts en humanos es el estudio Pakistán sobre riesgo de infarto de miocardio. Se descubrió que los individuos que poseían un gen heterocigoto de pérdida de función para el gen APOC3 tenían triglicéridos más bajos en la sangre después de consumir una comida rica en grasas en comparación con los individuos sin la mutación. Sin embargo, los individuos que poseen genes homocigotos de pérdida de función knockout del gen APOC3 mostraron el nivel más bajo de triglicéridos en la sangre después de la prueba de carga de grasa, ya que no producen proteína APOC3 funcional. [122]

Trastornos genéticos humanos

La mayoría de los aspectos de la biología humana involucran factores tanto genéticos (heredados) como no genéticos (ambientales). Alguna variación heredada influye en aspectos de nuestra biología que no son de naturaleza médica (altura, color de ojos, capacidad para saborear u oler ciertos compuestos, etc.). Además, algunos trastornos genéticos sólo causan enfermedades en combinación con los factores ambientales apropiados (como la dieta). Con estas advertencias, los trastornos genéticos pueden describirse como enfermedades clínicamente definidas causadas por la variación de la secuencia del ADN genómico. En los casos más sencillos, el trastorno puede estar asociado con una variación en un solo gen. Por ejemplo, la fibrosis quística es causada por mutaciones en el gen CFTR y es el trastorno recesivo más común en poblaciones caucásicas con más de 1300 mutaciones diferentes conocidas. [123]

Las mutaciones que causan enfermedades en genes específicos suelen ser graves en términos de función genética y, afortunadamente, son raras, por lo que los trastornos genéticos son igualmente raros individualmente. Sin embargo, dado que hay muchos genes que pueden variar para causar trastornos genéticos, en conjunto constituyen un componente importante de afecciones médicas conocidas, especialmente en medicina pediátrica. Los trastornos genéticos caracterizados molecularmente son aquellos para los cuales se ha identificado el gen causal subyacente. Actualmente hay aproximadamente 2200 trastornos de este tipo anotados en la base de datos OMIM . [123]

Los estudios de trastornos genéticos a menudo se realizan mediante estudios familiares. En algunos casos, se emplean enfoques poblacionales, particularmente en el caso de las llamadas poblaciones fundadoras, como las de Finlandia, el Canadá francés, Utah, Cerdeña, etc. El diagnóstico y el tratamiento de los trastornos genéticos generalmente los realiza un médico genetista . capacitado en genética clínica/médica. Es probable que los resultados del Proyecto Genoma Humano proporcionen una mayor disponibilidad de pruebas genéticas para trastornos relacionados con los genes y, en última instancia, un mejor tratamiento. Se puede examinar a los padres para detectar condiciones hereditarias y asesorarlos sobre las consecuencias, la probabilidad de herencia y cómo evitarla o mejorarla en sus hijos.

Hay muchos tipos diferentes de variación de la secuencia del ADN, que van desde cromosomas extras o faltantes completos hasta cambios de un solo nucleótido. Generalmente se supone que gran parte de la variación genética que ocurre naturalmente en las poblaciones humanas es fenotípicamente neutral, es decir, tiene poco o ningún efecto detectable sobre la fisiología del individuo (aunque puede haber diferencias fraccionarias en la aptitud definida a lo largo de períodos de tiempo evolutivos). Los trastornos genéticos pueden ser causados ​​por cualquiera o todos los tipos conocidos de variación de secuencia. Para caracterizar molecularmente un nuevo trastorno genético, es necesario establecer un vínculo causal entre una variante de secuencia genómica particular y la enfermedad clínica que se está investigando. Estos estudios constituyen el ámbito de la genética molecular humana.

Con la llegada del Genoma Humano y el Proyecto Internacional HapMap , se ha vuelto factible explorar influencias genéticas sutiles en muchas enfermedades comunes como diabetes, asma, migraña, esquizofrenia, etc. Aunque se han establecido algunos vínculos causales entre variantes de secuencia genómica en genes particulares y algunas de estas enfermedades, a menudo con mucha publicidad en los medios generales, generalmente no se consideran trastornos genéticos per se ya que sus causas son complejas e involucran muchos factores genéticos y ambientales diferentes. Por lo tanto, en casos particulares puede haber desacuerdo sobre si una condición médica específica debe denominarse trastorno genético.

Otros trastornos genéticos a mencionar son el síndrome de Kallman y el síndrome de Pfeiffer (gen FGFR1), la distrofia corneal de Fuchs (gen TCF4), la enfermedad de Hirschsprung (genes RET y FECH), el síndrome de Bardet-Biedl 1 (genes CCDC28B y BBS1), el síndrome de Bardet-Biedl 10 (gen BBS10) y distrofia muscular facioescapulohumeral tipo 2 (genes D4Z4 y SMCHD1). [124]

La secuenciación del genoma ahora puede reducir el genoma a ubicaciones específicas para encontrar con mayor precisión mutaciones que resultarán en un trastorno genético. Las variantes del número de copias (CNV) y las variantes de un solo nucleótido (SNV) también se pueden detectar al mismo tiempo que la secuenciación del genoma con procedimientos de secuenciación más nuevos disponibles, llamados secuenciación de próxima generación (NGS). [125] Esto solo analiza una pequeña porción del genoma, alrededor del 1-2%. Los resultados de esta secuenciación se pueden utilizar para el diagnóstico clínico de una afección genética, incluido el síndrome de Usher , enfermedades de la retina, deficiencias auditivas, diabetes, epilepsia, enfermedad de Leigh , cánceres hereditarios, enfermedades neuromusculares, inmunodeficiencias primarias, inmunodeficiencia combinada grave (SCID) y enfermedades de las mitocondrias. [126] La NGS también se puede utilizar para identificar portadores de enfermedades antes de la concepción. Las enfermedades que se pueden detectar en esta secuenciación incluyen la enfermedad de Tay-Sachs , el síndrome de Bloom , la enfermedad de Gaucher , la enfermedad de Canavan , la disautonomía familiar , la fibrosis quística, la atrofia muscular espinal y el síndrome del X frágil . La próxima secuenciación del genoma se puede limitar para buscar específicamente enfermedades más prevalentes en determinadas poblaciones étnicas. [127]

Evolución

Los estudios genómicos comparativos de genomas de mamíferos sugieren que aproximadamente el 5% del genoma humano se ha conservado mediante la evolución desde la divergencia de los linajes existentes hace aproximadamente 200 millones de años, y contiene la gran mayoría de los genes. [128] [129] El genoma del chimpancé publicado difiere del genoma humano en un 1,23% en comparaciones directas de secuencias. [130] Alrededor del 20% de esta cifra se debe a la variación dentro de cada especie, dejando solo ~1,06% de divergencia de secuencia consistente entre humanos y chimpancés en genes compartidos. [131] Sin embargo, esta diferencia nucleótido por nucleótido se ve eclipsada por la porción de cada genoma que no se comparte, incluido alrededor del 6% de los genes funcionales que son exclusivos de los humanos o los chimpancés. [132]

En otras palabras, las considerables diferencias observables entre humanos y chimpancés pueden deberse tanto o más a la variación a nivel del genoma en el número, función y expresión de los genes que a cambios en la secuencia del ADN en genes compartidos. De hecho, incluso entre los seres humanos, se ha descubierto que existe una cantidad de variación del número de copias (CNV, por sus siglas en inglés) que antes no se había apreciado y que puede representar entre el 5% y el 15% del genoma humano. En otras palabras, entre humanos podría haber +/- 500.000.000 de pares de bases de ADN, siendo algunos genes activos, otros inactivados o activos en diferentes niveles. El significado total de este hallazgo aún está por verse. En promedio, un gen codificador de proteínas humano típico difiere de su ortólogo de chimpancé en sólo dos sustituciones de aminoácidos ; casi un tercio de los genes humanos tienen exactamente la misma traducción de proteínas que sus ortólogos de chimpancé. Una diferencia importante entre los dos genomas es el cromosoma 2 humano , que es equivalente a un producto de fusión de los cromosomas 12 y 13 de chimpancé [133] (posteriormente renombrados como cromosomas 2A y 2B, respectivamente).

Los humanos hemos sufrido una pérdida extraordinaria de genes receptores olfativos durante nuestra evolución reciente, lo que explica nuestro sentido del olfato relativamente tosco en comparación con la mayoría de los demás mamíferos. La evidencia evolutiva sugiere que la aparición de la visión de los colores en los humanos y en varias otras especies de primates ha disminuido la necesidad del sentido del olfato. [134]

En septiembre de 2016, los científicos informaron que, basándose en estudios genéticos del ADN humano, todos los no africanos del mundo actual pueden rastrearse hasta una única población que salió de África hace entre 50.000 y 80.000 años. [135]

ADN mitocondrial

El ADN mitocondrial humano es de enorme interés para los genetistas, ya que sin duda desempeña un papel en las enfermedades mitocondriales . También arroja luz sobre la evolución humana; por ejemplo, el análisis de la variación en el genoma mitocondrial humano ha llevado a la postulación de un ancestro común reciente para todos los humanos en la línea de descendencia materna (ver Eva mitocondrial ).

Debido a la falta de un sistema para verificar errores de copia, [136] el ADN mitocondrial (ADNmt) tiene una tasa de variación más rápida que el ADN nuclear. Esta tasa de mutación 20 veces mayor permite que el ADNmt se utilice para un seguimiento más preciso de la ascendencia materna. [ cita necesaria ] Los estudios de ADNmt en poblaciones han permitido rastrear rutas migratorias antiguas, como la migración de nativos americanos de Siberia [137] o polinesios del sudeste asiático . [ cita necesaria ] También se ha utilizado para demostrar que no hay rastro de ADN de neandertal en la mezcla de genes europeos heredada a través del linaje puramente materno. [138] Debido a la forma restrictiva de herencia de todo o nada del ADNmt, este resultado (sin rastro de ADNmt de Neandertal) sería probable a menos que hubiera un gran porcentaje de ascendencia neandertal, o hubiera una fuerte selección positiva para ese ADNmt. Por ejemplo, retrocediendo 5 generaciones, sólo 1 de los 32 ancestros de una persona contribuyó al ADNmt de esa persona, por lo que si uno de estos 32 fuera neandertal puro, se espera que ~3% del ADN autosómico de esa persona sería de origen neandertal, pero tendría una probabilidad de ~97% de no tener rastros de ADNmt de Neandertal. [ cita necesaria ]

Epigenoma

La epigenética describe una variedad de características del genoma humano que trascienden su secuencia primaria de ADN, como el empaquetado de cromatina , las modificaciones de histonas y la metilación del ADN , y que son importantes en la regulación de la expresión genética, la replicación del genoma y otros procesos celulares. Los marcadores epigenéticos fortalecen y debilitan la transcripción de ciertos genes, pero no afectan la secuencia real de nucleótidos del ADN. La metilación del ADN es una forma importante de control epigenético sobre la expresión genética y uno de los temas más estudiados en epigenética. Durante el desarrollo, el perfil de metilación del ADN humano experimenta cambios dramáticos. En las células de la línea germinal temprana, el genoma tiene niveles de metilación muy bajos. Estos niveles bajos generalmente describen genes activos. A medida que avanza el desarrollo, las etiquetas de impresión parentales conducen a una mayor actividad de metilación. [139] [140]

Los patrones epigenéticos se pueden identificar entre tejidos dentro de un individuo, así como entre los propios individuos. Los genes idénticos que tienen diferencias sólo en su estado epigenético se denominan epialelos . Los epialelos se pueden clasificar en tres categorías: aquellos directamente determinados por el genotipo de un individuo, aquellos influenciados por el genotipo y aquellos completamente independientes del genotipo. El epigenoma también está influenciado significativamente por factores ambientales. La dieta, las toxinas y las hormonas impactan el estado epigenético. Los estudios sobre manipulación dietética han demostrado que las dietas deficientes en metilo están asociadas con la hipometilación del epigenoma. Dichos estudios establecen que la epigenética es una interfaz importante entre el medio ambiente y el genoma. [141]

Ver también

Referencias

  1. ^ "T2T-CHM13v2.0 - Genoma - Ensamblaje - NCBI". www.ncbi.nlm.nih.gov . Consultado el 11 de abril de 2022 .
  2. ^ Marrón TA (2002). El genoma humano (2ª ed.). Oxford: Wiley-Liss.
  3. ^ abcdef Nurk S, Koren S, Rhie A, Rautiainen M, Bzikadze AV, Mikheenko A, et al. (abril de 2022). "La secuencia completa de un genoma humano". Ciencia . 376 (6588): 44–53. Código Bib : 2022 Ciencia... 376... 44N. doi : 10.1126/ciencia.abj6987. PMC 9186530 . PMID  35357919. S2CID  247854936. 
  4. ^ ab Abecasis GR, Auton A, Brooks LD, DePristo MA, Durbin RM, Handsaker RE, et al. (Noviembre 2012). "Un mapa integrado de variación genética de 1.092 genomas humanos". Naturaleza . 491 (7422): 56–65. Código Bib :2012Natur.491...56T. doi : 10.1038/naturaleza11632. PMC 3498066 . PMID  23128226. 
  5. ^ Auton A, Brooks LD, Durbin RM, Garrison EP, Kang HM, Korbel JO y otros. (octubre de 2015). "Una referencia mundial para la variación genética humana". Naturaleza . 526 (7571): 68–74. Código Bib :2015Natur.526...68T. doi : 10.1038/naturaleza15393. PMC 4750478 . PMID  26432245. 
  6. ^ Consorcio de análisis de secuenciación de chimpancés (septiembre de 2005). "Secuencia inicial del genoma del chimpancé y comparación con el genoma humano". Naturaleza . 437 (7055): 69–87. Código bibliográfico : 2005Natur.437...69.. doi : 10.1038/nature04072 . PMID  16136131. ​​S2CID  2638825.
  7. ^ Varki A, Altheide TK (diciembre de 2005). "Comparación de los genomas humano y de chimpancé: buscando agujas en un pajar". Investigación del genoma . 15 (12): 1746-1758. doi : 10.1101/gr.3737405 . PMID  16339373.
  8. ^ "Informe de anotaciones de Homo sapiens". www.ncbi.nlm.nih.gov . Consultado el 17 de abril de 2022 .
  9. ^ ab "CHM13 T2T v1.1 - Genoma - Ensamblaje - NCBI". www.ncbi.nlm.nih.gov . Consultado el 26 de julio de 2021 .
  10. ^ Rhie A, Nurk S, Cechova M, Hoyt SJ, Taylor DJ, Altemose N, et al. (diciembre de 2022). "La secuencia completa de un cromosoma Y humano". doi :10.1101/2022.12.01.518724. S2CID  254181409. {{cite journal}}: Citar diario requiere |journal=( ayuda )
  11. ^ Rhie, Arang; Nurk, Sergey; Cechova, Mónica; Hoyt, Savannah J.; Taylor, Dylan J.; Altemose, Nicolás; Gancho, Paul W.; Koren, Sergey; Rautiainen, Mikko; Alexandrov, Ivan A.; Allen, Jamie; Asri, Mobin; Bzikadze, Andrey V.; Chen, Nae-Chyun; Chin, Chen-Shan (23 de agosto de 2023). "La secuencia completa de un cromosoma Y humano". Naturaleza : 1–11. doi :10.1038/s41586-023-06457-y. ISSN  1476-4687.
  12. ^ abcdef Liao WW, Asri M, Ebler J, Doerr D, Haukness M, Hickey G, et al. (mayo de 2023). "Un borrador de referencia del pangenoma humano". Naturaleza . 617 (7960): 312–324. Código Bib :2023Natur.617..312L. doi :10.1038/s41586-023-05896-x. PMC 10172123 . PMID  37165242. 
  13. ^ "El Consorcio Internacional de Secuenciación del Genoma Humano publica secuencia y análisis del genoma humano". Instituto Nacional de Investigaciones del Genoma Humano . Institutos Nacionales de Salud, Departamento de Salud y Recursos Humanos de EE. UU. 12 de febrero de 2001.
  14. ^ Pennisi E (febrero de 2001). "El genoma humano". Ciencia . 291 (5507): 1177–1180. doi : 10.1126/ciencia.291.5507.1177. PMID  11233420. S2CID  38355565.
  15. ^ ab Consorcio Internacional de Secuenciación del Genoma Humano (octubre de 2004). "Terminando la secuencia eucromática del genoma humano". Naturaleza . 431 (7011): 931–945. Código Bib :2004Natur.431..931H. doi : 10.1038/naturaleza03001 . PMID  15496913.
  16. ^ Molteni M (19 de noviembre de 2018). "Ahora puede secuenciar todo su genoma por sólo 200 dólares". Cableado .
  17. ^ Saey TH (17 de septiembre de 2018). "Un recuento de genes humanos eleva el número a al menos 46.831". Noticias de ciencia .
  18. ^ Alles J, Fehlmann T, Fischer U, Backes C, Galata V, Minet M, et al. (Abril de 2019). "Una estimación del número total de miARN humanos verdaderos". Investigación de ácidos nucleicos . 47 (7): 3353–3364. doi : 10.1093/nar/gkz097. PMC 6468295 . PMID  30820533. 
  19. ^ Zhang S (28 de noviembre de 2018). "Faltan 300 millones de letras de ADN en el genoma humano". El Atlántico .
  20. ^ Wade N (23 de septiembre de 1999). "El número de genes humanos se calcula en 140.000, una ganancia significativa". Los New York Times .
  21. ^ Ezkurdia I, Juan D, Rodriguez JM, Frankish A, Diekhans M, Harrow J, Vazquez J, Valencia A, Tress ML (noviembre de 2014). "Múltiples evidencias sugieren que puede haber tan solo 19.000 genes codificadores de proteínas humanas". Genética Molecular Humana . 23 (22): 5866–5878. doi :10.1093/hmg/ddu309. PMC 4204768 . PMID  24939910. 
  22. ^ Abadejo A (2 de junio de 2016). "Los científicos anuncian el proyecto HGP-Write para sintetizar el genoma humano". Los New York Times . Consultado el 2 de junio de 2016 .
  23. ^ Boeke JD, Church G, Hessel A, Kelley NJ, Arkin A, Cai Y, et al. (Julio de 2016). "El Proyecto Genoma-Escritura". Ciencia . 353 (6295): 126-127. Código Bib : 2016 Ciencia... 353..126B. doi : 10.1126/ciencia.aaf6850. PMID  27256881. S2CID  206649424.
  24. ^ Wrighton K (febrero de 2021). "Rellenar los huecos de telómero a telómero". Hitos de la naturaleza: secuenciación genómica : S21.
  25. ^ ab "Los científicos secuencian el genoma humano completo por primera vez". CNN . 31 de marzo de 2022 . Consultado el 1 de abril de 2022 .
  26. ^ ab Lander ES, Linton LM, Birren B, Nusbaum C, Zody MC, Baldwin J, et al. (febrero de 2001). "Secuenciación inicial y análisis del genoma humano". Naturaleza . 409 (6822): 860–921. Código Bib :2001Natur.409..860L. doi : 10.1038/35057062 . hdl : 2027.42/62798 . PMID  11237011.
  27. ^ Zhang S (28 de noviembre de 2018). "Faltan 300 millones de letras de ADN en el genoma humano". El Atlántico . Consultado el 16 de agosto de 2019 .
  28. ^ Chaisson MJ, Huddleston J, Dennis MY, Sudmant PH, Malig M, Hormozdiari F, et al. (Enero de 2015). "Resolver la complejidad del genoma humano mediante secuenciación de una sola molécula". Naturaleza . 517 (7536): 608–611. Código Bib :2015Natur.517..608C. doi : 10.1038/naturaleza13907. PMC 4317254 . PMID  25383537. 
  29. ^ Miga KH , Koren S, Rhie A, Vollger MR, Gershman A, Bzikadze A, et al. (septiembre de 2020). "Ensamblaje telómero a telómero de un cromosoma X humano completo". Naturaleza . 585 (7823): 79–84. Código Bib :2020Natur.585...79M. doi :10.1038/s41586-020-2547-7. PMC 7484160 . PMID  32663838. 
  30. ^ Logsdon GA, Vollger MR, Hsieh P, Mao Y, Liskovykh MA, Koren S, et al. (mayo de 2021). "La estructura, función y evolución de un cromosoma 8 humano completo". Naturaleza . 593 (7857): 101–107. Código Bib :2021Natur.593..101L. doi :10.1038/s41586-021-03420-7. PMC 8099727 . PMID  33828295. 
  31. ^ "Lista del genoma - Genoma - NCBI". www.ncbi.nlm.nih.gov . Consultado el 26 de julio de 2021 .
  32. ^ "Ensamblaje del genoma humano". Conjunto . Consultado el 23 de enero de 2024 .
  33. ^ Hatje, Klas; Mühlhausen, Stefanie; Simm, Domingo; Kollmar, Martín (23 de septiembre de 2019). "El genoma humano que codifica proteínas: anotando frutos maduros". Bioensayos . 41 (11): e1900066. doi : 10.1002/bies.201900066 . PMID  31544971. S2CID  202732556 . Consultado el 1 de julio de 2023 .
  34. ^ Nurk, Sergey; et al. (31 de marzo de 2022). "La secuencia completa de un genoma humano". Ciencia . 376 (6588): 44–53. Código Bib : 2022 Ciencia... 376... 44N. doi : 10.1126/ciencia.abj6987. PMC 9186530 . PMID  35357919. 
  35. ^ "Un recuento de genes humanos eleva el número a al menos 46.831". Noticias de ciencia . 17 de septiembre de 2018 . Consultado el 23 de junio de 2023 .
  36. ^ "Finalización del proyecto Genoma humano: preguntas frecuentes". Instituto Nacional de Investigación del Genoma Humano (NHGRI) . Consultado el 2 de febrero de 2019 .
  37. ^ ab Pallazo AF, Lee ES (enero de 2015). "ARN no codificante: ¿qué es funcional y qué es basura?". Fronteras en genética . 60 (2): e1004351. doi : 10.3389/fgene.2015.00002 . PMC 4306305 . PMID  25674102. 
  38. ^ White MA, Myers CA, Corbo JC, Cohen BA (julio de 2013). "El ensayo de potenciador in vivo masivamente paralelo revela que características altamente locales determinan la función reguladora en cis de los picos de ChIP-seq". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 110 (29): 11952-11957. Código Bib : 2013PNAS..11011952W. doi : 10.1073/pnas.1307449110 . PMC 3718143 . PMID  23818646. 
  39. ^ abc Kellis M, Wold B, Snyder MP, Bernstein BE, et al. (Abril de 2014). "Definición de elementos funcionales del ADN en el genoma humano". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 111 (17): 6131–6138. Código Bib : 2014PNAS..111.6131K. doi : 10.1073/pnas.1318948111 . PMC 4035993 . PMID  24753594. 
  40. ^ Linquist S, Doolittle WF, Palazzo AF (abril de 2020). "Aclarar la palabra F en genómica". PLOS Genética . 16 (4): e1008702. doi : 10.1371/journal.pgen.1008702 . PMC 7153884 . PMID  32236092. 
  41. ^ Doolittle WF (diciembre de 2018). "Simplemente no podemos seguir siendo tan vagos acerca de la 'función'". Biología del genoma . 19 (1): 223. doi : 10.1186/s13059-018-1600-4 . PMC 6299606 . PMID  30563541. 
  42. ^ ab Graur D (2017). "ADN basura: la fracción sin función del genoma humano". Evolución del Genoma Humano I. Estudios evolutivos. Tokio: Springer. págs. 19–60. arXiv : 1601.06047 . doi :10.1007/978-4-431-56603-8_2. ISBN 978-4-431-56603-8. S2CID  17826096.
  43. ↑ ab Peña SD (2021). "Una descripción general del genoma humano: ADN codificante y ADN no codificante". En Haddad LA (ed.). Estructura, función y consideraciones clínicas del genoma humano . Cham: Naturaleza Springer. págs. 5–7. ISBN 978-3-03-073151-9.
  44. ^ Abascal F, Acosta R, Addleman NJ, Adrian J, et al. (30 de julio de 2020). "Enciclopedias ampliadas de elementos de ADN en los genomas humano y de ratón". Naturaleza . 583 (7818): 699–710. Código Bib :2020Natur.583..699E. doi :10.1038/s41586-020-2493-4. PMC 7410828 . PMID  32728249. Operacionalmente, los elementos funcionales se definen como características de secuencia discretas y ordenadas linealmente que especifican productos moleculares (por ejemplo, genes codificadores de proteínas o ARN no codificantes) o actividades bioquímicas con funciones mecanicistas en la regulación de genes o genoma (por ejemplo, promotores transcripcionales o potenciadores). 
  45. ^ Graur D (julio de 2017). "Un límite superior de la fracción funcional del genoma humano". Biología y evolución del genoma . 9 (7): 1880–1885. doi :10.1093/gbe/evx121. PMC 5570035 . PMID  28854598. Resumen de Lay en: Le Page M (17 de julio de 2017). "Después de todo, al menos el 75 por ciento de nuestro ADN es realmente basura inútil". Científico nuevo .
  46. ^ Dunham I, Kundaje A, Aldred SF, Collins PJ, Davis CA, Doyle F, et al. (El Consorcio del Proyecto ENCODE) (septiembre de 2012). "Una enciclopedia integrada de elementos del ADN en el genoma humano". Naturaleza . 489 (7414): 57–74. Código Bib :2012Natur.489...57T. doi : 10.1038/naturaleza11247. PMC 3439153 . PMID  22955616. Estos datos nos permitieron asignar funciones bioquímicas para el 80% del genoma, en particular fuera de las regiones codificantes de proteínas bien estudiadas. .
  47. ^ Andolfatto P (octubre de 2005). "Evolución adaptativa del ADN no codificante en Drosophila". Naturaleza . 437 (7062): 1149–52. Código Bib : 2005Natur.437.1149A. doi : 10.1038/naturaleza04107. PMID  16237443. S2CID  191219.Resumen de Lay en: "Un estudio de UCSD muestra que el ADN 'basura' tiene una importancia evolutiva". Ciencia diaria . Rockville, MD. 20 de octubre de 2005.
  48. ^ Waters K (7 de marzo de 2007). "Genética molecular". Enciclopedia de Filosofía de Stanford . Consultado el 18 de julio de 2013 .
  49. ^ Gannett L (26 de octubre de 2008). "El Proyecto Genoma Humano". Enciclopedia de Filosofía de Stanford . Consultado el 18 de julio de 2013 .
  50. ^ "Gráfico circular PANTERA". Sistema de Clasificación PANTHER (Análisis de Proteínas a Través de Relaciones Evolutivas) . Consultado el 25 de mayo de 2011 .
  51. ^ Thomas PD. "Lista de proteínas humanas en el proteoma de referencia Uniprot Human". UniProt . Consultado el 28 de enero de 2015 .
  52. ^ Kauffman SA (marzo de 1969). "Estabilidad metabólica y epigénesis en redes genéticas construidas al azar". Revista de Biología Teórica . 22 (3): 437–467. Código Bib : 1969JThBi..22..437K. doi :10.1016/0022-5193(69)90015-0. PMID  5803332.
  53. ^ Ohno S (1972). "Un argumento a favor de la simplicidad genética del hombre y otros mamíferos". Revista de evolución humana . 1 (6): 651–662. doi :10.1016/0047-2484(72)90011-5.
  54. ^ Sémon M, Mouchiroud D, Duret L (febrero de 2005). "Relación entre la expresión genética y el contenido de GC en mamíferos: significación estadística y relevancia biológica". Genética Molecular Humana . 14 (3): 421–427. doi : 10.1093/hmg/ddi038 . PMID  15590696.
  55. ^ Huang M, Zhu H, Shen B, Gao G (enero de 2009). Un recorrido no aleatorio por el genoma humano . 3er Congreso Internacional de Bioinformática e Ingeniería Biomédica. Instituto de Ingenieros Eléctricos y Electrónicos (IEEE). págs. 1–3. doi :10.1109/ICBBE.2009.5162209. ISBN 978-1-4244-2901-1.
  56. ^ ab Bang ML, Centner T, Fornoff F, Geach AJ, Gotthardt M, McNabb M, Witt CC, Labeit D, Gregorio CC, Granzier H, Labeit S (2001). "La secuencia genética completa de la titina, la expresión de una isoforma inusual de titina de aproximadamente 700 kDa y su interacción con la obscurina identifican un nuevo sistema de unión de la línea Z a la banda I". Investigación de circulación . 89 (11): 1065-1072. doi :10.1161/hh2301.100981. PMID  11717165.
  57. ^ ab Piovesan A, Caracausi M, Antonaros F, Pelleri MC, Vitale L (2016). "GeneBase 1.1: una herramienta para resumir datos de conjuntos de datos de genes NCBI y su aplicación a una actualización de estadísticas de genes humanos". Base de datos: Revista de curación y bases de datos biológicas . 2016 : baw153. doi : 10.1093/base de datos/baw153. PMC 5199132 . PMID  28025344. 
  58. ^ Navegador del genoma Ensembl (julio de 2012)
  59. ^ Gregory TR (septiembre de 2005). "Sinergia entre secuencia y tamaño en genómica a gran escala". Naturaleza Reseñas Genética . 6 (9): 699–708. doi :10.1038/nrg1674. PMID  16151375. S2CID  24237594.
  60. ^ ab Pennisi E (septiembre de 2012). "Genómica. El proyecto ENCODE escribe un elogio del ADN basura". Ciencia . 337 (6099): 1159-1161. doi : 10.1126/ciencia.337.6099.1159. PMID  22955811.
  61. ^ ab Palazzo AF, Akef A (junio de 2012). "La exportación nuclear como árbitro clave de la" identidad del ARNm "en eucariotas". Biochimica et Biophysica Acta (BBA) - Mecanismos reguladores de genes . 1819 (6): 566–577. doi :10.1016/j.bbagrm.2011.12.012. PMID  22248619.
  62. ^ Ludwig MZ (diciembre de 2002). "Evolución funcional del ADN no codificante". Opinión actual en genética y desarrollo . 12 (6): 634–639. doi :10.1016/S0959-437X(02)00355-6. PMID  12433575.
  63. ^ Martens JA, Laprade L, Winston F (junio de 2004). "Se requiere la transcripción intergénica para reprimir el gen SER3 de Saccharomyces cerevisiae". Naturaleza . 429 (6991): 571–574. Código Bib :2004Natur.429..571M. doi : 10.1038/naturaleza02538. PMID  15175754. S2CID  809550.
  64. ^ Tsai MC, Manor O, Wan Y, Mosammaparast N, Wang JK, Lan F, Shi Y, Segal E, Chang HY (agosto de 2010). "ARN largo no codificante como andamio modular de complejos de modificación de histonas". Ciencia . 329 (5992): 689–693. Código Bib : 2010 Ciencia... 329..689T. doi :10.1126/ciencia.1192002. PMC 2967777 . PMID  20616235. 
  65. ^ Bartolomei MS, Zemel S, Tilghman SM (mayo de 1991). "Impresión parental del gen H19 de ratón". Naturaleza . 351 (6322): 153-155. Código Bib :1991Natur.351..153B. doi :10.1038/351153a0. PMID  1709450. S2CID  4364975.
  66. ^ Kobayashi T, Ganley AR (septiembre de 2005). "Regulación de la recombinación por disociación de cohesina inducida por la transcripción en repeticiones de ADNr". Ciencia . 309 (5740): 1581–1584. Código Bib : 2005 Ciencia... 309.1581K. doi :10.1126/ciencia.1116102. PMID  16141077. S2CID  21547462.
  67. ^ Salmena L, Poliseno L, Tay Y, Kats L, Pandolfi PP (agosto de 2011). "Una hipótesis de ARNce: ¿la piedra Rosetta de un lenguaje de ARN oculto?". Celúla . 146 (3): 353–358. doi :10.1016/j.cell.2011.07.014. PMC 3235919 . PMID  21802130. 
  68. ^ Pei B, Sisu C, Frankish A, Howald C, Habegger L, Mu XJ, Harte R, Balasubramanian S, Tanzer A, Diekhans M, Reymond A, Hubbard TJ, Harrow J, Gerstein MB (2012). "El recurso del pseudogén GENCODE". Biología del genoma . 13 (9): R51. doi : 10.1186/gb-2012-13-9-r51 . PMC 3491395 . PMID  22951037. 
  69. ^ Gilad Y, Man O, Pääbo S, Lancet D (marzo de 2003). "Pérdida específica humana de genes de receptores olfativos". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 100 (6): 3324–3327. Código Bib : 2003PNAS..100.3324G. doi : 10.1073/pnas.0535697100 . PMC 152291 . PMID  12612342. 
  70. ^ Iyer MK, Niknafs YS, Malik R, Singhal U, Sahu A, Hosono Y, Barrette TR, Prensner JR, Evans JR, Zhao S, Poliakov A, Cao X, Dhanasekaran SM, Wu YM, Robinson DR, Beer DG, Feng FY, Iyer HK, Chinnaiyan AM (marzo de 2015). "El panorama de los ARN largos no codificantes en el transcriptoma humano". Genética de la Naturaleza . 47 (3): 199–208. doi :10.1038/ng.3192. PMC 4417758 . PMID  25599403. 
  71. ^ Eddy SR (diciembre de 2001). "Genes de ARN no codificantes y el mundo moderno del ARN". Naturaleza Reseñas Genética . 2 (12): 919–929. doi :10.1038/35103511. PMID  11733745. S2CID  18347629.
  72. ^ Managadze D, Lobkovsky AE, Wolf YI, Shabalina SA, Rogozin IB, Koonin EV (2013). "El vasto y conservado lincRNome de mamíferos". PLOS Biología Computacional . 9 (2): e1002917. Código Bib : 2013PLSCB...9E2917M. doi : 10.1371/journal.pcbi.1002917 . PMC 3585383 . PMID  23468607. 
  73. ^ Palacio AF, Lee ES (2015). "ARN no codificante: ¿qué es funcional y qué es basura?". Fronteras en genética . 6 : 2. doi : 10.3389/fgene.2015.00002 . PMC 4306305 . PMID  25674102. 
  74. ^ Mattick JS, Makunin IV (abril de 2006). "ARN no codificante". Genética Molecular Humana . 15 (especificación n.° 1): R17–29. doi : 10.1093/hmg/ddl046 . PMID  16651366.
  75. ^ ab Bernstein BE, Birney E, Dunham I, Green ED, Gunter C, Snyder M (septiembre de 2012). "Una enciclopedia integrada de elementos del ADN en el genoma humano". Naturaleza . 489 (7414): 57–74. Código Bib :2012Natur.489...57T. doi : 10.1038/naturaleza11247. PMC 3439153 . PMID  22955616. 
  76. ^ Birney E (5 de septiembre de 2012). "CODIFICAR: Mis propios pensamientos". Blog de Ewan: bioinformático en general .
  77. ^ Stamatoyannopoulos JA (septiembre de 2012). "¿Qué codifica nuestro genoma?". Investigación del genoma . 22 (9): 1602-1611. doi :10.1101/gr.146506.112. PMC 3431477 . PMID  22955972. 
  78. ^ Carroll SB, Gompel N, Prudhomme B (mayo de 2008). "Regulación de la evolución". Científico americano . 298 (5): 60–67. Código Bib : 2008SciAm.298e..60C. doi : 10.1038/scientificamerican0508-60. PMID  18444326.
  79. ^ Miller JH, Ippen K, Scaife JG, Beckwith JR (1968). "La región promotora-operadora del operón lac de Escherichia coli". J. Mol. Biol . 38 (3): 413–420. doi :10.1016/0022-2836(68)90395-1. PMID  4887877.
  80. ^ Wright S, Rosenthal A, Flavell R, Grosveld F (1984). "Secuencias de ADN necesarias para la expresión regulada de genes de beta-globina en células de eritroleucemia murina". Celúla . 38 (1): 265–273. doi :10.1016/0092-8674(84)90548-8. PMID  6088069. S2CID  34587386.
  81. ^ Nei M, Xu P, Glazko G (febrero de 2001). "Estimación de tiempos de divergencia a partir de secuencias multiproteicas para algunas especies de mamíferos y varios organismos lejanamente relacionados". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 98 (5): 2497–2502. Código bibliográfico : 2001PNAS...98.2497N. doi : 10.1073/pnas.051611498 . PMC 30166 . PMID  11226267. 
  82. ^ Loots GG, Locksley RM, Blankespoor CM, Wang ZE, Miller W, Rubin EM, Frazer KA (abril de 2000). "Identificación de un regulador coordinado de las interleucinas 4, 13 y 5 mediante comparaciones de secuencias entre especies". Ciencia . 288 (5463): 136-140. Código bibliográfico : 2000Sci...288..136L. doi : 10.1126/ciencia.288.5463.136. PMID  10753117.Resumen Archivado el 6 de noviembre de 2009 en Wayback Machine.
  83. ^ Meunier M. "Genoscope y Whitehead anuncian una cobertura de secuencia alta del genoma de Tetraodon nigroviridis". Genoscopio. Archivado desde el original el 16 de octubre de 2006 . Consultado el 12 de septiembre de 2006 .
  84. ^ Romero IG, Ruvinsky I, Gilad Y (julio de 2012). "Estudios comparativos de la expresión génica y la evolución de la regulación genética". Naturaleza Reseñas Genética . 13 (7): 505–516. doi :10.1038/nrg3229. PMC 4034676 . PMID  22705669. 
  85. ^ Schmidt D, Wilson MD, Ballester B, Schwalie PC, Brown GD, Marshall A, Kutter C, Watt S, Martinez-Jimenez CP, Mackay S, Talianidis I, Flicek P, Odom DT (mayo de 2010). "ChIP-seq de cinco vertebrados revela la dinámica evolutiva de la unión del factor de transcripción". Ciencia . 328 (5981): 1036–1040. Código Bib : 2010 Ciencia... 328.1036S. doi : 10.1126/ciencia.1186176. PMC 3008766 . PMID  20378774. 
  86. ^ Wilson MD, Barbosa-Morais NL, Schmidt D, Conboy CM, Vanes L, Tybulewicz VL, Fisher EM, Tavaré S, Odom DT (octubre de 2008). "Transcripción específica de especie en ratones portadores del cromosoma 21 humano". Ciencia . 322 (5900): 434–438. Código Bib : 2008 Ciencia... 322.. 434W. doi : 10.1126/ciencia.1160930. PMC 3717767 . PMID  18787134. 
  87. ^ Treangen TJ, Salzberg SL (enero de 2012). "ADN repetitivo y secuenciación de próxima generación: desafíos y soluciones computacionales". Naturaleza Reseñas Genética . 13 (1): 36–46. doi :10.1038/nrg3117. PMC 3324860 . PMID  22124482. 
  88. ^ Duitama J, Zablotskaya A, Gemayel R, Jansen A, Belet S, Vermeesch JR, Verstrepen KJ, Froyen G (mayo de 2014). "Análisis a gran escala de la variabilidad de repeticiones en tándem en el genoma humano". Investigación de ácidos nucleicos . 42 (9): 5728–5741. doi : 10.1093/nar/gku212. PMC 4027155 . PMID  24682812. 
  89. ^ Pierce BA (2012). Genética: un enfoque conceptual (4ª ed.). Nueva York: WH Freeman. págs. 538–540. ISBN 978-1-4292-3250-0.
  90. ^ "minisatélite, n. significados, etimología y más | Diccionario de inglés Oxford". www.oed.com . Consultado el 8 de octubre de 2023 .
  91. ^ Bennett EA, Keller H, Mills RE, Schmidt S, Moran JV, Weichenrieder O, Devine SE (diciembre de 2008). "Retrotransposones Alu activos en el genoma humano". Investigación del genoma . 18 (12): 1875–1883. doi :10.1101/gr.081737.108. PMC 2593586 . PMID  18836035. 
  92. ^ Liang KH, Yeh CT (2013). "Una red de restricción de la expresión génica mediada por secuencias Alu sentido y antisentido ubicadas en los ARN mensajeros que codifican proteínas". Genómica BMC . 14 : 325. doi : 10.1186/1471-2164-14-325 . PMC 3655826 . PMID  23663499. 
  93. ^ Brouha B, Schustak J, Badge RM, Lutz-Prigge S, Farley AH, Moran JV, Kazazian HH (abril de 2003). "Los L1 calientes representan la mayor parte de la retrotransposición en la población humana". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 100 (9): 5280–5285. Código Bib : 2003PNAS..100.5280B. doi : 10.1073/pnas.0831042100 . PMC 154336 . PMID  12682288. 
  94. ^ Barton NH, Briggs DE, Eisen JA, Goldstein DB, Patel NH (2007). Evolución . Cold Spring Harbor, Nueva York: Cold Spring Harbor Laboratory Press. ISBN 978-0-87969-684-9.[ página necesaria ]
  95. ^ NCBI . "GRCh38 - hg38 - Genoma - Ensamblaje". ncbi.nlm.nih.gov . Consultado el 15 de marzo de 2019 .
  96. ^ "del discurso sobre el estado de la Unión de 2000 de Bill Clinton". Archivado desde el original el 21 de febrero de 2017 . Consultado el 14 de junio de 2007 .
  97. ^ Redon R, Ishikawa S, Fitch KR, Feuk L, Perry GH, Andrews TD y col. (noviembre de 2006). "Variación global en el número de copias en el genoma humano". Naturaleza . 444 (7118): 444–454. Código Bib :2006Natur.444..444R. doi : 10.1038/naturaleza05329. PMC 2669898 . PMID  17122850. 
  98. ^ "¿Qué es un genoma?". Genomenewsnetwork.org. 15 de enero de 2003 . Consultado el 31 de mayo de 2009 .
  99. ^ "Hoja informativa: Mapeo del genoma: una guía para la autopista genética que llamamos genoma humano". Centro Nacional de Información Biotecnológica . Biblioteca Nacional de Medicina de EE. UU., Institutos Nacionales de Salud. 29 de marzo de 2004. Archivado desde el original el 19 de julio de 2010 . Consultado el 31 de mayo de 2009 .
  100. ^ "Acerca del proyecto". Proyecto Internacional HapMap . Archivado desde el original el 15 de mayo de 2008 . Consultado el 31 de mayo de 2009 .
  101. ^ "Comunicado de 2008: investigadores producen el primer mapa de secuencia de variación estructural a gran escala en el genoma humano". genoma.gov . Consultado el 31 de mayo de 2009 .
  102. ^ Kidd JM, Cooper GM, Donahue WF, Hayden HS, Sampas N, Graves T, et al. (mayo de 2008). "Mapeo y secuenciación de variaciones estructurales de ocho genomas humanos". Naturaleza . 453 (7191): 56–64. Código Bib :2008Natur.453...56K. doi : 10.1038/naturaleza06862. PMC 2424287 . PMID  18451855. 
  103. ^ ab Abel HJ, Larson DE, Regier AA, Chiang C, Das I, Kanchi KL, et al. (julio de 2020). "Mapeo y caracterización de variación estructural en 17.795 genomas humanos". Naturaleza . 583 (7814): 83–89. Código Bib :2020Natur.583...83A. doi :10.1038/s41586-020-2371-0. PMC 7547914 . PMID  32460305. 
  104. ^ Gris IC, Campbell DA, Spurr NK (2000). "Polimorfismos de un solo nucleótido como herramientas en genética humana". Genética Molecular Humana . 9 (16): 2403–2408. doi : 10.1093/hmg/9.16.2403 . PMID  11005795.
  105. ^ Lai E (junio de 2001). "Aplicación de tecnologías SNP en medicina: lecciones aprendidas y desafíos futuros". Investigación del genoma . 11 (6): 927–929. doi : 10.1101/gr.192301 . PMID  11381021.
  106. ^ "Finalización del proyecto Genoma humano: preguntas frecuentes". genoma.gov . Consultado el 31 de mayo de 2009 .
  107. ^ Cantante E (4 de septiembre de 2007). "Genoma de Craig Venter". Revisión de tecnología del MIT . Consultado el 25 de mayo de 2010 .
  108. ^ Pushkarev D, Neff NF, Quake SR (septiembre de 2009). "Secuenciación de una sola molécula de un genoma humano individual". Biotecnología de la Naturaleza . 27 (9): 847–850. doi :10.1038/nbt.1561. PMC 4117198 . PMID  19668243. 
  109. ^ Ashley EA, Butte AJ, Wheeler MT, Chen R, Klein TE, Dewey FE y otros. (mayo de 2010). "Evaluación clínica incorporando un genoma personal". Lanceta . 375 (9725): 1525-1535. doi :10.1016/S0140-6736(10)60452-7. PMC 2937184 . PMID  20435227. 
  110. ^ Dewey FE, Chen R, Cordero SP, Ormond KE, Caleshu C, Karczewski KJ, et al. (Septiembre de 2011). "Riesgo genético de todo el genoma por fases en un cuarteto familiar utilizando una secuencia de referencia de alelos principales". PLOS Genética . 7 (9): e1002280. doi : 10.1371/journal.pgen.1002280 . PMC 3174201 . PMID  21935354. 
  111. ^ "Complete Genomics agrega 29 conjuntos de datos completos de secuenciación del genoma humano de alta cobertura a su repositorio genómico público" (Comunicado de prensa).
  112. ^ Muestra I (17 de febrero de 2010). "Secuenciado el genoma de Desmond Tutu como parte de un estudio de diversidad genética". El guardián .
  113. ^ Schuster SC, Miller W, Ratan A, Tomsho LP, Giardine B, Kasson LR y col. (febrero de 2010). "Genomas completos khoisan y bantú del sur de África". Naturaleza . 463 (7283): 943–947. Código Bib :2010Natur.463..943S. doi : 10.1038/naturaleza08795. PMC 3890430 . PMID  20164927. 
  114. ^ Rasmussen M, Li Y, Lindgreen S, Pedersen JS, Albrechtsen A, Moltke I, et al. (febrero de 2010). "Secuencia del genoma humano antiguo de un paleoesquimal extinto". Naturaleza . 463 (7282): 757–762. Código Bib :2010Natur.463..757R. doi : 10.1038/naturaleza08835. PMC 3951495 . PMID  20148029. 
  115. ^ Corpas M , Cariaso M, Coletta A, Weiss D, Harrison AP, Moran F, Yang H (12 de noviembre de 2013). "Un conjunto completo de datos de genómica familiar de dominio público". bioRxiv 10.1101/000216 . 
  116. Corpas M (junio de 2013). "Crowdsourcing del corpasoma". Código fuente para biología y medicina . 8 (1): 13. doi : 10.1186/1751-0473-8-13 . PMC 3706263 . PMID  23799911. 
  117. ^ Mao Q, Ciotlos S, Zhang RY, Ball MP, Chin R, Carnevali P, et al. (octubre de 2016). "Las secuencias completas del genoma y los haplotipos en fases experimentales de más de 100 genomas personales". GigaCiencia . 5 (1): 42. doi : 10.1186/s13742-016-0148-z . PMC 5057367 . PMID  27724973. 
  118. ^ Cai B, Li B, Kiga N, Asíberg J, Bergquist T, Chen YC, et al. (septiembre de 2017). "Emparejar fenotipos con genomas completos: lecciones aprendidas de cuatro iteraciones de los desafíos comunitarios del proyecto del genoma personal". Mutación humana . 38 (9): 1266-1276. doi :10.1002/humu.23265. PMC 5645203 . PMID  28544481. 
  119. ^ Gonzaga-Jauregui C, Lupski JR, Gibbs RA (2012). "Secuenciación del genoma humano en salud y enfermedad". Revista Anual de Medicina . 63 : 35–61. doi :10.1146/annurev-med-051010-162644. PMC 3656720 . PMID  22248320. 
  120. ^ Choi M, Scholl UI, Ji W, Liu T, Tikhonova IR, Zumbo P, Nayir A, Bakkaloğlu A, Ozen S, Sanjad S, Nelson-Williams C, Farhi A, Mane S, Lifton RP (noviembre de 2009). "Diagnóstico genético mediante captura del exoma completo y secuenciación masiva de ADN en paralelo". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 106 (45): 19096–19101. Código bibliográfico : 2009PNAS..10619096C. doi : 10.1073/pnas.0910672106 . PMC 2768590 . PMID  19861545. 
  121. ^ ab Narasimhan VM, Xue Y, Tyler-Smith C (abril de 2016). "Portadores humanos Knockout: ¿muertos, enfermos, sanos o mejorados?". Tendencias en Medicina Molecular . 22 (4): 341–351. doi :10.1016/j.molmed.2016.02.006. PMC 4826344 . PMID  26988438. 
  122. ^ Saleheen D, Natarajan P, Armean IM, Zhao W, Rasheed A, Khetarpal SA, et al. (Abril de 2017). "Nocauts humanos y análisis fenotípico en una cohorte con una alta tasa de consanguinidad". Naturaleza . 544 (7649): 235–239. Código Bib :2017Natur.544..235S. doi : 10.1038/naturaleza22034. PMC 5600291 . PMID  28406212. 
  123. ^ ab Hamosh A, Scott AF, Amberger J, Bocchini C, Valle D, McKusick VA (enero de 2002). "Herencia mendeliana en el hombre en línea (OMIM), una base de conocimientos sobre genes humanos y trastornos genéticos". Investigación de ácidos nucleicos . 30 (1): 52–55. doi : 10.1093/nar/30.1.52 . PMC 99152 . PMID  11752252. 
  124. ^ Katsanis N (noviembre de 2016). "El continuo de causalidad en los trastornos genéticos humanos". Biología del genoma . 17 (1): 233. doi : 10.1186/s13059-016-1107-9 . PMC 5114767 . PMID  27855690. 
  125. ^ Alekseyev YO, Fazeli R, Yang S, Basran R, Maher T, Miller NS, Remick D (2018). "Un manual de secuenciación de próxima generación: ¿cómo funciona y qué puede hacer?". Patología Académica . 5 : 2374289518766521. doi : 10.1177/2374289518766521 . PMC 5944141 . PMID  29761157. 
  126. ^ Wong JC (2017). "Descripción general de la utilidad clínica de la secuenciación de próxima generación en el diagnóstico molecular de trastornos genéticos humanos". En Wong LJ (ed.). "Diagnóstico molecular clínico de trastornos genéticos humanos basado en secuenciación de próxima generación ". Cham: Editorial Internacional Springer. págs. 1–11. doi :10.1007/978-3-319-56418-0_1. ISBN 978-3-319-56416-6.
  127. ^ Fedick A, Zhang J (2017). "Próxima generación de detección de portadores". En Wong LJ (ed.). "Diagnóstico molecular clínico de trastornos genéticos humanos basado en secuenciación de próxima generación ". Cham: Editorial Internacional Springer. págs. 339–354. doi :10.1007/978-3-319-56418-0_16. ISBN 978-3-319-56416-6.
  128. ^ Waterston RH, Lindblad-Toh K, Birney E, Rogers J, Abril JF, Agarwal P, Agarwala R, Ainscough R, Alexandersson M, et al. (Diciembre de 2002). "Secuenciación inicial y análisis comparativo del genoma del ratón". Naturaleza . 420 (6915): 520–562. Código Bib :2002Natur.420..520W. doi : 10.1038/naturaleza01262 . PMID  12466850. La proporción de segmentos pequeños (50 a 100 pb) en el genoma de los mamíferos que se encuentran bajo selección (purificadora) se puede estimar en aproximadamente el 5%. Esta proporción es mucho mayor de lo que puede explicarse únicamente por secuencias codificantes de proteínas, lo que implica que el genoma contiene muchas características adicionales (como regiones no traducidas, elementos reguladores, genes no codificantes de proteínas y elementos estructurales cromosómicos) bajo selección para función biológica. .
  129. ^ Birney E, Stamatoyannopoulos JA, Dutta A, Guigó R, Gingeras TR, Margulies EH, et al. (junio de 2007). "Identificación y análisis de elementos funcionales en el 1% del genoma humano mediante el proyecto piloto ENCODE". Naturaleza . 447 (7146): 799–816. Código Bib :2007Natur.447..799B. doi : 10.1038/naturaleza05874. PMC 2212820 . PMID  17571346. 
  130. ^ Consorcio de análisis de secuenciación de chimpancés (septiembre de 2005). "Secuencia inicial del genoma del chimpancé y comparación con el genoma humano". Naturaleza . 437 (7055): 69–87. Código bibliográfico : 2005Natur.437...69.. doi : 10.1038/nature04072 . PMID  16136131. ​​Calculamos que la divergencia de nucleótidos de todo el genoma entre humanos y chimpancés es del 1,23%, lo que confirma resultados recientes de estudios más limitados.
  131. ^ Consorcio de análisis de secuenciación de chimpancés (septiembre de 2005). "Secuencia inicial del genoma del chimpancé y comparación con el genoma humano". Naturaleza . 437 (7055): 69–87. Código bibliográfico : 2005Natur.437...69.. doi : 10.1038/nature04072 . PMID  16136131. ​​Estimamos que el polimorfismo representa entre el 14% y el 22% de la tasa de divergencia observada y, por lo tanto, que la divergencia fija es ~1,06% o menos.
  132. ^ Demuth JP, De Bie T, Stajich JE, Cristianini N, Hahn MW (2006). "La evolución de las familias de genes de mamíferos". MÁS UNO . 1 (1): e85. Código Bib : 2006PLoSO...1...85D. doi : 10.1371/journal.pone.0000085 . PMC 1762380 . PMID  17183716. Nuestros resultados implican que los humanos y los chimpancés difieren en al menos un 6% (1.418 de 22.000 genes) en su complemento de genes, lo que contrasta marcadamente con la tan citada diferencia del 1,5% entre secuencias de nucleótidos ortólogas. 
  133. ^ Consorcio de análisis de secuenciación de chimpancés (septiembre de 2005). "Secuencia inicial del genoma del chimpancé y comparación con el genoma humano". Naturaleza . 437 (7055): 69–87. Código bibliográfico : 2005Natur.437...69.. doi : 10.1038/nature04072 . PMID  16136131. ​​El cromosoma 2 humano resultó de una fusión de dos cromosomas ancestrales que permanecieron separados en el linaje de los chimpancés.
    Olson MV, Varki A (enero de 2003). "Secuenciación del genoma del chimpancé: conocimientos sobre la evolución y las enfermedades humanas". Naturaleza Reseñas Genética . 4 (1): 20–28. doi :10.1038/nrg981. PMID  12509750. S2CID  205486561. La secuenciación a gran escala del genoma del chimpancé es ahora inminente.
  134. ^ Gilad Y, Wiebe V, Przeworski M, Lancet D, Pääbo S (enero de 2004). "La pérdida de genes de receptores olfativos coincide con la adquisición de una visión tricromática completa en primates". Más biología . 2 (1): E5. doi : 10.1371/journal.pbio.0020005 . PMC 314465 . PMID  14737185. Nuestros hallazgos sugieren que el deterioro del repertorio olfativo se produjo concomitantemente con la adquisición de una visión de color tricromática completa en primates. 
  135. ^ Zimmer C (21 de septiembre de 2016). "Cómo llegamos aquí: el ADN apunta a una única migración desde África". Los New York Times . Consultado el 22 de septiembre de 2016 .
  136. ^ Copeland WC (enero de 2012). "Defectos en la replicación del ADN mitocondrial y enfermedades humanas". Reseñas críticas en bioquímica y biología molecular . 47 (1): 64–74. doi :10.3109/10409238.2011.632763. PMC 3244805 . PMID  22176657. 
  137. ^ Nielsen R, Akey JM, Jakobsson M, Pritchard JK, Tishkoff S, Willerslev E (enero de 2017). "Seguimiento del poblamiento del mundo a través de la genómica". Naturaleza . 541 (7637): 302–310. Código Bib :2017Natur.541..302N. doi : 10.1038/naturaleza21347. PMC 5772775 . PMID  28102248. 
  138. ^ Sykes B (9 de octubre de 2003). "ADN mitocondrial e historia humana". El genoma humano. Archivado desde el original el 7 de septiembre de 2015 . Consultado el 19 de septiembre de 2006 .
  139. ^ Misteli T (febrero de 2007). "Más allá de la secuencia: organización celular de la función del genoma". Celúla . 128 (4): 787–800. doi : 10.1016/j.cell.2007.01.028 . PMID  17320514. S2CID  9064584.
  140. ^ Bernstein BE, Meissner A, Lander ES (febrero de 2007). "El epigenoma de los mamíferos". Celúla . 128 (4): 669–681. doi : 10.1016/j.cell.2007.01.033 . PMID  17320505. S2CID  2722988.
  141. ^ Scheen AJ, Junien C (mayo-junio de 2012). "[Epigenética, interfaz entre el medio ambiente y los genes: papel en enfermedades complejas]". Revue Médicale de Lieja . 67 (5–6): 250–257. PMID  22891475.

enlaces externos