El Proyecto Genoma Humano ( PGH ) fue un proyecto de investigación científica internacional cuyo objetivo era determinar los pares de bases que componen el ADN humano , e identificar, mapear y secuenciar todos los genes del genoma humano desde un punto de vista físico y funcional. . Comenzó en 1990 y se completó en 2003. [1] Sigue siendo el proyecto biológico colaborativo más grande del mundo. [2] La planificación del proyecto comenzó después de que fuera adoptado en 1984 por el gobierno de EE. UU. y se lanzó oficialmente en 1990. Se declaró completo el 14 de abril de 2003 e incluía aproximadamente el 92% del genoma. [3] El nivel de "genoma completo" se alcanzó en mayo de 2021, con solo el 0,3% de las bases cubiertas por posibles problemas. [4] [5] El ensamblaje final sin espacios se completó en enero de 2022. [6]
La financiación provino del gobierno de los Estados Unidos a través de los Institutos Nacionales de Salud (NIH), así como de muchos otros grupos de todo el mundo. Celera Corporation , o Celera Genomics, llevó a cabo un proyecto paralelo fuera del gobierno, que se lanzó formalmente en 1998. La mayor parte de la secuenciación patrocinada por el gobierno se realizó en veinte universidades y centros de investigación en los Estados Unidos , el Reino Unido , Japón , Francia , Alemania y China , [7] trabajando en el Consorcio Internacional de Secuenciación del Genoma Humano (IHGSC).
El Proyecto Genoma Humano tenía como objetivo originalmente mapear el conjunto completo de nucleótidos contenidos en un genoma de referencia haploide humano , de los cuales hay más de tres mil millones. El genoma de cualquier individuo es único; mapear el genoma humano implicó secuenciar muestras recolectadas de un pequeño número de individuos y luego ensamblar los fragmentos secuenciados para obtener una secuencia completa para cada uno de los 23 pares de cromosomas humanos (22 pares de autosomas y un par de cromosomas sexuales, conocidos como alosomas). Por lo tanto, el genoma humano terminado es un mosaico que no representa a ningún individuo en particular. Gran parte de la utilidad del proyecto proviene del hecho de que la gran mayoría del genoma humano es igual en todos los humanos.
El Proyecto Genoma Humano fue un proyecto financiado con fondos públicos de 15 años de duración iniciado en 1990 con el objetivo de determinar la secuencia de ADN de todo el genoma humano eucromático en 13 años. [8] [9] La idea de tal proyecto se originó en el trabajo de Ronald A. Fisher , a cuyo trabajo también se le atribuye el inicio posterior del proyecto. [10]
En mayo de 1985, Robert Sinsheimer organizó un taller en la Universidad de California, Santa Cruz , para discutir la viabilidad de construir un genoma de referencia sistemático utilizando tecnologías de secuenciación de genes. [11] En marzo de 1986, el Taller de Santa Fe fue organizado por Charles DeLisi y David Smith de la Oficina de Investigación Ambiental y de Salud (OHER) del Departamento de Energía . [12] Al mismo tiempo, Renato Dulbecco , presidente del Instituto Salk de Estudios Biológicos , propuso por primera vez el concepto de secuenciación del genoma completo en un ensayo en Science . [13] El trabajo publicado, titulado "Un punto de inflexión en la investigación del cáncer: secuenciación del genoma humano", fue una abreviación de la propuesta original de utilizar la secuencia para comprender la base genética del cáncer de mama. [14] James Watson , uno de los descubridores de la forma de doble hélice del ADN en la década de 1950, siguió dos meses más tarde con un taller celebrado en el Laboratorio Cold Spring Harbor. Así, la idea de obtener una secuencia de referencia tuvo tres orígenes independientes: Sinsheimer, Dulbecco y DeLisi. Al final fueron las acciones de DeLisi las que lanzaron el proyecto. [15] [16] [17] [18]
El hecho de que el Taller de Santa Fe fuera motivado y apoyado por una agencia federal abrió un camino, aunque difícil y tortuoso, [19] para convertir la idea en política pública en Estados Unidos. En una nota dirigida al subsecretario de Investigación Energética, Alvin Trivelpiece , el entonces director de la OHER, Charles DeLisi, esbozó un plan amplio para el proyecto. [20] Esto inició una larga y compleja cadena de eventos que llevaron a la reprogramación aprobada de fondos que permitió a la OHER lanzar el proyecto en 1986 y recomendar la primera partida para el HGP, que estaba en la presentación presupuestaria del Presidente Reagan para 1988, [19] y finalmente aprobado por el Congreso. De particular importancia en la aprobación del Congreso fue la defensa del senador de Nuevo México Pete Domenici , con quien DeLisi se había hecho amigo. [21] Domenici presidió el Comité Senatorial de Energía y Recursos Naturales, así como el Comité de Presupuesto, los cuales fueron clave en el proceso presupuestario del DOE. El Congreso añadió una cantidad comparable al presupuesto de los NIH, iniciando así la financiación oficial de ambas agencias. [ cita necesaria ]
Trivelpiece buscó y obtuvo la aprobación de la propuesta de DeLisi del subsecretario William Flynn Martin . Este gráfico [22] fue utilizado por Trivelpiece en la primavera de 1986 para informar a Martin y al subsecretario Joseph Salgado sobre su intención de reprogramar 4 millones de dólares para iniciar el proyecto con la aprobación de John S. Herrington . [ cita necesaria ] Esta reprogramación fue seguida por una partida presupuestaria de $ 13 millones en la presentación presupuestaria de 1987 de la administración Reagan al Congreso. [12] Posteriormente fue aprobada por ambas Cámaras. Se planeó que el proyecto estuviera terminado en 15 años. [23]
En 1990, las dos principales agencias de financiación, el DOE y los Institutos Nacionales de Salud , desarrollaron un memorando de entendimiento para coordinar los planes y fijar el reloj para el inicio del Proyecto en 1990. [24] En ese momento, David J. Galas fue director de la rebautizada "Oficina de Investigación Biológica y Ambiental" de la Oficina de Ciencias del Departamento de Energía de EE. UU. y James Watson dirigió el Programa Genoma de los NIH. En 1993, Arístides Patrinos sucedió a Galas y Francis Collins sucedió a Watson, asumiendo el papel de jefe general del proyecto como director del Centro Nacional de Investigación del Genoma Humano de los NIH (que más tarde se convertiría en el Instituto Nacional de Investigación del Genoma Humano ). En 2000 se anunció un borrador de trabajo del genoma y los artículos que lo describen se publicaron en febrero de 2001. En 2003 se publicó un borrador más completo, y el trabajo de "terminación" del genoma continuó durante más de una década después. [ cita necesaria ]
El proyecto de 3.000 millones de dólares fue fundado formalmente en 1990 por el Departamento de Energía de Estados Unidos y los Institutos Nacionales de Salud, y se esperaba que durara 15 años. [25] Además de los Estados Unidos, el consorcio internacional estaba compuesto por genetistas del Reino Unido, Francia, Australia, China y muchas otras relaciones espontáneas. [26] El proyecto acabó costando menos de lo esperado, unos 2.700 millones de dólares (equivalentes a unos 5.000 millones de dólares en 2021). [7] [27] [28]
Dos tecnologías permitieron el proyecto: mapeo genético y secuenciación de ADN . La técnica de mapeo genético del polimorfismo de la longitud de los fragmentos de restricción (RFLP) surgió de la búsqueda de la ubicación del gen del cáncer de mama realizada por Mark Skolnick de la Universidad de Utah, [ 29] que comenzó en 1974. [30] gene, en colaboración con David Botstein , Ray White y Ron Davies concibieron una manera de construir un mapa de ligamiento genético del genoma humano. Esto permitió a los científicos lanzar un esfuerzo más amplio sobre el genoma humano. [31]
Gracias a la amplia cooperación internacional y a los avances en el campo de la genómica (especialmente en el análisis de secuencias ), así como a los avances paralelos en la tecnología informática, en 2000 se terminó un "borrador" del genoma (anunciado conjuntamente por el presidente estadounidense Bill Clinton y el británico Primer Ministro Tony Blair el 26 de junio de 2000). [32] [33] Este primer borrador disponible del genoma fue completado por el Grupo de Bioinformática del Genoma de la Universidad de California, Santa Cruz , dirigido principalmente por el entonces estudiante graduado Jim Kent y su asesor David Haussler . [34] La secuenciación en curso condujo al anuncio del genoma esencialmente completo el 14 de abril de 2003, dos años antes de lo previsto. [35] [36] En mayo de 2006, se alcanzó otro hito en el camino hacia la finalización del proyecto cuando se publicó en Nature la secuencia del último cromosoma . [37]
Las diversas instituciones, empresas y laboratorios que participaron en el Proyecto Genoma Humano se enumeran a continuación, según los NIH : [7]
Cabe destacar que el proyecto no pudo secuenciar todo el ADN encontrado en las células humanas ; más bien, el objetivo era secuenciar únicamente las regiones eucromaticas del genoma nuclear, que constituyen el 92,1% del genoma humano. El 7,9% restante existe en regiones heterocromáticas dispersas como las que se encuentran en los centrómeros y los telómeros . Estas regiones, por su naturaleza, son generalmente más difíciles de secuenciar y, por lo tanto, no se incluyeron como parte de los planes originales del proyecto. [38]
El Proyecto Genoma Humano (PGH) se declaró completo en abril de 2003. Un borrador inicial del genoma humano estuvo disponible en junio de 2000 y en febrero de 2001 se había completado y publicado un borrador de trabajo, seguido por el mapeo final de la secuenciación del genoma humano en 14 de abril de 2003. Aunque se informó que esto cubría el 99% del genoma humano eucromático con una precisión del 99,99%, el 27 de mayo de 2004 se publicó una importante evaluación de calidad de la secuencia del genoma humano, que indica que más del 92% del muestreo superó el 99,99% de precisión. que estaba dentro del objetivo previsto. [39]
En marzo de 2009, el Genome Reference Consortium (GRC) publicó una versión más precisa del genoma humano, pero todavía dejaba más de 300 lagunas, [40] mientras que en 2015 quedaban 160 de esas lagunas. [41]
Aunque en mayo de 2020, el GRC informó de 79 lagunas "no resueltas", [42] que representan hasta el 5% del genoma humano, [43] meses después, la aplicación de nuevas técnicas de secuenciación de largo alcance y una mola hidatidiforme derivada Una línea celular en la que ambas copias de cada cromosoma son idénticas condujo a la primera secuencia verdaderamente completa de telómero a telómero de un cromosoma humano, el cromosoma X. [44] De manera similar, varios meses después siguió una secuencia completa de extremo a extremo del cromosoma 8 autosómico humano. [45]
En 2021, se informó que el consorcio Telomere-to-Telomere (T2T) había llenado todos los vacíos excepto cinco en regiones repetitivas del ADN ribosomal. [46] Meses después, esas brechas también se habían cerrado. La secuencia completa no contenía el cromosoma Y , lo que provoca que el embrión se vuelva masculino, estando ausente en la línea celular que sirvió de fuente para el ADN analizado. Alrededor del 0,3% de la secuencia completa resultó difícil de comprobar en cuanto a calidad y, por lo tanto, podría haber contenido errores [47] , que estaban siendo objeto de confirmación. [48] En abril de 2022, se publicó formalmente la secuencia completa del cromosoma no Y, lo que proporciona una visión de gran parte del 8% del genoma omitido por el HGP. [49] En diciembre de 2022, un artículo preimpreso afirmaba que se había realizado la secuenciación de las regiones faltantes restantes del cromosoma Y, completando así la secuenciación de los 24 cromosomas humanos. [50] En agosto de 2023 finalmente se publicó esta preimpresión. [51] [52]
La secuenciación del genoma humano tiene beneficios para muchos campos, desde la medicina molecular hasta la evolución humana . El Proyecto Genoma Humano, a través de su secuenciación del ADN, puede ayudar a los investigadores a comprender enfermedades que incluyen: genotipado de virus específicos para dirigir el tratamiento adecuado; identificación de mutaciones relacionadas con diferentes formas de cáncer ; el diseño de medicamentos y una predicción más precisa de sus efectos; avance en las ciencias forenses aplicadas; biocombustibles y otras aplicaciones energéticas; agricultura , ganadería , bioprocesamiento ; Evaluación de riesgos ; bioarqueología , antropología y evolución . La secuencia del ADN se almacena en bases de datos disponibles para cualquier persona en Internet . El Centro Nacional de Información Biotecnológica de EE. UU. (y organizaciones hermanas en Europa y Japón) albergan la secuencia genética en una base de datos conocida como GenBank , junto con secuencias de genes y proteínas conocidos e hipotéticos. Otras organizaciones, como UCSC Genome Browser de la Universidad de California, Santa Cruz, [53] y Ensembl [54] presentan datos y anotaciones adicionales y poderosas herramientas para visualizarlos y buscarlos. Se han desarrollado programas informáticos para analizar los datos porque los datos en sí son difíciles de interpretar sin dichos programas. En términos generales, los avances en la tecnología de secuenciación del genoma han seguido la Ley de Moore , un concepto de la informática que establece que los circuitos integrados pueden aumentar su complejidad a un ritmo exponencial. [55] Esto significa que las velocidades a las que se pueden secuenciar genomas completos pueden aumentar a un ritmo similar, como se vio durante el desarrollo del Proyecto Genoma Humano.
El proceso de identificar los límites entre genes y otras características en una secuencia de ADN sin procesar se llama anotación genómica y pertenece al dominio de la bioinformática . Si bien los biólogos expertos son los mejores anotadores, su trabajo avanza lentamente y los programas informáticos se utilizan cada vez más para satisfacer las demandas de alto rendimiento de los proyectos de secuenciación del genoma. A partir de 2008, se introdujo una nueva tecnología conocida como RNA-seq que permitió a los científicos secuenciar directamente el ARN mensajero en las células. Esto reemplazó los métodos anteriores de anotación, que se basaban en las propiedades inherentes de la secuencia de ADN, por una medición directa, que era mucho más precisa. Hoy en día, la anotación del genoma humano y otros genomas se basa principalmente en la secuenciación profunda de las transcripciones en cada tejido humano utilizando RNA-seq. Estos experimentos han revelado que más del 90% de los genes contienen al menos una y normalmente varias variantes de empalme alternativas, en las que los exones se combinan de diferentes maneras para producir 2 o más productos genéticos del mismo locus. [56]
El genoma publicado por el HGP no representa la secuencia del genoma de cada individuo. Es el mosaico combinado de un pequeño número de donantes anónimos, de ascendencia africana, europea y del este de Asia. El genoma HGP es un andamio para trabajos futuros en la identificación de diferencias entre individuos. [ cita necesaria ] Proyectos posteriores secuenciaron los genomas de múltiples grupos étnicos distintos, aunque en 2019 todavía hay un solo "genoma de referencia". [57]
Los hallazgos clave del borrador (2001) y de las secuencias genómicas completas (2004) incluyen:
El genoma humano tiene aproximadamente 3,1 mil millones de pares de bases . [63] El Proyecto Genoma Humano se inició en 1990 con el objetivo de secuenciar e identificar todos los pares de bases en el conjunto de instrucciones genéticas humanas, encontrar las raíces genéticas de las enfermedades y luego desarrollar tratamientos. Se considera un megaproyecto .
El genoma se dividió en pedazos más pequeños; aproximadamente 150.000 pares de bases de longitud. [64] Estas piezas luego se ligaron en un tipo de vector conocido como " cromosomas artificiales bacterianos ", o BAC, que se derivan de cromosomas bacterianos que han sido modificados genéticamente. Los vectores que contienen los genes se pueden insertar en bacterias donde son copiados por la maquinaria de replicación del ADN bacteriano . Luego, cada una de estas piezas fue secuenciada por separado como un pequeño proyecto de " escopeta " y luego ensamblada. Los más grandes, 150.000 pares de bases, se unen para crear cromosomas. Esto se conoce como el enfoque de " escopeta jerárquica ", porque el genoma primero se divide en fragmentos relativamente grandes, que luego se asignan a los cromosomas antes de ser seleccionados para la secuenciación. [65] [66]
La financiación provino del gobierno de los EE. UU. a través de los Institutos Nacionales de Salud de los Estados Unidos y una organización benéfica del Reino Unido, Wellcome Trust , así como de muchos otros grupos de todo el mundo. La financiación apoyó a varios grandes centros de secuenciación, incluidos los del Instituto Whitehead , el Instituto Wellcome Sanger (entonces llamado The Sanger Center) con sede en el Wellcome Genome Campus , la Universidad de Washington en St. Louis y la Facultad de Medicina de Baylor . [25] [67]
La Organización de las Naciones Unidas para la Educación, la Ciencia y la Cultura (UNESCO) sirvió como un canal importante para la participación de los países en desarrollo en el Proyecto Genoma Humano. [68]
En 1998, el investigador estadounidense Craig Venter y su empresa Celera Genomics lanzaron una búsqueda similar, financiada con fondos privados . Venter era científico en los NIH a principios de la década de 1990, cuando se inició el proyecto. Se pretendía que el esfuerzo de Celera de 300 millones de dólares avanzara a un ritmo más rápido y a una fracción del costo del proyecto financiado con fondos públicos de aproximadamente 3 mil millones de dólares. Mientras que el proyecto Celera centró sus esfuerzos en la producción de secuenciación y ensamblaje del genoma humano, el PGH público también financió el mapeo y secuenciación de los genomas de gusanos , moscas y levaduras , financiación de bases de datos, desarrollo de nuevas tecnologías, apoyo a programas de bioinformática y ética, así como el pulido y evaluación del ensamblaje del genoma. [69] Tanto el enfoque de Celera como el público gastaron aproximadamente 250 millones de dólares en el esfuerzo de secuenciación de la producción. [70] Para el ensamblaje de la secuencia, Celera hizo uso de mapas disponibles públicamente en GenBank , que Celera era capaz de generar, pero cuya disponibilidad era "beneficiosa" para el proyecto financiado con fondos privados. [59]
Celera utilizó una técnica llamada secuenciación de escopeta del genoma completo , empleando secuenciación de extremos por pares , [71] que se había utilizado para secuenciar genomas bacterianos de hasta seis millones de pares de bases de longitud, pero no para nada tan grande como los tres mil millones de pares de bases humanos. genoma.
Celera anunció inicialmente que buscaría protección de patente sobre "sólo 200 a 300" genes, pero luego lo modificó para buscar "protección de propiedad intelectual" sobre "estructuras importantes completamente caracterizadas" que ascienden a 100 a 300 objetivos. La empresa finalmente presentó solicitudes de patente preliminares ("reservadoras") sobre 6.500 genes completos o parciales. Celera también prometió publicar sus hallazgos de acuerdo con los términos de la " Declaración de las Bermudas " de 1996, publicando nuevos datos anualmente (el HGP publicaba sus nuevos datos diariamente), aunque, a diferencia del proyecto financiado con fondos públicos, no permitirían la libre redistribución o uso científico de los datos. Por este motivo, los competidores financiados con fondos públicos se vieron obligados a publicar el primer borrador del genoma humano antes que Celera. El 7 de julio de 2000, el Grupo de Bioinformática del Genoma de la UCSC publicó un primer borrador de trabajo en la web. La comunidad científica descargó alrededor de 500 GB de información del servidor del genoma de la UCSC en las primeras 24 horas de acceso gratuito y sin restricciones. [72]
En marzo de 2000, el presidente Clinton , junto con el primer ministro Tony Blair, en una doble declaración, instó a que todos los investigadores que desearan investigar la secuencia tuvieran "acceso sin trabas" a la secuencia del genoma. [73] La declaración hizo que las acciones de Celera cayeran en picado y arrastró al Nasdaq , de gran biotecnología . El sector de la biotecnología perdió alrededor de 50 mil millones de dólares en capitalización de mercado en dos días. [ cita necesaria ]
Aunque el borrador de trabajo se anunció en junio de 2000, no fue hasta febrero de 2001 que Celera y los científicos del HGP publicaron detalles de sus borradores. Los números especiales de Nature (que publicó el artículo científico del proyecto financiado con fondos públicos ) [59] describieron los métodos utilizados para producir el borrador de la secuencia y ofrecieron un análisis de la secuencia. Estos borradores cubrían aproximadamente el 83% del genoma (el 90% de las regiones eucromáticas con 150.000 espacios y el orden y orientación de muchos segmentos aún no establecidos). En febrero de 2001, en el momento de las publicaciones conjuntas, comunicados de prensa anunciaban que ambos grupos habían completado el proyecto. En 2003 y 2005 se anunciaron borradores mejorados, que completan aproximadamente el 92% de la secuencia actual. [ cita necesaria ]
En el HGP del sector público del Consorcio Internacional de Secuenciación del Genoma Humano (IHGSC) , los investigadores recolectaron muestras de sangre (femenina) o de esperma (masculino) de una gran cantidad de donantes. Sólo unas pocas de las muchas muestras recolectadas se procesaron como recursos de ADN. De este modo, las identidades de los donantes estaban protegidas para que ni los donantes ni los científicos pudieran saber de quién fue el ADN secuenciado. En el proyecto general se utilizaron clones de ADN extraídos de muchas bibliotecas diferentes , y la mayoría de esas bibliotecas fueron creadas por Pieter J. de Jong. Gran parte de la secuencia (>70%) del genoma de referencia producido por el HGP público provino de un único donante masculino anónimo de Buffalo, Nueva York ( nombre en clave RP11; el "RP" se refiere a Roswell Park Comprehensive Cancer Center ). [74] [75]
Los científicos del HGP utilizaron glóbulos blancos de la sangre de dos donantes masculinos y dos femeninos (seleccionados al azar entre 20 de cada uno), y cada donante produjo una biblioteca de ADN separada. Una de estas bibliotecas (RP11) se utilizó considerablemente más que otras, debido a consideraciones de calidad. Un problema técnico menor es que las muestras masculinas contienen poco más de la mitad de ADN de los cromosomas sexuales (un cromosoma X y un cromosoma Y ) en comparación con las muestras femeninas (que contienen dos cromosomas X ). Los otros 22 cromosomas (los autosomas) son iguales para ambos sexos.
Aunque se completó la fase principal de secuenciación del HGP, los estudios de variación del ADN continuaron en el Proyecto Internacional HapMap , cuyo objetivo era identificar patrones de grupos de polimorfismos de un solo nucleótido (SNP) (llamados haplotipos o "haps"). Las muestras de ADN para HapMap provinieron de un total de 270 individuos; pueblo yoruba en Ibadán , Nigeria ; Los japoneses en Tokio ; los chinos han en Beijing ; y el recurso francés Centre d'Etude du Polymorphisme Humain (CEPH), que estaba formado por residentes de los Estados Unidos con ascendencia de Europa occidental y septentrional .
En el proyecto del sector privado Celera Genomics , se utilizó ADN de cinco individuos diferentes para la secuenciación. El científico principal de Celera Genomics en ese momento, Craig Venter, reconoció más tarde (en una carta pública a la revista Science ) que su ADN era una de las 21 muestras del grupo, cinco de las cuales fueron seleccionadas para su uso. [76] [77]
Con la secuencia en mano, el siguiente paso fue identificar las variantes genéticas que aumentan el riesgo de enfermedades comunes como el cáncer y la diabetes. [24] [64]
Se prevé que el conocimiento detallado del genoma humano abrirá nuevas vías para los avances en medicina y biotecnología . Los resultados prácticos claros del proyecto surgieron incluso antes de finalizar el trabajo. Por ejemplo, varias empresas, como Myriad Genetics , comenzaron a ofrecer formas sencillas de administrar pruebas genéticas que pueden mostrar predisposición a una variedad de enfermedades, incluido el cáncer de mama , trastornos de la hemostasia , fibrosis quística , enfermedades hepáticas y muchas otras. Además, se considera que las etiologías de los cánceres , la enfermedad de Alzheimer y otras áreas de interés clínico probablemente se beneficiarán de la información del genoma y posiblemente puedan conducir a largo plazo a avances significativos en su tratamiento. [78] [79]
También existen muchos beneficios tangibles para los biólogos. Por ejemplo, un investigador que investiga una determinada forma de cáncer puede haber limitado su búsqueda a un gen en particular. Al visitar la base de datos del genoma humano en la World Wide Web , este investigador puede examinar lo que otros científicos han escrito sobre este gen, incluyendo (potencialmente) la estructura tridimensional de su producto, sus funciones, sus relaciones evolutivas con otros genes humanos, o a genes en ratones, levaduras o moscas de la fruta, posibles mutaciones perjudiciales, interacciones con otros genes, tejidos corporales en los que se activa este gen y enfermedades asociadas con este gen u otros tipos de datos. Además, una comprensión más profunda de los procesos patológicos a nivel de biología molecular puede determinar nuevos procedimientos terapéuticos. Dada la importancia establecida del ADN en la biología molecular y su papel central en la determinación del funcionamiento fundamental de los procesos celulares , es probable que el conocimiento ampliado en esta área facilite avances médicos en numerosas áreas de interés clínico que tal vez no hubieran sido posibles sin ellos. [80]
El análisis de similitudes entre secuencias de ADN de diferentes organismos también está abriendo nuevas vías en el estudio de la evolución . En muchos casos, las cuestiones evolutivas ahora pueden formularse en términos de biología molecular ; de hecho, muchos hitos evolutivos importantes (la aparición de los ribosomas y los orgánulos , el desarrollo de embriones con planes corporales, el sistema inmunológico de los vertebrados ) pueden relacionarse con el nivel molecular. Se espera que los datos de este proyecto aclaren muchas preguntas sobre las similitudes y diferencias entre los humanos y sus parientes más cercanos (los primates y, de hecho, los otros mamíferos ). [78] [81]
El proyecto inspiró y allanó el camino para el trabajo genómico en otros campos, como la agricultura. Por ejemplo, al estudiar la composición genética de Tritium aestivum , el trigo harinero más utilizado en el mundo, se ha obtenido una gran comprensión de las formas en que la domesticación ha impactado la evolución de la planta. [82] Se está investigando qué loci son más susceptibles a la manipulación y cómo se desarrolla esto en términos evolutivos. La secuenciación genética ha permitido abordar estas cuestiones por primera vez, ya que se pueden comparar loci específicos en cepas silvestres y domesticadas de la planta. Esto permitirá avances en la modificación genética en el futuro que podrían producir cultivos de trigo más sanos y resistentes a enfermedades, entre otras cosas.
Al inicio del Proyecto Genoma Humano, se plantearon varias preocupaciones éticas, legales y sociales con respecto a cómo se podría utilizar un mayor conocimiento del genoma humano para discriminar a las personas . Una de las principales preocupaciones de la mayoría de las personas era el temor de que tanto los empleadores como las compañías de seguros médicos se negaran a contratar personas o se negaran a brindarles seguros debido a un problema de salud indicado por los genes de alguien. [83] En 1996, Estados Unidos aprobó la Ley de Responsabilidad y Portabilidad del Seguro Médico (HIPAA), que protege contra la divulgación no autorizada y no consensuada de información de salud de identificación individual a cualquier entidad que no participe activamente en la prestación de servicios de atención médica a un paciente. [84]
Además de identificar los aproximadamente 20.000 a 25.000 genes del genoma humano (estimados entre 80.000 y 140.000 al inicio del proyecto), el Proyecto Genoma Humano también buscó abordar los problemas éticos, legales y sociales que fueron creados por el inicio del proyecto. [85] Para ello, en 1990 se fundó el programa Implicaciones Éticas, Legales y Sociales (ELSI). Se asignó el cinco por ciento del presupuesto anual para abordar las ELSI que surgen del proyecto. [25] [86] Este presupuesto comenzó en aproximadamente $1,57 millones en el año 1990, pero aumentó a aproximadamente $18 millones en el año 2014. [87]
Si bien el proyecto puede ofrecer importantes beneficios para la medicina y la investigación científica, algunos autores han subrayado la necesidad de abordar las posibles consecuencias sociales del mapeo del genoma humano. El historiador de la ciencia Hans-Jörg Rheinberger escribió que "la perspectiva de 'molecularizar' las enfermedades y su posible cura tendrá un profundo impacto en lo que los pacientes esperan de la ayuda médica y en la percepción de la enfermedad por parte de una nueva generación de médicos". [88]
En julio de 2024, una investigación de Undark Magazine [89] y coeditada con STAT News [90] reveló por primera vez varios fallos éticos por parte de los científicos que encabezan el Proyecto Genoma Humano. El principal de ellos fue el uso de aproximadamente el 75 por ciento del ADN de un único donante en la construcción del genoma de referencia, a pesar de los formularios de consentimiento informado proporcionados a cada uno de los 20 donantes anónimos participantes, que indicaban no más del 10 por ciento del ADN de cada donante. Se utilizaría ADN. Alrededor del 10 por ciento del genoma de referencia pertenecía a uno de los científicos principales del proyecto, Pieter De Jong. [89]
{{cite web}}
: Mantenimiento CS1: copia archivada como título ( enlace )...sacó a la luz alrededor de 1200 familias de proteínas. Sólo 94 familias de proteínas, o el 7%, parecen ser específicas de vertebrados