La secuenciación del genoma del cáncer es la secuenciación del genoma completo de un único grupo homogéneo o heterogéneo de células cancerosas. Es un método bioquímico de laboratorio para la caracterización e identificación de las secuencias de ADN o ARN de células cancerosas.
A diferencia de la secuenciación del genoma completo (WG), que generalmente se realiza a partir de células sanguíneas, como los proyectos de secuenciación WG de J. Craig Venter [1] y James D. Watson [2], la secuenciación del genoma del cáncer de saliva, células epiteliales u hueso implica la secuenciación directa del tejido tumoral primario, el tejido normal adyacente o distal, el microambiente del tumor, como fibroblastos/células del estroma, o sitios tumorales metastásicos.
Similar a la secuenciación del genoma completo, la información generada a partir de esta técnica incluye: identificación de bases de nucleótidos (ADN o ARN), número de copias y variantes de secuencia, estado de mutación y cambios estructurales como translocaciones cromosómicas y genes de fusión .
La secuenciación del genoma del cáncer no se limita a la secuenciación de genes de la proteína WG y también puede incluir la secuenciación del exoma , el transcriptoma , el micronoma y el perfil de la secuencia final . Estos métodos se pueden utilizar para cuantificar la expresión génica , la expresión de miRNA e identificar eventos de empalme alternativo además de los datos de secuencia.
El primer informe sobre la secuenciación del genoma del cáncer apareció en 2006. En este estudio se secuenciaron 13.023 genes en 11 tumores de mama y 11 tumores colorrectales. [3] En 2007 se publicó un estudio de seguimiento en el que el mismo grupo añadió algo más de 5.000 genes más y casi 8.000 especies de transcripción para completar los exomas de 11 tumores de mama y colorrectales. [4] El primer genoma completo del cáncer que se secuenció fue el de la leucemia mieloide aguda citogenéticamente normal , realizado por Ley et al. en noviembre de 2008. [5] El primer tumor de cáncer de mama fue secuenciado por Shah et al. en octubre de 2009, [6] los primeros tumores de pulmón y piel por Pleasance et al. en enero de 2010, [7] [8] y los primeros tumores de próstata por Berger et al. en febrero de 2011. [9]
Históricamente, los esfuerzos de secuenciación del genoma del cáncer se han dividido entre proyectos de secuenciación basados en el transcriptoma y esfuerzos centrados en el ADN.
El Proyecto de Anatomía del Genoma del Cáncer (CGAP) se financió por primera vez en 1997 [10] con el objetivo de documentar las secuencias de transcripciones de ARN en células tumorales. [11] A medida que la tecnología mejoró, el CGAP amplió sus objetivos para incluir la determinación de perfiles de expresión genética de tejidos cancerosos, precancerosos y normales. [12]
El CGAP publicó la colección más grande disponible públicamente de etiquetas de secuencias expresadas en cáncer en 2003. [13]
El Proyecto Genoma del Cáncer del Instituto Sanger , financiado por primera vez en 2005, se centra en la secuenciación del ADN. Ha publicado un censo de genes causalmente implicados en el cáncer [14] y una serie de análisis de resecuenciación del genoma completo para genes implicados en el cáncer [15] .
El Consorcio Internacional del Genoma del Cáncer (ICGC) se fundó en 2007 con el objetivo de integrar los datos genómicos , transcriptómicos y epigenéticos disponibles de muchos grupos de investigación diferentes. [16] [17] A diciembre de 2011, el ICGC incluye 45 proyectos comprometidos y tiene datos de 2.961 genomas de cáncer disponibles. [16]
El proceso de tumorigénesis que transforma una célula normal en una célula cancerosa implica una serie de cambios genéticos y epigenéticos complejos . [18] [19] [20] La identificación y caracterización de todos estos cambios se puede lograr a través de varias estrategias de secuenciación del genoma del cáncer.
El poder de la secuenciación del genoma del cáncer reside en la heterogeneidad de los cánceres y los pacientes. La mayoría de los cánceres tienen una variedad de subtipos y, combinadas con estas "variantes del cáncer", se encuentran las diferencias entre un subtipo de cáncer en un individuo y en otro. La secuenciación del genoma del cáncer permite a los médicos y oncólogos identificar los cambios específicos y únicos que ha experimentado un paciente para desarrollar su cáncer. En función de estos cambios, se puede emprender una estrategia terapéutica personalizada. [21] [22]
Una gran contribución a la muerte por cáncer y al fracaso de su tratamiento es la evolución clonal a nivel citogenético, como se observa, por ejemplo, en la leucemia mieloide aguda (LMA). [23] [24] En un estudio publicado en Nature en 2011, Ding et al. identificaron fracciones celulares caracterizadas por cambios mutacionales comunes para ilustrar la heterogeneidad de un tumor particular antes y después del tratamiento en comparación con la sangre normal en un individuo. [25]
Estas facciones celulares sólo podrían haberse identificado a través de la secuenciación del genoma del cáncer, lo que muestra la información que puede proporcionar la secuenciación y la complejidad y heterogeneidad de un tumor dentro de un individuo.
Los dos proyectos principales centrados en la caracterización completa del cáncer en individuos, que implican en gran medida la secuenciación, incluyen el Cancer Genome Project , con sede en el Wellcome Trust Sanger Institute, y el Cancer Genome Atlas , financiado por el National Cancer Institute (NCI) y el National Human Genome Research Institute (NHGRI). Junto con estos esfuerzos, el International Cancer Genome Consortium (una organización más grande) es una organización científica voluntaria que ofrece un foro para la colaboración entre los principales investigadores del cáncer y la genómica del mundo.
El objetivo del Proyecto Genoma del Cáncer es identificar variantes de secuencia y mutaciones críticas en el desarrollo de cánceres humanos. El proyecto implica la detección sistemática de genes codificantes y uniones de empalme flanqueantes de todos los genes del genoma humano para detectar mutaciones adquiridas en cánceres humanos. Para investigar estos eventos, el conjunto de muestras de descubrimiento incluirá ADN de tumores primarios, tejido normal (de los mismos individuos) y líneas celulares cancerosas. Todos los resultados de este proyecto se fusionan y almacenan en la base de datos de cáncer COSMIC . COSMIC también incluye datos mutacionales publicados en la literatura científica.
El TCGA es un esfuerzo multiinstitucional para comprender la base molecular del cáncer a través de tecnologías de análisis genómico, incluidas técnicas de secuenciación genómica a gran escala. Se están recolectando, secuenciando y analizando cientos de muestras. Actualmente, el tejido canceroso que se está recolectando incluye: sistema nervioso central, mama, gastrointestinal, ginecológico, cabeza y cuello, hematológico, torácico y urológico.
Los componentes de la red de investigación del TCGA incluyen: recursos básicos de bioespecímenes, centros de caracterización del genoma, centros de secuenciación del genoma, centros de caracterización del proteoma, un centro de coordinación de datos y centros de análisis de datos del genoma. Cada tipo de cáncer se someterá a una caracterización y análisis genómicos exhaustivos. Los datos y la información generados están disponibles de forma gratuita a través del portal de datos del TCGA del proyecto.
El objetivo del ICGC es “obtener una descripción completa de los cambios genómicos, transcriptómicos y epigenómicos en 50 tipos y/o subtipos de tumores diferentes que son de importancia clínica y social en todo el mundo”. [16]
La secuenciación del genoma del cáncer utiliza la misma tecnología que se utiliza en la secuenciación del genoma completo. La historia de la secuenciación ha recorrido un largo camino, y se originó en 1977 por dos grupos independientes: la técnica de secuenciación enzimática de ADN didoxi de Frederick Sanger [26] y la técnica de degradación química de Allen Maxam y Walter Gilbert. [27] Después de estos artículos emblemáticos, más de 20 años después nació la secuenciación de próxima generación de alto rendimiento (HT-NGS) de "segunda generación", seguida por la "tecnología HT-NGS de tercera generación" en 2010. [28] Las figuras de la derecha ilustran la cadena de producción biológica general y las empresas involucradas en la secuenciación HT-NGS de segunda y tercera generación.
Las tres principales plataformas de segunda generación incluyen la secuenciación pirogénica Roche/454 , la secuenciación por ligación ABI/SOLiD y la tecnología de secuenciación por amplificación de puente de Illumina . Las tres principales plataformas de tercera generación incluyen la secuenciación de moléculas individuales en tiempo real (SMRT) de Pacific Biosciences , la secuenciación Oxford Nanopore y la secuenciación de semiconductores iónicos .
Al igual que con cualquier proyecto de secuenciación genómica, las lecturas deben ensamblarse para formar una representación de los cromosomas que se secuenciarán. En el caso de los genomas del cáncer, esto se suele hacer alineando las lecturas con el genoma humano de referencia .
Dado que incluso las células no cancerosas acumulan mutaciones somáticas, es necesario comparar la secuencia del tumor con un tejido normal compatible para descubrir qué mutaciones son exclusivas del cáncer. En algunos tipos de cáncer, como la leucemia, no es práctico comparar la muestra de cáncer con un tejido normal, por lo que se debe utilizar un tejido no canceroso diferente. [25]
Se ha estimado que el descubrimiento de todas las mutaciones somáticas en un tumor requeriría una cobertura de secuenciación de 30 veces el genoma del tumor y un tejido normal compatible. [29] En comparación, el borrador original del genoma humano tenía una cobertura de aproximadamente 65 veces. [30] Para facilitar una mayor mejora en la detección de mutaciones somáticas en el cáncer, el Consorcio de Control de Calidad de Secuenciación Fase 2 ha establecido un par de líneas celulares tumorales-normales como muestras de referencia comunitarias y conjuntos de datos para la evaluación comparativa de las detecciones de mutaciones del cáncer. [31]
Un objetivo importante de la secuenciación del genoma del cáncer es identificar las mutaciones impulsoras: cambios genéticos que aumentan la tasa de mutación en la célula, lo que conduce a una evolución más rápida del tumor y la metástasis. [32] Es difícil determinar las mutaciones impulsoras a partir de la secuencia de ADN únicamente; pero las impulsoras tienden a ser las mutaciones más comúnmente compartidas entre los tumores, se agrupan alrededor de oncogenes conocidos y tienden a no ser silenciosas. [29] Las mutaciones pasajeras, que no son importantes en la progresión de la enfermedad, se distribuyen aleatoriamente por todo el genoma. Se ha estimado que el tumor promedio tiene aproximadamente 80 mutaciones somáticas, de las cuales se espera que menos de 15 sean impulsoras. [33]
Un análisis genómico personal requiere una caracterización funcional adicional de los genes mutantes detectados y el desarrollo de un modelo básico del origen y la progresión del tumor. Este análisis se puede utilizar para hacer recomendaciones de tratamiento farmacológico. [21] [22] A febrero de 2012, esto sólo se ha realizado para ensayos clínicos con pacientes diseñados para evaluar el enfoque genómico personal para el tratamiento del cáncer. [22]
Un estudio a gran escala de mutaciones somáticas en tumores de mama y colorrectales mostró que muchas mutaciones de baja frecuencia hacen una pequeña contribución a la supervivencia celular. [33] Si la supervivencia celular está determinada por muchas mutaciones de pequeño efecto, es poco probable que la secuenciación del genoma descubra un único "talón de Aquiles" para los fármacos contra el cáncer. Sin embargo, las mutaciones somáticas tienden a agruparse en un número limitado de vías de señalización, [29] [33] [34] que son posibles objetivos de tratamiento.
Los cánceres son poblaciones heterogéneas de células. Cuando los datos de secuenciación se derivan de un tumor completo, se pierde información sobre las diferencias en la secuencia y el patrón de expresión entre las células. [35] Esta dificultad se puede mejorar mediante el análisis de células individuales.
Las propiedades clínicamente significativas de los tumores, incluida la resistencia a los medicamentos, a veces son causadas por reordenamientos a gran escala del genoma, en lugar de mutaciones individuales. [36] En este caso, la información sobre variantes de un solo nucleótido será de utilidad limitada. [35]
La secuenciación del genoma del cáncer se puede utilizar para proporcionar información clínicamente relevante en pacientes con tipos de tumores raros o nuevos. Traducir la información de la secuenciación en un plan de tratamiento clínico es muy complicado, requiere expertos de muchos campos diferentes y no se garantiza que conduzca a un plan de tratamiento eficaz. [21] [22]
El incidentaloma es el conjunto de variantes genómicas detectadas no relacionadas con el cáncer en estudio. [37] (El término es un juego de palabras con el nombre incidentaloma , que designa tumores y crecimientos detectados en imágenes de cuerpo entero por coincidencia). [38] La detección de dichas variantes puede dar lugar a medidas adicionales, como pruebas adicionales o control del estilo de vida. [37]