La identificación de genes de enfermedades es un proceso mediante el cual los científicos identifican los genotipos mutantes responsables de un trastorno genético hereditario . Las mutaciones en estos genes pueden incluir sustituciones de un solo nucleótido, adiciones o eliminaciones de un solo nucleótido, eliminación de todo el gen y otras anomalías genéticas.
El conocimiento de qué genes (cuando no funcionan) causan determinados trastornos simplificará el diagnóstico de los pacientes y proporcionará información sobre las características funcionales de la mutación. La aparición de las modernas tecnologías de secuenciación de alto rendimiento combinadas con los conocimientos aportados por el creciente campo de la genómica está dando lugar a una identificación más rápida de los genes de las enfermedades, lo que permite a los científicos identificar mutaciones más complejas.
Las técnicas de identificación de genes de enfermedades suelen seguir el mismo procedimiento general. Primero se recoge el ADN de varios pacientes que se cree que tienen la misma enfermedad genética. Luego, se analizan y examinan sus muestras de ADN para determinar las regiones probables en las que podría residir potencialmente la mutación. Estas técnicas se mencionan a continuación. Luego, estas regiones probables se alinean entre sí y la región superpuesta debe contener el gen mutante. Si se conoce una parte suficiente de la secuencia del genoma, se busca en esa región genes candidatos . Luego, se secuencian las regiones codificantes de estos genes hasta que se descubre una mutación o se descubre otro paciente, en cuyo caso se puede repetir el análisis, lo que potencialmente reduce la región de interés.
Las diferencias entre la mayoría de los procedimientos de identificación de genes de enfermedades están en el segundo paso (donde se analizan y examinan muestras de ADN para determinar regiones en las que podría residir la mutación).
Sin la ayuda de las secuencias del genoma completo, las investigaciones pregenómicas se centraron en regiones seleccionadas del genoma, a menudo con un conocimiento mínimo de las secuencias genéticas que estaban analizando. Las técnicas genéticas capaces de proporcionar este tipo de información incluyen el análisis de polimorfismos de longitud de fragmentos de restricción (RFLP) y el análisis de microsatélites .
La pérdida de heterocigosidad (LOH) es una técnica que solo se puede utilizar para comparar dos muestras del mismo individuo. El análisis de LOH se utiliza a menudo para identificar oncogenes que causan cáncer , ya que una muestra consta de ADN tumoral (mutante) y la otra muestra (de control) consta de ADN genómico de células no cancerosas del mismo individuo. Los RFLP y los marcadores microsatélites proporcionan patrones de polimorfismos de ADN, que pueden interpretarse como residentes en una región heterocigótica o en una región homocigótica del genoma. Siempre que todos los individuos estén afectados por la misma enfermedad resultante de una manifestación de una deleción de una única copia del mismo gen, todos los individuos contendrán una región donde su muestra de control es heterocigótica pero la muestra mutante es homocigótica: esta región contendrá el gen de la enfermedad. [1] [2]
Con el advenimiento de técnicas de laboratorio modernas, como la secuenciación de alto rendimiento y el software capaz de realizar análisis de todo el genoma, la adquisición de secuencias se ha vuelto cada vez menos costosa y requiere menos tiempo, lo que proporciona importantes beneficios a la ciencia en forma de técnicas de identificación de genes de enfermedades más eficientes.
El mapeo de identidad por descendencia (IBD) generalmente utiliza matrices de polimorfismos de un solo nucleótido (SNP) para examinar los sitios polimórficos conocidos en todo el genoma de los individuos afectados y sus padres y/o hermanos, tanto afectados como no afectados. Si bien estos SNP probablemente no causan la enfermedad, brindan información valiosa sobre la composición de los genomas en cuestión. Una región del genoma se considera idéntica por descendencia si los SNP contiguos comparten el mismo genotipo. Al comparar un individuo afectado con su hermano afectado, se registran todas las regiones idénticas (p. ej., sombreadas en rojo en la figura anterior). Dado que un hermano afectado y un hermano no afectado no tienen el mismo fenotipo de la enfermedad, su ADN debe ser diferente por definición (salvo la presencia de un modificador genético o ambiental ). Por lo tanto, los resultados del mapeo de IBD se pueden complementar aún más eliminando cualquier región que sea idéntica tanto en los individuos afectados como en los hermanos no afectados. [3] Luego, esto se repite para múltiples familias, lo que genera un pequeño fragmento superpuesto, que teóricamente contiene el gen de la enfermedad.
El mapeo de homocigosidad/autocigosidad es una técnica poderosa, pero solo es válida cuando se busca una mutación que se segrega dentro de una población pequeña y cerrada. Una población tan pequeña, posiblemente creada por el efecto fundador , tendrá un acervo genético limitado y, por lo tanto, cualquier enfermedad hereditaria probablemente será el resultado de dos copias de la misma mutación que se segregan en el mismo haplotipo . Dado que los individuos afectados probablemente serán homocigotos en las regiones, observar los SNP en una región es un marcador adecuado de las regiones de homocigosidad y heterocigosidad. Los arreglos de SNP de hoy en día se utilizan para examinar el genoma e identificar grandes regiones de homocigosidad. Los bloques homocigotos en los genomas de los individuos afectados pueden luego colocarse uno sobre otro, y la región superpuesta debería contener el gen de la enfermedad. [4]
Este análisis se suele ampliar analizando la autocigosidad , una extensión de la homocigosidad, en los genomas de los individuos afectados. [5] Esto se puede lograr trazando una puntuación LOD acumulativa junto con los bloques superpuestos de homocigosidad. Al tomar en consideración las frecuencias de alelos de la población para todos los SNP a través del mapeo de autocigosidad, se pueden confirmar los resultados de la homocigosidad. [5] Además, si aparecen dos regiones sospechosas como resultado del mapeo de homocigosidad, el mapeo de autocigosidad puede ser capaz de distinguir entre las dos (p. ej., si un bloque de homocigosidad es el resultado de una región muy no diversa del genoma, la puntuación LOD será muy baja).
Herramientas para el mapeo de homocigosidad
Los estudios de knockdown de todo el genoma son un ejemplo de la genética inversa que se hizo posible gracias a la adquisición de secuencias del genoma completo y al advenimiento de la genómica y las tecnologías de silenciamiento de genes, principalmente el siRNA y el mapeo de deleción . Los estudios de knockdown de todo el genoma implican el knockdown sistemático o la eliminación de genes o segmentos del genoma. [7] Esto se hace generalmente en procariotas o en un entorno de cultivo de tejidos debido a la enorme cantidad de knockdowns que se deben realizar. [8] Una vez que se completa el knockout sistemático (y posiblemente se confirma mediante el análisis de expresión de ARNm), se pueden observar los resultados fenotípicos del knockdown/knockout. Se pueden seleccionar parámetros de observación para apuntar a un fenotipo altamente específico. [8] Luego, el conjunto de datos resultante se consulta para obtener muestras que exhiban fenotipos que coincidan con la enfermedad en cuestión; el gen o los genes knockdown/eliminados en dichas muestras pueden considerarse genes candidatos de la enfermedad para el individuo en cuestión.
La secuenciación completa del exoma es un método de fuerza bruta que implica el uso de tecnología de secuenciación moderna y herramientas de ensamblaje de secuencias de ADN para unir todas las porciones codificantes del genoma. Luego, la secuencia se compara con un genoma de referencia y se anotan las diferencias. Después de filtrar todos los polimorfismos benignos conocidos, los cambios sinónimos y los cambios intrónicos (que no afectan los sitios de empalme), solo quedarán las variantes potencialmente patógenas. Esta técnica se puede combinar con otras técnicas para excluir aún más variantes potencialmente patógenas en caso de que se identifique más de una. [9]