La finalización de la secuenciación del genoma humano a principios de la década de 2000 fue un punto de inflexión en la investigación genómica. [1] Los científicos han llevado a cabo una serie de investigaciones sobre las actividades de los genes y el genoma en su conjunto. El genoma humano contiene alrededor de 3 mil millones de pares de bases de nucleótidos, y la enorme cantidad de datos creados requiere el desarrollo de una herramienta accesible para explorar e interpretar esta información con el fin de investigar la base genética de las enfermedades, la evolución y los procesos biológicos. [2] El campo de la genómica ha seguido creciendo, con nuevas tecnologías de secuenciación y herramientas computacionales que facilitan el estudio del genoma.
El navegador de genoma es una herramienta importante para estudiar el genoma. En bioinformática , un navegador de genoma es una interfaz gráfica para mostrar información de una base de datos biológica para datos genómicos. [2] Es una herramienta de software que muestra datos genéticos en forma gráfica. Los navegadores de genoma permiten a los usuarios visualizar y explorar genomas completos con datos anotados, que incluyen predicción de genes, estructura de genes, proteínas, expresión, regulación, variación y análisis comparativo. Los datos anotados generalmente provienen de múltiples fuentes diversas. Se diferencian de las bases de datos biológicas ordinarias en que muestran datos en un formato gráfico, con coordenadas del genoma en un eje con anotaciones o gráficos que llenan el espacio para mostrar análisis de los genes, como la frecuencia de los genes y sus perfiles de expresión. [1] El software permite a los usuarios navegar por el genoma, ver numerosas características, analizar e investigar las relaciones entre varios elementos genómicos.
El primer navegador genómico, conocido como Ensembl Genome Browser , fue desarrollado como parte del Proyecto Genoma Humano por un grupo de investigadores del Instituto Europeo de Bioinformática (EBI). Fue creado con el objetivo de proporcionar un recurso completo para la secuencia del genoma humano, con foco en la anotación de genes. Es una interfaz fácil de usar para explorar el genoma humano y los genomas de otros organismos. Se han creado varios navegadores genómicos más, incluido el UCSC Genome Browser , desarrollado en 2000 por Jim Kent y David Haussler , y el Genome Data Viewer del NCBI . [2] [3]
Estos navegadores genómicos pueden admitir varios genomas, pero otros pueden ser específicos para especies particulares. Estos navegadores pueden proporcionar un resumen de datos de bases de datos genómicas y una evaluación comparativa de diferentes secuencias genéticas en múltiples especies, y permitir que los datos se visualicen de diversas maneras para facilitar la evaluación e interpretación de estos datos complejos. [4] [5]
Ensamblaje y anotación del genoma: proporciona acceso al ensamblaje del genoma de referencia, que sirve como marco para superponer y analizar otros datos genómicos. También incluye anotaciones de genes que proporcionan información sobre las ubicaciones de los genes, las transcripciones y los elementos funcionales. No existe un navegador específico que se considere el "mejor" para la anotación y el ensamblaje del genoma, ya que, en última instancia, depende de las necesidades específicas del usuario y del tipo de análisis que se realice. Integrative Genomics Viewer (IGV): IGV es un navegador popular para visualizar y anotar datos genómicos, incluida la variación genómica, la expresión genética y la estructura de la cromatina. Admite una amplia gama de formatos de archivo y proporciona herramientas avanzadas para el análisis de datos.
Superposición e integración de datos: permite a los usuarios superponer e integrar diversos tipos de datos genómicos, como datos de secuenciación de ADN, datos de expresión genética y datos epigenéticos, en el genoma de referencia. Esto permite a los investigadores estudiar las relaciones entre diferentes características genómicas y conjuntos de datos. La elección del navegador de anotación y ensamblaje de genomas más adecuado varía en función de las necesidades y preferencias de análisis específicas del usuario. Sin embargo, una opción popular para visualizar y anotar datos genómicos es Integrative Genomics Viewer (IGV), que ofrece una amplia gama de herramientas de análisis de datos y admite varios formatos de archivo, incluidos datos de variación genómica, expresión genética y estructura de la cromatina.
Herramientas de visualización: Ofrece herramientas de visualización que permiten a los usuarios visualizar datos genómicos en varios formatos, como mapas de calor, gráficos de líneas, gráficos de barras y pistas genómicas. Estas herramientas facilitan la exploración e interpretación de datos genómicos complejos en un formato gráfico. El UCSC Genome Browser es un navegador de genoma popular y completo que ofrece una amplia gama de herramientas de visualización para datos genómicos, como variación genética, expresión genética y modificaciones epigenéticas. Además, proporciona acceso a numerosos conjuntos de datos disponibles públicamente para la investigación genómica comparativa. [6]
Zoom y navegación: proporciona herramientas de zoom y navegación que permiten a los usuarios explorar datos genómicos en diferentes escalas, desde el genoma completo hasta nucleótidos individuales. Esto facilita la navegación y el enfoque en regiones genómicas específicas de interés. Nuevamente, UCSC es un excelente navegador para la navegación; sin embargo, NCBI en la Figura 1, como se muestra en la figura a continuación, tiene una navegación y una interfaz de usuario lógicas.
Búsqueda y recuperación: incluye funciones de búsqueda y recuperación que permiten a los usuarios buscar genes específicos, regiones genómicas o elementos funcionales. Esto simplifica el proceso de localización y recuperación de datos genómicos relevantes para el análisis. El navegador NCBI [7] es una herramienta valiosa para la investigación genómica debido a su extensa base de datos, interfaz fácil de usar e integración con otras herramientas NCBI. Proporciona acceso a un conjunto grande y diverso de bases de datos biológicas, incluida la base de datos GenBank, lo que facilita a los usuarios la búsqueda y recuperación de datos genómicos. Además, la interfaz fácil de usar y las opciones de búsqueda avanzadas permiten búsquedas más eficientes, mientras que la integración con otras herramientas NCBI garantiza una experiencia de búsqueda y recuperación fluida.
Genómica comparativa: algunos navegadores genómicos incluyen funciones para comparar y analizar datos genómicos de diferentes especies o cepas. Esto permite a los investigadores estudiar relaciones evolutivas, identificar regiones conservadas y comparar ortólogos genéticos. Ensembl [8] ofrece herramientas avanzadas de genómica comparativa, incluida la capacidad de comparar estructuras genéticas, alineaciones genómicas y sintenia entre diferentes organismos.
Personalización y anotación: permite a los usuarios personalizar la visualización de los datos genómicos añadiendo sus propias anotaciones, pistas o visualizaciones. Esto permite a los investigadores adaptar la interfaz del navegador a sus necesidades de investigación e hipótesis específicas.
Intercambio de datos y colaboración: contiene funciones para compartir datos y colaborar, como la capacidad de compartir sesiones de navegador, guardar personalizaciones o colaborar con otros investigadores en tiempo real. Esto promueve la colaboración y el intercambio de datos entre investigadores. GMOD: GMOD (Base de datos genérica de organismos modelo) es una colección de herramientas de código abierto para crear y compartir bases de datos genómicas. Proporciona un marco para integrar datos genómicos con otros tipos de datos biológicos, como proteómica y metabolómica, y permite compartir datos y análisis con colaboradores.
Herramientas de análisis: algunos navegadores proporcionan herramientas de análisis, como herramientas para identificar genes expresados diferencialmente, predecir elementos funcionales o realizar otros análisis computacionales sobre los datos genómicos directamente dentro del entorno del navegador.
↵Las dos imágenes muestran las características y las entradas del navegador genómico de NCBI, que es uno de los muchos que existen. La imagen de la derecha muestra la región Chr1 del gen humano. El cuadro de la parte inferior resaltado en rojo muestra las opciones personalizables, como BLAST, seguimiento por accesión, detalles de ensamblaje, historial y datos de seguimiento/usuario. Estas características pueden ser diferentes en las distintas plataformas genómicas.
El explorador de genoma muestra el genoma como una serie de pistas o capas que se pueden activar o desactivar según las necesidades del usuario. Cada pista representa una característica genómica única, como genes, transcripciones, región reguladora o variaciones de secuencia. El usuario puede ampliar o reducir una determinada región del genoma para ver diferentes niveles de detalle o información adicional, así como navegar a regiones específicas mediante una función de búsqueda o haciendo clic en una característica específica.
Además de las anotaciones genéticas, los navegadores de genoma pueden mostrar una variedad de diferentes tipos de datos, como:
Secuencia de ADN: se puede mostrar como una sola pista lineal o como varias pistas, con diferentes colores que indican características distintas (por ejemplo, exones , intrones y repeticiones).
Datos de variación: esto incluye información sobre polimorfismos de un solo nucleótido (SNP), inserciones/deleciones (indels) y variantes estructurales.
Transcriptómica: contiene información sobre los niveles de expresión genética, empalme alternativo y ARN no codificantes.
Proteómica: incluye información sobre los niveles de expresión de proteínas, modificaciones postraduccionales e interacciones proteína-proteína.
Los exploradores genómicos se utilizan en diversos campos de investigación, como la bioinformática, la genética y la genómica clínica. Permiten a los investigadores investigar la base genética de las enfermedades, la evolución y otros procesos biológicos. A continuación, se muestran algunos ejemplos de cómo se utilizan los exploradores genómicos en diversos campos:
Biología evolutiva : los exploradores de genomas se utilizan para estudiar y comparar los genomas de varios organismos a fin de identificar similitudes y diferencias en la estructura genética, los elementos reguladores, las funciones y las secuencias repetitivas. Esto puede proporcionar información evolutiva sobre la relación entre diferentes especies y también ayudar a identificar alteraciones genéticas que sustentan la adaptación y la especiación, así como proporcionar información evolutiva sobre la relación entre diferentes especies.
Genómica clínica: los exploradores de genomas se utilizan para estudiar la base genética de las enfermedades. Al examinar el genoma de un paciente, los investigadores pueden identificar mutaciones genéticas que pueden ser responsables de la enfermedad. Los exploradores de genomas permiten a los investigadores investigar el posible impacto de estas mutaciones en la expresión genética y la función de las proteínas visualizándolas en el contexto del genoma y de cómo funcionan las proteínas.