Genómica funcional

La genómica funcional es un campo de la biología molecular que intenta describir las funciones e interacciones de los genes (y las proteínas ). La genómica funcional hace uso de la gran cantidad de datos generados por proyectos genómicos y transcriptómicos (como los proyectos de secuenciación del genoma y la secuenciación del ARN ). La genómica funcional se centra en los aspectos dinámicos como la transcripción génica , la traducción , la regulación de la expresión génica y las interacciones proteína-proteína , en contraposición a los aspectos estáticos de la información genómica como la secuencia o las estructuras del ADN. Una característica clave de los estudios de genómica funcional es su enfoque de todo el genoma para estas cuestiones, que generalmente implica métodos de alto rendimiento en lugar de un enfoque más tradicional de "gen candidato".

Definición y objetivos

Para comprender la genómica funcional es importante definir primero la función. En su artículo ^[1], Graur et al. definen la función de dos maneras posibles: "efecto seleccionado" y "rol causal". La función de "efecto seleccionado" se refiere a la función para la cual se selecciona un rasgo (ADN, ARN, proteína, etc.). La función de "rol causal" se refiere a la función para la cual un rasgo es suficiente y necesario. La genómica funcional generalmente prueba la definición de "rol causal" de la función.

El objetivo de la genómica funcional es comprender la función de los genes o las proteínas, en definitiva todos los componentes de un genoma. El término genómica funcional se utiliza a menudo para referirse a los numerosos enfoques técnicos para estudiar los genes y las proteínas de un organismo, incluidas las "propiedades bioquímicas, celulares y/o fisiológicas de todos y cada uno de los productos génicos" ^[2], mientras que algunos autores incluyen el estudio de elementos no genéticos en su definición. ^[3] La genómica funcional también puede incluir estudios de la variación genética natural a lo largo del tiempo (como el desarrollo de un organismo) o del espacio (como sus regiones corporales), así como de alteraciones funcionales como las mutaciones.

La promesa de la genómica funcional es generar y sintetizar conocimientos genómicos y proteómicos para comprender las propiedades dinámicas de un organismo. Esto podría proporcionar potencialmente una imagen más completa de cómo el genoma especifica la función en comparación con los estudios de genes individuales. La integración de datos de genómica funcional suele ser parte de los enfoques de biología de sistemas .

Técnicas y aplicaciones

La genómica funcional incluye aspectos relacionados con la función del genoma en sí, como la mutación y el polimorfismo (como el análisis de polimorfismos de un solo nucleótido (SNP)), así como la medición de actividades moleculares. Estas últimas comprenden una serie de " ómicas ", como la transcriptómica ( expresión génica ), la proteómica ( producción de proteínas ) y la metabolómica . La genómica funcional utiliza principalmente técnicas multiplex para medir la abundancia de muchos o todos los productos génicos, como los ARNm o las proteínas, dentro de una muestra biológica . Un enfoque de genómica funcional más centrado podría probar la función de todas las variantes de un gen y cuantificar los efectos de los mutantes utilizando la secuenciación como una lectura de la actividad. En conjunto, estas modalidades de medición intentan cuantificar los diversos procesos biológicos y mejorar nuestra comprensión de las funciones e interacciones de los genes y las proteínas.

A nivel de ADN

Mapeo de la interacción genética

La eliminación sistemática de genes por pares o la inhibición de la expresión génica se pueden utilizar para identificar genes con funciones relacionadas, incluso si no interactúan físicamente. La epistasis se refiere al hecho de que los efectos de dos knockouts de genes diferentes pueden no ser aditivos; es decir, el fenotipo que resulta cuando se inhiben dos genes puede ser diferente de la suma de los efectos de knockouts individuales.

Interacciones ADN/Proteína

Las proteínas formadas por la traducción del ARN mensajero (ARN mensajero, una información codificada del ADN para la síntesis de proteínas) desempeñan un papel importante en la regulación de la expresión génica. Para comprender cómo regulan la expresión génica es necesario identificar las secuencias de ADN con las que interactúan. Se han desarrollado técnicas para identificar los sitios de interacción entre el ADN y las proteínas. Estas incluyen la secuenciación ChIP , la secuenciación CUT&RUN y las tarjetas de visita. ^[4]

Ensayos de accesibilidad del ADN

Se han desarrollado ensayos para identificar regiones del genoma que son accesibles. Estas regiones de cromatina accesible son regiones reguladoras candidatas. Estos ensayos incluyen ATAC-seq , DNase-Seq y FAIRE-Seq .

A nivel de ARN

Microarrays

Los microarrays miden la cantidad de ARNm en una muestra que corresponde a un gen determinado o a una secuencia de ADN de sonda. Las secuencias de sonda se inmovilizan en una superficie sólida y se les permite hibridar con el ARNm "diana" marcado con fluorescencia. La intensidad de la fluorescencia de un punto es proporcional a la cantidad de secuencia diana que se ha hibridado con ese punto y, por lo tanto, a la abundancia de esa secuencia de ARNm en la muestra. Los microarrays permiten la identificación de genes candidatos involucrados en un proceso determinado en función de la variación entre los niveles de transcripción para diferentes condiciones y los patrones de expresión compartidos con genes de función conocida.

SABIO

El análisis serial de la expresión génica (SAGE, por sus siglas en inglés) es un método alternativo de análisis basado en la secuenciación de ARN en lugar de la hibridación. El SAGE se basa en la secuenciación de etiquetas de 10 a 17 pares de bases que son exclusivas de cada gen. Estas etiquetas se producen a partir de ARNm poli-A y se ligan de extremo a extremo antes de la secuenciación. El SAGE proporciona una medición imparcial del número de transcripciones por célula, ya que no depende del conocimiento previo de qué transcripciones se deben estudiar (como lo hacen los microarrays).

Secuenciación de ARN

Como se señaló en 2016, en los últimos años la secuenciación de ARN ha sustituido a la tecnología de microarrays y SAGE y se ha convertido en la forma más eficiente de estudiar la transcripción y la expresión génica. Esto se hace normalmente mediante secuenciación de nueva generación . ^[5]

Un subconjunto de los ARN secuenciados son los ARN pequeños, una clase de moléculas de ARN no codificante que son reguladores clave del silenciamiento génico transcripcional y postranscripcional, o silenciamiento de ARN . La secuenciación de próxima generación es la herramienta de referencia para el descubrimiento, la elaboración de perfiles y el análisis de expresión de ARN no codificante .

Ensayos de reporteros masivamente paralelos (MPRA)

Los ensayos de reporteros paralelos masivos son una tecnología para probar la actividad cis-reguladora de secuencias de ADN. ^[6]^[7] Los MPRA utilizan un plásmido con un elemento cis-regulador sintético aguas arriba de un promotor que impulsa un gen sintético como la proteína fluorescente verde. Una biblioteca de elementos cis-reguladores generalmente se prueba utilizando MPRA, una biblioteca puede contener de cientos a miles de elementos cis-reguladores. La actividad cis-reguladora de los elementos se analiza utilizando la actividad del reportero aguas abajo. La actividad de todos los miembros de la biblioteca se analiza en paralelo utilizando códigos de barras para cada elemento cis-regulador. Una limitación de los MPRA es que la actividad se analiza en un plásmido y puede no capturar todos los aspectos de la regulación genética observados en el genoma.

secuencia STARR

STARR-seq es una técnica similar a las MPRA para ensayar la actividad potenciadora de fragmentos genómicos cortados al azar. En la publicación original, ^[8] fragmentos cortados al azar del genoma de Drosophila se colocaron aguas abajo de un promotor mínimo. Los potenciadores candidatos entre los fragmentos cortados al azar se transcribirán a sí mismos utilizando el promotor mínimo. Al utilizar la secuenciación como lectura y controlar las cantidades de entrada de cada secuencia, se ensaya la fuerza de los potenciadores putativos mediante este método.

Perturbación-secuencia

Perturb-seq combina la inhibición de genes mediada por CRISPR con la expresión génica de una sola célula. Se utilizan modelos lineales para calcular el efecto de la inhibición de un solo gen sobre la expresión de múltiples genes.

A nivel de proteínas

Sistema de doble híbrido de levadura

Un cribado de dos híbridos de levadura (Y2H) prueba una proteína "cebo" contra muchas proteínas interactuantes potenciales ("presa") para identificar interacciones físicas proteína-proteína. Este sistema se basa en un factor de transcripción, originalmente GAL4, ^[9] cuyos dominios separados de unión al ADN y activación de la transcripción son necesarios para que la proteína cause la transcripción de un gen reportero. En un cribado Y2H, la proteína "cebo" se fusiona con el dominio de unión de GAL4, y una biblioteca de proteínas "presa" (interactuantes) potenciales se expresa de forma recombinante en un vector con el dominio de activación. La interacción in vivo de las proteínas cebo y presa en una célula de levadura acerca los dominios de activación y unión de GAL4 lo suficiente como para dar como resultado la expresión de un gen reportero . También es posible probar sistemáticamente una biblioteca de proteínas cebo contra una biblioteca de proteínas presa para identificar todas las interacciones posibles en una célula.

Maestría y maestría avanzada

La espectrometría de masas (MS) puede identificar proteínas y sus niveles relativos, por lo que se puede utilizar para estudiar la expresión de proteínas. Cuando se utiliza en combinación con la purificación por afinidad , la espectrometría de masas (AP/MS) se puede utilizar para estudiar complejos proteicos, es decir, qué proteínas interactúan entre sí en complejos y en qué proporciones. Para purificar complejos proteicos, normalmente se marca una proteína "cebo" con una proteína o péptido específico que se puede utilizar para extraer el complejo de una mezcla compleja. La purificación se realiza normalmente utilizando un anticuerpo o un compuesto que se une a la parte de fusión. A continuación, las proteínas se digieren en fragmentos de péptidos cortos y se utiliza la espectrometría de masas para identificar las proteínas en función de las proporciones masa-carga de esos fragmentos.

Escaneo mutacional profundo

En el escaneo mutacional profundo, primero se sintetiza cada posible cambio de aminoácidos en una proteína dada. ^[10] La actividad de cada una de estas variantes de proteína se analiza en paralelo utilizando códigos de barras para cada variante. ^[11] Al comparar la actividad con la proteína de tipo salvaje, se identifica el efecto de cada mutación. Si bien es posible analizar cada posible cambio de aminoácidos debido a la combinatoria, dos o más mutaciones concurrentes son difíciles de analizar. Los experimentos de escaneo mutacional profundo también se han utilizado para inferir la estructura de las proteínas y las interacciones proteína-proteína. ^[12] El escaneo mutacional profundo es un ejemplo de ensayos multiplexados de efecto de variante (MAVE), una familia de métodos que implican la mutagénesis de una proteína codificada por ADN o un elemento regulador seguido de un ensayo multiplexado para algún aspecto de la función. Los MAVE permiten la generación de "mapas de efecto de variante" que caracterizan aspectos de la función de cada posible cambio de nucleótido único en un gen o elemento funcional de interés. ^[13]

Mutagénesis y fenotipado

Una característica funcional importante de los genes es el fenotipo causado por las mutaciones. Los mutantes pueden producirse por mutaciones aleatorias o por mutagénesis dirigida, incluida la mutagénesis dirigida, la eliminación de genes completos u otras técnicas.

Knock-outs (eliminaciones de genes)

La función de los genes se puede investigar "eliminando" sistemáticamente genes uno por uno. Esto se hace mediante la eliminación o la alteración de la función (como por mutagénesis insercional ) y los organismos resultantes se examinan en busca de fenotipos que proporcionen pistas sobre la función del gen alterado. Se han producido eliminaciones para genomas completos, es decir, eliminando todos los genes de un genoma. Para los genes esenciales , esto no es posible, por lo que se utilizan otras técnicas, por ejemplo, eliminando un gen mientras se expresa el gen a partir de un plásmido , utilizando un promotor inducible, de modo que el nivel de producto génico se pueda cambiar a voluntad (y así lograr una eliminación "funcional").

Mutagénesis dirigida al sitio

La mutagénesis dirigida se utiliza para mutar bases específicas (y, por lo tanto, aminoácidos ). Esto es fundamental para investigar la función de aminoácidos específicos en una proteína, por ejemplo, en el sitio activo de una enzima .

ARNi

Los métodos de interferencia de ARN (RNAi) se pueden utilizar para silenciar o inhibir transitoriamente la expresión génica utilizando ARN bicatenario de ~20 pares de bases típicamente administrado por transfección de moléculas de ARN de interferencia cortas sintéticas de ~20 meros (siRNA) o por ARN de horquilla corta codificados por virus (shRNA). Los exámenes de RNAi, típicamente realizados en ensayos basados en cultivos celulares u organismos experimentales (como C. elegans ) se pueden utilizar para alterar sistemáticamente casi todos los genes en un genoma o subconjuntos de genes (subgenomas); las posibles funciones de los genes alterados se pueden asignar en función de los fenotipos observados .

Pantallas CRISPR

Un ejemplo de una prueba de pérdida de función CRISPR ^[14]

CRISPR-Cas9 se ha utilizado para eliminar genes de forma multiplexada en líneas celulares. Cuantificar la cantidad de ARN guía para cada gen antes y después del experimento puede indicar la presencia de genes esenciales. Si un ARN guía altera un gen esencial, provocará la pérdida de esa célula y, por lo tanto, habrá una disminución de ese ARN guía en particular después del análisis. En un experimento reciente con CRISPR-cas9 en líneas celulares de mamíferos, se encontró que alrededor de 2000 genes eran esenciales en múltiples líneas celulares. ^[15]^[16] Algunos de estos genes eran esenciales en una sola línea celular. La mayoría de los genes forman parte de complejos multiproteicos. Este enfoque se puede utilizar para identificar la letalidad sintética utilizando el trasfondo genético adecuado. CRISPRi y CRISPRa permiten realizar análisis de pérdida y ganancia de función de forma similar. CRISPRi identificó ~2100 genes esenciales en la línea celular K562. ^[17]^[18] Los análisis de deleción CRISPR también se han utilizado para identificar posibles elementos reguladores de un gen. Por ejemplo, se publicó una técnica llamada ScanDel que intentó este enfoque. Los autores eliminaron regiones fuera de un gen de interés (HPRT1 involucrado en un trastorno mendeliano) en un intento de identificar elementos reguladores de este gen. ^[19] Gassperini et al. no identificaron ningún elemento regulador distal para HPRT1 utilizando este enfoque, sin embargo, dichos enfoques se pueden extender a otros genes de interés.

Anotaciones funcionales para genes

Anotación del genoma

Los genes putativos se pueden identificar escaneando un genoma en busca de regiones que probablemente codifiquen proteínas, basándose en características como marcos de lectura abiertos largos , secuencias de iniciación de la transcripción y sitios de poliadenilación . Una secuencia identificada como un gen putativo debe confirmarse con evidencia adicional, como similitud con secuencias de ADNc o EST del mismo organismo, similitud de la secuencia de proteína predicha con proteínas conocidas, asociación con secuencias promotoras o evidencia de que mutar la secuencia produce un fenotipo observable.

Enfoque de la piedra de Rosetta

El método de la piedra de Rosetta es un método computacional para la predicción de funciones de proteínas de novo. Se basa en la hipótesis de que algunas proteínas involucradas en un proceso fisiológico determinado pueden existir como dos genes separados en un organismo y como un solo gen en otro. Los genomas se escanean en busca de secuencias que sean independientes en un organismo y que estén en un único marco de lectura abierto en otro. Si dos genes se han fusionado, se predice que tienen funciones biológicas similares que hacen que dicha corregulación sea ventajosa.

Métodos bioinformáticos para la genómica funcional

Debido a la gran cantidad de datos producidos por estas técnicas y el deseo de encontrar patrones biológicamente significativos, la bioinformática es crucial para el análisis de datos genómicos funcionales. Ejemplos de técnicas en esta clase son la agrupación de datos o el análisis de componentes principales para el aprendizaje automático no supervisado (detección de clases), así como las redes neuronales artificiales o las máquinas de vectores de soporte para el aprendizaje automático supervisado (predicción de clases, clasificación ). El análisis de enriquecimiento funcional se utiliza para determinar el grado de sobreexpresión o subexpresión (reguladores positivos o negativos en el caso de las pruebas de ARNi) de las categorías funcionales en relación con un conjunto de antecedentes. El análisis de enriquecimiento basado en ontología genética lo proporcionan DAVID y el análisis de enriquecimiento de conjuntos de genes (GSEA), ^[20] el análisis basado en vías de Ingenuity ^[21] y Pathway Studio ^[22] y el análisis basado en complejos proteicos de COMPLEAT. ^[23]

Una descripción general de un flujo de trabajo de Phydms

Se han desarrollado nuevos métodos computacionales para comprender los resultados de un experimento de escaneo mutacional profundo. 'phydms' compara el resultado de un experimento de escaneo mutacional profundo con un árbol filogenético. ^[24] Esto permite al usuario inferir si el proceso de selección en la naturaleza aplica restricciones similares a una proteína como indican los resultados del escaneo mutacional profundo. Esto puede permitir que un experimentador elija entre diferentes condiciones experimentales en función de lo bien que reflejen la naturaleza. El escaneo mutacional profundo también se ha utilizado para inferir interacciones proteína-proteína. ^[25] Los autores utilizaron un modelo termodinámico para predecir los efectos de las mutaciones en diferentes partes de un dímero. La estructura mutacional profunda también se puede utilizar para inferir la estructura de la proteína. Una epistasis positiva fuerte entre dos mutaciones en un escaneo mutacional profundo puede ser indicativa de dos partes de la proteína que están cerca una de la otra en el espacio 3-D. Esta información se puede utilizar para inferir la estructura de la proteína. Una prueba de principio de este enfoque fue mostrada por dos grupos que utilizaron la proteína GB1. ^[26]^[27]

Los resultados de los experimentos de MPRA han requerido enfoques de aprendizaje automático para interpretar los datos. Se ha utilizado un modelo SVM de k-meros con huecos para inferir los kmeros que están enriquecidos dentro de secuencias cis-reguladoras con alta actividad en comparación con secuencias con menor actividad. ^[28] Estos modelos proporcionan un alto poder predictivo. También se han utilizado enfoques de aprendizaje profundo y de bosque aleatorio para interpretar los resultados de estos experimentos de alta dimensión. ^[29] Estos modelos están comenzando a ayudar a desarrollar una mejor comprensión de la función del ADN no codificante con respecto a la regulación genética.

Proyectos de consorcio

El proyecto ENCODE

El proyecto ENCODE (Enciclopedia de elementos del ADN) es un análisis profundo del genoma humano cuyo objetivo es identificar todos los elementos funcionales del ADN genómico, tanto en las regiones codificantes como en las no codificantes. Entre los resultados importantes se incluyen pruebas de que la mayoría de los nucleótidos se transcriben como transcripciones codificantes, ARN no codificantes o transcripciones aleatorias, el descubrimiento de sitios reguladores de la transcripción adicionales y una mayor elucidación de los mecanismos de modificación de la cromatina.

El proyecto Genotipo-Expresión Tisular (GTEx)

Muestras utilizadas y eQTL descubiertos en GTEx v6

El proyecto GTEx es un proyecto de genética humana cuyo objetivo es comprender el papel de la variación genética en la conformación de la variación en el transcriptoma en los distintos tejidos. El proyecto ha recopilado una variedad de muestras de tejido (> 50 tejidos diferentes) de más de 700 donantes post mortem. Esto ha dado como resultado la recolección de > 11.000 muestras. GTEx ha ayudado a comprender la compartición de tejidos y la especificidad de los tejidos de los eQTL . ^[30] El recurso genómico se desarrolló para "enriquecer nuestra comprensión de cómo las diferencias en nuestra secuencia de ADN contribuyen a la salud y la enfermedad". ^[31]

La Alianza del Atlas de Efectos Variantes

La Atlas of Variant Effects Alliance (AVE), ^[32] fundada en 2020, es un consorcio internacional cuyo objetivo es catalogar el impacto de todas las variantes genéticas posibles para la genómica funcional relacionada con las enfermedades mediante la creación de mapas de efectos de variantes que revelen la función de cada posible cambio de nucleótido en un gen o elemento regulador. AVE está financiada en parte por el Instituto Brotman Baty de la Universidad de Washington y el Instituto Nacional de Investigación del Genoma Humano, a través de la financiación de la subvención del Centro de Excelencia en Ciencia Genómica (NHGRI RM1HG010461). ^[33]

Véase también

Referencias

^ Graur D, Zheng Y, Price N, Azevedo RB, Zufall RA, Elhaik E (20 de febrero de 2013). "Sobre la inmortalidad de los televisores: "función" en el genoma humano según el evangelio libre de evolución de ENCODE". Genome Biology and Evolution . 5 (3): 578–90. doi :10.1093/gbe/evt028. PMC 3622293 . PMID 23431001.
^ Gibson G, Muse SV. Introducción a la ciencia del genoma (3.ª ed.). Sunderland, MA: Sinauer Associates.
^ Pevsner J (2009). Bioinformática y genómica funcional (2.ª ed.). Hoboken, Nueva Jersey: Wiley-Blackwell. ISBN 9780470085851.
^ Wang H, Mayhew D, Chen X, Johnston M, Mitra RD (mayo de 2011). "Las tarjetas de visita permiten la identificación multiplexada de los objetivos genómicos de las proteínas de unión al ADN". Genome Research . 21 (5): 748–55. doi :10.1101/gr.114850.110. PMC 3083092 . PMID 21471402.
^ Hrdlickova R, Toloue M, Tian B (enero de 2017). "Métodos de ARN-Seq para el análisis del transcriptoma". Wiley Interdisciplinary Reviews: ARN . 8 (1): e1364. doi :10.1002/wrna.1364. PMC 5717752 . PMID 27198714.
^ Kwasnieski JC, Fiore C, Chaudhari HG, Cohen BA (octubre de 2014). "Pruebas funcionales de alto rendimiento de predicciones de segmentación de ENCODE". Genome Research . 24 (10): 1595–602. doi :10.1101/gr.173518.114. PMC 4199366 . PMID 25035418.
^ Patwardhan RP, Hiatt JB, Witten DM, Kim MJ, Smith RP, May D, et al. (febrero de 2012). "Disección funcional masivamente paralela de potenciadores de mamíferos in vivo". Nature Biotechnology . 30 (3): 265–70. doi :10.1038/nbt.2136. PMC 3402344 . PMID 22371081.
^ Arnold CD, Gerlach D, Stelzer C, Boryń ŁM, Rath M, Stark A (marzo de 2013). "Mapas cuantitativos de actividad potenciadora de todo el genoma identificados por STARR-seq". Science . 339 (6123): 1074–7. Bibcode :2013Sci...339.1074A. doi :10.1126/science.1232542. PMID 23328393. S2CID 54488955.
^ Fields S, Song O (julio de 1989). "Un nuevo sistema genético para detectar interacciones proteína-proteína". Nature . 340 (6230): 245–6. Bibcode :1989Natur.340..245F. doi :10.1038/340245a0. PMID 2547163. S2CID 4320733.
^ Araya C, Fowler D (29 de septiembre de 2011). "Escaneo mutacional profundo: evaluación de la función de las proteínas a gran escala". Tendencias en biotecnología . 29 (9): 435–442. doi :10.1016/j.tibtech.2011.04.003. PMC 3159719 . PMID 21561674.
^ Penn WD, McKee AG, Kuntz CP, Woods H, Nash V, Gruenhagen TC, et al. (marzo de 2020). "Sondeo de las restricciones de secuencia biofísicas dentro de los dominios transmembrana de la rodopsina mediante escaneo mutacional profundo". Sci Adv . 6 (10): eaay7505. Bibcode :2020SciA....6.7505P. doi :10.1126/sciadv.aay7505. PMC 7056298 . PMID 32181350.
^ Rollins N, Brock K, Poelwijk F, Marks D (2019). "Inferir la estructura 3D de las proteínas a partir de exploraciones de mutaciones profundas". Nature Genetics . 51 (7): 1170–1176. doi :10.1038/s41588-019-0432-9. PMC 7295002 . PMID 31209393.
^ Fowler DM, Adams DJ, Gloyn AL, Starita L (2023). "Atlas de efectos de variantes para comprender el genoma con resolución de nucleótidos". Genome Biology . 24 (1): 147. doi : 10.1186/s13059-023-02986-x . PMC 10316620 . PMID 37394429.
^ Tian S, Muneeruddin K, Choi MY, Tao L, Bhuiyan RH, Ohmi Y, et al. (27 de noviembre de 2018). "Las pruebas CRISPR de todo el genoma para toxinas Shiga y ricina revelan proteínas de Golgi críticas para la glicosilación". PLOS Biology . 16 (11). e2006951. doi : 10.1371/journal.pbio.2006951 . PMC 6258472 . PMID 30481169.
^ Hart T, Chandrashekhar M, Aregger M, Steinhart Z, Brown KR, MacLeod G, et al. (diciembre de 2015). "Las pruebas CRISPR de alta resolución revelan genes de aptitud y predisposiciones cancerígenas específicas del genotipo". Cell . 163 (6): 1515–26. doi : 10.1016/j.cell.2015.11.015 . PMID 26627737.
^ Shalem O, Sanjana NE, Hartenian E, Shi X, Scott DA, Mikkelson T, et al. (enero de 2014). "Cribado de knockout CRISPR-Cas9 a escala genómica en células humanas". Science . 343 (6166): 84–87. Bibcode :2014Sci...343...84S. doi :10.1126/science.1247005. PMC 4089965 . PMID 24336571.
^ Gilbert LA, Horlbeck MA, Adamson B, Villalta JE, Chen Y, Whitehead EH, et al. (octubre de 2014). "Control de la represión y activación génica mediado por CRISPR a escala genómica". Cell . 159 (3): 647–61. doi :10.1016/j.cell.2014.09.029. PMC 4253859 . PMID 25307932.
^ Horlbeck MA, Gilbert LA, Villalta JE, Adamson B, Pak RA, Chen Y, et al. (septiembre de 2016). "Bibliotecas de próxima generación compactas y altamente activas para la represión y activación de genes mediada por CRISPR". eLife . 5 . doi : 10.7554/eLife.19760 . PMC 5094855 . PMID 27661255.
^ Gasperini M, Findlay GM, McKenna A, Milbank JH, Lee C, Zhang MD, et al. (agosto de 2017). "Escaneo mediado por CRISPR/Cas9 para elementos reguladores necesarios para la expresión de HPRT1 a través de miles de grandes deleciones genómicas programadas". American Journal of Human Genetics . 101 (2): 192–205. doi :10.1016/j.ajhg.2017.06.010. PMC 5544381 . PMID 28712454.
^ Subramanian A, Tamayo P, Mootha VK, Mukherjee S, Ebert BL, Gillette MA, et al. (octubre de 2005). "Análisis de enriquecimiento del conjunto de genes: un enfoque basado en el conocimiento para interpretar los perfiles de expresión de todo el genoma". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 102 (43): 15545–50. Bibcode :2005PNAS..10215545S. doi : 10.1073/pnas.0506580102 . PMC 1239896 . PMID 16199517.
^ "Ingenuity Systems". Archivado desde el original el 25 de enero de 1999. Consultado el 31 de diciembre de 2007 .
^ "Ariadne Genomics: Pathway Studio". Archivado desde el original el 2007-12-30 . Consultado el 2007-12-31 .
^ Vinayagam A, Hu Y, Kulkarni M, Roesel C, Sopko R, Mohr SE, et al. (febrero de 2013). "Marco de análisis basado en complejos proteicos para conjuntos de datos de alto rendimiento". Science Signaling . 6 (264): rs5. doi :10.1126/scisignal.2003629. PMC 3756668 . PMID 23443684.
^ Hilton SK, Doud MB, Bloom JD (2017). "phydms: software para análisis filogenéticos basado en escaneo mutacional profundo". PeerJ . 5 : e3657. doi : 10.7717/peerj.3657 . PMC 5541924 . PMID 28785526.
^ Diss G, Lehner B (abril de 2018). "El paisaje genético de una interacción física". eLife . 7 . doi : 10.7554/eLife.32472 . PMC 5896888 . PMID 29638215.
^ Schmiedel JM, Lehner B (julio de 2019). "Determinación de estructuras proteínicas mediante mutagénesis profunda". Nature Genetics . 51 (7): 1177–1186. doi : 10.1038/s41588-019-0431-x . PMC 7610650 . PMID 31209395.
^ Rollins NJ, Brock KP, Poelwijk FJ, Stiffler MA, Gauthier NP, Sander C, et al. (julio de 2019). "Inferir la estructura 3D de las proteínas a partir de exploraciones de mutaciones profundas". Nature Genetics . 51 (7): 1170–1176. doi :10.1038/s41588-019-0432-9. PMC 7295002 . PMID 31209393.
^ Ghandi M, Lee D, Mohammad-Noori M, Beer MA (julio de 2014). "Predicción mejorada de secuencias reguladoras usando características de k-meros con huecos". PLOS Computational Biology . 10 (7): e1003711. Bibcode :2014PLSCB..10E3711G. doi : 10.1371/journal.pcbi.1003711 . PMC 4102394 . PMID 25033408.
^ Li Y, Shi W, Wasserman WW (mayo de 2018). "Predicción de regiones cisreguladoras en todo el genoma mediante métodos de aprendizaje profundo supervisado". BMC Bioinformatics . 19 (1): 202. doi : 10.1186/s12859-018-2187-1 . PMC 5984344 . PMID 29855387.
^ Battle A, Brown CD, Engelhardt BE, Montgomery SB, et al. (GTEx Consortium) (octubre de 2017). "Efectos genéticos en la expresión génica en tejidos humanos". Nature . 550 (7675): 204–213. Bibcode :2017Natur.550..204A. doi :10.1038/nature24277. PMC 5776756 . PMID 29022597.
^ "GTEx crea un conjunto de datos de referencia para estudiar los cambios genéticos y la expresión génica". Oficina de Coordinación Estratégica - Fondo Común . Institutos Nacionales de Salud de EE. UU. 8 de febrero de 2018. Consultado el 13 de enero de 2022 .
^ "Atlas of Variant Effects Alliance". Registro de organizaciones de investigación .
^ "Los científicos lanzan un proyecto 'hercúleo' para crear un atlas de variantes del genoma humano | Instituto Brotman Baty". brotmanbaty.org . Consultado el 5 de febrero de 2024 .

Enlaces externos

Programa de la Fundación Europea de la Ciencia sobre las fronteras de la genómica funcional
MUGEN NoE: Genómica funcional integrada en modelos de ratones mutantes
Perspectivas de la naturaleza: genómica funcional
CODIFICAR