stringtranslate.com

Genómica funcional

Exploración mutacional profunda del motivo de reconocimiento de ARN (RRM2) de una proteína de unión PolyA de levadura (Pab1)

La genómica funcional es un campo de la biología molecular que intenta describir las funciones e interacciones de los genes (y las proteínas ). La genómica funcional hace uso de la gran cantidad de datos generados por proyectos genómicos y transcriptómicos (como proyectos de secuenciación del genoma y secuenciación de ARN ). La genómica funcional se centra en los aspectos dinámicos como la transcripción de genes , la traducción , la regulación de la expresión génica y las interacciones proteína-proteína , a diferencia de los aspectos estáticos de la información genómica como la secuencia o las estructuras del ADN . Una característica clave de los estudios de genómica funcional es su enfoque de todo el genoma para estas cuestiones, que generalmente implica métodos de alto rendimiento en lugar de un enfoque más tradicional de "gen candidato".

Definición y objetivos

Para comprender la genómica funcional es importante definir primero la función. En su artículo [1] Graur et al. Defina la función de dos maneras posibles. Se trata de "efecto seleccionado" y "papel causal". La función "efecto seleccionado" se refiere a la función para la cual se selecciona un rasgo (ADN, ARN, proteína, etc.). La función "rol causal" se refiere a la función para la que un rasgo es suficiente y necesario. La genómica funcional suele poner a prueba la definición de función como "rol causal".

El objetivo de la genómica funcional es comprender la función de los genes o proteínas y, en última instancia, de todos los componentes de un genoma. El término genómica funcional se utiliza a menudo para referirse a los numerosos enfoques técnicos para estudiar los genes y proteínas de un organismo, incluidas las "propiedades bioquímicas, celulares y/o fisiológicas de todos y cada uno de los productos genéticos" [2] , mientras que algunos autores incluyen el estudio de elementos no genéticos en su definición. [3] La genómica funcional también puede incluir estudios de la variación genética natural a lo largo del tiempo (como el desarrollo de un organismo) o el espacio (como las regiones del cuerpo), así como alteraciones funcionales como las mutaciones.

La promesa de la genómica funcional es generar y sintetizar conocimiento genómico y proteómico para comprender las propiedades dinámicas de un organismo. Potencialmente, esto podría proporcionar una imagen más completa de cómo el genoma especifica la función en comparación con los estudios de genes individuales. La integración de datos de genómica funcional suele ser parte de los enfoques de biología de sistemas .

Técnicas y aplicaciones

La genómica funcional incluye aspectos relacionados con la función del propio genoma, como la mutación y el polimorfismo (como el análisis del polimorfismo de un solo nucleótido (SNP), así como la medición de actividades moleculares. Estos últimos comprenden una serie de " ómicas ", como la transcriptómica ( expresión genética ), la proteómica ( producción de proteínas ) y la metabolómica . La genómica funcional utiliza principalmente técnicas multiplex para medir la abundancia de muchos o todos los productos genéticos, como ARNm o proteínas, dentro de una muestra biológica . Un enfoque de genómica funcional más centrado podría probar la función de todas las variantes de un gen y cuantificar los efectos de los mutantes mediante el uso de la secuenciación como lectura de la actividad. Juntas, estas modalidades de medición intentan cuantificar los diversos procesos biológicos y mejorar nuestra comprensión de las funciones e interacciones de genes y proteínas.

A nivel de ADN

Mapeo de interacciones genéticas.

La eliminación sistemática de genes por pares o la inhibición de la expresión genética se puede utilizar para identificar genes con funciones relacionadas, incluso si no interactúan físicamente. Epistasis se refiere al hecho de que los efectos de dos genes knockout diferentes pueden no ser aditivos; es decir, el fenotipo que resulta cuando se inhiben dos genes puede ser diferente de la suma de los efectos de las inhibiciones individuales.

Interacciones ADN/Proteína

Las proteínas formadas por la traducción del ARNm (ARN mensajero, una información codificada del ADN para la síntesis de proteínas) desempeñan un papel importante en la regulación de la expresión genética. Para comprender cómo regulan la expresión genética es necesario identificar las secuencias de ADN con las que interactúan. Se han desarrollado técnicas para identificar sitios de interacciones ADN-proteína. Estos incluyen secuenciación ChIP , secuenciación CUT&RUN y tarjetas telefónicas. [4]

Ensayos de accesibilidad al ADN.

Se han desarrollado ensayos para identificar regiones del genoma que son accesibles. Estas regiones de cromatina accesible son regiones reguladoras candidatas. Estos ensayos incluyen ATAC-seq , DNase-Seq y FAIRE-Seq .

A nivel de ARN

Microarrays

Un microarray de ADN

Los microarrays miden la cantidad de ARNm en una muestra que corresponde a un gen determinado o a una secuencia de ADN sonda. Las secuencias de sonda se inmovilizan sobre una superficie sólida y se les permite hibridar con ARNm "objetivo" marcado fluorescentemente. La intensidad de la fluorescencia de una mancha es proporcional a la cantidad de secuencia diana que se ha hibridado con esa mancha y, por tanto, a la abundancia de esa secuencia de ARNm en la muestra. Los microarrays permiten la identificación de genes candidatos involucrados en un proceso determinado basándose en la variación entre niveles de transcripción para diferentes condiciones y patrones de expresión compartidos con genes de función conocida.

SABIO

El análisis en serie de la expresión genética (SAGE) es un método alternativo de análisis basado en la secuenciación de ARN en lugar de la hibridación. SAGE se basa en la secuenciación de etiquetas de 10 a 17 pares de bases que son únicas para cada gen. Estas etiquetas se producen a partir de ARNm poli-A y se ligan de extremo a extremo antes de la secuenciación. SAGE proporciona una medición imparcial del número de transcripciones por célula, ya que no depende del conocimiento previo de qué transcripciones estudiar (como lo hacen los microarrays).

secuenciación de ARN

La secuenciación de ARN se ha apoderado de la tecnología de microarrays y SAGE en los últimos años, como se señaló en 2016, y se ha convertido en la forma más eficiente de estudiar la transcripción y la expresión genética. Esto normalmente se hace mediante secuenciación de próxima generación . [5]

Un subconjunto de ARN secuenciados son los ARN pequeños, una clase de moléculas de ARN no codificantes que son reguladores clave del silenciamiento de genes transcripcional y postranscripcional, o silenciamiento de ARN . La secuenciación de próxima generación es la herramienta estándar de oro para el descubrimiento, la elaboración de perfiles y el análisis de expresión de ARN no codificante .

Ensayos de reporteros masivamente paralelos (MPRA)

Los ensayos de reporteros masivamente paralelos son una tecnología para probar la actividad reguladora en cis de secuencias de ADN. [6] [7] Los MPRA utilizan un plásmido con un elemento regulador cis sintético aguas arriba de un promotor que impulsa un gen sintético como la proteína fluorescente verde. Una biblioteca de elementos reguladores cis generalmente se prueba utilizando MPRA; una biblioteca puede contener de cientos a miles de elementos reguladores cis. La actividad reguladora en cis de los elementos se analiza utilizando la actividad informadora aguas abajo. La actividad de todos los miembros de la biblioteca se analiza en paralelo utilizando códigos de barras para cada elemento regulador cis. Una limitación de los MPRA es que la actividad se analiza en un plásmido y es posible que no capture todos los aspectos de la regulación genética observados en el genoma.

STARR-seq

STARR-seq es una técnica similar a las MPRA para analizar la actividad potenciadora de fragmentos genómicos cortados aleatoriamente. En la publicación original, [8] fragmentos cortados aleatoriamente del genoma de Drosophila se colocaron aguas abajo de un promotor mínimo. Los potenciadores candidatos entre los fragmentos cortados aleatoriamente se transcribirán utilizando el promotor mínimo. Al utilizar la secuenciación como lectura y controlar las cantidades de entrada de cada secuencia, se analiza mediante este método la fuerza de los potenciadores putativos.

Perturb-seq

Descripción general del flujo de trabajo de Perturb-seq

Perturb-seq combina la eliminación de genes mediada por CRISPR con la expresión de genes unicelulares. Se utilizan modelos lineales para calcular el efecto de la desactivación de un solo gen en la expresión de múltiples genes.

A nivel proteico

Sistema de dos híbridos de levadura

Un cribado de dos híbridos de levadura (Y2H) prueba una proteína "cebo" frente a muchas proteínas potenciales que interactúan ("presa") para identificar interacciones físicas entre proteínas. Este sistema se basa en un factor de transcripción, originalmente GAL4, [9] cuyos dominios separados de activación de la transcripción y de unión al ADN son necesarios para que la proteína provoque la transcripción de un gen informador. En un cribado Y2H, la proteína "cebo" se fusiona con el dominio de unión de GAL4 y una biblioteca de proteínas "presa" potenciales (que interactúan) se expresa de forma recombinante en un vector con el dominio de activación. La interacción in vivo de proteínas de cebo y presa en una célula de levadura acerca los dominios de activación y unión de GAL4 lo suficientemente cerca como para dar como resultado la expresión de un gen informador . También es posible probar sistemáticamente una biblioteca de proteínas cebo frente a una biblioteca de proteínas presa para identificar todas las posibles interacciones en una célula.

MS y AP/MS

La espectrometría de masas (MS) puede identificar proteínas y sus niveles relativos, por lo que puede utilizarse para estudiar la expresión de proteínas. Cuando se usa en combinación con purificación por afinidad , la espectrometría de masas (AP/MS) se puede usar para estudiar complejos de proteínas, es decir, qué proteínas interactúan entre sí en complejos y en qué proporciones. Para purificar complejos de proteínas, normalmente se etiqueta una proteína "cebo" con una proteína o péptido específico que se puede utilizar para extraer el complejo de una mezcla compleja. La purificación suele realizarse utilizando un anticuerpo o un compuesto que se une a la parte de fusión. Luego, las proteínas se digieren en fragmentos peptídicos cortos y se utiliza espectrometría de masas para identificar las proteínas en función de las relaciones masa-carga de esos fragmentos.

Exploración mutacional profunda

En la exploración mutacional profunda, primero se sintetiza cada posible cambio de aminoácido en una proteína determinada. La actividad de cada una de estas variantes de proteínas se analiza en paralelo utilizando códigos de barras para cada variante. [10] Al comparar la actividad con la proteína de tipo salvaje, se identifica el efecto de cada mutación. Si bien es posible analizar cada posible cambio de aminoácido debido a la combinatoria, es difícil probar dos o más mutaciones concurrentes. También se han utilizado experimentos de exploración mutacional profunda para inferir la estructura de las proteínas y las interacciones entre proteínas.

Mutagénesis y fenotipado.

Una característica funcional importante de los genes es el fenotipo causado por mutaciones. Los mutantes pueden producirse mediante mutaciones aleatorias o mediante mutagénesis dirigida, incluida la mutagénesis dirigida al sitio, la eliminación de genes completos u otras técnicas.

Knock-outs (deleciones de genes)

La función de los genes se puede investigar "eliminando" genes uno por uno de forma sistemática. Esto se hace mediante deleción o alteración de la función (como por mutagénesis por inserción ) y los organismos resultantes se analizan en busca de fenotipos que proporcionen pistas sobre la función del gen alterado. Se han producido knock-outs para genomas completos, es decir, eliminando todos los genes de un genoma. Para los genes esenciales , esto no es posible, por lo que se utilizan otras técnicas, por ejemplo, eliminar un gen mientras se expresa el gen a partir de un plásmido , utilizando un promotor inducible, de modo que el nivel del producto genético pueda cambiarse a voluntad (y, por lo tanto, un "funcional"). "eliminación lograda).

Mutagénesis dirigida al sitio

La mutagénesis dirigida al sitio se utiliza para mutar bases específicas (y por tanto aminoácidos ). Esto es fundamental para investigar la función de aminoácidos específicos en una proteína, por ejemplo, en el sitio activo de una enzima .

ARNi

Los métodos de interferencia de ARN (ARNi) se pueden utilizar para silenciar o anular transitoriamente la expresión génica utilizando ARN bicatenario de aproximadamente 20 pares de bases que normalmente se administra mediante la transfección de moléculas sintéticas de ARN de interferencia corta (ARNip) de aproximadamente 20 unidades o mediante ARN cortas codificadas viralmente. ARN en horquilla (shRNA). Los análisis de ARNi, que normalmente se realizan en ensayos basados ​​en cultivos celulares u organismos experimentales (como C. elegans ), se pueden utilizar para alterar sistemáticamente casi todos los genes de un genoma o subconjuntos de genes (subgenomas); Se pueden asignar posibles funciones de genes alterados en función de los fenotipos observados .

Pantallas CRISPR

Un ejemplo de una pantalla de pérdida de función CRISPR [11]

CRISPR-Cas9 se ha utilizado para eliminar genes de forma multiplexada en líneas celulares. Cuantificar la cantidad de ARN guía para cada gen antes y después del experimento puede apuntar hacia genes esenciales. Si un ARN guía altera un gen esencial, provocará la pérdida de esa célula y, por lo tanto, habrá un agotamiento de ese ARN guía en particular después de la prueba. En un reciente experimento CRISPR-cas9 en líneas celulares de mamíferos, se descubrió que alrededor de 2.000 genes eran esenciales en múltiples líneas celulares. [12] [13] Algunos de estos genes eran esenciales en una sola línea celular. La mayoría de los genes forman parte de complejos multiproteicos. Este enfoque se puede utilizar para identificar la letalidad sintética utilizando los antecedentes genéticos apropiados. CRISPRi y CRISPRa permiten pantallas de pérdida de función y ganancia de función de manera similar. CRISPRi identificó ~2100 genes esenciales en la línea celular K562. [14] [15] Las pruebas de deleción CRISPR también se han utilizado para identificar posibles elementos reguladores de un gen. Por ejemplo, se publicó una técnica llamada ScanDel que intentó este enfoque. Los autores eliminaron regiones fuera de un gen de interés (HPRT1 implicado en un trastorno mendeliano) en un intento de identificar elementos reguladores de este gen. [16] Gassperini y cols. no identificó ningún elemento regulador distal para HPRT1 utilizando este enfoque; sin embargo, dichos enfoques pueden extenderse a otros genes de interés.

Anotaciones funcionales para genes.

Anotación del genoma

Los genes putativos se pueden identificar escaneando un genoma en busca de regiones que probablemente codifiquen proteínas, en función de características como marcos de lectura abiertos largos , secuencias de iniciación transcripcional y sitios de poliadenilación . Una secuencia identificada como un gen putativo debe ser confirmada por evidencia adicional, como similitud con secuencias de ADNc o EST del mismo organismo, similitud de la secuencia de proteína predicha con proteínas conocidas, asociación con secuencias promotoras o evidencia de que la mutación de la secuencia produce un fenotipo observable.

Enfoque de piedra de Rosetta

El enfoque de la piedra de Rosetta es un método computacional para la predicción de novo de la función de proteínas. Se basa en la hipótesis de que algunas proteínas implicadas en un proceso fisiológico determinado pueden existir como dos genes separados en un organismo y como un solo gen en otro. Los genomas se escanean en busca de secuencias que sean independientes en un organismo y en un único marco de lectura abierto en otro. Si dos genes se han fusionado, se predice que tendrán funciones biológicas similares que hacen que dicha corregulación sea ventajosa.

Métodos bioinformáticos para genómica funcional.

Debido a la gran cantidad de datos producidos por estas técnicas y al deseo de encontrar patrones biológicamente significativos, la bioinformática es crucial para el análisis de datos genómicos funcionales. Ejemplos de técnicas de esta clase son la agrupación de datos o el análisis de componentes principales para el aprendizaje automático no supervisado (detección de clases), así como las redes neuronales artificiales o máquinas de vectores de soporte para el aprendizaje automático supervisado (predicción de clases, clasificación ). El análisis de enriquecimiento funcional se utiliza para determinar el grado de sobreexpresión o subexpresión (reguladores positivos o negativos en el caso de pantallas de ARNi) de categorías funcionales en relación con conjuntos de fondo. DAVID proporciona análisis de enriquecimiento basados ​​en ontología genética y análisis de enriquecimiento de conjuntos de genes (GSEA), [17] análisis basado en vías de Ingenuity [18] y Pathway Studio [19] y análisis basado en complejos de proteínas de COMPLEAT. [20]

Una descripción general de un flujo de trabajo de phydms

Se han desarrollado nuevos métodos computacionales para comprender los resultados de un experimento de exploración mutacional profunda. 'phydms' compara el resultado de un experimento de exploración mutacional profunda con un árbol filogenético. [21] Esto permite al usuario inferir si el proceso de selección en la naturaleza aplica restricciones similares a una proteína como lo indican los resultados del escaneo mutacional profundo. Esto puede permitir al experimentador elegir entre diferentes condiciones experimentales en función de qué tan bien reflejan la naturaleza. También se ha utilizado la exploración mutacional profunda para inferir interacciones proteína-proteína. [22] Los autores utilizaron un modelo termodinámico para predecir los efectos de las mutaciones en diferentes partes de un dímero. La estructura mutacional profunda también se puede utilizar para inferir la estructura de las proteínas. Una fuerte epistasis positiva entre dos mutaciones en una exploración mutacional profunda puede ser indicativa de dos partes de la proteína que están cercanas entre sí en el espacio tridimensional. Esta información luego se puede utilizar para inferir la estructura de las proteínas. Dos grupos demostraron una prueba de principio de este enfoque utilizando la proteína GB1. [23] [24]

Los resultados de los experimentos MPRA han requerido enfoques de aprendizaje automático para interpretar los datos. Se ha utilizado un modelo SVM de k-mer con espacios para inferir los kmers que están enriquecidos dentro de secuencias reguladoras en cis con alta actividad en comparación con secuencias con menor actividad. [25] Estos modelos proporcionan un alto poder predictivo. También se han utilizado enfoques de aprendizaje profundo y bosque aleatorio para interpretar los resultados de estos experimentos de alta dimensión. [26] Estos modelos están comenzando a ayudar a desarrollar una mejor comprensión de la función del ADN no codificante hacia la regulación genética.

Proyectos de consorcio

El proyecto CODIFICAR

El proyecto ENCODE (Encyclopedia of DNA elements) es un análisis en profundidad del genoma humano cuyo objetivo es identificar todos los elementos funcionales del ADN genómico, tanto en regiones codificantes como no codificantes. Los resultados importantes incluyen evidencia de matrices de mosaicos genómicos de que la mayoría de los nucleótidos se transcriben como transcripciones codificantes, ARN no codificantes o transcripciones aleatorias, el descubrimiento de sitios reguladores transcripcionales adicionales y una mayor aclaración de los mecanismos de modificación de la cromatina.

El proyecto Genotipo-Expresión Tisular (GTEx)

Muestras utilizadas y eQTL descubiertos en GTEx v6

El proyecto GTEx es un proyecto de genética humana cuyo objetivo es comprender el papel de la variación genética en la configuración de la variación del transcriptoma en los tejidos. El proyecto ha recolectado una variedad de muestras de tejido (> 50 tejidos diferentes) de más de 700 donantes post-mortem. Esto ha resultado en la recolección de más de 11.000 muestras. GTEx ha ayudado a comprender el intercambio de tejidos y la especificidad de los tejidos de los eQTL . [27] El recurso genómico se desarrolló para "enriquecer nuestra comprensión de cómo las diferencias en nuestra secuencia de ADN contribuyen a la salud y la enfermedad". [28]

Ver también

Referencias

  1. ^ Graur D, Zheng Y, Price N, Azevedo RB, Zufall RA, Elhaik E (20 de febrero de 2013). "Sobre la inmortalidad de los televisores:" función "en el genoma humano según el evangelio libre de evolución de ENCODE". Biología y evolución del genoma . 5 (3): 578–90. doi : 10.1093/gbe/evt028. PMC  3622293 . PMID  23431001.
  2. ^ Gibson G, Muse SV. Una introducción a la ciencia del genoma (3ª ed.). Sunderland, MA: Sinauer Associates.
  3. ^ Pevsner J (2009). Bioinformática y genómica funcional (2ª ed.). Hoboken, Nueva Jersey: Wiley-Blackwell. ISBN 9780470085851.
  4. ^ Wang H, Mayhew D, Chen X, Johnston M, Mitra RD (mayo de 2011). "Las tarjetas telefónicas permiten la identificación multiplexada de los objetivos genómicos de las proteínas de unión al ADN". Investigación del genoma . 21 (5): 748–55. doi :10.1101/gr.114850.110. PMC 3083092 . PMID  21471402. 
  5. ^ Hrdlickova R, Toloue M, Tian B (enero de 2017). "Métodos RNA-Seq para el análisis del transcriptoma". Revisiones interdisciplinarias de Wiley: ARN . 8 (1): e1364. doi :10.1002/wrna.1364. PMC 5717752 . PMID  27198714. 
  6. ^ Kwasnieski JC, Fiore C, Chaudhari HG, Cohen BA (octubre de 2014). "Pruebas funcionales de alto rendimiento de predicciones de segmentación ENCODE". Investigación del genoma . 24 (10): 1595–602. doi :10.1101/gr.173518.114. PMC 4199366 . PMID  25035418. 
  7. ^ Patwardhan RP, Hiatt JB, Witten DM, Kim MJ, Smith RP, May D, et al. (febrero de 2012). "Disección funcional masivamente paralela de potenciadores de mamíferos in vivo". Biotecnología de la Naturaleza . 30 (3): 265–70. doi :10.1038/nbt.2136. PMC 3402344 . PMID  22371081. 
  8. ^ Arnold CD, Gerlach D, Stelzer C, Boryń ŁM, Rath M, Stark A (marzo de 2013). "Mapas de actividad potenciadora cuantitativa de todo el genoma identificados por STARR-seq". Ciencia . 339 (6123): 1074–7. Código Bib : 2013 Ciencia... 339.1074A. doi : 10.1126/ciencia.1232542. PMID  23328393. S2CID  54488955.
  9. ^ Fields S, Song O (julio de 1989). "Un novedoso sistema genético para detectar interacciones proteína-proteína". Naturaleza . 340 (6230): 245–6. Código Bib :1989Natur.340..245F. doi :10.1038/340245a0. PMID  2547163. S2CID  4320733.
  10. ^ Penn WD, McKee AG, Kuntz CP, Woods H, Nash V, Gruenhagen TC y otros. (Marzo de 2020). "Sondeo de las limitaciones de la secuencia biofísica dentro de los dominios transmembrana de la rodopsina mediante exploración mutacional profunda". Ciencia avanzada . 6 (10): fácil7505. doi :10.1126/sciadv.aay7505. PMC 7056298 . PMID  32181350. 
  11. ^ Tian S, Muneeruddin K, Choi MY, Tao L, Bhuiyan RH, Ohmi Y, et al. (27 de noviembre de 2018). "Las pruebas CRISPR de todo el genoma para detectar toxinas Shiga y ricina revelan proteínas de Golgi fundamentales para la glicosilación". Más biología . 16 (11). e2006951. doi : 10.1371/journal.pbio.2006951 . PMC 6258472 . PMID  30481169. 
  12. ^ Hart T, Chandrashekhar M, Aregger M, Steinhart Z, Brown KR, MacLeod G, et al. (Diciembre de 2015). "Las pantallas CRISPR de alta resolución revelan genes de aptitud y responsabilidades cancerosas específicas del genotipo". Celúla . 163 (6): 1515–26. doi : 10.1016/j.cell.2015.11.015 . PMID  26627737.
  13. ^ Shalem O, Sanjana NE, Hartenian E, Shi X, Scott DA, Mikkelson T, et al. (Enero 2014). "Detección de eliminación de CRISPR-Cas9 a escala del genoma en células humanas". Ciencia . 343 (6166): 84–87. Código Bib : 2014 Ciencia... 343... 84S. doi : 10.1126/ciencia.1247005. PMC 4089965 . PMID  24336571. 
  14. ^ Gilbert LA, Horlbeck MA, Adamson B, Villalta JE, Chen Y, Whitehead EH, et al. (octubre de 2014). "Control de la represión y activación de genes mediado por CRISPR a escala del genoma". Celúla . 159 (3): 647–61. doi :10.1016/j.cell.2014.09.029. PMC 4253859 . PMID  25307932. 
  15. ^ Horlbeck MA, Gilbert LA, Villalta JE, Adamson B, Pak RA, Chen Y, et al. (septiembre de 2016). "Bibliotecas de próxima generación compactas y altamente activas para la represión y activación de genes mediadas por CRISPR". eVida . 5 . doi : 10.7554/eLife.19760 . PMC 5094855 . PMID  27661255. 
  16. ^ Gasperini M, Findlay GM, McKenna A, Milbank JH, Lee C, Zhang MD y col. (Agosto de 2017). "Escaneo mediado por CRISPR/Cas9 en busca de elementos reguladores necesarios para la expresión de HPRT1 a través de miles de deleciones genómicas programadas de gran tamaño". Revista Estadounidense de Genética Humana . 101 (2): 192-205. doi :10.1016/j.ajhg.2017.06.010. PMC 5544381 . PMID  28712454. 
  17. ^ Subramanian A, Tamayo P, Mootha VK, Mukherjee S, Ebert BL, Gillette MA, et al. (octubre de 2005). "Análisis de enriquecimiento de conjuntos de genes: un enfoque basado en el conocimiento para interpretar perfiles de expresión de todo el genoma". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 102 (43): 15545–50. Código Bib : 2005PNAS..10215545S. doi : 10.1073/pnas.0506580102 . PMC 1239896 . PMID  16199517. 
  18. ^ "Sistemas de ingenio". Archivado desde el original el 25 de enero de 1999 . Consultado el 31 de diciembre de 2007 .
  19. ^ "Ariadne Genomics: Pathway Studio". Archivado desde el original el 30 de diciembre de 2007 . Consultado el 31 de diciembre de 2007 .
  20. ^ Vinayagam A, Hu Y, Kulkarni M, Roesel C, Sopko R, Mohr SE y col. (Febrero de 2013). "Marco de análisis basado en complejos de proteínas para conjuntos de datos de alto rendimiento". Señalización científica . 6 (264): rs5. doi :10.1126/scisignal.2003629. PMC 3756668 . PMID  23443684. 
  21. ^ Hilton SK, Doud MB, Bloom JD (2017). "phydms: software para análisis filogenéticos informados por escaneo mutacional profundo". PeerJ . 5 : e3657. doi : 10.7717/peerj.3657 . PMC 5541924 . PMID  28785526. 
  22. ^ Diss G, Lehner B (abril de 2018). "El panorama genético de una interacción física". eVida . 7 . doi : 10.7554/eLife.32472 . PMC 5896888 . PMID  29638215. 
  23. ^ Schmiedel JM, Lehner B (julio de 2019). "Determinación de estructuras proteicas mediante mutagénesis profunda". Genética de la Naturaleza . 51 (7): 1177–1186. doi : 10.1038/s41588-019-0431-x . PMC 7610650 . PMID  31209395. 
  24. ^ Rollins Nueva Jersey, Brock KP, Poelwijk FJ, Stiffler MA, Gauthier NP, Sander C, et al. (julio de 2019). "Inferir la estructura 3D de la proteína a partir de exploraciones de mutaciones profundas". Genética de la Naturaleza . 51 (7): 1170-1176. doi :10.1038/s41588-019-0432-9. PMC 7295002 . PMID  31209393. 
  25. ^ Ghandi M, Lee D, Mohammad-Noori M, Beer MA (July 2014). "Enhanced regulatory sequence prediction using gapped k-mer features". PLOS Computational Biology. 10 (7): e1003711. Bibcode:2014PLSCB..10E3711G. doi:10.1371/journal.pcbi.1003711. PMC 4102394. PMID 25033408.
  26. ^ Li Y, Shi W, Wasserman WW (May 2018). "Genome-wide prediction of cis-regulatory regions using supervised deep learning methods". BMC Bioinformatics. 19 (1): 202. doi:10.1186/s12859-018-2187-1. PMC 5984344. PMID 29855387.
  27. ^ Battle A, Brown CD, Engelhardt BE, Montgomery SB, et al. (GTEx Consortium) (October 2017). "Genetic effects on gene expression across human tissues". Nature. 550 (7675): 204–213. Bibcode:2017Natur.550..204A. doi:10.1038/nature24277. PMC 5776756. PMID 29022597.
  28. ^ "GTEx Creates a Reference Data Set to Study Genetic Changes and Gene Expression". Office of Strategic Coordination - The Common Fund. U.S. National Institutes of Health. 8 February 2018. Retrieved 2022-01-13.

External links