Se considera que un gen podría estar involucrado en una enfermedad
El enfoque de los genes candidatos para realizar estudios de asociación genética se centra en las asociaciones entre la variación genética dentro de genes de interés preespecificados y los fenotipos o estados patológicos. Esto contrasta con los estudios de asociación de todo el genoma (GWAS), que es un enfoque sin hipótesis que escanea todo el genoma en busca de asociaciones entre variantes genéticas comunes (normalmente SNP ) y rasgos de interés. Los genes candidatos se seleccionan con mayor frecuencia para su estudio basándose en un conocimiento a priori del impacto funcional biológico del gen en el rasgo o la enfermedad en cuestión. [1] [2] La razón detrás de centrarse en la variación alélica en regiones específicas y biológicamente relevantes del genoma es que ciertos alelos dentro de un gen pueden afectar directamente la función del gen en cuestión y conducir a una variación en el fenotipo o estado patológico que se investiga. Este enfoque a menudo utiliza el diseño de estudio de casos y controles para intentar responder a la pregunta: "¿Se observa un alelo de un gen candidato con mayor frecuencia en sujetos con la enfermedad que en sujetos sin la enfermedad?" [1] Los genes candidatos que se supone que están asociados con rasgos complejos generalmente no han sido replicados por GWAS posteriores [3] [4] [5] [6] o intentos de replicación de alta potencia. [7] [8] El fracaso de los estudios de genes candidatos para arrojar luz sobre los genes específicos subyacentes a tales rasgos se ha atribuido a un poder estadístico insuficiente , una baja probabilidad previa de que los científicos puedan adivinar correctamente un alelo específico dentro de un gen específico que está relacionado con un rasgo, malas prácticas metodológicas y dragado de datos . [9] [6] [10]
Selección
Los genes candidatos adecuados se seleccionan generalmente en función de su relevancia biológica, fisiológica o funcional conocida para la enfermedad en cuestión. Este enfoque está limitado por su dependencia del conocimiento existente sobre la biología conocida o teórica de la enfermedad. Sin embargo, las herramientas moleculares están permitiendo comprender los mecanismos de la enfermedad y señalar regiones potenciales de interés en el genoma. Los estudios de asociación de todo el genoma (GWAS) y el mapeo de locus de rasgos cuantitativos (QTL) examinan la variación común en todo el genoma y, como tal, pueden detectar una nueva región de interés que se encuentra en un gen candidato potencial o cerca de él. Los datos de microarrays permiten a los investigadores examinar la expresión genética diferencial entre casos y controles, y pueden ayudar a señalar nuevos genes potenciales de interés. [11]
La gran variabilidad entre organismos puede dificultar a veces la distinción entre la variación normal en polimorfismos de un solo nucleótido (SNP) y un gen candidato con variación asociada a una enfermedad. [12] Al analizar grandes cantidades de datos, hay otros factores que pueden ayudar a determinar la variante más probable. Estos factores incluyen las prioridades en los SNP, el riesgo relativo de cambio funcional en los genes y el desequilibrio de ligamiento entre los SNP. [13]
Además, la disponibilidad de información genética a través de bases de datos en línea permite a los investigadores extraer datos existentes y recursos basados en la web para encontrar nuevos objetivos genéticos candidatos. [14] Hay muchas bases de datos en línea disponibles para investigar genes de distintas especies.
- Gene es una de esas bases de datos que permite acceder a información sobre fenotipos, vías y variaciones de muchos genes en distintas especies.
- Al examinar la funcionalidad entre genes en vías, el Consorcio de Ontología Genética puede ayudar a mapear estas relaciones. El Proyecto GO describe los productos genéticos de tres maneras diferentes, de manera independiente de la especie: procesos biológicos, componentes celulares y funciones moleculares. El uso de esta información puede mejorar el conocimiento a priori de una vía y, por lo tanto, ayudar a elegir el gen candidato más probable.
- Topp Gene es otra base de datos útil que permite a los usuarios priorizar genes candidatos utilizando anotaciones funcionales o análisis de red. [15] ToppGene ayuda a los investigadores a seleccionar un subconjunto de posibles genes candidatos a partir de conjuntos más grandes de genes candidatos, probablemente descubiertos a través de tecnologías genómicas de alto rendimiento.
- Lynx es una plataforma de biología de sistemas integrada que permite a los usuarios priorizar genes candidatos utilizando tanto anotaciones funcionales como redes de asociación de pares de genes. [16] Lynx proporciona dos herramientas de priorización sofisticadas, Cheetoh [17] y PINTA, [18] para ayudar a los usuarios a seleccionar genes candidatos de todo el genoma en función de la relevancia para la lista de genes de entrada, que puede ser una lista de genes conocidos que contribuyen a cierta enfermedad o fenotipo, o un gen expresado de manera diferencial a partir de la tecnología de secuenciación de ARN de próxima generación .
Antes del enfoque del gen candidato
Antes de que se desarrollara por completo el enfoque del gen candidato, se utilizaban otros métodos para identificar genes vinculados a estados patológicos. Estos métodos estudiaban el ligamiento genético y la clonación posicional mediante el uso de un cribado genético , y eran eficaces para identificar genes de riesgo relativo en enfermedades mendelianas . [13] [19] Sin embargo, estos métodos no son tan beneficiosos cuando se estudian enfermedades complejas por varias razones: [13]
- Las enfermedades complejas tienden a variar tanto en la edad de aparición como en la gravedad. Esto puede deberse a la variación en la penetrancia y la expresividad . [20] En la mayoría de las enfermedades humanas, la expresividad variable del fenotipo de la enfermedad es la norma. Esto hace que sea más difícil elegir un grupo de edad específico o un marcador fenotípico para su estudio. [13]
- Los orígenes de las enfermedades complejas involucran muchas vías biológicas, algunas de las cuales pueden diferir entre los fenotipos de la enfermedad. [13]
- Lo más importante es que las enfermedades complejas suelen ilustrar la heterogeneidad genética: se pueden encontrar múltiples genes que interactúan y producen un estado patológico. A menudo, cada gen individual es parcialmente responsable del fenotipo producido y del riesgo general de padecer el trastorno. [13] [21]
Críticas
Un estudio de genes candidatos busca equilibrar el uso de los datos y, al mismo tiempo, intentar minimizar la posibilidad de crear resultados falsos positivos o negativos. [13] Debido a que este equilibrio a menudo puede ser difícil, existen varias críticas al enfoque de genes candidatos que es importante comprender antes de comenzar un estudio de este tipo. Por ejemplo, se ha demostrado que el enfoque de genes candidatos produce una alta tasa de falsos positivos, [22] lo que requiere que los hallazgos de asociaciones genéticas individuales se traten con gran cautela. [23]
Una crítica es que los hallazgos de asociación dentro de los estudios de genes candidatos no se han replicado fácilmente en estudios de seguimiento. [24] Por ejemplo, una investigación reciente sobre 18 genes candidatos bien estudiados para la depresión (10 publicaciones o más cada uno) no logró identificar ninguna asociación significativa con la depresión, a pesar de utilizar muestras órdenes de magnitud más grandes que las de las publicaciones originales. [25] Además de los problemas estadísticos (por ejemplo, estudios con poca potencia), a menudo se ha culpado a la estratificación de la población por esta inconsistencia; por lo tanto, también se debe tener cuidado con respecto a qué criterios definen un cierto fenotipo, así como otras variaciones en el estudio de diseño. [13]
Además, como estos estudios incorporan conocimientos a priori , algunos críticos sostienen que nuestro conocimiento no es suficiente para hacer predicciones válidas. Por lo tanto, los resultados obtenidos con estos enfoques "basados en hipótesis" dependen de la capacidad de seleccionar candidatos plausibles del genoma, en lugar de utilizar un enfoque sin hipótesis.
Uso en estudios de investigación
Uno de los primeros éxitos con el enfoque del gen candidato fue encontrar una mutación de una sola base en la región no codificante del APOC3 (gen de la apolipoproteína C3) que se asociaba con mayores riesgos de hipertrigliceridemia y aterosclerosis . [26] En un estudio de Kim et al., se descubrieron genes vinculados al rasgo de obesidad tanto en cerdos como en humanos utilizando genómica comparativa y heredabilidad cromosómica. [27] Al utilizar estos dos métodos, los investigadores pudieron superar la crítica de que los estudios de genes candidatos se centran únicamente en el conocimiento previo. La genómica comparativa se completó examinando los loci de rasgos cuantitativos humanos y porcinos a través de un método conocido como análisis de rasgos complejos de todo el genoma (GCTA), que permitió a los investigadores mapear la varianza genética a cromosomas específicos. Esto permitió que el parámetro de heredabilidad proporcionara comprensión de dónde estaba la variación fenotípica en regiones cromosómicas específicas, extendiéndose así a los marcadores y genes candidatos dentro de estas regiones. Otros estudios también pueden utilizar métodos computacionales para encontrar genes candidatos de una manera generalizada y complementaria, como un estudio de Tiffin et al. que estudió los genes vinculados a la diabetes tipo 2. [12]
Muchos estudios han utilizado de forma similar genes candidatos como parte de un enfoque multidisciplinario para examinar un rasgo o fenotipo. Un ejemplo de manipulación de genes candidatos se puede ver en un estudio completado por Martin E. Feder sobre las proteínas de choque térmico y su función en Drosophila melanogaster . [28] Feder diseñó un enfoque holístico para estudiar Hsp70 , un gen candidato que se planteó como hipótesis que desempeñaba un papel en la forma en que un organismo se adaptaba al estrés. D. melanogaster es un organismo modelo muy útil para estudiar este rasgo debido a la forma en que puede soportar un número diverso de enfoques genéticos para estudiar un gen candidato. Los diferentes enfoques que adoptó este estudio incluyeron tanto la modificación genética del gen candidato (utilizando la recombinación homóloga específica del sitio y la expresión de varias proteínas), como el examen de la variación natural de Hsp70 . Concluyó que los resultados de estos estudios dieron una visión multifacética de Hsp70 . La manipulación de genes candidatos también se ve en el estudio de Caspar C. Chater sobre el origen y la función de los estomas en Physcomitrella patens , un musgo. PpSMF1 , PpSMF2 y PpSCRM1 fueron los tres genes candidatos que fueron derribados por recombinación homóloga para ver cualquier cambio en el desarrollo de los estomas. Con el experimento de derribo, Chater observó que PpSMF1 y PpSCRM1 eran responsables del desarrollo de los estomas en P. patens. [29] Al diseñar y modificar estos genes candidatos, pudieron confirmar las formas en que este gen estaba vinculado a un fenotipo de cambio. Comprender el contexto natural e histórico en el que operan estos fenotipos examinando la estructura natural del genoma complementó esto.
Referencias
- ^ ab Kwon JM, Goate AM (2000). "El enfoque del gen candidato" (PDF) . Alcohol Research & Health . 24 (3): 164–168. PMC 6709736. PMID 11199286 .
- ^ Zhu M, Zhao S (octubre de 2007). "Enfoque de identificación de genes candidatos: progreso y desafíos". Revista internacional de ciencias biológicas . 3 (7): 420–427. doi :10.7150/ijbs.3.420. PMC 2043166 . PMID 17998950.
- ^ Johnson EC, Border R, Melroy-Greif WE, de Leeuw CA, Ehringer MA, Keller MC (noviembre de 2017). "No hay evidencia de que los genes candidatos a esquizofrenia estén más asociados a la esquizofrenia que los genes no candidatos". Psiquiatría biológica . 82 (10): 702–708. doi :10.1016/j.biopsych.2017.06.033. PMC 5643230 . PMID 28823710.
- ^ Chabris CF, Hebert BM, Benjamin DJ, Beauchamp J, Cesarini D, van der Loos M, et al. (24 de septiembre de 2012). "La mayoría de las asociaciones genéticas reportadas con la inteligencia general son probablemente falsos positivos". Psychological Science . 23 (11): 1314–1323. doi :10.1177/0956797611435528. PMC 3498585 . PMID 23012269.
- ^ Bosker FJ, Hartman CA, Nolte IM, Prins BP, Terpstra P, Posthuma D, et al. (mayo de 2011). "Replicación deficiente de genes candidatos para el trastorno depresivo mayor utilizando datos de asociación de todo el genoma". Psiquiatría molecular . 16 (5): 516–532. doi : 10.1038/mp.2010.38 . PMID 20351714.
- ^ ab Border R, Johnson EC, Evans LM, Smolen A, Berley N, Sullivan PF, Keller MC (mayo de 2019). "No hay respaldo para hipótesis históricas de gen candidato o de gen candidato por interacción para la depresión mayor en múltiples muestras grandes". The American Journal of Psychiatry . 176 (5): 376–387. doi :10.1176/appi.ajp.2018.18070881. PMC 6548317 . PMID 30845820.
- ^ Duncan LE, Keller MC (octubre de 2011). "Una revisión crítica de los primeros 10 años de investigación sobre la interacción de genes candidatos con el ambiente en psiquiatría". The American Journal of Psychiatry . 168 (10): 1041–1049. doi :10.1176/appi.ajp.2011.11020191. PMC 3222234 . PMID 21890791.
- ^ Culverhouse RC, Saccone NL, Horton AC, Ma Y, Anstey KJ, Banaschewski T, et al. (enero de 2018). "Un metaanálisis colaborativo no encuentra evidencia de una fuerte interacción entre el estrés y el genotipo 5-HTTLPR que contribuya al desarrollo de la depresión". Psiquiatría molecular . 23 (1): 133–142. doi :10.1038/mp.2017.44. PMC 5628077 . PMID 28373689.
- ^ Farrell MS, Werge T, Sklar P, Owen MJ, Ophoff RA, O'Donovan MC, et al. (mayo de 2015). "Evaluación de genes candidatos históricos para la esquizofrenia". Psiquiatría molecular . 20 (5): 555–562. doi :10.1038/mp.2015.16. PMC 4414705 . PMID 25754081.
- ^ Risch N, Herrell R, Lehner T, Liang KY, Eaves L, Hoh J, et al. (junio de 2009). "Interacción entre el gen transportador de serotonina (5-HTTLPR), eventos vitales estresantes y riesgo de depresión: un metaanálisis". JAMA . 301 (23): 2462–71. doi :10.1001/jama.2009.878. PMC 2938776 . PMID 19531786.
- ^ Wayne ML, McIntyre LM (noviembre de 2002). "Combinación de mapeo y arreglo: un enfoque para la identificación de genes candidatos". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 99 (23): 14903–14906. Bibcode :2002PNAS...9914903W. doi : 10.1073/pnas.222549199 . PMC 137517 . PMID 12415114.
- ^ ab Tiffin N, Adie E, Turner F, Brunner HG, van Driel MA, Oti M, et al. (2006). "Identificación computacional de genes de enfermedades: un conjunto de métodos prioriza los genes candidatos de la diabetes tipo 2 y la obesidad". Nucleic Acids Research . 34 (10): 3067–3081. doi :10.1093/nar/gkl381. PMC 1475747 . PMID 16757574.
- ^ abcdefgh Tabor HK, Risch NJ, Myers RM (mayo de 2002). "Enfoques de genes candidatos para estudiar rasgos genéticos complejos: consideraciones prácticas". Nature Reviews. Genética . 3 (5): 391–397. doi :10.1038/nrg796. PMID 11988764. S2CID 23314997.
- ^ Zhu M, Zhao S (octubre de 2007). "Enfoque de identificación de genes candidatos: progreso y desafíos". Revista internacional de ciencias biológicas . 3 (7): 420–427. doi :10.7150/ijbs.3.420. PMC 2043166 . PMID 17998950.
- ^ Chen J, Bardes EE, Aronow BJ, Jegga AG (julio de 2009). "ToppGene Suite para el análisis de enriquecimiento de listas de genes y la priorización de genes candidatos". Nucleic Acids Research . 37 (edición del servidor web): W305–W311. doi :10.1093/nar/gkp427. PMC 2703978 . PMID 19465376.
- ^ Sulakhe D, Balasubramanian S, Xie B, Feng B, Taylor A, Wang S, et al. (enero de 2014). "Lynx: una base de datos y un motor de extracción de conocimiento para la medicina integrativa". Nucleic Acids Research . 42 (número de base de datos): D1007–D1012. doi :10.1093/nar/gkt1166. PMC 3965040 . PMID 24270788.
- ^ Xie B, Agam G, Balasubramanian S, Xu J, Gilliam TC, Maltsev N, Börnigen D (abril de 2015). "Priorización de genes de enfermedades mediante redes y características". Journal of Computational Biology . 22 (4): 313–323. doi :10.1089/cmb.2015.0001. PMC 4808289 . PMID 25844670.
- ^ Nitsch D, Gonçalves JP, Ojeda F, de Moor B, Moreau Y (septiembre de 2010). "Priorización de genes candidatos mediante análisis de redes de expresión diferencial utilizando enfoques de aprendizaje automático". BMC Bioinformatics . 11 (1): 460. doi : 10.1186/1471-2105-11-460 . PMC 2945940 . PMID 20840752.
- ^ Teixeira LV, Lezirovitz K, Mandelbaum KL, Pereira LV, Perez AB (agosto de 2011). "El análisis de ligamiento de genes candidatos indica heterogeneidad genética en el síndrome de Marfan". Revista Brasileña de Investigación Médica y Biológica . 44 (8): 793–800. doi : 10.1590/s0100-879x2011007500095 . PMID 21789464.
- ^ Lobo I (2008). "Misma mutación genética, diferente fenotipo de enfermedad genética". Nature Education . 1 (1): 64.
- ^ Gizer IR, Ficks C, Waldman ID (julio de 2009). "Estudios de genes candidatos del TDAH: una revisión metaanalítica". Human Genetics . 126 (1): 51–90. doi :10.1007/s00439-009-0694-x. PMID 19506906. S2CID 166017.
- ^ Border, Richard; Johnson, Emma C.; Evans, Luke M.; Smolen, Andrew; Berley, Noah; Sullivan, Patrick F.; Keller, Matthew C. (1 de mayo de 2019). "No hay respaldo para las hipótesis históricas de gen candidato o gen candidato por interacción para la depresión mayor en múltiples muestras grandes". American Journal of Psychiatry . 176 (5): 376–387. doi :10.1176/appi.ajp.2018.18070881. ISSN 0002-953X. PMC 6548317 . PMID 30845820.
- ^ Sullivan PF (mayo de 2007). "Asociaciones genéticas espurias". Psiquiatría biológica . 61 (10): 1121–1126. doi :10.1016/j.biopsych.2006.11.010. PMID 17346679. S2CID 35033987.
- ^ Hutchison KE, Stallings M, McGeary J, Bryan A (enero de 2004). "Estratificación de la población en el estudio de genes candidatos: ¿amenaza fatal o pista falsa?". Psychological Bulletin . 130 (1): 66–79. doi :10.1037/0033-2909.130.1.66. PMID 14717650.
- ^ Border R, Johnson EC, Evans LM, Smolen A, Berley N, Sullivan PF, Keller MC (mayo de 2019). "No hay respaldo para hipótesis históricas de gen candidato o de gen candidato por interacción para la depresión mayor en múltiples muestras grandes". The American Journal of Psychiatry . 176 (5): 376–387. doi :10.1176/appi.ajp.2018.18070881. PMC 6548317 . PMID 30845820.
- ^
- ^ Kim J, Lee T, Kim TH, Lee KT, Kim H (diciembre de 2012). "Un enfoque integrado de genómica comparativa y análisis de heredabilidad del rasgo de obesidad porcina y humana: evidencia de genes candidatos en el cromosoma humano 2". BMC Genomics . 13 : 711. doi : 10.1186/1471-2164-13-711 . PMC 3562524 . PMID 23253381.
- ^ Feder ME (julio de 1999). "Ingeniería de genes candidatos en estudios de adaptación: la proteína de choque térmico Hsp70 en Drosophila melanogaster". The American Naturalist . 154 (S1): S55–S66. doi :10.1086/303283. PMID 29586709. S2CID 4394996.
- ^ Chater CC, Caine RS, Tomek M, Wallace S, Kamisugi Y, Cuming AC y col. (noviembre de 2016). "Origen y función de los estomas en el musgo Physcomitrella patens". Plantas de la naturaleza . 2 (12): 16179. doi :10.1038/nplants.2016.179. PMC 5131878 . PMID 27892923.
Enlaces externos
- Gene
- Consorcio de Ontología Genética
- Gen Topp
- Plataforma Lynx