stringtranslate.com

Reducción de la dimensionalidad multifactorial

La reducción de dimensionalidad multifactorial ( MDR ) es un enfoque estadístico, también utilizado en enfoques automáticos de aprendizaje automático , [1] para detectar y caracterizar combinaciones de atributos o variables independientes que interactúan para influir en una variable dependiente o de clase. [2] [3] [4] [5] [6] [7] [8] La MDR fue diseñada específicamente para identificar interacciones no aditivas entre variables discretas que influyen en un resultado binario y se considera una alternativa no paramétrica y libre de modelos a los métodos estadísticos tradicionales como la regresión logística .

La base del método MDR es un algoritmo de inducción constructiva o ingeniería de características que convierte dos o más variables o atributos en un solo atributo. [9] Este proceso de construcción de un nuevo atributo cambia el espacio de representación de los datos. [10] El objetivo final es crear o descubrir una representación que facilite la detección de interacciones no lineales o no aditivas entre los atributos de modo que la predicción de la variable de clase mejore con respecto a la de la representación original de los datos.

Ejemplo ilustrativo

Considere el siguiente ejemplo simple que utiliza la función OR exclusiva (XOR). XOR es un operador lógico que se utiliza comúnmente en minería de datos y aprendizaje automático como un ejemplo de una función que no es linealmente separable. La siguiente tabla representa un conjunto de datos simple donde la relación entre los atributos (X1 y X2) y la variable de clase (Y) está definida por la función XOR de modo que Y = X1 XOR X2.

Tabla 1

Un algoritmo de aprendizaje automático necesitaría descubrir o aproximarse a la función XOR para predecir con precisión Y utilizando información sobre X1 y X2. Una estrategia alternativa sería cambiar primero la representación de los datos utilizando inducción constructiva para facilitar el modelado predictivo. El algoritmo MDR cambiaría la representación de los datos (X1 y X2) de la siguiente manera. MDR comienza seleccionando dos atributos. En este ejemplo simple, se seleccionan X1 y X2. Se examina cada combinación de valores para X1 y X2 y se cuenta la cantidad de veces que Y = 1 y/o Y = 0. En este ejemplo simple, Y = 1 ocurre cero veces e Y = 0 ocurre una vez para la combinación de X1 = 0 y X2 = 0. Con MDR, se calcula la relación de estos conteos y se compara con un umbral fijo. Aquí, la relación de los recuentos es 0/1, que es menor que nuestro umbral fijo de 1. Como 0/1 < 1, codificamos un nuevo atributo (Z) como 0. Cuando la relación es mayor que uno, codificamos Z como 1. Este proceso se repite para todas las combinaciones únicas de valores para X1 y X2. La Tabla 2 ilustra nuestra nueva transformación de los datos.

Tabla 2

El algoritmo de aprendizaje automático ahora tiene mucho menos trabajo que hacer para encontrar una buena función predictiva. De hecho, en este ejemplo muy simple, la función Y = Z tiene una precisión de clasificación de 1. Una característica interesante de los métodos de inducción constructiva como MDR es la capacidad de utilizar cualquier método de minería de datos o aprendizaje automático para analizar la nueva representación de los datos. Se podrían utilizar árboles de decisión , redes neuronales o un clasificador Bayes ingenuo en combinación con medidas de calidad del modelo como la precisión equilibrada [11] [12] y la información mutua. [13]

Aprendizaje automático con MDR

Como se ilustra arriba, el algoritmo básico de inducción constructiva en MDR es muy simple. Sin embargo, su implementación para extraer patrones de datos reales puede ser computacionalmente compleja. Como con cualquier algoritmo de aprendizaje automático, siempre existe la preocupación por el sobreajuste . Es decir, los algoritmos de aprendizaje automático son buenos para encontrar patrones en datos completamente aleatorios. A menudo es difícil determinar si un patrón informado es una señal importante o solo una casualidad. Un enfoque es estimar la generalización de un modelo a conjuntos de datos independientes utilizando métodos como la validación cruzada . [14] [15] [16] [17] Los modelos que describen datos aleatorios normalmente no se generalizan. Otro enfoque es generar muchas permutaciones aleatorias de los datos para ver qué encuentra el algoritmo de minería de datos cuando se le da la oportunidad de sobreajustar. Las pruebas de permutación permiten generar un valor p empírico para el resultado. [18] [ 19] [20] [21] La replicación en datos independientes también puede proporcionar evidencia de un modelo MDR, pero puede ser sensible a las diferencias en los conjuntos de datos. [22] [23] Se ha demostrado que todos estos enfoques son útiles para elegir y evaluar modelos de MDR. Un paso importante en un ejercicio de aprendizaje automático es la interpretación. Se han utilizado varios enfoques con MDR, incluido el análisis de entropía [9] [24] y el análisis de vías. [25] [26] Se han revisado consejos y enfoques para usar MDR para modelar interacciones gen-gen. [7] [27]

Extensiones al MDR

Se han introducido numerosas extensiones de la MDR, entre ellas, métodos basados ​​en la familia, [28] [29] [30] métodos difusos, [31] ajuste de covariables, [32] razones de probabilidades , [33] puntuaciones de riesgo, [34] métodos de supervivencia, [35] [36] métodos robustos, [37] métodos para rasgos cuantitativos, [38] [39] y muchos otros.

Aplicaciones del MDR

La MDR se ha aplicado principalmente para detectar interacciones gen-gen o epistasis en estudios genéticos de enfermedades humanas comunes como fibrilación auricular , [40] [41] autismo , [42] cáncer de vejiga , [43] [44] [45] cáncer de mama , [46] enfermedad cardiovascular , [14] hipertensión , [47] [48] [49] obesidad , [50] [51] cáncer de páncreas , [52] cáncer de próstata [53] [54] [55] y tuberculosis . [56] También se ha aplicado a otros problemas biomédicos como el análisis genético de resultados farmacológicos . [57] [ 58] [59] Un desafío central es la escala de MDR a big data como el de los estudios de asociación de todo el genoma (GWAS). [60] Se han utilizado varios enfoques. Un enfoque es filtrar las características antes del análisis de MDR. [61] Esto se puede hacer utilizando conocimiento biológico a través de herramientas como BioFilter. [62] También se puede hacer usando herramientas computacionales como ReliefF. [63] Otro enfoque es usar algoritmos de búsqueda estocástica como la programación genética para explorar el espacio de búsqueda de combinaciones de características. [64] Otro enfoque es una búsqueda de fuerza bruta usando computación de alto rendimiento . [65] [66] [67]

Implementaciones

Véase también

Referencias

  1. ^ McKinney, Brett A.; Reif, David M.; Ritchie, Marylyn D.; Moore, Jason H. (1 de enero de 2006). "Aprendizaje automático para detectar interacciones gen-gen: una revisión". Applied Bioinformatics . 5 (2): 77–88. doi :10.2165/00822942-200605020-00002. ISSN  1175-5636. PMC  3244050 . PMID  16722772.
  2. ^ Ritchie, Marylyn D.; Hahn, Lance W.; Roodi, Nady; Bailey, L. Renee; Dupont, William D.; Parl, Fritz F.; Moore, Jason H. (1 de julio de 2001). "La reducción de la dimensionalidad multifactorial revela interacciones de alto orden entre los genes del metabolismo del estrógeno en el cáncer de mama esporádico". The American Journal of Human Genetics . 69 (1): 138–147. doi :10.1086/321276. ISSN  0002-9297. PMC 1226028 . PMID  11404819. 
  3. ^ Ritchie, Marylyn D.; Hahn, Lance W.; Moore, Jason H. (1 de febrero de 2003). "Poder de la reducción de la dimensionalidad multifactorial para detectar interacciones gen-gen en presencia de error de genotipado, datos faltantes, fenocopia y heterogeneidad genética". Epidemiología genética . 24 (2): 150–157. doi :10.1002/gepi.10218. ISSN  1098-2272. PMID  12548676. S2CID  6335612.
  4. ^ Hahn, LW; Ritchie, MD; Moore, JH (12 de febrero de 2003). "Software de reducción de dimensionalidad multifactorial para detectar interacciones gen-gen y gen-ambiente". Bioinformática . 19 (3): 376–382. doi : 10.1093/bioinformatics/btf869 . ISSN  1367-4803. PMID  12584123.
  5. ^ W., Hahn, Lance; H., Moore, Jason (1 de enero de 2004). "Discriminación ideal de criterios de valoración clínicos discretos mediante genotipos multilocus". Biología in silico . 4 (2): 183–194. ISSN  1386-6338. PMID  15107022.{{cite journal}}: CS1 maint: varios nombres: lista de autores ( enlace )
  6. ^ Moore, Jason H. (1 de noviembre de 2004). "Análisis computacional de interacciones gen-gen utilizando reducción de dimensionalidad multifactorial". Expert Review of Molecular Diagnostics . 4 (6): 795–803. doi :10.1586/14737159.4.6.795. ISSN  1473-7159. PMID  15525222. S2CID  26324399.
  7. ^ ab Moore, Jason H.; Andrews, Peter C. (1 de enero de 2015). "Análisis de epistasis mediante reducción de dimensionalidad multifactorial". En Moore, Jason H.; Williams, Scott M. (eds.). Epistasis . Métodos en biología molecular. Vol. 1253. Springer Nueva York. págs. 301–314. doi :10.1007/978-1-4939-2155-3_16. ISBN 9781493921546. Número de identificación personal  25403539.
  8. ^ Moore, Jason H. (1 de enero de 2010). "Detección, caracterización e interpretación de interacciones gen-gen no lineales mediante reducción de dimensionalidad multifactorial". Métodos computacionales para la genética de rasgos complejos . Avances en genética. Vol. 72. págs. 101–116. doi :10.1016/B978-0-12-380862-2.00005-9. ISBN 978-0-12-380862-2. ISSN  0065-2660. PMID  21029850.
  9. ^ ab Moore, Jason H.; Gilbert, Joshua C.; Tsai, Chia-Ti; Chiang, Fu-Tien; Holden, Todd; Barney, Nate; White, Bill C. (21 de julio de 2006). "Un marco computacional flexible para detectar, caracterizar e interpretar patrones estadísticos de epistasis en estudios genéticos de susceptibilidad humana a enfermedades". Journal of Theoretical Biology . 241 (2): 252–261. Bibcode :2006JThBi.241..252M. doi :10.1016/j.jtbi.2005.11.036. PMID  16457852.
  10. ^ Michalski, R (febrero de 1983). "Una teoría y metodología del aprendizaje inductivo". Inteligencia artificial . 20 (2): 111–161. doi :10.1016/0004-3702(83)90016-4.
  11. ^ Velez, Digna R.; White, Bill C.; Motsinger, Alison A.; Bush, William S.; Ritchie, Marylyn D.; Williams, Scott M.; Moore, Jason H. (1 de mayo de 2007). "Una función de precisión equilibrada para el modelado de epistasis en conjuntos de datos desequilibrados utilizando reducción de dimensionalidad multifactorial". Epidemiología genética . 31 (4): 306–315. doi :10.1002/gepi.20211. ISSN  0741-0395. PMID  17323372. S2CID  28156181.
  12. ^ Namkung, Junghyun; Kim, Kyunga; Yi, Sungon; Chung, Wonil; Kwon, Min-Seok; Park, Taesung (1 de febrero de 2009). "Nuevas medidas de evaluación para clasificadores de reducción de dimensionalidad multifactorial en análisis de interacción gen-gen". Bioinformática . 25 (3): 338–345. doi : 10.1093/bioinformatics/btn629 . ISSN  1367-4811. PMID  19164302.
  13. ^ Bush, William S.; Edwards, Todd L.; Dudek, Scott M.; McKinney, Brett A.; Ritchie, Marylyn D. (1 de enero de 2008). "Las medidas de tabla de contingencia alternativas mejoran la potencia y la detección de la reducción de la dimensionalidad multifactorial". BMC Bioinformatics . 9 : 238. doi : 10.1186/1471-2105-9-238 . ISSN  1471-2105. PMC 2412877 . PMID  18485205. 
  14. ^ ab Coffey, Christopher S.; Hebert, Patricia R.; Ritchie, Marylyn D.; Krumholz, Harlan M.; Gaziano, J. Michael; Ridker, Paul M.; Brown, Nancy J.; Vaughan, Douglas E.; Moore, Jason H. (1 de enero de 2004). "Una aplicación de regresión logística condicional y reducción de dimensionalidad multifactorial para detectar interacciones gen-gen en el riesgo de infarto de miocardio: la importancia de la validación del modelo". BMC Bioinformatics . 5 : 49. doi : 10.1186/1471-2105-5-49 . ISSN  1471-2105. PMC 419697 . PMID  15119966. 
  15. ^ Motsinger, Alison A.; Ritchie, Marylyn D. (1 de septiembre de 2006). "El efecto de la reducción de los intervalos de validación cruzada en el rendimiento de la reducción de la dimensionalidad multifactorial". Epidemiología genética . 30 (6): 546–555. doi :10.1002/gepi.20166. ISSN  1098-2272. PMID  16800004. S2CID  20573232.
  16. ^ Gory, Jeffrey J.; Sweeney, Holly C.; Reif, David M.; Motsinger-Reif, Alison A. (5 de noviembre de 2012). "Una comparación de los métodos de validación de modelos internos para la reducción de la dimensionalidad multifactorial en el caso de la heterogeneidad genética". BMC Research Notes . 5 : 623. doi : 10.1186/1756-0500-5-623 . ISSN  1756-0500. PMC 3599301 . PMID  23126544. 
  17. ^ Winham, Stacey J.; Slater, Andrew J.; Motsinger-Reif, Alison A. (22 de julio de 2010). "Una comparación de técnicas de validación interna para la reducción de la dimensionalidad multifactorial". BMC Bioinformatics . 11 : 394. doi : 10.1186/1471-2105-11-394 . ISSN  1471-2105. PMC 2920275 . PMID  20650002. 
  18. ^ Pattin, Kristine A.; White, Bill C.; Barney, Nate; Gui, Jiang; Nelson, Heather H.; Kelsey, Karl T.; Andrew, Angeline S.; Karagas, Margaret R.; Moore, Jason H. (1 de enero de 2009). "Un método de prueba de hipótesis computacionalmente eficiente para el análisis de epistasis utilizando reducción de dimensionalidad multifactorial". Epidemiología genética . 33 (1): 87–94. doi :10.1002/gepi.20360. ISSN  1098-2272. PMC 2700860 . PMID  18671250. 
  19. ^ Greene, Casey S.; Himmelstein, Daniel S.; Nelson, Heather H.; Kelsey, Karl T.; Williams, Scott M.; Andrew, Angeline S.; Karagas, Margaret R.; Moore, Jason H. (1 de octubre de 2009). "Habilitación de la genómica personal con una prueba explícita de epistasis". Biocomputing 2010: Simposio del Pacífico sobre biocomputación . World Scientific. págs. 327–336. doi :10.1142/9789814295291_0035. ISBN . 9789814299473. PMC  2916690 . PMID  19908385.
  20. ^ Dai, Hongying; Bhandary, Madhusudan; Becker, Mara; Leeder, J. Steven; Gaedigk, Roger; Motsinger-Reif, Alison A. (22 de mayo de 2012). "Pruebas globales de valores P para modelos de reducción de dimensionalidad multifactorial en la selección del número óptimo de genes objetivo". BioData Mining . 5 (1): 3. doi : 10.1186/1756-0381-5-3 . ISSN  1756-0381. PMC 3508622 . PMID  22616673. 
  21. ^ Motsinger-Reif, Alison A. (30 de diciembre de 2008). "El efecto de las estrategias de prueba de permutación alternativas en el rendimiento de la reducción de dimensionalidad multifactorial". BMC Research Notes . 1 : 139. doi : 10.1186/1756-0500-1-139 . ISSN  1756-0500. PMC 2631601 . PMID  19116021. 
  22. ^ Greene, Casey S.; Penrod, Nadia M.; Williams, Scott M.; Moore, Jason H. (2 de junio de 2009). "La imposibilidad de replicar una asociación genética puede proporcionar pistas importantes sobre la arquitectura genética". PLOS ONE . ​​4 (6): e5639. Bibcode :2009PLoSO...4.5639G. doi : 10.1371/journal.pone.0005639 . ISSN  1932-6203. PMC 2685469 . PMID  19503614. 
  23. ^ Piette, Elizabeth R.; Moore, Jason H. (19 de abril de 2017). "Mejora de la reproducibilidad de los resultados de asociación genética mediante métodos de remuestreo de genotipos". Aplicaciones de la computación evolutiva . Apuntes de clase en informática. Vol. 10199. págs. 96–108. doi :10.1007/978-3-319-55849-3_7. ISBN 978-3-319-55848-6.
  24. ^ Moore, Jason H.; Hu, Ting (1 de enero de 2015). "Análisis de epistasis mediante la teoría de la información". Epistasis . Métodos en biología molecular . Vol. 1253. págs. 257–268. doi :10.1007/978-1-4939-2155-3_13. ISBN 978-1-4939-2154-6. ISSN  1940-6029. PMID  25403536.
  25. ^ Kim, Nora Chung; Andrews, Peter C.; Asselbergs, Folkert W.; Frost, H. Robert; Williams, Scott M.; Harris, Brent T.; Read, Cynthia; Askland, Kathleen D.; Moore, Jason H. (28 de julio de 2012). "Análisis de ontología génica de asociaciones genéticas por pares en dos estudios de todo el genoma de ELA esporádica". BioData Mining . 5 (1): 9. doi : 10.1186/1756-0381-5-9 . ISSN  1756-0381. PMC 3463436 . PMID  22839596. 
  26. ^ Cheng, Samantha; Andrew, Angeline S.; Andrews, Peter C.; Moore, Jason H. (1 de enero de 2016). "El análisis de sistemas complejos de la susceptibilidad al cáncer de vejiga revela un papel para la actividad descarboxilasa en dos estudios de asociación de todo el genoma". BioData Mining . 9 : 40. doi : 10.1186/s13040-016-0119-z . PMC 5154053 . PMID  27999618. 
  27. ^ Gola, Damian; Mahachie John, Jestinah M.; van Steen, Kristel; König, Inke R. (1 de marzo de 2016). "Una hoja de ruta hacia métodos de reducción de dimensionalidad multifactorial". Briefings in Bioinformatics . 17 (2): 293–308. doi :10.1093/bib/bbv038. ISSN  1477-4054. PMC 4793893 . PMID  26108231. 
  28. ^ Martin, ER; Ritchie, MD; Hahn, L.; Kang, S.; Moore, JH (1 de febrero de 2006). "Un nuevo método para identificar efectos gen-gen en familias nucleares: la MDR-PDT". Epidemiología genética . 30 (2): 111–123. doi :10.1002/gepi.20128. ISSN  0741-0395. PMID  16374833. S2CID  25772215.
  29. ^ Lou, Xiang-Yang; Chen, Guo-Bo; Yan, Lei; Ma, Jennie Z.; Mangold, Jamie E.; Zhu, Jun; Elston, Robert C.; Li, Ming D. (1 de octubre de 2008). "Un enfoque combinatorio para detectar interacciones gen-gen y gen-ambiente en estudios familiares". American Journal of Human Genetics . 83 (4): 457–467. doi :10.1016/j.ajhg.2008.09.001. ISSN  1537-6605. PMC 2561932 . PMID  18834969. 
  30. ^ Cattaert, Tom; Urrea, Víctor; Naj, Adam C.; De Lobel, Lizzy; De Wit, Vanessa; Fu, Mao; Mahachie John, Jestinah M.; Shen, Haiqing; Calle, M. Luz (22 de abril de 2010). "FAM-MDR: una técnica flexible de reducción de dimensionalidad multifactorial basada en la familia para detectar epistasis utilizando individuos relacionados". PLOS ONE . ​​5 (4): e10304. Bibcode :2010PLoSO...510304C. doi : 10.1371/journal.pone.0010304 . ISSN  1932-6203. PMC 2858665 . PMID  20421984. 
  31. ^ Leem, Sangseob; Park, Taesung (14 de marzo de 2017). "Un método empírico de reducción de la dimensionalidad difusa multifactorial para detectar interacciones gen-gen". BMC Genomics . 18 (Supl 2): ​​115. doi : 10.1186/s12864-017-3496-x . ISSN  1471-2164. PMC 5374597 . PMID  28361694. 
  32. ^ Gui, Jiang; Andrew, Angeline S.; Andrews, Peter; Nelson, Heather M.; Kelsey, Karl T.; Karagas, Margaret R.; Moore, Jason H. (1 de enero de 2010). "Un enfoque de muestreo simple y computacionalmente eficiente para el ajuste de covariables para el análisis de reducción de dimensionalidad multifactorial de la epistasis". Herencia humana . 70 (3): 219–225. doi :10.1159/000319175. ISSN  1423-0062. PMC 2982850 . PMID  20924193. 
  33. ^ Chung, Yujin; Lee, Seung Yeoun; Elston, Robert C.; Park, Taesung (1 de enero de 2007). "Método de reducción de dimensionalidad multifactorial basado en odds ratio para detectar interacciones gen-gen". Bioinformática . 23 (1): 71–76. doi : 10.1093/bioinformatics/btl557 . ISSN  1367-4811. PMID  17092990.
  34. ^ Dai, Hongying; Charnigo, Richard J.; Becker, Mara L.; Leeder, J. Steven; Motsinger-Reif, Alison A. (8 de enero de 2013). "Modelado de puntuación de riesgo de interacciones de múltiples genes a genes utilizando reducción de dimensionalidad multifactorial agregada". BioData Mining . 6 (1): 1. doi : 10.1186/1756-0381-6-1 . PMC 3560267 . PMID  23294634. 
  35. ^ Gui, Jiang; Moore, Jason H.; Kelsey, Karl T.; Marsit, Carmen J.; Karagas, Margaret R.; Andrew, Angeline S. (1 de enero de 2011). "Un nuevo método de reducción de la dimensionalidad multifactorial de supervivencia para detectar interacciones gen-gen con aplicación al pronóstico del cáncer de vejiga". Genética humana . 129 (1): 101–110. doi :10.1007/s00439-010-0905-5. ISSN  1432-1203. PMC 3255326 . PMID  20981448. 
  36. ^ Lee, Seungyeoun; Son, Donghee; Yu, Wenbao; Park, Taesung (1 de diciembre de 2016). "Análisis de interacción gen-gen para el modelo de tiempo de falla acelerada utilizando un método de reducción de dimensionalidad multifactorial basado en un modelo unificado". Genómica e informática . 14 (4): 166–172. doi :10.5808/GI.2016.14.4.166. ISSN  1598-866X. PMC 5287120 . PMID  28154507. 
  37. ^ Gui, Jiang; Andrew, Angeline S.; Andrews, Peter; Nelson, Heather M.; Kelsey, Karl T.; Karagas, Margaret R.; Moore, Jason H. (1 de enero de 2011). "Un método robusto de reducción de la dimensionalidad multifactorial para detectar interacciones gen-gen con aplicación al análisis genético de la susceptibilidad al cáncer de vejiga". Anales de genética humana . 75 (1): 20–28. doi :10.1111/j.1469-1809.2010.00624.x. ISSN  1469-1809. PMC 3057873 . PMID  21091664. 
  38. ^ Gui, Jiang; Moore, Jason H.; Williams, Scott M.; Andrews, Peter; Hillege, Hans L.; van der Harst, Pim; Navis, Gerjan; Van Gilst, Wiek H.; Asselbergs, Folkert W. (1 de enero de 2013). "Un enfoque simple y computacionalmente eficiente para el análisis de reducción de dimensionalidad multifactorial de interacciones gen-gen para rasgos cuantitativos". PLOS ONE . ​​8 (6): e66545. Bibcode :2013PLoSO...866545G. doi : 10.1371/journal.pone.0066545 . ISSN  1932-6203. PMC 3689797 . PMID  23805232. 
  39. ^ Lou, Xiang-Yang; Chen, Guo-Bo; Yan, Lei; Ma, Jennie Z.; Zhu, Jun; Elston, Robert C.; Li, Ming D. (1 de junio de 2007). "Un enfoque combinatorio generalizado para detectar interacciones gen por gen y gen por entorno con aplicación a la dependencia de la nicotina". American Journal of Human Genetics . 80 (6): 1125–1137. doi :10.1086/518312. ISSN  0002-9297. PMC 1867100 . PMID  17503330. 
  40. ^ Tsai, Chia-Ti; Lai, Ling-Ping; Lin, Jiunn-Lee; Chiang, Fu-Tien; Hwang, Juey-Jen; Ritchie, Marylyn D.; Moore, Jason H.; Hsu, Kuan-Lih; Tseng, Chuen-Den (6 de abril de 2004). "Polimorfismos genéticos del sistema renina-angiotensina y fibrilación auricular". Circulation . 109 (13): 1640–1646. doi : 10.1161/01.CIR.0000124487.36586.26 . ISSN  0009-7322. PMID  15023884.
  41. ^ Asselbergs, Folkert W.; Moore, Jason H.; van den Berg, Maarten P.; Rimm, Eric B.; de Boer, Rudolf A.; Dullaart, Robin P.; Navis, Gerjan; van Gilst, Wiek H. (1 de enero de 2006). "Un papel para el polimorfismo CETP TaqIB en la determinación de la susceptibilidad a la fibrilación auricular: un estudio de casos y controles anidado". BMC Medical Genetics . 7 : 39. doi : 10.1186/1471-2350-7-39 . ISSN  1471-2350. PMC 1462991 . PMID  16623947. 
  42. ^ Ma, DQ; Whitehead, PL; Menold, MM; Martin, ER; Ashley-Koch, AE; Mei, H.; Ritchie, MD; DeLong, GR; Abramson, RK (1 de septiembre de 2005). "Identificación de asociación significativa e interacción gen-gen de los genes de la subunidad del receptor GABA en el autismo". The American Journal of Human Genetics . 77 (3): 377–388. doi :10.1086/433195. ISSN  0002-9297. PMC 1226204 . PMID  16080114. 
  43. ^ Andrew, Angeline S.; Nelson, Heather H.; Kelsey, Karl T.; Moore, Jason H.; Meng, Alexis C.; Casella, Daniel P.; Tosteson, Tor D.; Schned, Alan R.; Karagas, Margaret R. (1 de mayo de 2006). "La concordancia de múltiples enfoques analíticos demuestra una relación compleja entre los SNP de genes de reparación del ADN, el tabaquismo y la susceptibilidad al cáncer de vejiga". Carcinogénesis . 27 (5): 1030–1037. doi : 10.1093/carcin/bgi284 . ISSN  0143-3334. PMID  16311243.
  44. ^ Andrew, Angeline S.; Karagas, Margaret R.; Nelson, Heather H.; Guarrera, Simonetta; Polidoro, Silvia; Gamberini, Sara; Sacerdote, Carlotta; Moore, Jason H.; Kelsey, Karl T. (1 de enero de 2008). "Los polimorfismos de reparación del ADN modifican el riesgo de cáncer de vejiga: una estrategia analítica multifactorial". Herencia humana . 65 (2): 105–118. doi :10.1159/000108942. ISSN  0001-5652. PMC 2857629 . PMID  17898541. 
  45. ^ Andrew, Angeline S.; Hu, Ting; Gu, Jian; Gui, Jiang; Ye, Yuanqing; Marsit, Carmen J.; Kelsey, Karl T.; Schned, Alan R.; Tanyos, Sam A. (1 de enero de 2012). "HSD3B e interacciones gen-gen en un análisis basado en la vía de la susceptibilidad genética al cáncer de vejiga". PLOS ONE . ​​7 (12): e51301. Bibcode :2012PLoSO...751301A. doi : 10.1371/journal.pone.0051301 . ISSN  1932-6203. PMC 3526593 . PMID  23284679. 
  46. ^ Cao, Jingjing; Luo, Chenglin; Yan, Rui; Peng, Rui; Wang, Kaijuan; Wang, Peng; Ye, Hua; Song, Chunhua (1 de diciembre de 2016). "rs15869 en el sitio de unión de miRNA en BRCA2 está asociado con la susceptibilidad al cáncer de mama". Oncología médica . 33 (12): 135. doi :10.1007/s12032-016-0849-2. ISSN  1357-0560. PMID  27807724. S2CID  26042128.
  47. ^ Williams, Scott M.; Ritchie, Marylyn D.; III, John A. Phillips; Dawson, Elliot; Prince, Melissa; Dzhura, Elvira; Willis, Alecia; Semenya, Amma; Summar, Marshall (1 de enero de 2004). "Análisis multilocus de la hipertensión: un enfoque jerárquico". Herencia humana . 57 (1): 28–38. doi :10.1159/000077387. ISSN  0001-5652. PMID  15133310. S2CID  21079485.
  48. ^ Sanada, Hironobu; Yatabe, Junichi; Midorikawa, Sanae; Hashimoto, Shigeatsu; Watanabe, Tsuyoshi; Moore, Jason H.; Ritchie, Marylyn D.; Williams, Scott M.; Pezzullo, John C. (1 de marzo de 2006). "Polimorfismos de un solo nucleótido para el diagnóstico de hipertensión sensible a la sal". Química clínica . 52 (3): 352–360. doi : 10.1373/clinchem.2005.059139 . ISSN  0009-9147. PMID  16439609.
  49. ^ Moore, Jason H.; Williams, Scott M. (1 de enero de 2002). "Nuevas estrategias para identificar interacciones gen-gen en la hipertensión". Anales de Medicina . 34 (2): 88–95. doi :10.1080/07853890252953473. ISSN  0785-3890. PMID  12108579. S2CID  25398042.
  50. ^ De, Rishika; Verma, Shefali S.; Holzinger, Emily; Hall, Molly; Burt, Amber; Carrell, David S.; Crosslin, David R.; Jarvik, Gail P.; Kuivaniemi, Helena (1 de febrero de 2017). "Identificación de interacciones gen-gen que están altamente asociadas con cuatro rasgos lipídicos cuantitativos en múltiples cohortes" (PDF) . Human Genetics . 136 (2): 165–178. doi :10.1007/s00439-016-1738-7. ISSN  1432-1203. PMID  27848076. S2CID  24702049.
  51. ^ De, Rishika; Verma, Shefali S.; Drenos, Fotios; Holzinger, Emily R.; Holmes, Michael V.; Hall, Molly A.; Crosslin, David R.; Carrell, David S.; Hakonarson, Hakon (1 de enero de 2015). "Identificación de interacciones gen-gen que están altamente asociadas con el índice de masa corporal mediante reducción cuantitativa de la dimensionalidad multifactorial (QMDR)". BioData Mining . 8 : 41. doi : 10.1186/s13040-015-0074-0 . PMC 4678717 . PMID  26674805. 
  52. ^ Duell, Eric J.; Bracci, Paige M.; Moore, Jason H.; Burk, Robert D.; Kelsey, Karl T.; Holly, Elizabeth A. (1 de junio de 2008). "Detección de interacciones gen-gen y gen-ambiente basadas en vías en el cáncer de páncreas". Epidemiología del cáncer, biomarcadores y prevención . 17 (6): 1470–1479. doi :10.1158/1055-9965.EPI-07-2797. ISSN  1055-9965. PMC 4410856 . PMID  18559563. 
  53. ^ Xu, Jianfeng; Lowey, James; Wiklund, Fredrik; Sun, Jielin; Lindmark, Fredrik; Hsu, Fang-Chi; Dimitrov, Latchezar; Chang, Baoli; Turner, Aubrey R. (1 de noviembre de 2005). "La interacción de cuatro genes en la vía de la inflamación predice significativamente el riesgo de cáncer de próstata". Epidemiología del cáncer, biomarcadores y prevención . 14 (11): 2563–2568. doi : 10.1158/1055-9965.EPI-05-0356 . ISSN  1055-9965. PMID  16284379.
  54. ^ Lavender, Nicole A.; Rogers, Erica N.; Yeyeodu, Susan; Rudd, James; Hu, Ting; Zhang, Jie; Brock, Guy N.; Kimbro, Kevin S.; Moore, Jason H. (30 de abril de 2012). "Interacción entre variantes de secuencia asociadas a la apoptosis y efectos conjuntos en el cáncer de próstata agresivo". BMC Medical Genomics . 5 : 11. doi : 10.1186/1755-8794-5-11 . ISSN  1755-8794. PMC 3355002 . PMID  22546513. 
  55. ^ Lavender, Nicole A.; Benford, Marnita L.; VanCleave, Tiva T.; Brock, Guy N.; Kittles, Rick A.; Moore, Jason H.; Hein, David W.; Kidd, La Creis R. (16 de noviembre de 2009). "Examen de los genes polimórficos de glutatión S-transferasa (GST), tabaquismo y riesgo de cáncer de próstata entre hombres de ascendencia africana: un estudio de casos y controles". BMC Cancer . 9 : 397. doi : 10.1186/1471-2407-9-397 . ISSN  1471-2407. PMC 2783040 . PMID  19917083. 
  56. ^ Collins, Ryan L.; Hu, Ting; Wejse, Christian; Sirugo, Giorgio; Williams, Scott M.; Moore, Jason H. (18 de febrero de 2013). "La reducción de la dimensionalidad multifactorial revela una interacción epistática de tres locus asociada con la susceptibilidad a la tuberculosis pulmonar". BioData Mining . 6 (1): 4. doi : 10.1186/1756-0381-6-4 . PMC 3618340 . PMID  23418869. 
  57. ^ Wilke, Russell A.; Reif, David M.; Moore, Jason H. (1 de noviembre de 2005). "Combinatorial Pharmacogenetics". Nature Reviews Drug Discovery . 4 (11): 911–918. doi :10.1038/nrd1874. ISSN  1474-1776. PMID  16264434. S2CID  11643026.
  58. ^ Motsinger, Alison A.; Ritchie, Marylyn D.; Shafer, Robert W.; Robbins, Gregory K.; Morse, Gene D.; Labbe, Line; Wilkinson, Grant R.; Clifford, David B.; D'Aquila, Richard T. (1 de noviembre de 2006). "Interacciones genéticas multilocus y respuesta a regímenes que contienen efavirenz: un estudio grupal de ensayos clínicos sobre el SIDA en adultos". Farmacogenética y genómica . 16 (11): 837–845. doi :10.1097/01.fpc.0000230413.97596.fa. ISSN  1744-6872. PMID  17047492. S2CID  26266170.
  59. ^ Ritchie, Marylyn D.; Motsinger, Alison A. (1 de diciembre de 2005). "Reducción de la dimensionalidad multifactorial para detectar interacciones gen-gen y gen-ambiente en estudios farmacogenómicos". Farmacogenómica . 6 (8): 823–834. doi :10.2217/14622416.6.8.823. ISSN  1462-2416. PMID  16296945. S2CID  10348021.
  60. ^ Moore, Jason H.; Asselbergs, Folkert W.; Williams, Scott M. (15 de febrero de 2010). "Desafíos de la bioinformática para los estudios de asociación de todo el genoma". Bioinformática . 26 (4): 445–455. doi :10.1093/bioinformatics/btp713. ISSN  1367-4811. PMC 2820680 . PMID  20053841. 
  61. ^ Sun, Xiangqing; Lu, Qing; Mukherjee, Shubhabrata; Mukheerjee, Shubhabrata; Crane, Paul K.; Elston, Robert; Ritchie, Marylyn D. (1 de enero de 2014). "Proceso de análisis para la búsqueda de epistasis: filtrado estadístico versus biológico". Frontiers in Genetics . 5 : 106. doi : 10.3389/fgene.2014.00106 . PMC 4012196 . PMID  24817878. 
  62. ^ Pendergrass, Sarah A.; Frase, Alex; Wallace, John; Wolfe, Daniel; Katiyar, Neerja; Moore, Carrie; Ritchie, Marylyn D. (30 de diciembre de 2013). "Análisis genómicos con biofiltro 2.0: filtrado, anotación y desarrollo de modelos basados ​​en el conocimiento". BioData Mining . 6 (1): 25. doi : 10.1186/1756-0381-6-25 . PMC 3917600 . PMID  24378202. 
  63. ^ Moore, Jason H. (1 de enero de 2015). "Análisis de epistasis con ReliefF". Epistasis . Métodos en biología molecular . Vol. 1253. págs. 315–325. doi :10.1007/978-1-4939-2155-3_17. ISBN 978-1-4939-2154-6. ISSN  1940-6029. PMID  25403540.
  64. ^ Moore, Jason H.; White, Bill C. (1 de enero de 2007). "Análisis genético de todo el genoma mediante programación genética: la necesidad crítica de conocimiento experto". En Riolo, Rick; Soule, Terence; Worzel, Bill (eds.). Teoría y práctica de la programación genética IV . Computación genética y evolutiva. Springer US. págs. 11–28. doi :10.1007/978-0-387-49650-4_2. ISBN 9780387333755. Número de identificación del sujeto  55188394.
  65. ^ Greene, Casey S.; Sinnott-Armstrong, Nicholas A.; Himmelstein, Daniel S.; Park, Paul J.; Moore, Jason H.; Harris, Brent T. (1 de marzo de 2010). "La reducción de la dimensionalidad multifactorial para las unidades de procesamiento gráfico permite la prueba de epistasis en todo el genoma en ELA esporádica". Bioinformática . 26 (5): 694–695. doi :10.1093/bioinformatics/btq009. ISSN  1367-4811. PMC 2828117 . PMID  20081222. 
  66. ^ Bush, William S.; Dudek, Scott M.; Ritchie, Marylyn D. (1 de septiembre de 2006). "Reducción de la dimensionalidad multifactorial paralela: una herramienta para el análisis a gran escala de interacciones gen-gen". Bioinformática . 22 (17): 2173–2174. doi :10.1093/bioinformatics/btl347. ISSN  1367-4811. PMC 4939609 . PMID  16809395. 
  67. ^ Sinnott-Armstrong, Nicholas A.; Greene, Casey S.; Cancare, Fabio; Moore, Jason H. (24 de julio de 2009). "Aceleración del análisis de epistasis en genética humana con hardware gráfico de consumo". BMC Research Notes . 2 : 149. doi : 10.1186/1756-0500-2-149 . ISSN  1756-0500. PMC 2732631 . PMID  19630950. 
  68. ^ Winham, Stacey J.; Motsinger-Reif, Alison A. (16 de agosto de 2011). "Una implementación del paquete R de reducción de dimensionalidad multifactorial". BioData Mining . 4 (1): 24. doi : 10.1186/1756-0381-4-24 . ISSN  1756-0381. PMC 3177775 . PMID  21846375. 
  69. ^ Calle, M. Luz; Urrea, Víctor; Malats, Núria; Van Steen, Kristel (1 de septiembre de 2010). «mbmdr: un paquete R para explorar interacciones gen-gen asociadas con rasgos binarios o cuantitativos». Bioinformática . 26 (17): 2198–2199. doi : 10.1093/bioinformatics/btq352 . ISSN  1367-4811. PMID  20595460.

Lectura adicional