La reducción de dimensionalidad multifactorial ( MDR ) es un enfoque estadístico, también utilizado en enfoques automáticos de aprendizaje automático , [1] para detectar y caracterizar combinaciones de atributos o variables independientes que interactúan para influir en una variable dependiente o de clase. [2] [3] [4] [5] [6] [7] [8] La MDR fue diseñada específicamente para identificar interacciones no aditivas entre variables discretas que influyen en un resultado binario y se considera una alternativa no paramétrica y libre de modelos a los métodos estadísticos tradicionales como la regresión logística .
La base del método MDR es un algoritmo de inducción constructiva o ingeniería de características que convierte dos o más variables o atributos en un solo atributo. [9] Este proceso de construcción de un nuevo atributo cambia el espacio de representación de los datos. [10] El objetivo final es crear o descubrir una representación que facilite la detección de interacciones no lineales o no aditivas entre los atributos de modo que la predicción de la variable de clase mejore con respecto a la de la representación original de los datos.
Ejemplo ilustrativo
Considere el siguiente ejemplo simple que utiliza la función OR exclusiva (XOR). XOR es un operador lógico que se utiliza comúnmente en minería de datos y aprendizaje automático como un ejemplo de una función que no es linealmente separable. La siguiente tabla representa un conjunto de datos simple donde la relación entre los atributos (X1 y X2) y la variable de clase (Y) está definida por la función XOR de modo que Y = X1 XOR X2.
Tabla 1
Un algoritmo de aprendizaje automático necesitaría descubrir o aproximarse a la función XOR para predecir con precisión Y utilizando información sobre X1 y X2. Una estrategia alternativa sería cambiar primero la representación de los datos utilizando inducción constructiva para facilitar el modelado predictivo. El algoritmo MDR cambiaría la representación de los datos (X1 y X2) de la siguiente manera. MDR comienza seleccionando dos atributos. En este ejemplo simple, se seleccionan X1 y X2. Se examina cada combinación de valores para X1 y X2 y se cuenta la cantidad de veces que Y = 1 y/o Y = 0. En este ejemplo simple, Y = 1 ocurre cero veces e Y = 0 ocurre una vez para la combinación de X1 = 0 y X2 = 0. Con MDR, se calcula la relación de estos conteos y se compara con un umbral fijo. Aquí, la relación de los recuentos es 0/1, que es menor que nuestro umbral fijo de 1. Como 0/1 < 1, codificamos un nuevo atributo (Z) como 0. Cuando la relación es mayor que uno, codificamos Z como 1. Este proceso se repite para todas las combinaciones únicas de valores para X1 y X2. La Tabla 2 ilustra nuestra nueva transformación de los datos.
Tabla 2
El algoritmo de aprendizaje automático ahora tiene mucho menos trabajo que hacer para encontrar una buena función predictiva. De hecho, en este ejemplo muy simple, la función Y = Z tiene una precisión de clasificación de 1. Una característica interesante de los métodos de inducción constructiva como MDR es la capacidad de utilizar cualquier método de minería de datos o aprendizaje automático para analizar la nueva representación de los datos. Se podrían utilizar árboles de decisión , redes neuronales o un clasificador Bayes ingenuo en combinación con medidas de calidad del modelo como la precisión equilibrada [11] [12] y la información mutua. [13]
Aprendizaje automático con MDR
Como se ilustra arriba, el algoritmo básico de inducción constructiva en MDR es muy simple. Sin embargo, su implementación para extraer patrones de datos reales puede ser computacionalmente compleja. Como con cualquier algoritmo de aprendizaje automático, siempre existe la preocupación por el sobreajuste . Es decir, los algoritmos de aprendizaje automático son buenos para encontrar patrones en datos completamente aleatorios. A menudo es difícil determinar si un patrón informado es una señal importante o solo una casualidad. Un enfoque es estimar la generalización de un modelo a conjuntos de datos independientes utilizando métodos como la validación cruzada . [14] [15] [16] [17] Los modelos que describen datos aleatorios normalmente no se generalizan. Otro enfoque es generar muchas permutaciones aleatorias de los datos para ver qué encuentra el algoritmo de minería de datos cuando se le da la oportunidad de sobreajustar. Las pruebas de permutación permiten generar un valor p empírico para el resultado. [18] [ 19] [20] [21] La replicación en datos independientes también puede proporcionar evidencia de un modelo MDR, pero puede ser sensible a las diferencias en los conjuntos de datos. [22] [23] Se ha demostrado que todos estos enfoques son útiles para elegir y evaluar modelos de MDR. Un paso importante en un ejercicio de aprendizaje automático es la interpretación. Se han utilizado varios enfoques con MDR, incluido el análisis de entropía [9] [24] y el análisis de vías. [25] [26] Se han revisado consejos y enfoques para usar MDR para modelar interacciones gen-gen. [7] [27]
Extensiones al MDR
Se han introducido numerosas extensiones de la MDR, entre ellas, métodos basados en la familia, [28] [29] [30] métodos difusos, [31] ajuste de covariables, [32] razones de probabilidades , [33] puntuaciones de riesgo, [34] métodos de supervivencia, [35] [36] métodos robustos, [37] métodos para rasgos cuantitativos, [38] [39] y muchos otros.
Aplicaciones del MDR
La MDR se ha aplicado principalmente para detectar interacciones gen-gen o epistasis en estudios genéticos de enfermedades humanas comunes como fibrilación auricular , [40] [41] autismo , [42] cáncer de vejiga , [43] [44] [45] cáncer de mama , [46] enfermedad cardiovascular , [14] hipertensión , [47] [48] [49] obesidad , [50] [51] cáncer de páncreas , [52] cáncer de próstata [53] [54] [55] y tuberculosis . [56] También se ha aplicado a otros problemas biomédicos como el análisis genético de resultados farmacológicos . [57] [ 58] [59] Un desafío central es la escala de MDR a big data como el de los estudios de asociación de todo el genoma (GWAS). [60] Se han utilizado varios enfoques. Un enfoque es filtrar las características antes del análisis de MDR. [61] Esto se puede hacer utilizando conocimiento biológico a través de herramientas como BioFilter. [62] También se puede hacer usando herramientas computacionales como ReliefF. [63] Otro enfoque es usar algoritmos de búsqueda estocástica como la programación genética para explorar el espacio de búsqueda de combinaciones de características. [64] Otro enfoque es una búsqueda de fuerza bruta usando computación de alto rendimiento . [65] [66] [67]
Implementaciones
- www.epistasis.org ofrece un paquete de software MDR de código abierto y disponible gratuitamente.
- Un paquete R para MDR. [68]
- Una implementación de Python compatible con sklearn.
- Un paquete R para MDR basado en modelos. [69]
- MDR en Weka.
- MDR generalizado.
Véase también
Referencias
- ^ McKinney, Brett A.; Reif, David M.; Ritchie, Marylyn D.; Moore, Jason H. (1 de enero de 2006). "Aprendizaje automático para detectar interacciones gen-gen: una revisión". Applied Bioinformatics . 5 (2): 77–88. doi :10.2165/00822942-200605020-00002. ISSN 1175-5636. PMC 3244050 . PMID 16722772.
- ^ Ritchie, Marylyn D.; Hahn, Lance W.; Roodi, Nady; Bailey, L. Renee; Dupont, William D.; Parl, Fritz F.; Moore, Jason H. (1 de julio de 2001). "La reducción de la dimensionalidad multifactorial revela interacciones de alto orden entre los genes del metabolismo del estrógeno en el cáncer de mama esporádico". The American Journal of Human Genetics . 69 (1): 138–147. doi :10.1086/321276. ISSN 0002-9297. PMC 1226028 . PMID 11404819.
- ^ Ritchie, Marylyn D.; Hahn, Lance W.; Moore, Jason H. (1 de febrero de 2003). "Poder de la reducción de la dimensionalidad multifactorial para detectar interacciones gen-gen en presencia de error de genotipado, datos faltantes, fenocopia y heterogeneidad genética". Epidemiología genética . 24 (2): 150–157. doi :10.1002/gepi.10218. ISSN 1098-2272. PMID 12548676. S2CID 6335612.
- ^ Hahn, LW; Ritchie, MD; Moore, JH (12 de febrero de 2003). "Software de reducción de dimensionalidad multifactorial para detectar interacciones gen-gen y gen-ambiente". Bioinformática . 19 (3): 376–382. doi : 10.1093/bioinformatics/btf869 . ISSN 1367-4803. PMID 12584123.
- ^ W., Hahn, Lance; H., Moore, Jason (1 de enero de 2004). "Discriminación ideal de criterios de valoración clínicos discretos mediante genotipos multilocus". Biología in silico . 4 (2): 183–194. ISSN 1386-6338. PMID 15107022.
{{cite journal}}
: CS1 maint: varios nombres: lista de autores ( enlace ) - ^ Moore, Jason H. (1 de noviembre de 2004). "Análisis computacional de interacciones gen-gen utilizando reducción de dimensionalidad multifactorial". Expert Review of Molecular Diagnostics . 4 (6): 795–803. doi :10.1586/14737159.4.6.795. ISSN 1473-7159. PMID 15525222. S2CID 26324399.
- ^ ab Moore, Jason H.; Andrews, Peter C. (1 de enero de 2015). "Análisis de epistasis mediante reducción de dimensionalidad multifactorial". En Moore, Jason H.; Williams, Scott M. (eds.). Epistasis . Métodos en biología molecular. Vol. 1253. Springer Nueva York. págs. 301–314. doi :10.1007/978-1-4939-2155-3_16. ISBN 9781493921546. Número de identificación personal 25403539.
- ^ Moore, Jason H. (1 de enero de 2010). "Detección, caracterización e interpretación de interacciones gen-gen no lineales mediante reducción de dimensionalidad multifactorial". Métodos computacionales para la genética de rasgos complejos . Avances en genética. Vol. 72. págs. 101–116. doi :10.1016/B978-0-12-380862-2.00005-9. ISBN 978-0-12-380862-2. ISSN 0065-2660. PMID 21029850.
- ^ ab Moore, Jason H.; Gilbert, Joshua C.; Tsai, Chia-Ti; Chiang, Fu-Tien; Holden, Todd; Barney, Nate; White, Bill C. (21 de julio de 2006). "Un marco computacional flexible para detectar, caracterizar e interpretar patrones estadísticos de epistasis en estudios genéticos de susceptibilidad humana a enfermedades". Journal of Theoretical Biology . 241 (2): 252–261. Bibcode :2006JThBi.241..252M. doi :10.1016/j.jtbi.2005.11.036. PMID 16457852.
- ^ Michalski, R (febrero de 1983). "Una teoría y metodología del aprendizaje inductivo". Inteligencia artificial . 20 (2): 111–161. doi :10.1016/0004-3702(83)90016-4.
- ^ Velez, Digna R.; White, Bill C.; Motsinger, Alison A.; Bush, William S.; Ritchie, Marylyn D.; Williams, Scott M.; Moore, Jason H. (1 de mayo de 2007). "Una función de precisión equilibrada para el modelado de epistasis en conjuntos de datos desequilibrados utilizando reducción de dimensionalidad multifactorial". Epidemiología genética . 31 (4): 306–315. doi :10.1002/gepi.20211. ISSN 0741-0395. PMID 17323372. S2CID 28156181.
- ^ Namkung, Junghyun; Kim, Kyunga; Yi, Sungon; Chung, Wonil; Kwon, Min-Seok; Park, Taesung (1 de febrero de 2009). "Nuevas medidas de evaluación para clasificadores de reducción de dimensionalidad multifactorial en análisis de interacción gen-gen". Bioinformática . 25 (3): 338–345. doi : 10.1093/bioinformatics/btn629 . ISSN 1367-4811. PMID 19164302.
- ^ Bush, William S.; Edwards, Todd L.; Dudek, Scott M.; McKinney, Brett A.; Ritchie, Marylyn D. (1 de enero de 2008). "Las medidas de tabla de contingencia alternativas mejoran la potencia y la detección de la reducción de la dimensionalidad multifactorial". BMC Bioinformatics . 9 : 238. doi : 10.1186/1471-2105-9-238 . ISSN 1471-2105. PMC 2412877 . PMID 18485205.
- ^ ab Coffey, Christopher S.; Hebert, Patricia R.; Ritchie, Marylyn D.; Krumholz, Harlan M.; Gaziano, J. Michael; Ridker, Paul M.; Brown, Nancy J.; Vaughan, Douglas E.; Moore, Jason H. (1 de enero de 2004). "Una aplicación de regresión logística condicional y reducción de dimensionalidad multifactorial para detectar interacciones gen-gen en el riesgo de infarto de miocardio: la importancia de la validación del modelo". BMC Bioinformatics . 5 : 49. doi : 10.1186/1471-2105-5-49 . ISSN 1471-2105. PMC 419697 . PMID 15119966.
- ^ Motsinger, Alison A.; Ritchie, Marylyn D. (1 de septiembre de 2006). "El efecto de la reducción de los intervalos de validación cruzada en el rendimiento de la reducción de la dimensionalidad multifactorial". Epidemiología genética . 30 (6): 546–555. doi :10.1002/gepi.20166. ISSN 1098-2272. PMID 16800004. S2CID 20573232.
- ^ Gory, Jeffrey J.; Sweeney, Holly C.; Reif, David M.; Motsinger-Reif, Alison A. (5 de noviembre de 2012). "Una comparación de los métodos de validación de modelos internos para la reducción de la dimensionalidad multifactorial en el caso de la heterogeneidad genética". BMC Research Notes . 5 : 623. doi : 10.1186/1756-0500-5-623 . ISSN 1756-0500. PMC 3599301 . PMID 23126544.
- ^ Winham, Stacey J.; Slater, Andrew J.; Motsinger-Reif, Alison A. (22 de julio de 2010). "Una comparación de técnicas de validación interna para la reducción de la dimensionalidad multifactorial". BMC Bioinformatics . 11 : 394. doi : 10.1186/1471-2105-11-394 . ISSN 1471-2105. PMC 2920275 . PMID 20650002.
- ^ Pattin, Kristine A.; White, Bill C.; Barney, Nate; Gui, Jiang; Nelson, Heather H.; Kelsey, Karl T.; Andrew, Angeline S.; Karagas, Margaret R.; Moore, Jason H. (1 de enero de 2009). "Un método de prueba de hipótesis computacionalmente eficiente para el análisis de epistasis utilizando reducción de dimensionalidad multifactorial". Epidemiología genética . 33 (1): 87–94. doi :10.1002/gepi.20360. ISSN 1098-2272. PMC 2700860 . PMID 18671250.
- ^ Greene, Casey S.; Himmelstein, Daniel S.; Nelson, Heather H.; Kelsey, Karl T.; Williams, Scott M.; Andrew, Angeline S.; Karagas, Margaret R.; Moore, Jason H. (1 de octubre de 2009). "Habilitación de la genómica personal con una prueba explícita de epistasis". Biocomputing 2010: Simposio del Pacífico sobre biocomputación . World Scientific. págs. 327–336. doi :10.1142/9789814295291_0035. ISBN . 9789814299473. PMC 2916690 . PMID 19908385.
- ^ Dai, Hongying; Bhandary, Madhusudan; Becker, Mara; Leeder, J. Steven; Gaedigk, Roger; Motsinger-Reif, Alison A. (22 de mayo de 2012). "Pruebas globales de valores P para modelos de reducción de dimensionalidad multifactorial en la selección del número óptimo de genes objetivo". BioData Mining . 5 (1): 3. doi : 10.1186/1756-0381-5-3 . ISSN 1756-0381. PMC 3508622 . PMID 22616673.
- ^ Motsinger-Reif, Alison A. (30 de diciembre de 2008). "El efecto de las estrategias de prueba de permutación alternativas en el rendimiento de la reducción de dimensionalidad multifactorial". BMC Research Notes . 1 : 139. doi : 10.1186/1756-0500-1-139 . ISSN 1756-0500. PMC 2631601 . PMID 19116021.
- ^ Greene, Casey S.; Penrod, Nadia M.; Williams, Scott M.; Moore, Jason H. (2 de junio de 2009). "La imposibilidad de replicar una asociación genética puede proporcionar pistas importantes sobre la arquitectura genética". PLOS ONE . 4 (6): e5639. Bibcode :2009PLoSO...4.5639G. doi : 10.1371/journal.pone.0005639 . ISSN 1932-6203. PMC 2685469 . PMID 19503614.
- ^ Piette, Elizabeth R.; Moore, Jason H. (19 de abril de 2017). "Mejora de la reproducibilidad de los resultados de asociación genética mediante métodos de remuestreo de genotipos". Aplicaciones de la computación evolutiva . Apuntes de clase en informática. Vol. 10199. págs. 96–108. doi :10.1007/978-3-319-55849-3_7. ISBN 978-3-319-55848-6.
- ^ Moore, Jason H.; Hu, Ting (1 de enero de 2015). "Análisis de epistasis mediante la teoría de la información". Epistasis . Métodos en biología molecular . Vol. 1253. págs. 257–268. doi :10.1007/978-1-4939-2155-3_13. ISBN 978-1-4939-2154-6. ISSN 1940-6029. PMID 25403536.
- ^ Kim, Nora Chung; Andrews, Peter C.; Asselbergs, Folkert W.; Frost, H. Robert; Williams, Scott M.; Harris, Brent T.; Read, Cynthia; Askland, Kathleen D.; Moore, Jason H. (28 de julio de 2012). "Análisis de ontología génica de asociaciones genéticas por pares en dos estudios de todo el genoma de ELA esporádica". BioData Mining . 5 (1): 9. doi : 10.1186/1756-0381-5-9 . ISSN 1756-0381. PMC 3463436 . PMID 22839596.
- ^ Cheng, Samantha; Andrew, Angeline S.; Andrews, Peter C.; Moore, Jason H. (1 de enero de 2016). "El análisis de sistemas complejos de la susceptibilidad al cáncer de vejiga revela un papel para la actividad descarboxilasa en dos estudios de asociación de todo el genoma". BioData Mining . 9 : 40. doi : 10.1186/s13040-016-0119-z . PMC 5154053 . PMID 27999618.
- ^ Gola, Damian; Mahachie John, Jestinah M.; van Steen, Kristel; König, Inke R. (1 de marzo de 2016). "Una hoja de ruta hacia métodos de reducción de dimensionalidad multifactorial". Briefings in Bioinformatics . 17 (2): 293–308. doi :10.1093/bib/bbv038. ISSN 1477-4054. PMC 4793893 . PMID 26108231.
- ^ Martin, ER; Ritchie, MD; Hahn, L.; Kang, S.; Moore, JH (1 de febrero de 2006). "Un nuevo método para identificar efectos gen-gen en familias nucleares: la MDR-PDT". Epidemiología genética . 30 (2): 111–123. doi :10.1002/gepi.20128. ISSN 0741-0395. PMID 16374833. S2CID 25772215.
- ^ Lou, Xiang-Yang; Chen, Guo-Bo; Yan, Lei; Ma, Jennie Z.; Mangold, Jamie E.; Zhu, Jun; Elston, Robert C.; Li, Ming D. (1 de octubre de 2008). "Un enfoque combinatorio para detectar interacciones gen-gen y gen-ambiente en estudios familiares". American Journal of Human Genetics . 83 (4): 457–467. doi :10.1016/j.ajhg.2008.09.001. ISSN 1537-6605. PMC 2561932 . PMID 18834969.
- ^ Cattaert, Tom; Urrea, Víctor; Naj, Adam C.; De Lobel, Lizzy; De Wit, Vanessa; Fu, Mao; Mahachie John, Jestinah M.; Shen, Haiqing; Calle, M. Luz (22 de abril de 2010). "FAM-MDR: una técnica flexible de reducción de dimensionalidad multifactorial basada en la familia para detectar epistasis utilizando individuos relacionados". PLOS ONE . 5 (4): e10304. Bibcode :2010PLoSO...510304C. doi : 10.1371/journal.pone.0010304 . ISSN 1932-6203. PMC 2858665 . PMID 20421984.
- ^ Leem, Sangseob; Park, Taesung (14 de marzo de 2017). "Un método empírico de reducción de la dimensionalidad difusa multifactorial para detectar interacciones gen-gen". BMC Genomics . 18 (Supl 2): 115. doi : 10.1186/s12864-017-3496-x . ISSN 1471-2164. PMC 5374597 . PMID 28361694.
- ^ Gui, Jiang; Andrew, Angeline S.; Andrews, Peter; Nelson, Heather M.; Kelsey, Karl T.; Karagas, Margaret R.; Moore, Jason H. (1 de enero de 2010). "Un enfoque de muestreo simple y computacionalmente eficiente para el ajuste de covariables para el análisis de reducción de dimensionalidad multifactorial de la epistasis". Herencia humana . 70 (3): 219–225. doi :10.1159/000319175. ISSN 1423-0062. PMC 2982850 . PMID 20924193.
- ^ Chung, Yujin; Lee, Seung Yeoun; Elston, Robert C.; Park, Taesung (1 de enero de 2007). "Método de reducción de dimensionalidad multifactorial basado en odds ratio para detectar interacciones gen-gen". Bioinformática . 23 (1): 71–76. doi : 10.1093/bioinformatics/btl557 . ISSN 1367-4811. PMID 17092990.
- ^ Dai, Hongying; Charnigo, Richard J.; Becker, Mara L.; Leeder, J. Steven; Motsinger-Reif, Alison A. (8 de enero de 2013). "Modelado de puntuación de riesgo de interacciones de múltiples genes a genes utilizando reducción de dimensionalidad multifactorial agregada". BioData Mining . 6 (1): 1. doi : 10.1186/1756-0381-6-1 . PMC 3560267 . PMID 23294634.
- ^ Gui, Jiang; Moore, Jason H.; Kelsey, Karl T.; Marsit, Carmen J.; Karagas, Margaret R.; Andrew, Angeline S. (1 de enero de 2011). "Un nuevo método de reducción de la dimensionalidad multifactorial de supervivencia para detectar interacciones gen-gen con aplicación al pronóstico del cáncer de vejiga". Genética humana . 129 (1): 101–110. doi :10.1007/s00439-010-0905-5. ISSN 1432-1203. PMC 3255326 . PMID 20981448.
- ^ Lee, Seungyeoun; Son, Donghee; Yu, Wenbao; Park, Taesung (1 de diciembre de 2016). "Análisis de interacción gen-gen para el modelo de tiempo de falla acelerada utilizando un método de reducción de dimensionalidad multifactorial basado en un modelo unificado". Genómica e informática . 14 (4): 166–172. doi :10.5808/GI.2016.14.4.166. ISSN 1598-866X. PMC 5287120 . PMID 28154507.
- ^ Gui, Jiang; Andrew, Angeline S.; Andrews, Peter; Nelson, Heather M.; Kelsey, Karl T.; Karagas, Margaret R.; Moore, Jason H. (1 de enero de 2011). "Un método robusto de reducción de la dimensionalidad multifactorial para detectar interacciones gen-gen con aplicación al análisis genético de la susceptibilidad al cáncer de vejiga". Anales de genética humana . 75 (1): 20–28. doi :10.1111/j.1469-1809.2010.00624.x. ISSN 1469-1809. PMC 3057873 . PMID 21091664.
- ^ Gui, Jiang; Moore, Jason H.; Williams, Scott M.; Andrews, Peter; Hillege, Hans L.; van der Harst, Pim; Navis, Gerjan; Van Gilst, Wiek H.; Asselbergs, Folkert W. (1 de enero de 2013). "Un enfoque simple y computacionalmente eficiente para el análisis de reducción de dimensionalidad multifactorial de interacciones gen-gen para rasgos cuantitativos". PLOS ONE . 8 (6): e66545. Bibcode :2013PLoSO...866545G. doi : 10.1371/journal.pone.0066545 . ISSN 1932-6203. PMC 3689797 . PMID 23805232.
- ^ Lou, Xiang-Yang; Chen, Guo-Bo; Yan, Lei; Ma, Jennie Z.; Zhu, Jun; Elston, Robert C.; Li, Ming D. (1 de junio de 2007). "Un enfoque combinatorio generalizado para detectar interacciones gen por gen y gen por entorno con aplicación a la dependencia de la nicotina". American Journal of Human Genetics . 80 (6): 1125–1137. doi :10.1086/518312. ISSN 0002-9297. PMC 1867100 . PMID 17503330.
- ^ Tsai, Chia-Ti; Lai, Ling-Ping; Lin, Jiunn-Lee; Chiang, Fu-Tien; Hwang, Juey-Jen; Ritchie, Marylyn D.; Moore, Jason H.; Hsu, Kuan-Lih; Tseng, Chuen-Den (6 de abril de 2004). "Polimorfismos genéticos del sistema renina-angiotensina y fibrilación auricular". Circulation . 109 (13): 1640–1646. doi : 10.1161/01.CIR.0000124487.36586.26 . ISSN 0009-7322. PMID 15023884.
- ^ Asselbergs, Folkert W.; Moore, Jason H.; van den Berg, Maarten P.; Rimm, Eric B.; de Boer, Rudolf A.; Dullaart, Robin P.; Navis, Gerjan; van Gilst, Wiek H. (1 de enero de 2006). "Un papel para el polimorfismo CETP TaqIB en la determinación de la susceptibilidad a la fibrilación auricular: un estudio de casos y controles anidado". BMC Medical Genetics . 7 : 39. doi : 10.1186/1471-2350-7-39 . ISSN 1471-2350. PMC 1462991 . PMID 16623947.
- ^ Ma, DQ; Whitehead, PL; Menold, MM; Martin, ER; Ashley-Koch, AE; Mei, H.; Ritchie, MD; DeLong, GR; Abramson, RK (1 de septiembre de 2005). "Identificación de asociación significativa e interacción gen-gen de los genes de la subunidad del receptor GABA en el autismo". The American Journal of Human Genetics . 77 (3): 377–388. doi :10.1086/433195. ISSN 0002-9297. PMC 1226204 . PMID 16080114.
- ^ Andrew, Angeline S.; Nelson, Heather H.; Kelsey, Karl T.; Moore, Jason H.; Meng, Alexis C.; Casella, Daniel P.; Tosteson, Tor D.; Schned, Alan R.; Karagas, Margaret R. (1 de mayo de 2006). "La concordancia de múltiples enfoques analíticos demuestra una relación compleja entre los SNP de genes de reparación del ADN, el tabaquismo y la susceptibilidad al cáncer de vejiga". Carcinogénesis . 27 (5): 1030–1037. doi : 10.1093/carcin/bgi284 . ISSN 0143-3334. PMID 16311243.
- ^ Andrew, Angeline S.; Karagas, Margaret R.; Nelson, Heather H.; Guarrera, Simonetta; Polidoro, Silvia; Gamberini, Sara; Sacerdote, Carlotta; Moore, Jason H.; Kelsey, Karl T. (1 de enero de 2008). "Los polimorfismos de reparación del ADN modifican el riesgo de cáncer de vejiga: una estrategia analítica multifactorial". Herencia humana . 65 (2): 105–118. doi :10.1159/000108942. ISSN 0001-5652. PMC 2857629 . PMID 17898541.
- ^ Andrew, Angeline S.; Hu, Ting; Gu, Jian; Gui, Jiang; Ye, Yuanqing; Marsit, Carmen J.; Kelsey, Karl T.; Schned, Alan R.; Tanyos, Sam A. (1 de enero de 2012). "HSD3B e interacciones gen-gen en un análisis basado en la vía de la susceptibilidad genética al cáncer de vejiga". PLOS ONE . 7 (12): e51301. Bibcode :2012PLoSO...751301A. doi : 10.1371/journal.pone.0051301 . ISSN 1932-6203. PMC 3526593 . PMID 23284679.
- ^ Cao, Jingjing; Luo, Chenglin; Yan, Rui; Peng, Rui; Wang, Kaijuan; Wang, Peng; Ye, Hua; Song, Chunhua (1 de diciembre de 2016). "rs15869 en el sitio de unión de miRNA en BRCA2 está asociado con la susceptibilidad al cáncer de mama". Oncología médica . 33 (12): 135. doi :10.1007/s12032-016-0849-2. ISSN 1357-0560. PMID 27807724. S2CID 26042128.
- ^ Williams, Scott M.; Ritchie, Marylyn D.; III, John A. Phillips; Dawson, Elliot; Prince, Melissa; Dzhura, Elvira; Willis, Alecia; Semenya, Amma; Summar, Marshall (1 de enero de 2004). "Análisis multilocus de la hipertensión: un enfoque jerárquico". Herencia humana . 57 (1): 28–38. doi :10.1159/000077387. ISSN 0001-5652. PMID 15133310. S2CID 21079485.
- ^ Sanada, Hironobu; Yatabe, Junichi; Midorikawa, Sanae; Hashimoto, Shigeatsu; Watanabe, Tsuyoshi; Moore, Jason H.; Ritchie, Marylyn D.; Williams, Scott M.; Pezzullo, John C. (1 de marzo de 2006). "Polimorfismos de un solo nucleótido para el diagnóstico de hipertensión sensible a la sal". Química clínica . 52 (3): 352–360. doi : 10.1373/clinchem.2005.059139 . ISSN 0009-9147. PMID 16439609.
- ^ Moore, Jason H.; Williams, Scott M. (1 de enero de 2002). "Nuevas estrategias para identificar interacciones gen-gen en la hipertensión". Anales de Medicina . 34 (2): 88–95. doi :10.1080/07853890252953473. ISSN 0785-3890. PMID 12108579. S2CID 25398042.
- ^ De, Rishika; Verma, Shefali S.; Holzinger, Emily; Hall, Molly; Burt, Amber; Carrell, David S.; Crosslin, David R.; Jarvik, Gail P.; Kuivaniemi, Helena (1 de febrero de 2017). "Identificación de interacciones gen-gen que están altamente asociadas con cuatro rasgos lipídicos cuantitativos en múltiples cohortes" (PDF) . Human Genetics . 136 (2): 165–178. doi :10.1007/s00439-016-1738-7. ISSN 1432-1203. PMID 27848076. S2CID 24702049.
- ^ De, Rishika; Verma, Shefali S.; Drenos, Fotios; Holzinger, Emily R.; Holmes, Michael V.; Hall, Molly A.; Crosslin, David R.; Carrell, David S.; Hakonarson, Hakon (1 de enero de 2015). "Identificación de interacciones gen-gen que están altamente asociadas con el índice de masa corporal mediante reducción cuantitativa de la dimensionalidad multifactorial (QMDR)". BioData Mining . 8 : 41. doi : 10.1186/s13040-015-0074-0 . PMC 4678717 . PMID 26674805.
- ^ Duell, Eric J.; Bracci, Paige M.; Moore, Jason H.; Burk, Robert D.; Kelsey, Karl T.; Holly, Elizabeth A. (1 de junio de 2008). "Detección de interacciones gen-gen y gen-ambiente basadas en vías en el cáncer de páncreas". Epidemiología del cáncer, biomarcadores y prevención . 17 (6): 1470–1479. doi :10.1158/1055-9965.EPI-07-2797. ISSN 1055-9965. PMC 4410856 . PMID 18559563.
- ^ Xu, Jianfeng; Lowey, James; Wiklund, Fredrik; Sun, Jielin; Lindmark, Fredrik; Hsu, Fang-Chi; Dimitrov, Latchezar; Chang, Baoli; Turner, Aubrey R. (1 de noviembre de 2005). "La interacción de cuatro genes en la vía de la inflamación predice significativamente el riesgo de cáncer de próstata". Epidemiología del cáncer, biomarcadores y prevención . 14 (11): 2563–2568. doi : 10.1158/1055-9965.EPI-05-0356 . ISSN 1055-9965. PMID 16284379.
- ^ Lavender, Nicole A.; Rogers, Erica N.; Yeyeodu, Susan; Rudd, James; Hu, Ting; Zhang, Jie; Brock, Guy N.; Kimbro, Kevin S.; Moore, Jason H. (30 de abril de 2012). "Interacción entre variantes de secuencia asociadas a la apoptosis y efectos conjuntos en el cáncer de próstata agresivo". BMC Medical Genomics . 5 : 11. doi : 10.1186/1755-8794-5-11 . ISSN 1755-8794. PMC 3355002 . PMID 22546513.
- ^ Lavender, Nicole A.; Benford, Marnita L.; VanCleave, Tiva T.; Brock, Guy N.; Kittles, Rick A.; Moore, Jason H.; Hein, David W.; Kidd, La Creis R. (16 de noviembre de 2009). "Examen de los genes polimórficos de glutatión S-transferasa (GST), tabaquismo y riesgo de cáncer de próstata entre hombres de ascendencia africana: un estudio de casos y controles". BMC Cancer . 9 : 397. doi : 10.1186/1471-2407-9-397 . ISSN 1471-2407. PMC 2783040 . PMID 19917083.
- ^ Collins, Ryan L.; Hu, Ting; Wejse, Christian; Sirugo, Giorgio; Williams, Scott M.; Moore, Jason H. (18 de febrero de 2013). "La reducción de la dimensionalidad multifactorial revela una interacción epistática de tres locus asociada con la susceptibilidad a la tuberculosis pulmonar". BioData Mining . 6 (1): 4. doi : 10.1186/1756-0381-6-4 . PMC 3618340 . PMID 23418869.
- ^ Wilke, Russell A.; Reif, David M.; Moore, Jason H. (1 de noviembre de 2005). "Combinatorial Pharmacogenetics". Nature Reviews Drug Discovery . 4 (11): 911–918. doi :10.1038/nrd1874. ISSN 1474-1776. PMID 16264434. S2CID 11643026.
- ^ Motsinger, Alison A.; Ritchie, Marylyn D.; Shafer, Robert W.; Robbins, Gregory K.; Morse, Gene D.; Labbe, Line; Wilkinson, Grant R.; Clifford, David B.; D'Aquila, Richard T. (1 de noviembre de 2006). "Interacciones genéticas multilocus y respuesta a regímenes que contienen efavirenz: un estudio grupal de ensayos clínicos sobre el SIDA en adultos". Farmacogenética y genómica . 16 (11): 837–845. doi :10.1097/01.fpc.0000230413.97596.fa. ISSN 1744-6872. PMID 17047492. S2CID 26266170.
- ^ Ritchie, Marylyn D.; Motsinger, Alison A. (1 de diciembre de 2005). "Reducción de la dimensionalidad multifactorial para detectar interacciones gen-gen y gen-ambiente en estudios farmacogenómicos". Farmacogenómica . 6 (8): 823–834. doi :10.2217/14622416.6.8.823. ISSN 1462-2416. PMID 16296945. S2CID 10348021.
- ^ Moore, Jason H.; Asselbergs, Folkert W.; Williams, Scott M. (15 de febrero de 2010). "Desafíos de la bioinformática para los estudios de asociación de todo el genoma". Bioinformática . 26 (4): 445–455. doi :10.1093/bioinformatics/btp713. ISSN 1367-4811. PMC 2820680 . PMID 20053841.
- ^ Sun, Xiangqing; Lu, Qing; Mukherjee, Shubhabrata; Mukheerjee, Shubhabrata; Crane, Paul K.; Elston, Robert; Ritchie, Marylyn D. (1 de enero de 2014). "Proceso de análisis para la búsqueda de epistasis: filtrado estadístico versus biológico". Frontiers in Genetics . 5 : 106. doi : 10.3389/fgene.2014.00106 . PMC 4012196 . PMID 24817878.
- ^ Pendergrass, Sarah A.; Frase, Alex; Wallace, John; Wolfe, Daniel; Katiyar, Neerja; Moore, Carrie; Ritchie, Marylyn D. (30 de diciembre de 2013). "Análisis genómicos con biofiltro 2.0: filtrado, anotación y desarrollo de modelos basados en el conocimiento". BioData Mining . 6 (1): 25. doi : 10.1186/1756-0381-6-25 . PMC 3917600 . PMID 24378202.
- ^ Moore, Jason H. (1 de enero de 2015). "Análisis de epistasis con ReliefF". Epistasis . Métodos en biología molecular . Vol. 1253. págs. 315–325. doi :10.1007/978-1-4939-2155-3_17. ISBN 978-1-4939-2154-6. ISSN 1940-6029. PMID 25403540.
- ^ Moore, Jason H.; White, Bill C. (1 de enero de 2007). "Análisis genético de todo el genoma mediante programación genética: la necesidad crítica de conocimiento experto". En Riolo, Rick; Soule, Terence; Worzel, Bill (eds.). Teoría y práctica de la programación genética IV . Computación genética y evolutiva. Springer US. págs. 11–28. doi :10.1007/978-0-387-49650-4_2. ISBN 9780387333755. Número de identificación del sujeto 55188394.
- ^ Greene, Casey S.; Sinnott-Armstrong, Nicholas A.; Himmelstein, Daniel S.; Park, Paul J.; Moore, Jason H.; Harris, Brent T. (1 de marzo de 2010). "La reducción de la dimensionalidad multifactorial para las unidades de procesamiento gráfico permite la prueba de epistasis en todo el genoma en ELA esporádica". Bioinformática . 26 (5): 694–695. doi :10.1093/bioinformatics/btq009. ISSN 1367-4811. PMC 2828117 . PMID 20081222.
- ^ Bush, William S.; Dudek, Scott M.; Ritchie, Marylyn D. (1 de septiembre de 2006). "Reducción de la dimensionalidad multifactorial paralela: una herramienta para el análisis a gran escala de interacciones gen-gen". Bioinformática . 22 (17): 2173–2174. doi :10.1093/bioinformatics/btl347. ISSN 1367-4811. PMC 4939609 . PMID 16809395.
- ^ Sinnott-Armstrong, Nicholas A.; Greene, Casey S.; Cancare, Fabio; Moore, Jason H. (24 de julio de 2009). "Aceleración del análisis de epistasis en genética humana con hardware gráfico de consumo". BMC Research Notes . 2 : 149. doi : 10.1186/1756-0500-2-149 . ISSN 1756-0500. PMC 2732631 . PMID 19630950.
- ^ Winham, Stacey J.; Motsinger-Reif, Alison A. (16 de agosto de 2011). "Una implementación del paquete R de reducción de dimensionalidad multifactorial". BioData Mining . 4 (1): 24. doi : 10.1186/1756-0381-4-24 . ISSN 1756-0381. PMC 3177775 . PMID 21846375.
- ^ Calle, M. Luz; Urrea, Víctor; Malats, Núria; Van Steen, Kristel (1 de septiembre de 2010). «mbmdr: un paquete R para explorar interacciones gen-gen asociadas con rasgos binarios o cuantitativos». Bioinformática . 26 (17): 2198–2199. doi : 10.1093/bioinformatics/btq352 . ISSN 1367-4811. PMID 20595460.
Lectura adicional
- Michalski, RS, "Reconocimiento de patrones como inducción informática guiada por el conocimiento", Informes del Departamento de Ciencias de la Computación, Nº 927, Universidad de Illinois, Urbana, junio de 1978.