stringtranslate.com

Parcela MA

En el ámbito de la biología computacional , un gráfico MA es una aplicación del gráfico de Bland-Altman para la representación visual de datos genómicos . El gráfico visualiza las diferencias entre las mediciones tomadas en dos muestras, transformando los datos en escalas M (ratio logarítmico) y A ( media media ), y luego representando gráficamente estos valores. Aunque originalmente se aplicaron en el contexto de datos de expresión génica de microarrays de ADN de dos canales , los gráficos MA también se utilizan para visualizar análisis de secuenciación de alto rendimiento . [1] [2]

Explicación

Los datos de microarrays se normalizan a menudo dentro de los arrays para controlar los sesgos sistemáticos en el acoplamiento de colorantes y las eficiencias de hibridación, así como otros sesgos técnicos en las sondas de ADN y la punta de impresión utilizada para detectar el array. [3] Al minimizar estas variaciones sistemáticas, se pueden encontrar diferencias biológicas reales. Para determinar si se necesita normalización, se pueden representar gráficamente las intensidades de Cy5 (R) contra las intensidades de Cy3 (G) y ver si la pendiente de la línea es de alrededor de 1. Un método mejorado, que es básicamente una rotación escalada de 45 grados del gráfico R vs. G es un gráfico MA. [4] El gráfico MA es un gráfico de la distribución de la relación de intensidad rojo/verde ('M') graficada por la intensidad promedio ('A'). M y A se definen mediante las siguientes ecuaciones.

Por lo tanto, M es el logaritmo binario de la relación de intensidad (o diferencia entre intensidades logarítmicas) y A es la intensidad logarítmica promedio de un punto en el gráfico. Los gráficos MA se utilizan luego para visualizar la relación dependiente de la intensidad de los datos de microarrays sin procesar (los microarrays suelen mostrar un sesgo aquí, con un A más alto que resulta en un |M| más alto, es decir, cuanto más brillante sea el punto, más probable es que se observe una diferencia entre la muestra y el control). El gráfico MA coloca la variable M en el eje y y A en el eje x y brinda una descripción general rápida de la distribución de los datos.

En muchos experimentos de expresión génica con microarrays, se supone que la mayoría de los genes no verían ningún cambio en su expresión; por lo tanto, la mayoría de los puntos en el eje y ( M ) estarían ubicados en 0, ya que log(1) es 0. Si este no es el caso, entonces se debe aplicar un método de normalización como LOESS a los datos antes del análisis estadístico. (En el diagrama a continuación, observe la línea roja que corre debajo de la marca cero antes de la normalización; debería ser recta. Como no es recta, los datos deben normalizarse. Después de normalizarse, la línea roja es recta sobre la línea cero y se muestra como rosa/negra).

Paquetes

Varios paquetes de Bioconductor , para el software R , ofrecen la posibilidad de crear gráficos MA. Entre ellos se incluyen affy (ma.plot, mva.pairs), limma (plotMA), marray (maPlot) y edgeR(maPlot).

Se pueden generar gráficos "RA" similares utilizando la función raPlot en el paquete R de caroline CRAN .

Un gráfico MA interactivo para filtrar genes por valores M, A y p, buscar por nombres o con un lazo y guardar genes seleccionados, está disponible como un gráfico MA mejorado con código R-Shiny.

Ejemplo en el lenguaje de programación R

biblioteca ( afy )si ( requerir ( affydata )) { datos ( Dilución ) }  y <- ( exprs ( Dilución )[, c ( "20B" , "10A" )])    x11 ()ma.plot ( filaMeans ( log2 ( y )), log2 ( y [, 1 ]) - log2 ( y [, 2 ]), cex = 1 )      título ( "Conjunto de datos de diluciones (matriz 20B v 10A)" )biblioteca ( preprocessCore )#hacer una normalización cuantil x <- normalize.quantiles ( y )  x11 ()ma.plot ( rowMeans ( log2 ( x )), log2 ( x [, 1 ]) - log2 ( x [, 2 ]), cex = 1 ) title ( "Post Norm: Conjunto de datos de diluciones (matriz 20B v 10A)" )       
Parcelas MA.

Véase también

Referencias

  1. ^ Robinson, MD; McCarthy, DJ; Smyth, GK (11 de noviembre de 2009). "edgeR: un paquete Bioconductor para el análisis de expresión diferencial de datos de expresión génica digital". Bioinformática . 26 (1): 139–140. doi :10.1093/bioinformatics/btp616. PMC  2796818 . PMID  19910308.
  2. ^ Love, Michael I; Huber, Wolfgang; Anders, Simon (5 de diciembre de 2014). "Estimación moderada del cambio de plegamiento y dispersión para datos de ARN-seq con DESeq2". Genome Biology . 15 (12): 550. doi : 10.1186/s13059-014-0550-8 . PMC 4302049 . PMID  25516281. 
  3. ^ YH Yang , S Dudoit , P Luu, DM Lin, V Peng, J Ngai, TP Speed . (2002). Normalización de datos de microarrays de ADNc: un método compuesto robusto que aborda la variación sistemática de portaobjetos único y múltiple. Nucleic Acids Research vol. 30 (4) pp. e15.
  4. ^ Dudoit, S , Yang, YH , Callow, MJ, Speed, TP . (2002). Métodos estadísticos para identificar genes expresados ​​diferencialmente en experimentos de microarrays de ADNc replicados. Stat. Sin. 12:1 111–139