Parcela RA

El gráfico de promedio de razón (RA) es una versión basada en números enteros de un gráfico MA para visualizar datos de recuento de dos condiciones. Su forma distintiva similar a una flecha se deriva de la forma en que incluye puntos (0, n ) o ( n ,0) exclusivos de la condición en el gráfico a través de un factor épsilon .

Definición

Un gráfico RA , al igual que su primo, el gráfico MA , es una versión reescalada y rotada (45 grados) de un gráfico de dispersión bidimensional simple de a versus b donde a y b son vectores de igual longitud de mediciones positivas. Este reescalado y rotación permite una mejor visibilidad y énfasis de puntos atípicos importantes que varían entre las dos condiciones de medición. ^[1] Esencialmente es un gráfico de la razón logarítmica [R] vs el logaritmo promedio [A] de cada par de elementos de a y b . Sin embargo, a diferencia de un gráfico MA, debido a que el gráfico RA toma recuentos de números enteros no negativos como entrada, debe emplear soluciones alternativas para incluir puntos matemáticamente invisibles (como puntos donde uno o ambos elementos del par es cero).

Si modificamos nuestro vector a (o b ) original mediante:

a={\begin{cases}a+\varepsilon ,&{\text{si }}a=0\\a,&{\text{si }}a>0\end{cases}}

dónde

0<\varepsilon <0.5

Entonces R y A se pueden definir como:

R=\log _{2}(a/b)

A={\frac {1}{2}}\times (\log _{2}a+\log _{2}b)

R , al igual que M , se representa en el eje y y representa una relación logarítmica (cambio de pliegue) entre a y b . A se representa en el eje x y representa la abundancia promedio para un par de coordenadas. El gráfico RA proporciona una descripción general rápida de la distribución y el tamaño de un conjunto de datos que consta de recuentos distintos de cero.

Etimología

El prefijo del acrónimo "RA" a veces se pronuncia como la palabra de una sílaba "ray" debido a la gran semejanza del gráfico con un rayo geométrico . Esta característica forma de flecha se deriva de dos características clave: a la derecha, en el origen del vector , una cola asintótica larga y, a la izquierda (que forma la punta de la flecha), dos parches (a menudo densos) de puntos de condición única.

Soluciones alternativas para la visibilidad e inclusión de puntos

Puntos únicos de condición

Debido a que una gran parte de los pares de a y b contienen ceros en una o ambas condiciones, es imposible representarlos tal como están en una escala logarítmica. Otras funciones de representación gráfica MA incluyen artificialmente estos puntos únicos en la gráfica, distribuyéndolos verticalmente como una "mancha" a la izquierda u horizontalmente como una "alfombra" en la parte superior e inferior de la gráfica. En una gráfica RA, por el contrario, los únicos se incluyen mediante la adición de un pequeño factor épsilon (entre .1 y .5) que los coloca en una ubicación estadísticamente más apropiada en la gráfica.

Dos formas diferentes de agregar artificialmente puntos de condición única en un gráfico de estilo MA.

Trazado excesivo

Otro problema con la representación gráfica de este (o cualquier otro) tipo de datos de recuento es la superposición de los gráficos, que se soluciona en el gráfico RA alejando los puntos entre sí, pero sin que se fusionen con otras coordenadas. El resultado de esta característica es una apariencia de mosaico en el gráfico que se desvanece a medida que aumenta A.

Parcela RA en el paquete caroline

Paquetes

El paquete R de CRAN de Caroline contiene la única implementación conocida de un gráfico de AR. Sin embargo, el paquete R de metatranscriptómica "manta" proporciona una envoltura alrededor de esta implementación del gráfico de AR y se utiliza para evaluar el cambio de pliegue en la transcripción de genes (los puntos) mientras se visualizan simultáneamente las distribuciones taxonómicas de cada gen como puntos individuales del gráfico circular. ^[2]

Ejemplos

biblioteca(carolina)a <- rnbinom(n=10000, mu=5, tamaño=2)b <- rnbinom(n=10000, mu=5, tamaño=2)raPlot(a, b)

Referencias

^ Dudoit, S , Yang, YH , Callow, MJ, Speed, TP . (2002). Métodos estadísticos para identificar genes expresados diferencialmente en experimentos de microarrays de ADNc replicados. Stat. Sin. 12:1 111–139
^ Schruth, D. y Marchetti, A. (2011). Análisis de transcripción normalizada de ensamblaje microbiano. Versión del paquete R 0.9.5.