microarrays de ADN

Cómo utilizar un microarray para el genotipado. El vídeo muestra el proceso de extracción de genotipos de una muestra de saliva humana mediante microarrays. El genotipado es un uso importante de los microarrays de ADN, pero con algunas modificaciones también se pueden utilizar para otros fines, como la medición de la expresión genética y los marcadores epigenéticos.

Un microarray de ADN (también conocido comúnmente como chip de ADN o biochip ) es una colección de puntos microscópicos de ADN adheridos a una superficie sólida. Los científicos utilizan micromatrices de ADN para medir los niveles de expresión de una gran cantidad de genes simultáneamente o para genotipar múltiples regiones de un genoma. Cada mancha de ADN contiene picomoles (10 ⁻¹² moles ) de una secuencia de ADN específica, conocida como sondas (o reporteros u oligos ). Puede ser una sección corta de un gen u otro elemento de ADN que se utiliza para hibridar una muestra de ADNc o ARNc (también llamado ARN antisentido) (llamada diana ) en condiciones muy estrictas. La hibridación sonda-diana generalmente se detecta y cuantifica mediante la detección de dianas marcadas con fluoróforo , plata o quimioluminiscencia para determinar la abundancia relativa de secuencias de ácido nucleico en la diana. Las matrices de ácido nucleico originales eran macromatrices de aproximadamente 9 cm × 12 cm y el primer análisis computarizado basado en imágenes se publicó en 1981. ^[1] Fue inventado por Patrick O. Brown . Un ejemplo de su aplicación es en matrices de SNP para polimorfismos en enfermedades cardiovasculares, cáncer, patógenos y análisis GWAS. También se utiliza para la identificación de variaciones estructurales y la medición de la expresión genética.

Principio

El principio central detrás de los microarrays es la hibridación entre dos cadenas de ADN, la propiedad de las secuencias de ácidos nucleicos complementarias de emparejarse específicamente entre sí formando enlaces de hidrógeno entre pares de bases de nucleótidos complementarios . Un gran número de pares de bases complementarias en una secuencia de nucleótidos significa un enlace no covalente más estrecho entre las dos cadenas. Después de eliminar por lavado las secuencias de unión no específicas, sólo quedarán hibridadas las cadenas fuertemente apareadas. Las secuencias diana marcadas con fluorescencia que se unen a una secuencia de sonda generan una señal que depende de las condiciones de hibridación (como la temperatura) y del lavado después de la hibridación. La intensidad total de la señal, desde un punto (característica), depende de la cantidad de muestra objetivo que se une a las sondas presentes en ese punto. Los microarrays utilizan cuantificación relativa en la que la intensidad de una característica se compara con la intensidad de la misma característica en una condición diferente, y la identidad de la característica se conoce por su posición.

Los pasos requeridos en un experimento de microarrays.

Usos y tipos

Dos chips Affymetrix. Se muestra una coincidencia en la parte inferior izquierda para comparar el tamaño.

Existen muchos tipos de matrices y la distinción más amplia es si están dispuestas espacialmente en una superficie o en cuentas codificadas:

La matriz tradicional en fase sólida es una colección de "puntos" microscópicos ordenados, llamados características, cada uno con miles de sondas idénticas y específicas unidas a una superficie sólida, como un biochip de vidrio , plástico o silicio (comúnmente conocido como chip de genoma , ADN). chip o conjunto de genes ). Se pueden colocar miles de estas características en ubicaciones conocidas en un solo microarray de ADN.
La matriz de perlas alternativa es una colección de perlas microscópicas de poliestireno, cada una con una sonda específica y una proporción de dos o más tintes, que no interfieren con los tintes fluorescentes utilizados en la secuencia objetivo.

Las micromatrices de ADN se pueden utilizar para detectar ADN (como en la hibridación genómica comparativa ) o detectar ARN (más comúnmente como ADNc después de la transcripción inversa ) que puede traducirse o no en proteínas. El proceso de medir la expresión génica mediante ADNc se denomina análisis de expresión o perfil de expresión .

Las aplicaciones incluyen:

Los conjuntos especializados adaptados a cultivos particulares se están volviendo cada vez más populares en aplicaciones de mejoramiento molecular . En el futuro podrían usarse para seleccionar plántulas en etapas tempranas para reducir el número de plántulas innecesarias que se prueban en las operaciones de mejoramiento. ^[10]

Fabricación

Los microarrays se pueden fabricar de diferentes maneras, según la cantidad de sondas que se examinen, los costos, los requisitos de personalización y el tipo de pregunta científica que se plantee. Los conjuntos de proveedores comerciales pueden tener tan solo 10 sondas o hasta 5 millones o más de sondas a escala micrométrica.

Manchado vs.en el lugarmatrices sintetizadas

Un robot imprime un microarray de ADN en la Universidad de Delaware

Los microarrays se pueden fabricar utilizando una variedad de tecnologías, incluida la impresión con alfileres de punta fina sobre portaobjetos de vidrio, fotolitografía usando máscaras prefabricadas, fotolitografía usando dispositivos de microespejos dinámicos, impresión por chorro de tinta, ^[11]^[12] o electroquímica en conjuntos de microelectrodos. .

En los microarrays manchados , las sondas son oligonucleótidos , ADNc o pequeños fragmentos de productos de PCR que corresponden a ARNm . Las sondas se sintetizan antes de su depósito en la superficie de la matriz y luego se "manchan" sobre el vidrio. Un enfoque común utiliza una serie de finos alfileres o agujas controlados por un brazo robótico que se sumerge en pocillos que contienen sondas de ADN y luego deposita cada sonda en ubicaciones designadas en la superficie de la matriz. La "cuadrícula" de sondas resultante representa los perfiles de ácido nucleico de las sondas preparadas y está lista para recibir "objetivos" de ADNc o ARNc complementarios derivados de muestras experimentales o clínicas. Esta técnica es utilizada por científicos investigadores de todo el mundo para producir micromatrices impresas "internas" en sus propios laboratorios. Estas matrices se pueden personalizar fácilmente para cada experimento, porque los investigadores pueden elegir las sondas y las ubicaciones de impresión en las matrices, sintetizar las sondas en su propio laboratorio (o instalación colaboradora) y detectar las matrices. Luego pueden generar sus propias muestras etiquetadas para la hibridación, hibridar las muestras con la matriz y, finalmente, escanear las matrices con su propio equipo. Esto proporciona una micromatriz de costo relativamente bajo que puede personalizarse para cada estudio y evita los costos de comprar matrices comerciales, a menudo más caras, que pueden representar una gran cantidad de genes que no son de interés para el investigador. Existen publicaciones que indican que los microarrays manchados internos pueden no proporcionar el mismo nivel de sensibilidad en comparación con los arreglos de oligonucleótidos comerciales, ^[13] posiblemente debido a los tamaños de lote pequeños y a la reducción de la eficiencia de impresión en comparación con los fabricantes industriales de arreglos de oligo.

En los microarrays de oligonucleótidos , las sondas son secuencias cortas diseñadas para coincidir con partes de la secuencia de marcos de lectura abiertos conocidos o previstos . Aunque las sondas de oligonucleótidos se utilizan a menudo en micromatrices "manchadas", el término "matriz de oligonucleótidos" se refiere con mayor frecuencia a una técnica de fabricación específica. Las matrices de oligonucleótidos se producen imprimiendo secuencias cortas de oligonucleótidos diseñadas para representar un único gen o familia de variantes de empalme de genes mediante la síntesis de esta secuencia directamente sobre la superficie de la matriz en lugar de depositar secuencias intactas. Las secuencias pueden ser más largas (sondas de 60 unidades, como las diseñadas por Agilent ) o más cortas (sondas de 25 unidades producidas por Affymetrix ) dependiendo del propósito deseado; Las sondas más largas son más específicas de genes diana individuales, las sondas más cortas pueden detectarse con mayor densidad en todo el conjunto y son más baratas de fabricar. Una técnica utilizada para producir matrices de oligonucleótidos incluye la síntesis fotolitográfica (Affymetrix) sobre un sustrato de sílice donde se utilizan agentes de enmascaramiento sensibles a la luz y a la luz para "construir" una secuencia de un nucleótido a la vez en toda la matriz. ^[14] Cada sonda aplicable se "desenmascara" selectivamente antes de bañar la matriz en una solución de un solo nucleótido, luego tiene lugar una reacción de enmascaramiento y el siguiente conjunto de sondas se desenmascara en preparación para una exposición de nucleótido diferente. Después de muchas repeticiones, las secuencias de cada sonda quedan completamente construidas. Más recientemente, Maskless Array Synthesis de NimbleGen Systems ha combinado flexibilidad con una gran cantidad de sondas. ^[15]

Detección de dos canales versus detección de un canal

Diagrama de un experimento típico de microarrays de dos colores.

Los microarrays de dos colores o los microarrays de dos canales normalmente se hibridan con ADNc preparado a partir de dos muestras para comparar (por ejemplo, tejido enfermo versus tejido sano) y que están marcados con dos fluoróforos diferentes . ^{[16] Los tintes} fluorescentes comúnmente utilizados para el marcaje de ADNc incluyen Cy 3, que tiene una longitud de onda de emisión de fluorescencia de 570 nm (correspondiente a la parte verde del espectro de luz), y Cy 5 con una longitud de onda de emisión de fluorescencia de 670 nm (correspondiente a la parte verde del espectro de luz). parte roja del espectro luminoso). Las dos muestras de ADNc marcadas con Cy se mezclan e hibridan en un único microarray que luego se escanea en un escáner de microarrays para visualizar la fluorescencia de los dos fluoróforos después de la excitación con un rayo láser de una longitud de onda definida. Luego se pueden utilizar las intensidades relativas de cada fluoróforo en un análisis basado en proporciones para identificar genes regulados hacia arriba y hacia abajo. ^[17]

"Los microarrays de oligonucleótidos a menudo llevan sondas de control diseñadas para hibridar con picos de ARN" . El grado de hibridación entre las puntas y las sondas de control se utiliza para normalizar las mediciones de hibridación para las sondas diana. Aunque en raras ocasiones se pueden determinar niveles absolutos de expresión genética en la matriz de dos colores, las diferencias relativas en la expresión entre diferentes puntos dentro de una muestra y entre muestras es el método preferido de análisis de datos para el sistema de dos colores. Ejemplos de proveedores de tales microarrays incluyen Agilent con su plataforma Dual-Mode, Eppendorf con su plataforma DualChip para etiquetado colorimétrico Silverquant y TeleChem International con Arrayit.

En microarrays de un solo canal o microarrays de un color , los arreglos proporcionan datos de intensidad para cada sonda o conjunto de sondas que indican un nivel relativo de hibridación con el objetivo marcado. Sin embargo, no indican realmente los niveles de abundancia de un gen, sino más bien la abundancia relativa en comparación con otras muestras o condiciones cuando se procesan en el mismo experimento. Cada molécula de ARN encuentra un sesgo de protocolo y específico de lote durante las fases de amplificación, etiquetado e hibridación del experimento, lo que hace que las comparaciones entre genes para el mismo microarray no sean informativas. La comparación de dos condiciones para el mismo gen requiere dos hibridaciones separadas con un solo tinte. Varios sistemas monocanal populares son el "Gene Chip" de Affymetrix, el "Bead Chip" de Illumina, los arreglos monocanal de Agilent, los arreglos "CodeLink" de Applied Microarrays y el "DualChip & Silverquant" de Eppendorf. Una ventaja del sistema de tinte único radica en el hecho de que una muestra aberrante no puede afectar los datos sin procesar derivados de otras muestras, porque cada chip de matriz está expuesto a una sola muestra (a diferencia de un sistema de dos colores en el que un solo tinte bajo (una muestra de alta calidad puede afectar drásticamente la precisión general de los datos, incluso si la otra muestra fuera de alta calidad). Otro beneficio es que los datos se comparan más fácilmente con matrices de diferentes experimentos siempre que se hayan tenido en cuenta los efectos de los lotes.

Los microarrays de un canal pueden ser la única opción en algunas situaciones. Supongamos que es necesario comparar muestras: entonces el número de experimentos necesarios utilizando las dos matrices de canales rápidamente se vuelve inviable, a menos que se utilice una muestra como referencia. $i$

Un protocolo típico

Este es un ejemplo de un experimento de microarrays de ADN que incluye detalles de un caso particular para explicar mejor los experimentos de microarrays de ADN, al tiempo que enumera modificaciones para el ARN u otros experimentos alternativos.

Las dos muestras a comparar (comparación por pares) se cultivan/adquieren. En este ejemplo, muestra tratada ( caso ) y muestra no tratada ( control ).
El ácido nucleico de interés se purifica: puede ser ARN para perfiles de expresión , ADN para hibridación comparativa o ADN/ARN unido a una proteína particular que se inmunoprecipita ( ChIP-on-chip ) para estudios epigenéticos o de regulación. En este ejemplo, el ARN total se aísla (tanto nuclear como citoplasmático ) mediante extracción con tiocianato de guanidinio-fenol-cloroformo (por ejemplo, Trizol ), que aísla la mayor parte del ARN (mientras que los métodos de columna tienen un límite de 200 nucleótidos) y, si se hace correctamente, tiene una mayor pureza.
El ARN purificado se analiza en cuanto a calidad (mediante electroforesis capilar ) y cantidad (por ejemplo, utilizando un espectrómetro NanoDrop o NanoPhotometer ). Si el material es de calidad aceptable y hay suficiente cantidad (por ejemplo, >1 μg , aunque la cantidad requerida varía según la plataforma de microarrays), el experimento puede continuar.
El producto marcado se genera mediante transcripción inversa y le sigue una amplificación por PCR opcional . El ARN se transcribe de forma inversa con cebadores poliT (que amplifican sólo el ARNm ) o cebadores aleatorios (que amplifican todo el ARN, la mayor parte del cual es ARNr ). Las micromatrices de miARN ligan un oligonucleótido al ARN pequeño purificado (aislado con un fraccionador), que luego se transcribe de manera inversa y se amplifica.
- La etiqueta se agrega durante el paso de transcripción inversa o después de la amplificación, si se realiza. El etiquetado de sentido depende del microarray; por ejemplo, si el marcador se añade con la mezcla RT, el ADNc es antisentido y la sonda de micromatriz tiene sentido, excepto en el caso de controles negativos.
- La etiqueta suele ser fluorescente ; Sólo una máquina utiliza radioetiquetas .
- El etiquetado puede ser directo (no utilizado) o indirecto (requiere una etapa de acoplamiento). Para las matrices de dos canales, la etapa de acoplamiento ocurre antes de la hibridación, utilizando trifosfato de aminoaliluridina (aminoalil-UTP o aaUTP) y tintes aminorreactivos NHS (como tintes de cianina ); para las matrices de un solo canal, la etapa de acoplamiento ocurre después de la hibridación, utilizando biotina y estreptavidina marcada . Los nucleótidos modificados (normalmente en una proporción de 1 aaUTP: 4 TTP ( trifosfato de timidina )) se añaden enzimáticamente en una proporción baja con respecto a los nucleótidos normales, lo que normalmente da como resultado 1 cada 60 bases. Luego, el ADNaa se purifica con una columna (usando una solución tampón fosfato, ya que Tris contiene grupos amina). El grupo aminoalilo es un grupo amina en un conector largo unido a la nucleobase, que reacciona con un tinte reactivo.
  - Se puede realizar una forma de réplica conocida como cambio de tinte para controlar los artefactos del tinte en experimentos de dos canales; para un cambio de tinte, se utiliza un segundo portaobjetos, con las etiquetas intercambiadas (la muestra que se etiquetó con Cy3 en el primer portaobjetos está etiquetada con Cy5 y viceversa). En este ejemplo, aminoalil -UTP está presente en la mezcla con transcripción inversa.
Luego, las muestras marcadas se mezclan con una solución de hibridación patentada que puede consistir en SDS , SSC , sulfato de dextrano , un agente bloqueador (como ADN Cot-1 , ADN de esperma de salmón, ADN de timo de ternera, PolyA o PolyT), solución de Denhardt, o formamina .
La mezcla se desnaturaliza y se añade a los poros del microarray. Los orificios se sellan y el microarray se hibrida, ya sea en un horno hyb, donde el microarray se mezcla mediante rotación, o en un mezclador, donde el microarray se mezcla alternando presión en los orificios.
Después de una hibridación durante la noche, se elimina por lavado toda unión no específica (SDS y SSC).
El microarray se seca y escanea mediante una máquina que utiliza un láser para excitar el tinte y mide los niveles de emisión con un detector.
La imagen se cuadricula con una plantilla y se cuantifican las intensidades de cada característica (compuesta por varios píxeles).
Los datos sin procesar están normalizados; El método de normalización más simple es restar la intensidad de fondo y la escala para que las intensidades totales de las características de los dos canales sean iguales, o usar la intensidad de un gen de referencia para calcular el valor t para todas las intensidades. Los métodos más sofisticados incluyen relación z , regresión loess y lowess y RMA (análisis multichip robusto) para chips Affymetrix (chip de silicio de un solo canal, oligonucleótidos cortos sintetizados in situ ).

Microarrays y bioinformática.

Los valores de expresión genética de experimentos de microarrays se pueden representar como mapas de calor para visualizar el resultado del análisis de datos.

La llegada de experimentos de microarrays económicos creó varios desafíos bioinformáticos específicos: ^[19] los múltiples niveles de replicación en el diseño experimental (Diseño experimental); el número de plataformas y grupos independientes y formato de datos (Estandarización); el tratamiento estadístico de los datos (Análisis de datos); mapear cada sonda con la transcripción de ARNm que mide (Anotación); el gran volumen de datos y la capacidad de compartirlos (almacenamiento de datos).

Diseño experimental

Debido a la complejidad biológica de la expresión génica, las consideraciones de diseño experimental que se analizan en el artículo sobre perfiles de expresión son de importancia crítica si se quieren extraer conclusiones estadística y biológicamente válidas de los datos.

Hay tres elementos principales a considerar al diseñar un experimento de microarrays. Primero, la replicación de las muestras biológicas es esencial para sacar conclusiones del experimento. En segundo lugar, las réplicas técnicas (por ejemplo, dos muestras de ARN obtenidas de cada unidad experimental) pueden ayudar a cuantificar la precisión. Las réplicas biológicas incluyen extracciones de ARN independientes. Las réplicas técnicas podrán ser dos alícuotas de la misma extracción. En tercer lugar, las manchas de cada clon de ADNc u oligonucleótido están presentes como réplicas (al menos duplicados) en el portaobjetos del microarray, para proporcionar una medida de precisión técnica en cada hibridación. Es fundamental que se analice la información sobre la preparación y el manejo de la muestra para ayudar a identificar las unidades independientes en el experimento y evitar estimaciones infladas de significancia estadística . ^[20]

Estandarización

Los datos de microarrays son difíciles de intercambiar debido a la falta de estandarización en la fabricación de plataformas, protocolos de ensayo y métodos de análisis. Esto presenta un problema de interoperabilidad en bioinformática . Varios proyectos comunitarios de código abierto están intentando facilitar el intercambio y el análisis de datos producidos con chips no propietarios:

Por ejemplo, la lista de verificación "Información mínima sobre un experimento de microarrays" ( MIAME ) ayuda a definir el nivel de detalle que debe existir y está siendo adoptada por muchas revistas como requisito para el envío de artículos que incorporen resultados de microarrays. Pero MIAME no describe el formato de la información, por lo que si bien muchos formatos pueden admitir los requisitos de MIAME, a partir de 2007 ^[actualizar]ningún formato permite la verificación del cumplimiento semántico completo. El "Proyecto MicroArray Quality Control (MAQC)" está siendo llevado a cabo por la Administración de Alimentos y Medicamentos de EE. UU. (FDA) para desarrollar estándares y métricas de control de calidad que eventualmente permitirán el uso de datos de MicroArray en el descubrimiento de fármacos, la práctica clínica y la toma de decisiones regulatorias. . ^[21] La Sociedad MGED ha desarrollado estándares para la representación de los resultados de experimentos de expresión génica y anotaciones relevantes.

Análisis de los datos

Los conjuntos de datos de microarrays suelen ser muy grandes y la precisión analítica está influenciada por una serie de variables. Los desafíos estadísticos incluyen tener en cuenta los efectos del ruido de fondo y la normalización adecuada de los datos. Los métodos de normalización pueden ser adecuados para plataformas específicas y, en el caso de plataformas comerciales, el análisis puede ser propietario. ^[22] Los algoritmos que afectan el análisis estadístico incluyen:

Análisis de imágenes: cuadrícula, reconocimiento de puntos de la imagen escaneada (algoritmo de segmentación), eliminación o marcado de características de baja calidad y baja intensidad (llamado marcado ).
Procesamiento de datos: resta de fondo (basada en el fondo global o local), determinación de intensidades puntuales y relaciones de intensidad, visualización de datos (por ejemplo, ver gráfico MA ) y transformación logarítmica de relaciones, normalización global o local de relaciones de intensidad y segmentación en diferentes regiones de números de copias utilizando algoritmos de detección de pasos . ^[23]
Análisis de descubrimiento de clases: este enfoque analítico, a veces llamado clasificación no supervisada o descubrimiento de conocimiento, intenta identificar si los microarrays (objetos, pacientes, ratones, etc.) o los genes se agrupan en grupos. La identificación de grupos de objetos existentes de forma natural (micromatrices o genes) que se agrupan puede permitir el descubrimiento de nuevos grupos que de otro modo no se sabía que existían. Durante el análisis de descubrimiento de conocimientos, se pueden emplear varias técnicas de clasificación no supervisadas con datos de micromatrices de ADN para identificar nuevos grupos (clases) de matrices. ^[24] Este tipo de enfoque no se basa en hipótesis, sino que se basa en el reconocimiento de patrones iterativos o en métodos de aprendizaje estadístico para encontrar un número "óptimo" de grupos en los datos. Ejemplos de métodos de análisis no supervisados incluyen mapas autoorganizados, gas neuronal, análisis de conglomerados de k-medias, ^[25] análisis de conglomerados jerárquicos, agrupamientos basados en procesamiento de señales genómicas y análisis de conglomerados basados en modelos. Para algunos de estos métodos, el usuario también debe definir una medida de distancia entre pares de objetos. Aunque normalmente se emplea el coeficiente de correlación de Pearson, en la literatura se han propuesto y evaluado varias otras medidas. ^[26] Los datos de entrada utilizados en los análisis de descubrimiento de clases se basan comúnmente en listas de genes que tienen un alto contenido informativo (bajo ruido) basadas en valores bajos del coeficiente de variación o valores altos de entropía de Shannon, etc. El número óptimo de conglomerados obtenidos de un análisis no supervisado se denomina validez de conglomerado. Algunas métricas comúnmente utilizadas para la validez de conglomerados son el índice de silueta, el índice de Davies-Bouldin, ^[27] el índice de Dunn o la estadística de Hubert. $\Gamma$
Análisis de predicción de clase: este enfoque, llamado clasificación supervisada, establece la base para desarrollar un modelo predictivo en el que se pueden ingresar futuros objetos de prueba desconocidos para predecir la pertenencia a clase más probable de los objetos de prueba. El análisis supervisado ^[24] para la predicción de clases implica el uso de técnicas como regresión lineal, k-vecino más cercano, aprendizaje de cuantificación de vectores, análisis de árboles de decisión, bosques aleatorios, Bayes ingenuo, regresión logística, regresión de kernel, redes neuronales artificiales, máquinas de vectores de soporte, mezcla de expertos y gas neural supervisado. Además, se emplean varios métodos metaheurísticos, como algoritmos genéticos , autoadaptación de matrices de covarianza, optimización de enjambres de partículas y optimización de colonias de hormigas . Los datos de entrada para la predicción de clases generalmente se basan en listas filtradas de genes que predicen la clase, determinadas mediante pruebas de hipótesis clásicas (siguiente sección), índice de diversidad de Gini o ganancia de información (entropía).
Análisis estadístico basado en hipótesis: la identificación de cambios estadísticamente significativos en la expresión genética se identifica comúnmente mediante la prueba t , ANOVA , método bayesiano ^{[28] Métodos}de prueba de Mann-Whitney adaptados a conjuntos de datos de microarrays, que tienen en cuenta comparaciones múltiples ^[29] o análisis de conglomerados . ^[30] Estos métodos evalúan el poder estadístico en función de la variación presente en los datos y el número de réplicas experimentales, y pueden ayudar a minimizar los errores de tipo I y tipo II en los análisis. ^[31]
Reducción dimensional: los analistas suelen reducir el número de dimensiones (genes) antes del análisis de datos. ^[24] Esto puede implicar enfoques lineales como el análisis de componentes principales (PCA) o el aprendizaje múltiple no lineal (aprendizaje métrico a distancia) utilizando PCA del núcleo, mapas de difusión, mapas propios laplacianos, incrustación lineal local, proyecciones que preservan localmente y mapeo de Sammon.
Métodos basados en redes: métodos estadísticos que tienen en cuenta la estructura subyacente de las redes genéticas, representando interacciones o dependencias asociativas o causales entre productos genéticos. ^[32] El análisis de redes de coexpresión de genes ponderados se utiliza ampliamente para identificar módulos de coexpresión y genes centrales intramodulares. Los módulos pueden corresponder a tipos de células o vías. Los concentradores intramodulares altamente conectados representan mejor sus respectivos módulos.

Los datos de microarrays pueden requerir un procesamiento adicional destinado a reducir la dimensionalidad de los datos para ayudar a la comprensión y un análisis más centrado. ^[33] Otros métodos permiten el análisis de datos que consisten en un número reducido de réplicas biológicas o técnicas ; por ejemplo, la prueba de error agrupado local (LPE) agrupa desviaciones estándar de genes con niveles de expresión similares en un esfuerzo por compensar la replicación insuficiente. ^[34]

Anotación

La relación entre una sonda y el ARNm que se espera que detecte no es trivial. ^[35] Algunos ARNm pueden hibridar de forma cruzada sondas en la matriz que se supone detectan otro ARNm. Además, los ARNm pueden experimentar un sesgo de amplificación específico de secuencia o molécula. En tercer lugar, las sondas diseñadas para detectar el ARNm de un gen particular pueden depender de información EST genómica que está asociada incorrectamente con ese gen.

Almacenamiento de datos

Se descubrió que los datos de microarrays eran más útiles en comparación con otros conjuntos de datos similares. El gran volumen de datos, los formatos especializados (como MIAME ) y los esfuerzos de curación asociados con los conjuntos de datos requieren bases de datos especializadas para almacenar los datos. Se han creado varias soluciones de almacenamiento de datos de código abierto, como InterMine y BioMart, con el propósito específico de integrar diversos conjuntos de datos biológicos y también respaldar el análisis.

Tecnologías alternativas

Los avances en la secuenciación masiva paralela han llevado al desarrollo de la tecnología RNA-Seq , que permite un enfoque de transcriptoma completo para caracterizar y cuantificar la expresión genética. ^[36]^[37] A diferencia de los microarrays, que necesitan que un genoma y un transcriptoma de referencia estén disponibles antes de que se pueda diseñar el microarray en sí, RNA-Seq también se puede utilizar para nuevos organismos modelo cuyo genoma aún no ha sido secuenciado. ^[37]

Glosario

Una matriz o diapositiva es una colección de características dispuestas espacialmente en una cuadrícula bidimensional, dispuestas en columnas y filas.
Bloque o subconjunto : un grupo de puntos, generalmente realizados en una ronda de impresión; varios subarreglos/bloques forman una matriz.
Caso/control : un paradigma de diseño experimental especialmente adecuado para el sistema de matriz de dos colores, en el que una condición elegida como control (como un tejido o estado sano) se compara con una condición alterada (como un tejido o estado enfermo).
Canal : la salida de fluorescencia registrada en el escáner para un fluoróforo individual y puede ser incluso ultravioleta.
Inversión de tinte o intercambio de tinte o inversión de flúor : etiquetado recíproco de objetivos de ADN con los dos tintes para tener en cuenta el sesgo de tinte en los experimentos.
Escáner : instrumento utilizado para detectar y cuantificar la intensidad de la fluorescencia de manchas en un portaobjetos de microarrays, excitando selectivamente los fluoróforos con un láser y midiendo la fluorescencia con un sistema fotomultiplicador de filtro (óptico) .
Punto o característica : un área pequeña en un portaobjetos que contiene picomoles de muestras de ADN específicas.
Para otros términos relevantes, consulte:
- Glosario de términos de expresión genética.
- Protocolo (ciencias naturales)

Ver también

Tecnologías transcriptómicas
- Análisis en serie de la expresión genética.
- Sec. de ARN
MAGIChip
Técnicas de análisis de microarrays.
Bases de datos de microarrays
Los colorantes de cianina , como Cy3 y Cy5, son fluoróforos comúnmente utilizados con microarrays.
Análisis de chips genéticos
Análisis de importancia de microarrays.
Micromatriz de oligonucleótidos específica de metilación
Microfluidos o laboratorio en chip
Patogenómica
Microarrays de fenotipo
Biologia de sistemas
Secuenciación del genoma completo.

Referencias

^ Taub, Floyd (1983). "Métodos de laboratorio: las hibridaciones comparativas secuenciales analizadas mediante procesamiento de imágenes computarizado pueden identificar y cuantificar los ARN regulados". ADN . 2 (4): 309–327. doi :10.1089/dna.1983.2.309. PMID 6198132.
^ Adamas A; Heller G; Olson A; Osborne J; Karlsson M; Nahalkova J; Van Zyl L; Sederoff R; Stenlid J; Finlay R; Asiegbu FO (2008). "Análisis comparativo de la abundancia de transcripciones en Pinus sylvestris después del desafío con un hongo saprotrófico, patógeno o mutualista". Fisiol del árbol . 28 (6): 885–897. doi : 10.1093/treephys/28.6.885. PMID 18381269.
^ Abadejo JR; Perú CM; Alizadeh AA; EisenMB; Pergamenschikov A; Williams CF; Jeffrey SS; Botstein D; Marrón PO (1999). "Análisis de todo el genoma de los cambios en el número de copias de ADN utilizando micromatrices de ADNc". Nat Genet . 23 (1): 41–46. doi :10.1038/12640. PMID 10471496. S2CID 997032.
^ Morán G; alimenta C; Thewes S; Hube B; Coleman DC; Sullivan D (2004). "La genómica comparada utilizando micromatrices de ADN de Candida albicans revela ausencia y divergencia de genes asociados a la virulencia en Candida dubliniensis". Microbiología . 150 (Parte 10): 3363–3382. doi : 10.1099/mic.0.27221-0 . hdl : 2262/6097 . PMID 15470115.
^ Hacia JG; Fan JB; Ryder O; Jin L; Edgemon K; Ghandour G; Mayer RA; sol B; Hsie L; Robbins CM; Brody LC; Wang D; Módulo de aterrizaje ES; Lipshutz R; Fodor SP; Collins FS (1999). "Determinación de alelos ancestrales de polimorfismos de un solo nucleótido humano utilizando matrices de oligonucleótidos de alta densidad". Nat Genet . 22 (2): 164-167. doi :10.1038/9674. PMID 10369258. S2CID 41718227.
^ abc Gagna, Claude E.; Lambert, W. Clark (1 de mayo de 2009). "Nuevos microarrays de ADN y ARN de transición helicoidales y plásmidos alternativos, multicatenarios: implicaciones para la terapéutica". Farmacogenómica . 10 (5): 895–914. doi :10.2217/pgs.09.27. ISSN 1744-8042. PMID 19450135.
^ abc Gagna, Claude E.; Clark Lambert, W. (1 de marzo de 2007). "Biología celular, quimiogenómica y quimioproteómica: aplicación al descubrimiento de fármacos". Opinión de expertos sobre el descubrimiento de fármacos . 2 (3): 381–401. doi :10.1517/17460441.2.3.381. ISSN 1746-0441. PMID 23484648. S2CID 41959328.
^ Mukherjee, Anirban; Vásquez, Karen M. (1 de agosto de 2011). "Tecnología triplex en estudios de daño del ADN, reparación del ADN y mutagénesis". Bioquimia . 93 (8): 1197-1208. doi :10.1016/j.biochi.2011.04.001. ISSN 1638-6183. PMC 3545518 . PMID 21501652.
^ Rodas, Daniela; Lipps, Hans J. (15 de octubre de 2015). "G-quadruplex y sus funciones reguladoras en biología". Investigación de ácidos nucleicos . 43 (18): 8627–8637. doi :10.1093/nar/gkv862. ISSN 1362-4962. PMC 4605312 . PMID 26350216.
^ Rasheed, Awais; Hao, Yuanfeng; Xia, Xianchun; Khan, Awais; Xu, Yunbi; Varshney, Rajeev K.; Él, Zhonghu (2017). "Chips de mejoramiento de cultivos y plataformas de genotipado: avances, desafíos y perspectivas" (PDF) . Planta Molecular . 10 (8). Chin Acad Sci + Chin Soc Plant Bio + Shanghai Inst Bio Sci ( Elsevier ): 1047–1064. doi : 10.1016/j.molp.2017.06.008 . ISSN 1674-2052. PMID 28669791. S2CID 33780984.
^ Métodos de J Biochem Biophys. 16 de marzo de 2000; 42 (3): 105–10. Impresión de ADN: utilización de una impresora de inyección de tinta estándar para la transferencia de ácidos nucleicos a soportes sólidos. Goldmann T, González JS.
^ Lausado C; et al. (2004). "POSaM: un microarrayador y sintetizador de oligonucleótidos de inyección de tinta rápido, flexible y de código abierto". Biología del genoma . 5 (8): R58. doi : 10.1186/gb-2004-5-8-r58 . PMC 507883 . PMID 15287980.
^ Bammler T, Beyer RP; Consorcio, Miembros de la Investigación Toxicogenómica; Kerr, X; Jing, LX; Lapidus, S; Lasarev, DA; Paules, RS; Li, JL; Phillips, SO (2005). "Estandarización del análisis global de expresión genética entre laboratorios y entre plataformas". Métodos Nat . 2 (5): 351–356. doi : 10.1038/nmeth754. PMID 15846362. S2CID 195368323.
^ Por favor AC; Solás D; Sullivan EJ; Cronin MT; Holmes CP; Fodor SP (1994). "Matrices de oligonucleótidos generadas por luz para un análisis rápido de secuencias de ADN". PNAS . 91 (11): 5022–5026. Código bibliográfico : 1994PNAS...91.5022P. doi : 10.1073/pnas.91.11.5022 . PMC 43922 . PMID 8197176.
^ Nuwaysir EF; Huang W; Alberto TJ; Singh J; Nuwaysir K; Pitas A; Richmond T; Gorski T; Berg JP; Ballín J; McCormick M; Norton J; Pollock T; Sumwalt T; Carnicero L; Portero D; Molla M; Sala C; Blattner F; Sussman Señor; Wallace RL; Cerrina F; RD Verde (2002). "Análisis de expresión genética utilizando matrices de oligonucleótidos producidas por fotolitografía sin máscara". Res del genoma . 12 (11): 1749-1755. doi :10.1101/gr.362402. PMC 187555 . PMID 12421762.
^ Shalon D; Smith SJ; Marrón PO (1996). "Un sistema de microarrays de ADN para analizar muestras de ADN complejas mediante hibridación con sonda fluorescente de dos colores". Res del genoma . 6 (7): 639–645. doi : 10.1101/gr.6.7.639 . PMID 8796352.
^ Tang T; François N; Glatigny A; Agier N; Mucchielli MH; Aggerbeck L; Delacroix H (2007). "La evaluación de la relación de expresión en experimentos de microarrays de dos colores mejora significativamente al corregir la desalineación de la imagen". Bioinformática . 23 (20): 2686–2691. doi : 10.1093/bioinformática/btm399 . PMID 17698492.
^ Shafee, Thomas; Lowe, Rohan (2017). "Estructura de genes eucariotas y procarióticos". WikiRevista de Medicina . 4 (1). doi : 10.15347/wjm/2017.002 . ISSN 2002-4436.
^ Tinker, Anna V.; Boussioutas, Alex; Bowtell, David DL (2006). "Los desafíos de los microarrays de expresión génica para el estudio del cáncer humano". Célula cancerosa . 9 (5): 333–339. doi : 10.1016/j.ccr.2006.05.001 . ISSN 1535-6108.
^ Churchill, Georgia (2002). "Fundamentos del diseño experimental de microarrays de ADNc" (PDF) . Genética de la Naturaleza . suplemento. 32 : 490–5. doi :10.1038/ng1031. PMID 12454643. S2CID 15412245. Archivado desde el original (PDF) el 8 de mayo de 2005 . Consultado el 12 de diciembre de 2013 .
^ Centro NCTR de Toxicoinformática - Proyecto MAQC
^ "Prosigna | Algoritmo Prosigna". prosigna.com . Consultado el 22 de junio de 2017 .
^ Pequeño, MA; Jones, NS (2011). "Métodos generalizados y solucionadores de señales constantes por partes: Parte I" (PDF) . Actas de la Royal Society A. 467 (2135): 3088–3114. doi :10.1098/rspa.2010.0671. PMC 3191861 . PMID 22003312.
^ abc Peterson, Leif E. (2013). Análisis de clasificación de microarrays de ADN. John Wiley e hijos. ISBN 978-0-470-17081-6.
^ De Souto M et al. (2008) Agrupación de datos de expresión de genes de cáncer: un estudio comparativo, BMC Bioinformatics, 9 (497).
^ Jaskowiak, Pablo A; Campello, Ricardo JGB; Costa, Iván G (2014). "Sobre la selección de distancias apropiadas para la agrupación de datos de expresión génica". Bioinformática BMC . 15 (Suplemento 2): T2. doi : 10.1186/1471-2105-15-S2-S2 . PMC 4072854 . PMID 24564555.
^ Bolshakova N, Azuaje F (2003) Técnicas de validación de conglomerados para datos de expresión del genoma, Procesamiento de señales, vol. 83, págs. 825–833.
^ Ben Gal, yo; Shani, A.; Gohr, A.; Grau, J.; Arviv, S.; Shmilovici, A.; Posch, S.; Grosse, I. (2005). "Identificación de sitios de unión de factores de transcripción con redes bayesianas de orden variable". Bioinformática . 21 (11): 2657–2666. doi : 10.1093/bioinformática/bti410. ISSN 1367-4803. PMID 15797905.
^ Yuk Fai Leung y Duccio Cavalieri, Fundamentos del análisis de datos de microarrays de ADNc. Tendencias en Genética Vol.19 No.11 Noviembre de 2003.
^ Princesa I.; Maimón O.; Ben-Gal I. (2007). "Evaluación de la agrupación de expresión genética mediante medida de distancia de información mutua". Bioinformática BMC . 8 (1): 111. doi : 10.1186/1471-2105-8-111 . PMC 1858704 . PMID 17397530.
^ Wei C; LiJ; Bumgarner RE (2004). "Tamaño de muestra para detectar genes expresados diferencialmente en experimentos de microarrays". Genómica BMC . 5 : 87. doi : 10.1186/1471-2164-5-87 . PMC 533874 . PMID 15533245.
^ Emmert-Streib, F. y Dehmer, M. (2008). "Análisis de datos de microarrays: un enfoque basado en redes" . Wiley-VCH. ISBN 978-3-527-31822-3.
^ Wouters L; Göhlmann HW; Bijnens L; Kass SU; Molenberghs G; Lewis PJ (2003). "Exploración gráfica de datos de expresión génica: un estudio comparativo de tres métodos multivariados". Biometría . 59 (4): 1131-1139. CiteSeerX 10.1.1.730.3670 . doi :10.1111/j.0006-341X.2003.00130.x. PMID 14969494. S2CID 16248921.
^ Jainista N; Thatte J; Braciale T; Ley K; O'Connell M; Lee JK (2003). "Prueba de error local agrupado para identificar genes expresados diferencialmente con una pequeña cantidad de micromatrices replicadas". Bioinformática . 19 (15): 1945-1951. doi : 10.1093/bioinformática/btg264 . PMID 14555628.
^ Barbosa-Morais, NL; Dunning, MJ; Samarajiwa, SA; Darot, JFJ; Ritchie, YO; Lynch, AG; Tavare, S. (18 de noviembre de 2009). "Un proceso de reanotación para Illumina BeadArrays: mejorar la interpretación de los datos de expresión genética". Investigación de ácidos nucleicos . 38 (3): e17. doi : 10.1093/nar/gkp942. PMC 2817484 . PMID 19923232.
^ Mortazavi, Ali; Brian A Williams; Kenneth McCue; Lorian Schaeffer; Barbara Wold (julio de 2008). "Mapeo y cuantificación de transcriptomas de mamíferos mediante RNA-Seq". Métodos Nat . 5 (7): 621–628. doi :10.1038/nmeth.1226. ISSN 1548-7091. PMID 18516045. S2CID 205418589.
^ ab Wang, Zhong; Mark Gerstein; Michael Snyder (enero de 2009). "RNA-Seq: una herramienta revolucionaria para la transcriptómica". Nat Rev Genet . 10 (1): 57–63. doi :10.1038/nrg2484. ISSN 1471-0056. PMC 2949280 . PMID 19015660.

enlaces externos

Recursos de la biblioteca sobre
microarrays de ADN.

Recursos en tu biblioteca
Recursos en otras bibliotecas

Wikimedia Commons tiene medios relacionados con microarrays de ADN .

Expresión genética en Curlie
Productos y servicios a microescala para bioquímica y biología molecular en Curlie
Productos y servicios para la expresión genética en Curlie
Servicios en línea para análisis de expresión genética en Curlie
Animación de microarrays 1Lec.com
Introducción a la biología de PLoS: análisis de microarrays
Resumen de la tecnología de microarrays
ArrayMining.net: un servidor web gratuito para análisis de microarrays en línea
Microarrays: ¿cómo funciona?
Comentario de PNAS: Descubrimiento de los principios de la naturaleza a partir del modelado matemático de datos de microarrays de ADN
Experimento virtual de microarrays de ADN