stringtranslate.com

Cresta (biología)

Las crestas ( regiones de mayor expresión génica ) son dominios del genoma con una alta expresión génica ; lo opuesto a las crestas son las anticrestas. El término fue utilizado por primera vez por Caron et al. en 2001. [ 1] Las características de las crestas son: [1]

Descubrimiento

La agrupación de genes en los procariotas se conoce desde hace mucho tiempo. Sus genes se agrupan en operones , los genes dentro de los operones comparten una unidad promotora común. Estos genes están relacionados funcionalmente en su mayoría. El genoma de los procariotas es relativamente muy simple y compacto. En los eucariotas, el genoma es enorme y solo una pequeña cantidad son genes funcionalmente relacionados, además, los genes no están organizados en operones. Excepto en los nematodos y los tripanosomas ; aunque sus operones son diferentes de los operones procariotas. En los eucariotas, cada gen tiene un sitio de regulación de la transcripción propio. Por lo tanto, los genes no tienen que estar muy próximos para ser coexpresados. Por lo tanto, durante mucho tiempo se asumió que los genes eucariotas se distribuían aleatoriamente a lo largo del genoma debido a la alta tasa de reordenamientos cromosómicos. Pero debido a que la secuencia completa de los genomas estuvo disponible, se hizo posible localizar absolutamente un gen y medir su distancia a otros genes.

El primer genoma eucariota secuenciado fue el de Saccharomyces cerevisiae , o levadura en ciernes, en 1996. Medio año después, Velculescu et al. (1997) publicaron una investigación en la que habían integrado los datos de SAGE con el mapa genómico ahora disponible. Durante un ciclo celular, hay diferentes genes activos en una célula. Por lo tanto, utilizaron datos de SAGE de tres momentos del ciclo celular (fase logarítmica, fase S -células detenidas y fase G2 / M -células detenidas). Debido a que en la levadura todos los genes tienen una unidad promotora propia, no se sospechaba que los genes se agruparan cerca unos de otros, pero lo hicieron. Los grupos estaban presentes en los 16 cromosomas de la levadura. [2] Un año después, Cho et al. también informaron (aunque con más detalle) que ciertos genes se encuentran cerca unos de otros en la levadura. [3]

Características y función

Coexpresión

Cho et al. fueron los primeros en determinar que los genes agrupados tienen los mismos niveles de expresión. Identificaron transcripciones que muestran una periodicidad dependiente del ciclo celular. De esos genes, el 25 % se encontraba en estrecha proximidad a otros genes que se transcribían en el mismo ciclo celular. Cohen et al. (2000) también identificaron agrupaciones de genes coexpresados.

Caron et al. (2001) realizaron un mapa del transcriptoma humano de 12 tejidos diferentes (células cancerosas) y concluyeron que los genes no se distribuyen aleatoriamente a través de los cromosomas. En cambio, los genes tienden a agruparse en grupos de a veces 39 genes en estrecha proximidad. Los agrupamientos no solo eran densos en genes. Identificaron 27 agrupamientos de genes con niveles de expresión muy altos y los llamaron RIDGE. Un RIDGE común cuenta de 6 a 30 genes por centiray. Sin embargo, hubo grandes excepciones: entre el 40 y el 50% de los RIDGE no eran tan densos en genes; al igual que en la levadura, estos RIDGE se ubicaban en las regiones de los telómeros . [1]

Lercher et al. (2002) señalaron algunas debilidades en el enfoque de Caron. Los grupos de genes en estrecha proximidad y altos niveles de transcripción pueden generarse fácilmente mediante duplicados en tándem. Los genes pueden generar duplicados de sí mismos que se incorporan en su vecindad. Estos duplicados pueden convertirse en una parte funcional de la vía de su gen original o (porque ya no son favorecidos por la selección natural) sufrir mutaciones deletéreas y convertirse en pseudogenes. Debido a que estos duplicados son falsos positivos en la búsqueda de grupos de genes, deben excluirse. Lercher excluyó los genes vecinos con un alto parecido entre sí, después de eso buscó con una ventana deslizante regiones con 15 genes vecinos. [4]

Estaba claro que existían regiones con alta densidad de genes. Había una correlación sorprendente entre la densidad de genes y un alto contenido de CG. Algunos grupos tenían, de hecho, altos niveles de expresión. Pero la mayoría de las regiones altamente expresadas consistían en genes de mantenimiento; genes que se expresan en gran medida en todos los tejidos porque codifican mecanismos basales. Solo una minoría de los grupos contenían genes que estaban restringidos a tejidos específicos.

Versteeg et al. (2003) intentaron, con un mejor mapa del genoma humano y mejores taqs SAGE, determinar las características de los RIDGE de manera más específica. Los genes superpuestos se trataron como un gen, y los genes sin intrones se rechazaron como pseudogenes. Determinaron que los RIDGE son muy densos en genes, tienen una alta expresión génica, intrones cortos, alta densidad de repeticiones SINE y baja densidad de repeticiones LINE. Los grupos que contienen genes con niveles de transcripción muy bajos tenían características que eran opuestas a los RIDGE, por lo tanto, esos grupos se denominaron antiridges. [5] Las repeticiones LINE son ADN basura que contiene un sitio de escisión de endonucleasa (TTTTA). Su escasez en los RIDGE se puede explicar por el hecho de que la selección natural favorece la escasez de repeticiones LINE en los ORF porque sus sitios de endonucleasa pueden causar mutaciones perjudiciales para los genes. Todavía no se entiende por qué las repeticiones SINE son abundantes.

Versteeg et al. también concluyeron que, contrariamente al análisis de Lerchers, los niveles de transcripción de muchos genes en RIDGEs (por ejemplo, un grupo en el cromosoma 9) pueden variar fuertemente entre diferentes tejidos. Lee et al. (2003) analizaron la tendencia de agrupamiento de genes entre diferentes especies. Compararon Saccharomyces cerevisiae , Homo sapiens , Caenorhabditis elegans , Arabidopsis thaliana y Drosophila melanogaster , y encontraron un grado de agrupamiento, como fracción de genes en grupos sueltos, de respectivamente (37%), (50%), (74%), (52%) y (68%). Concluyeron que las vías de las cuales los genes son grupos a través de muchas especies son raras. Encontraron siete vías agrupadas universalmente: glucólisis , biosíntesis de aminoacil-ARNt , ATP sintasa , ADN polimerasa , degradación de hexaclorociclohexano , metabolismo de cianoaminoácidos y fotosíntesis ( síntesis de ATP en especies no vegetales). No es sorprendente que se trate de vías celulares básicas. [6]

Lee et al. utilizaron grupos muy diversos de animales. Dentro de estos grupos, la agrupación se conserva; por ejemplo, los motivos de agrupación del Homo sapiens y del Mus musculus son más o menos los mismos. [7]

Spellman y Rubin (2002) realizaron un mapa del transcriptoma de Drosophila . De todos los genes analizados, el 20 % estaba agrupado. Los grupos estaban formados por entre 10 y 30 genes en un tamaño de grupo de aproximadamente 100 kilobases. Los miembros de los grupos no estaban relacionados funcionalmente y la ubicación de los grupos no se correlacionaba con las estructuras de cromatina conocidas. [8]

Este estudio también demostró que dentro de los grupos, los niveles de expresión de un promedio de 15 genes eran muy similares en las distintas condiciones experimentales utilizadas. Estas similitudes eran tan sorprendentes que los autores dedujeron que los genes de los grupos no estaban regulados individualmente por su promotor personal, sino que estaban involucrados cambios en la estructura de la cromatina. Roy et al. (2002) publicaron un patrón de corregulación similar en C. elegans. [9]

Muchos genes que se agrupan en grupos muestran los mismos perfiles de expresión en carcinomas ductales invasivos de mama en humanos. Aproximadamente el 20% de los genes muestran una correlación con sus vecinos. Los grupos de genes coexpresados ​​se dividieron en regiones con menor correlación entre genes. Estos grupos podrían cubrir un brazo cromosómico completo.

Contrariamente a los informes discutidos previamente, Johnidis et al. (2005) han descubierto que (al menos algunos) genes dentro de los grupos no están co-regulados. Aire es un factor de transcripción que tiene un efecto de regulación positiva y negativa en varios genes. Funciona en la selección negativa de timocitos, que responden a los epítopos propios del organismo, por parte de las células medulares. [10]

Los genes controlados por aire se agruparon. 53 de los genes más activados por aire tenían un vecino activado por aire dentro de 200 Kb o menos, y 32 de los genes más reprimidos por aire tenían un vecino reprimido por aire dentro de 200 Kb; esto es menos de lo esperado por el cambio. Hicieron la misma prueba para el regulador transcripcional CIITA.

Estos reguladores de la transcripción no tuvieron el mismo efecto en todos los genes del mismo grupo. Los genes que se activaron y reprimieron o no se vieron afectados a veces estaban presentes en el mismo grupo. En este caso, es imposible que los genes regulados por aire estuvieran agrupados porque todos estaban co-regulados.

Por lo tanto, no está muy claro si los dominios están co-regulados o no. Una forma muy efectiva de probar esto sería insertando genes sintéticos en RIDGEs, anti-ridges y/o lugares aleatorios en el genoma y determinando su expresión. Esos niveles de expresión deben compararse entre sí. Gierman et al. (2007) fueron los primeros que demostraron la co-regulación utilizando este enfoque. Como construcción de inserción utilizaron un gen GFP fluorescente impulsado por el promotor de la fosfoglicerato quinasa humana (PGK) expresado ubicuamente. Integraron esta construcción en 90 posiciones diferentes en el genoma de células HEK293 humanas . Encontraron que la expresión de la construcción en Ridges era de hecho mayor que la de aquellos insertados en anti-ridges (mientras que todas las construcciones tienen el mismo promotor). [11]

Investigaron si estas diferencias en las expresiones se debían a los genes en la vecindad directa de los constructos o al dominio en su conjunto. Encontraron que los constructos junto a genes altamente expresados ​​se expresaban ligeramente más que otros. Pero cuando ampliaron el tamaño de la ventana a los 49 genes circundantes (nivel de dominio), vieron que los constructos ubicados en dominios con una expresión general alta tenían una expresión más del doble que aquellos ubicados en dominios con un nivel de expresión bajo.

También comprobaron si el constructo se expresaba en niveles similares a los genes vecinos y si esa estrecha coexpresión se daba únicamente en los RIDGE. Descubrieron que las expresiones estaban altamente correlacionadas en los RIDGE y eran casi inexistentes cerca del final y fuera de los RIDGE.

Observaciones previas y la investigación de Gierman et al. demostraron que la actividad de un dominio tiene un gran impacto en la expresión de los genes ubicados en él. Y los genes dentro de un RIDGE se coexpresan. Sin embargo, las construcciones utilizadas por Gierman et al. estaban reguladas por un promotor activo a tiempo completo. Los genes de la investigación de Johnidis et al. dependían de la presencia del factor de transcripción aire. La extraña expresión de los genes regulados por aire podría haber sido causada en parte por diferencias en la expresión y conformación del propio factor de transcripción aire.

Relación funcional

Antes de la era genómica se sabía que los genes agrupados tienden a estar funcionalmente relacionados. Abderrahim et al. (1994) habían demostrado que todos los genes del complejo mayor de histocompatibilidad estaban agrupados en el cromosoma 6p21. Roy et al. (2002) demostraron que en el nematodo C. elegans los genes que se expresan únicamente en el tejido muscular durante la etapa larvaria tienden a agruparse en pequeños grupos de 2 a 5 genes. Identificaron 13 agrupaciones.

Yamashita et al. (2004) demostraron que los genes relacionados con funciones específicas en órganos tienden a agruparse. Seis dominios relacionados con el hígado contenían genes para el metabolismo de xenobióticos, lípidos y alcohol. Cinco dominios relacionados con el colon tenían genes para la apoptosis, la proliferación celular, el transportador de iones y la producción de mucina. Estos grupos eran muy pequeños y los niveles de expresión eran bajos. Los genes relacionados con el cerebro y la mama no se agruparon. [12]

Esto demuestra que al menos algunos grupos están compuestos por genes funcionalmente relacionados. Sin embargo, hay grandes excepciones. Spellman y Rubin han demostrado que hay grupos de genes coexpresados ​​que no están funcionalmente relacionados. Parece que los grupos aparecen en formas muy diferentes.

Regulación

Cohen et al. descubrieron que, de un par de genes coexpresados, solo un promotor tiene una secuencia activadora ascendente (UAS, por sus siglas en inglés) asociada con ese patrón de expresión. Sugirieron que las UAS pueden activar genes que no están en una adyacencia inmediata con ellas. Esta explicación podría explicar la coexpresión de grupos pequeños, pero muchos grupos contienen demasiados genes para ser regulados por una sola UAS.

Los cambios en la cromatina son una explicación plausible de la corregulación observada en los cúmulos. La cromatina está formada por la cadena de ADN y las histonas que están unidas al ADN. Las regiones en las que la cromatina está muy compacta se denominan heterocromatina. La heterocromatina está formada muy a menudo por restos de genomas virales, transposones y otro ADN basura. Debido a la gran densidad de la cromatina, el ADN es casi inalcanzable para la maquinaria de transcripción; cubrir el ADN perjudicial con proteínas es la forma en que la célula puede protegerse. La cromatina, que está formada por genes funcionales, suele ser una estructura abierta en la que el ADN es accesible. Sin embargo, no es necesario que la mayoría de los genes se expresen todo el tiempo.

El ADN con genes que no son necesarios puede cubrirse con histonas. Cuando un gen debe expresarse, proteínas especiales pueden alterar las sustancias químicas que están unidas a las histonas (modificaciones de histonas) que hacen que las histonas abran la estructura. Cuando se abre la cromatina de un gen, también se abre la cromatina de los genes adyacentes hasta que esta modificación se encuentra con un elemento límite. De esa manera, los genes que están muy cerca se expresan al mismo tiempo. Por lo tanto, los genes se agrupan en "centros de expresión". En comparación con este modelo, Gilbert et al. (2004) demostraron que los RIDGE están presentes principalmente en estructuras de cromatina abiertas. [13] [14]

Sin embargo, Johnidis et al. (2005) han demostrado que los genes de un mismo grupo pueden expresarse de forma muy diferente. Todavía no está muy claro cómo funciona exactamente la regulación génica eucariota y los cambios asociados a la cromatina y no hay consenso al respecto. Para obtener una imagen clara del mecanismo de los grupos de genes, primero es necesario aclarar el funcionamiento de la cromatina y la regulación génica. Además, la mayoría de los artículos que identificaron grupos de genes corregulados se centraron en los niveles de transcripción, mientras que pocos se centraron en grupos regulados por los mismos factores de transcripción. Johnides et al. descubrieron fenómenos extraños cuando lo hicieron.

Orígenes

Los primeros modelos que intentaron explicar la agrupación de genes se centraron, por supuesto, en los operones, porque se descubrieron antes que los grupos de genes eucariotas. En 1999, Lawrence propuso un modelo para los operones de origen. Este modelo egoísta de operones sugiere que los genes individuales se agruparon mediante transferencia vertical y horizontal y se conservaron como una sola unidad porque eso era beneficioso para los genes, no per se para el organismo. Este modelo predice que los grupos de genes deben haberse conservado entre especies. Este no es el caso de muchos operones y grupos de genes observados en eucariotas. [15]

Según Eichler y Sankoff, los dos procesos principales en la evolución de los cromosomas eucariotas son 1) reordenamientos de segmentos cromosómicos y 2) duplicación localizada de genes. La agrupación podría explicarse razonando que todos los genes de una agrupación se originan a partir de duplicados en tándem de un ancestro común. Si todos los genes coexpresados ​​en una agrupación evolucionaron a partir de un gen ancestral común, se habría esperado que se coexpresaran porque todos tienen promotores comparables. Sin embargo, la agrupación de genes es un fenómeno muy común en los genomas y no está claro cómo este modelo de duplicación podría explicar toda la agrupación. Además, muchos genes que están presentes en agrupaciones no son homólogos.

¿Cómo se produjo el acercamiento de genes evolutivamente no relacionados? O bien existe una fuerza que acerca los genes funcionalmente relacionados entre sí, o bien los genes se acercaron por cambio. Singer et al. propusieron que los genes se acercaron por recombinación aleatoria de segmentos del genoma. Cuando los genes funcionalmente relacionados se acercaban, esta proximidad se conservaba. Determinaron todos los posibles sitios de recombinación entre genes humanos y de ratón. Después, compararon la agrupación del genoma del ratón y del humano y observaron si la recombinación se había producido en los sitios de recombinación potenciales. Resultó que la recombinación entre genes del mismo grupo era muy rara. Por lo tanto, tan pronto como se forma un grupo funcional, la recombinación es suprimida por la célula. En los cromosomas sexuales, la cantidad de grupos es muy baja tanto en humanos como en ratones. Los autores razonaron que esto se debía a la baja tasa de reordenamientos cromosómicos de los cromosomas sexuales.

Las regiones abiertas de la cromatina son regiones activas. Es más probable que los genes se transfieran a estas regiones. Los genes de los orgánulos y del genoma del virus se insertan con mayor frecuencia en estas regiones. De esta manera, los genes no homólogos pueden comprimirse juntos en un dominio pequeño. [16]

Es posible que algunas regiones del genoma sean más adecuadas para genes importantes. Es importante para la célula que los genes responsables de las funciones basales estén protegidos de la recombinación. Se ha observado en levaduras y gusanos que los genes esenciales tienden a agruparse en regiones con una tasa de replicación baja. [17]

Es posible que los genes se hayan acercado entre sí por medio de cambios. Se han propuesto otros modelos, pero ninguno de ellos puede explicar todos los fenómenos observados. Está claro que, tan pronto como se forman los grupos, estos se conservan por selección natural. Sin embargo, todavía no existe un modelo preciso de cómo los genes se acercaron entre sí.

La mayor parte de los grupos actuales deben haberse formado hace relativamente poco tiempo, ya que solo se conservan siete grupos de genes funcionalmente relacionados entre filos. Algunas de estas diferencias se pueden explicar por el hecho de que la expresión génica está regulada de manera muy diferente por los distintos filos. Por ejemplo, en los vertebrados y las plantas se utiliza la metilación del ADN, mientras que está ausente en las levaduras y las moscas. [18]

Véase también

Notas

  1. ^ abc Caron H, van Schaik B, van der Mee M, et al. (febrero de 2001). "El mapa del transcriptoma humano: agrupamiento de genes altamente expresados ​​en dominios cromosómicos". Science . 291 (5507): 1289–92. Bibcode :2001Sci...291.1289C. doi : 10.1126/science.1056794 . PMID  11181992.
  2. ^ Velculescu VE, Zhang L, Zhou W, et al. (enero de 1997). "Caracterización del transcriptoma de la levadura". Cell . 88 (2): 243–51. doi : 10.1016/S0092-8674(00)81845-0 . PMID  9008165.
  3. ^ Cho RJ, Campbell MJ, Winzeler EA , et al. (julio de 1998). "Un análisis transcripcional del ciclo celular mitótico en todo el genoma". Mol. Cell . 2 (1): 65–73. doi : 10.1016/S1097-2765(00)80114-8 . PMID  9702192.
  4. ^ Lercher MJ, Urrutia AO, Hurst LD (junio de 2002). "La agrupación de genes de mantenimiento proporciona un modelo unificado del orden de los genes en el genoma humano". Nat. Genet . 31 (2): 180–3. doi :10.1038/ng887. PMID  11992122. S2CID  5797987.
  5. ^ Versteeg R, van Schaik BD, van Batenburg MF, et al. (septiembre de 2003). "El mapa del transcriptoma humano revela extremos en la densidad de genes, longitud de intrones, contenido de GC y patrón de repetición para dominios de genes expresados ​​en forma alta y débil". Genome Res . 13 (9): 1998–2004. doi :10.1101/gr.1649303. PMC 403669 . PMID  12915492. 
  6. ^ Lee JM, Sonnhammer EL (mayo de 2003). "Análisis de agrupamiento de genes genómicos de vías en eucariotas". Genome Res . 13 (5): 875–82. doi :10.1101/gr.737703. PMC 430880 . PMID  12695325. 
  7. ^ Singer GA, Lloyd AT, Huminiecki LB, Wolfe KH (marzo de 2005). "Los grupos de genes coexpresados ​​en genomas de mamíferos se conservan mediante selección natural". Mol. Biol. Evol . 22 (3): 767–75. doi : 10.1093/molbev/msi062 . hdl : 2262/29227 . PMID:  15574806.
  8. ^ Spellman PT, Rubin GM (2002). "Evidencia de grandes dominios de genes expresados ​​de manera similar en el genoma de Drosophila". J. Biol . 1 (1): 5. doi : 10.1186/1475-4924-1-5 . PMC 117248 . PMID  12144710. 
  9. ^ Roy PJ, Stuart JM, Lund J, Kim SK (agosto de 2002). "Agrupamiento cromosómico de genes expresados ​​en músculos en Caenorhabditis elegans ". Nature . 418 (6901): 975–9. doi :10.1038/nature01012. PMID  12214599. S2CID  4379384.
  10. ^ Johnnidis JB, Venanzi ES, Taxman DJ, Ting JP, Benoist CO, Mathis DJ (mayo de 2005). "Agrupamiento cromosómico de genes controlados por el factor de transcripción aire". Proc. Natl. Sci. USA . 102 (20): 7233–8. Bibcode :2005PNAS..102.7233J. doi : 10.1073/pnas.0502670102 . PMC 1129145 . PMID  15883360. 
  11. ^ Gierman HJ, Indemans MH, Koster J, et al. (septiembre de 2007). "Regulación de la expresión génica en todo el dominio en el genoma humano". Genome Res . 17 (9): 1286–95. doi :10.1101/gr.6276007. PMC 1950897 . PMID  17693573. 
  12. ^ Yamashita T, Honda M, Takatori H, Nishino R, Hoshino N, Kaneko S (noviembre de 2004). "El análisis del mapeo del transcriptoma de todo el genoma identifica patrones de expresión génica específicos de órganos a lo largo de los cromosomas humanos". Genomics . 84 (5): 867–75. doi :10.1016/j.ygeno.2004.08.008. PMID  15475266.
  13. ^ Kosak ST, Groudine M (octubre de 2004). "Orden genético y dominios dinámicos". Science . 306 (5696): 644–7. Bibcode :2004Sci...306..644K. doi :10.1126/science.1103864. PMID  15499009. S2CID  7293449.
  14. ^ Gilbert N, Boyle S, Fiegler H, Woodfine K, Carter NP, Bickmore WA (septiembre de 2004). "Arquitectura de la cromatina del genoma humano: los dominios ricos en genes se enriquecen en fibras de cromatina abiertas". Cell . 118 (5): 555–66. doi : 10.1016/j.cell.2004.08.011 . PMID  15339661.
  15. ^ Lawrence JG (septiembre de 1997). "Operones egoístas y especiación por transferencia de genes". Trends Microbiol . 5 (9): 355–9. doi :10.1016/S0966-842X(97)01110-4. PMID  9294891.
  16. ^ Lefai E, Fernández-Moreno MA, Kaguni LS, Garesse R (junio de 2000). "La estructura altamente compacta de la región genómica de la ADN polimerasa mitocondrial de Drosophila melanogaster : implicaciones funcionales y evolutivas". Insect Mol. Biol . 9 (3): 315–22. doi :10.1046/j.1365-2583.2000.00191.x. PMID  10886416. S2CID  39243989.
  17. ^ Pál C, Hurst LD (marzo de 2003). "Evidencia de coevolución del orden genético y tasa de recombinación". Nat. Genet . 33 (3): 392–5. doi :10.1038/ng1111. PMID  12577060. S2CID  21567576.
  18. ^ Regev A, Lamb MJ, Jablonka E (julio de 1998). "El papel de la metilación del ADN en invertebrados: ¿regulación del desarrollo o defensa del genoma?". Mol Biol Evol . 15 (7): 880–891. doi : 10.1093/oxfordjournals.molbev.a025992 .