TEMA MONOGRÁFICO GENÉTICA BÁSICA (I) Regulación de la expresión génica en las células eucarióticas C. Mezquita y J. Mezquita Unitat de Fisiologia. Laboratori de Genètica Molecular. Institut d’Investigacions Biomèdiques August Pi i Sunyer. Barcelona. EXPRESIÓN GÉNICA EN LAS CÉLULAS EUCARIÓTICAS existen también una serie de secuencias reguladoras situadas en los extremos 5‘ y 3’ no traducidos (5‘UTR y 3’UTR) que controlan los mecanismos postranscripcionales (fig. 2). Se denomina expresión génica1 al conjunto de procesos necesarios para la síntesis de proteínas a partir de los genes que las codifican (fig. 1). La enzima ARN polimerasa II copia el ADN de un gen (transcripción) y da lugar a un ARN precursor del ARN mensajero (ARNm). El ARN precursor experimenta una serie de modificaciones, denominadas postranscripcionales, que generan los tránscritos definitivos. Éstos son transportados al citoplasma, donde mediante el proceso de traducción se sintetizan las correspondientes proteínas. Los tránscritos presentan una estabilidad variable, su vida media puede durar de varios minutos a varios días. La secuencia de los ARNm no es inmutable y resulta modificada en algunos casos a través de un proceso denominado edición. La edición, aunque es poco frecuente en los organismos superiores, puede dar lugar a importantes cambios funcionales en las proteínas. REGULACIÓN DE LA TRANSCRIPCIÓN En la transcripción, además de la enzima ARN polimerasa II, intervienen una serie de proteínas denominadas factores de transcripción. Existen dos tipos de factores de transcripción: los generaA ADN Elemento regulador Dominio de unión Factor de transcripción específico REGULACIÓN DE LA EXPRESIÓN GÉNICA EN LAS CÉLULAS EUCARIÓTICAS Dominio de activación Factores de transcripción generales Promotor A veces se considera erróneamente que el proceso de regulación de la expresión génica consiste sólo en el control de la transcripción, pero en realidad el proceso de regulación se extiende también a los mecanismos postranscripcionales. De la misma manera que para el control de la transcripción resultan esenciales las secuencias de ADN, denominadas promotores y elementos reguladores, y las proteínas que interaccionan con las mismas, en el ARN Gen Sitio de iniciación B Factores de iniciación de la traducción Factor regulador 3’ específico Iniciación 5’ Factor regulador específico Transcripción Expresión génica Elongación Precursor del ARNm Mecanismos postranscripcionales Formación de la estructura 5’ cap Formación del sitio de poliadenilación Poliadenilación Eliminación de los intrones Edición Mecanismos postranscripcionales Estabilización Transporte Traducción ARNm Elementos reguladores específicos ARNm Iniciación Proteína Figura 1 La expresión génica es el conjunto de procesos que conducen a la síntesis de una determinada proteína a partir del gen que la codifica. Figura 2 La iniciación de la transcripción (A) y la iniciación de la traducción (B) son procesos estrechamente regulados. En el control intervienen factores generales y factores específicos que interaccionan entre sí y con las secuencias indicadas de los ácidos nucleicos. TEMA MONOGRÁFICO GENÉTICA BÁSICA (I) Regulación de la expresión génica en las células eucarióticas C. Mezquita Pla y J. Mezquita Pla les, que se unen a secuencias del gen, denominadas promotoras, próximas al sitio de iniciación de la transcripción, y los específicos, que se unen a elementos reguladores situados a distancias variables del sitio de iniciación (fig. 2). Los factores de transcripción pueden actuar como activadores o como inhibidores de la transcripción. PROMOTORES Y ELEMENTOS REGULADORES Los promotores son secuencias reguladoras del ADN próximas al sitio de iniciación de la transcripción2. En muchos genes el promotor se extiende desde la posición –40 a la posición +40, siendo +1 el sitio de iniciación, y contiene una secuencia TATA, rica en nucleótidos A/T. La secuencia TATA se encuentra entre las posiciones –25 y –30 antes del sitio de iniciación. Esta secuencia es reconocida por la proteína TBP (TATA binding protein). Otra secuencia promotora, el iniciador (Inr), se superpone con el sitio de iniciación. Una tercera secuencia, denominada DPE, está situada entre las posiciones +28 y +34. El elemento DPE se comporta como un análogo alternativo a la secuencia TATA. Otro tipo de promotores no contienen la secuencia TATA (promotores sin-TATA) y se caracterizan por ser ricos en GC. Poseen sitios de unión para el factor de transcripción Sp1. El promotor se extiende en una región de unos 200 nucleótidos que precede al sitio de iniciación. A diferencia de los promotores con secuencias TATA que inician con precisión en un sitio determinado, los promotores ricos en GC presentan varios sitios de iniciación. Concentraciones variables del factor Sp1 pueden modular la intensidad de la transcripción en estos promotores. COMPLEJO DE INICIACIÓN Para que la ARN polimerasa II reconozca el sitio de iniciación ha de unirse al promotor. La unión al promotor requiere la participación de los denominados factores generales de transcripción que forman con la polimerasa un complejo denominado complejo de iniciación de la transcripción (fig. 2). Entre los factores generales de transcripción, es particularmente importante el denominado TFIID, que reconoce el promotor y proporciona el andamio estructural en el que pueden ensamblarse el resto de proteínas. La proteína TBP y los factores asociados a la misma (TAF) forman parte del TFIID. Las proteínas TAF son capaces de reconocer al promotor y también a los factores de transcripción específicos, activadores o represores, que se unen a los elementos reguladores. De esta forma transmiten al promotor la acción activadora o represora de los factores de transcripción específicos. Además de esta función, las proteínas TAF modifican la estructura de la cromatina a través de reacciones enzimáticas de acetilación y fosforilización de las histonas. Una vez se ha unido el factor IID, se unen secuencialmente el resto de los factores que constituyen el complejo de iniciación. Uno de los últimos factores en unirse al complejo, el denominado IIH, presenta actividad helicasa y utiliza la energía resultante de la hidrólisis del ATP para separar la doble cadena del ADN, lo cual permite iniciar la transcripción. El factor IIH posee, además, actividad cinasa y fosforiliza múltiples serinas existentes en el extremo carboxiterminal de la subunidad mayor de la ARN polimerasa II. La fosforilización es importante para liberar a la enzima del complejo de iniciación y dar comienzo a la transcripción. FACTORES DE TRANSCRIPCIÓN ESPECÍFICOS Los factores de transcripción específicos poseen un dominio de unión que interacciona con secuencias específicas del ADN, denominadas elementos reguladores, y un dominio de activación que se une a los factores generales de transcripción del complejo de iniciación (fig. 2). Muy a menudo los factores de transcripción forman heterodímeros, lo que permite la interacción con un mayor número de elementos reguladores y la combinación de diferentes dominios activadores. Los heterodímeros pueden activar o inhibir la transcripción. Los elementos reguladores pueden estar situados a distancias variables del promotor. Cuando la distancia es muy grande, los factores de transcripción específicos unidos a los elementos reguladores pueden establecer contacto con las proteínas del complejo de iniciación gracias a que el ADN forma asas que aproximan el elemento regulador al promotor (fig. 2). Los elementos reguladores pueden tener una longitud de unos 100 pares de bases (pb) y contener sitios de unión para múltiples proteínas activadoras o represoras. Los factores represores pueden actuar por varios mecanismos. Una posibilidad es que estén constituidos, como los factores activadores, por un dominio de unión al ADN y un dominio funcional represor. Los represores pueden también unirse a elementos reguladores activadores y bloquearlos o interaccionar directamente con el sitio de iniciación de la transcripción inhibiéndola. Cada tipo celular presenta diferencias cualitativas y cuantitativas en los factores de transcripción, generales y específicos, que expresa. Además, la expresión génica puede ser regulada por la unión a los factores de transcripción de diferentes moléculas (hormonas esteroideas, hormonas tiroideas, retinoides, etc.) Algunas de estas moléculas, por su solubilidad en la membrana, tienen libre acceso a los factores de transcripción; otras, como las hormonas de naturaleza proteica y también las hormonas esteroideas, pueden interaccionar con proteínas de la membrana celular y activar vías de transducción de señales. Estas vías, aparte de provocar otras respuestas, modifican la transcripción induciendo cambios covalentes en los factores de transcripción como la fosforilización. ELONGACIÓN El inicio de la transcripción no significa necesariamente que la síntesis del precursor del ARNm prosiga sin interrupción hasta completarse, puesto que en ocasiones se detiene cuando sólo se ha formado un polímero de unas decenas de nucleótidos. No se conocen los mecanismos que provocan las pausas en la elongación de la cadena del ARN. En el caso de la proteína de estrés térmico HSP70, a temperaturas fisiológicas, la elongación se detiene cuando la longitud de la cadena de ARN alcanza unos 25 nucleótidos. Durante el estrés térmico, la transcripción y la traducción de la mayoría de genes se detiene; sin embargo, un grupo de genes que codifican proteínas esenciales para la supervivencia en condiciones de estrés presentan una mayor transcripción. En estas circunstancias no se produce la pausa y la elongación prosigue hasta completarse el tránscrito. Además, la reiniciación de la transcripción se produce con mayor frecuencia. No se conoce el mecanismo responsable de la pausa. La activación de los factores de transcripción de heat shock que interaccionan con los elementos reguladores de estrés térmico aumenta la velocidad de elongación y de reiniciación. TEMA MONOGRÁFICO GENÉTICA BÁSICA (I) Regulación de la expresión génica en las células eucarióticas C. Mezquita Pla y J. Mezquita Pla ESTRUCTURA DE LA CROMATINA Y TRANSCRIPCIÓN El ADN se encuentra asociado a las histonas formando los nucleosomas que son las unidades estructurales de la cromatina. Las histonas inhiben la transcripción tanto en la fase de iniciación como en la fase de elongación. Para que tenga lugar la transcripción resulta necesaria la presencia de una serie de proteínas capaces de contrarrestar la acción de las histonas. Tal como se ha mencionado anteriormente, los factores de transcripción modifican la estructura de la cromatina y hacen posible la transcripción. Los factores implicados en estos cambios estructurales se denominan complejos de remodelación, como el RSF, que permite la iniciación de la transcripción y complejos de elongación, como el FACT, que facilitan la elongación3. Los complejos que modifican la estructura de la cromatina para facilitar la transcripción pueden clasificarse en dos grupos distintos: los que producen modificaciones covalentes de las histonas y los que utilizan la hidrólisis del ATP para cambiar la conformación de los nucleosomas. El cambio de conformación de los nucleosomas puede implicar un aumento o una disminución de la transcripción. Al primer grupo pertenecen las acetiltransferasas, que añaden grupos acetilo a los extremos aminoterminales de las histonas, y las desacetilasas que quitan grupos acetilo. El aumento de la acetilación suele estar relacionado con un incremento de la transcripción, aunque no ocurre así en todos los casos. METILACIÓN DEL ADN En el embrión de ratón, en la fase de blástula, la mayor parte del ADN se encuentra no metilado. Después de la implantación se produce una ola de metilación de novo que afecta a la mayoría del genoma. Se ha postulado que esta metilación global constituiría un mecanismo de seguridad para inhibir la expresión de secuencias exógenas existentes en el genoma o para bloquear la expresión de trasposones. La metilación global bloquea la expresión de todas aquellas secuencias que carecen de los elementos necesarios para impedir la metilación. Estos elementos se encuentran, sin embargo, en las islas CpG asociadas a los genes de expresión habitual que no resultan metiladas. Aunque la hipermetilación puede estar asociada con la condensación de la cromatina y la represión de la transcripción, no se ha podido establecer una relación unívoca entre metilación y bloqueo de la transcripción. Así, el gen de la ciclina A1 con el promotor hipometilado no se expresa en las células somáticas, mientras que el mismo gen con el promotor hipermetilado presenta una expresión máxima durante la espermatogénesis4. MODIFICACIONES POSTRANSCRIPCIONALES Poco después de que la ARN polimerasa inicie la transcripción en el primer nucleótido del primer exón de un gen, tiene lugar la adición de 7-metilguanilato al extremo 5’ del mensajero (estructura cap). La transcripción termina más alla del extremo 3’ del último exón. El extremo 3’ del tránscrito definitivo se genera por un corte en un punto específico denominado sitio de poliadenilación. Existen señales de poliadenilación (AAUAAA) separadas por 10-30 nucleótidos del sitio de corte. La poliadenilación consiste en la adición de 100-250 adeninas. A continuación, si el tránscrito tiene intrones, éstos son eliminados y los exones se unen formando el mensajero definitivo que es transportado al citoplasma, donde tiene lugar la traducción. Los procesos postranscripcionales mencio- nados y el control de la traducción que tiene lugar a continuación dependen de una serie de proteínas que se unen al ARN formando partículas ribonucleoproteicas. CONTROL DE LA TRADUCCIÓN La traducción de los ARNm es un proceso altamente competitivo y una fase estrechamente regulada de la expresión génica. La regulación tiene lugar esencialmente en la fase de iniciación. La subunidad ribosómica 40S se une, junto con una serie de proteínas denominadas factores de iniciación, al extremo 5’ del ARNm (fig. 2). Entre estos factores cabe destacar una helicasa que deshace la estructura secundaria del extremo 5’ del ARNm. En una segunda fase el conjunto de la subunidad 40S y de los factores de iniciación se desplazan sobre el ARN hasta que reconocen un triplete AUG como inicio de la traducción. Entonces se produce la disociación de los factores de iniciación y la incorporación de la subunidad ribosómica 60S. El ARNm que está siendo traducido adopta una forma circular debido a proteínas que unen los extremos 5’ y 3’ de la molécula (fig. 2)5. La circulación del ARNm aumentaría la fidelidad de la traducción y facilitaría la reutilización del tránscrito. La disposición circular explica también por qué las secuencias 3’UTR, además de las 5’UTR, son importantes para el control de la iniciación de la traducción. Se ha identificado una proteína, denominada maskin6, que compite con un factor de iniciación y bloquea el inicio de la traducción. La disociación de la proteína maskin y la poliadenilación del tránscrito permiten el inicio de la traducción. REGULACIÓN GLOBAL DE LA TRADUCCIÓN La traducción puede ser regulada de forma global a través de los factores de iniciación y de factores que compiten con los mismos, y también gracias a la existencia de proteínas represoras que interaccionan con el ARN de forma inespecífica. En los espermatocitos y en las espermátidas, más del 70% de los ARNm se encuentran unidos a proteínas que bloquean temporalmente la traducción. Estas proteínas pertenecen a la familia denominada Y-box (YB). Estas mismas proteínas inhiben también la traducción prematura de mensajeros maternos que son almacenados en el oocito para ser traducidos más adelante durante la maduración de esta célula o en la fase inicial de la embriogénesis. En las partículas de ARN almacenadas, además de proteínas YB, existen helicasas. Estas proteínas pueden ejercer un importante papel controlando el plegamiento y desplegamiento del ARN durante la formación y el desensamblaje de los complejos ribonucleoproteicos. La introducción de estructura secundaria en el extremo 5’ de los ARNm bloquea la traducción. Éste puede ser el mecanismo responsable del bloqueo temporal de la traducción de una serie de tráscritos testiculares que hemos caracterizado en nuestro laboratorio7. Existen helicasas específicas de células meióticas y posmeióticas que resultarían esenciales para el control de la traducción en la línea germinal. REGULACIÓN ESPECÍFICA DE LA TRADUCCIÓN Además de la regulación global de la traducción, existen mecanismos de regulación específica a través de secuencias existentes en los extremos 5’UTR y 3’UTR (fig. 2). La traducción del mensajero de la ferritina es inhibida por proteínas que se unen a secuencias TEMA MONOGRÁFICO GENÉTICA BÁSICA (I) Regulación de la expresión génica en las células eucarióticas C. Mezquita Pla y J. Mezquita Pla del extremo 5’. Algunas proteínas reguladoras actúan como agentes dobles8: por una parte, son factores de transcripción que se unen a elementos reguladores del ADN y, por otra, son factores de traducción que se unen a elementos reguladores del ARN. La región 3’ de los tránscritos también contiene elementos reguladores que pueden ser reconocidos de forma específica por represores de la traducción. Éste es el caso de la familia de proteínas denominada “STAR”. Estas proteínas reconocen elementos reguladores denominados TGE en la región 3’ de determinados tránscritos y forman parte de una vía de transducción de señales que actúa sobre los ARNm controlando su traducción. Las proteínas STAR se expresan durante la espermatogénesis9 y podrían bloquear temporalmente la traducción de algunos mensajeros. El mensajero de la protamina es también controlado por una proteína que se une al extremo 3’. La proteína reguladora está presente en las células que almacenan los tránscritos de protamina pero no los traducen y falta en las células que sintetizan protamina al final de la espermiogénesis. El extremo 3’UTR de los tránscritos resulta también esencial para el control de la estabilidad de los ARNm. Los tránscritos de protooncogenes, de factores de transcripción y de citocinas, entre otros, tienen vidas medias muy cortas y poseen extremos 3’UTR con secuencias desestabilizantes ricas en AU, denominadas secuencias ARE. Las secuencias ARE promueven la desadenilación de los mensajeros como fase previa a su ulterior degradación. La existencia de secuencias ARE no prejuzga que los mensajeros sean rápidamente degradados, puesto que los tránscritos pueden resul- tar estabilizados por la unión de determinadas proteínas como la proteína de heat shock HSP7010,11. Bibliografía 1. Lodish H, Baltimore D, Berk A, Zipursky SL, Matsudaira P, Darnell J. Molecular Cell Biology. Nueva York: Scientific American, 1995. 2. Albright SR, Tjian R. TAFs revisited: more data reveal new twists and confirm old ideas. Gene 2000; 242: 1-13. 3. LeRoy G, Orphanides G, Lane WS, Reinberg D. Requirement of RSF and FACT for transcription of chromatin templates in vitro. Science 1998; 282: 1900-1904. 4. Muller C, Readhead C, Diederichs S, Idos G, Yang R, Tidow N et al. Methylation of the cyclin A1 promoter correlates with gene silencing in somatic cell lines, while tissue.specific expression of cyclin A1 is methylation independent. Mol Cell Biol 2000; 20: 3316-3329. 5. Wells SE, Hillner PE, Vale RD, Sachs AB. Circularization of mRNA by eukaryotic translation initiation factors, Mol Cell 1998; 2: 135-190. 6. Stebbins-Boaz B, Cao Q, De Moor CH, Méndez R, Richter JD. Maskin is a CPEB-associated factor that transiently interacts with el F-4E. Mol Cell 1999; 4: 1017-1027. 7. Mezquita P, Mezquita C, Mezquita J. Novel transcripts of carbonic anhydrase II in mouse and human testis. Mol Hum Reprod 1999; 5: 199-205. 8. Kempe E, Muhs B, Schafer M. Gene regulation in drosophila spermatogenesis: analysis of protein binding at the translational control element TCE. Dev Genet 1993; 14: 449-459. 9. Mezquita J, Pau M, Mezquita C. Four isoforms of the signal-transduction and RNA-binding protein QKI expressed during chicken spermatogenesis. Mol Reprod Deb 1998; 50: 70-78. 10. Laroia G, Cuesta R, Brewer G, Schneider RJ. Control of mRNA decay by heart shock-ubiquitin-proteasome pathway. Science 1999; 284: 499-502. 11. Henics T, Nagy E, Oh HJ, Csermely P, Von Gabain A, Subjeck JR. Mammalian Hdp 70 and Hsp 100 proteins bind to RNA motifs involved in mRNa stability. J Biol Chem 1999; 274: 17318-17324.