Genética Molecular. Biología. UB. Curso 2007-08. Carlos F. R. Genética Molecular. Carlos F.R. Página 2 ÍNDICE Tema 1: La Transcripción Procariota. Tema 2: La Transcripción Procariota: Regulación. Problemas. Tema 3: La Transcripción Eucariota I. Problemas. Tema 4: La Transcripción Eucariota II. Problemas. Tema 5: La Transcripción Eucariota III. Extra Tema 5: Técnicas. Problemas. Tema 6: La Transcripción Eucariota IV. Problemas. Tema 7: La Traducción. Tema 8: La Replicación Procariota. Problemas. Tema 9: La Replicación Eucariota. Tema 10: Reparación de las Mutaciones en Procariotas I. Tema 11: Reparación de las Mutaciones en Procariotas II. Problemas. Tema 12: Reparación de las Mutaciones en Eucariotas. Problemas. Tema 13: Recombinación General: Introducción. Tema 14: Recombinación General: Mecanismo Enzimático. Problemas. Tema 15: Recombinación de Sitio Específico. Tema 16: Transposición Procariota. Problemas. Tema 17: Transposición Eucariota. Tema 18: Biología de los Retrovirus. Tema 19: Retrotransposones y Retrogenes. Problemas. Tema 20: Inmunoglobulinas. Problemas. Exámenes. Genética Molecular. Carlos F.R. Página 3 TEMA 1: LA TRANSCRIPCIÓN PROCARIOTA. La transcripción consiste en sintetizar RNA a partir de DNA. El dsDNA es el DNA de doble cadena (y el ssDNA, el DNA de cadena simple). Por consenso, siempre nos dan el extremo 5’-P arriba a la izquierda. Abajo suyo hay un 3’-OH. La cadena “sense” del DNA es la que NO contiene la información, es decir, la que no lee la RNA Polimerasa. La cadena “antisense” es la que tiene la información para pasar a gen, es leída por la RNA Polimerasa. La transcripción siempre es en 5’3’ de la cadena que se sintetiza. Hay 3 etapas en la Transcripción: - Iniciación: La RNA Polimerasa se une al promotor, abre la burbuja e inicia la transcripción. - Elongación: La RNA Polimerasa se desplaza elongando el RNA. - Terminación: La RNA Polimerasa, el RNA y el DNA se separan. 1. La Iniciación. El promotor es la secuencia de bases a la cual se une la RNA polimerasa. Forma parte del gen, en la región “upstream” del gen (no se transcribe, regula, está a 5’). El “downstream” es desde el inicio de la transcripción hasta el final. La base “+1” en el DNA se asigna al primer nt que se encuentra en el RNA, es decir, es el primer nt que se transcribe. La numeración de las bases del promotor, por tanto, será negativa. El promotor tiene una secuencia de bases hacia la cual la RNA polimerasa tiene mayor o menor afinidad. Pero siempre tiene unas cajas de secuencia “consenso”, que es invariable, en la misma posición. A saber: Caja “-35”. Dominio de reconocimiento. “TATA box” ó caja“-10” ó Pribnow Box ó Dominio de desenrollamiento. Caja “CAT”. En el 90% de los casos, la base “+1” (la primera en el RNA) es una A. No se procesará el RNA. Las distancias entre la caja “-35” y la “tata box”, y entre la “tata box” y la caja “CAT” son de 16 a 19 pb y de 5 a 9 Genética Molecular. Carlos F.R. Página 4 pb respectivamente. Siempre se debe mantener éste número de bases que las separe. Lo que se puede variar es la secuencia de bases que contienen. Así, si mutamos éstas bases podemos obtener mutaciones “UP” si son bases hacia las cuales la RNA Polimerasa tiene alta afinidad: incrementa la tasa de transcripción (DOMINANTE, promotor fuerte); mientras que serán mutaciones “DOWN” si son bases hacia las cuales la RNA Polimerasa tiene poca afinidad: baja tasa de transcripción (RECESIVO, promotor débil). De éste modo, la RNA Polimerasa se une a la caja “-35” y a la “tata box”, desenrolla desde la “tata box”, se mueve sobre el DNA sintetizando RNA complementario al DNA, en 5’3’. Estrictamente, en la iniciación se sintetizan unos pequeños tránscritos abortivos (oligos de RNA no unido) desde antes de -10, pero el RNA definitivo siempre se sintetiza a partir de la base +1. Los promotores fuertes tienen una durada pequeña de la fase abortiva, al revés que los débiles. Así se forma el “complejo de transcripción cerrado” (dsDNA + RNA polimerasa). A partir del inicio de la transcripción se forma el “complejo ternario” (dsDNA + RNA polimerasa + RNA). Una vez hechas las transcripciones abortivas e iniciada la elongación, se pueden separar subunidades de la RNA polimerasa que ya no sean necesarias para elongar. La RNA polimerasa Procariota (sólo hay 1 tipo): - Subunidades α: Ensamblan. Interaccionan con prots. reguladoras. Reconocen a las secuencias “UP ELEMENTS”(están en el promotor, aumentan la tasa de transcripción). - Subunidades β y β’: Reclutan rNTP. Son el verdadero centro catalítico, forman enlaces fosfodiéster. - Subunidad σ: reconoce a la caja “-35” con su dominio σ4 y a la “tata box” con su dominio σ6. Las subunidades σ son intercambiables, hay una diferente para cada gen. 2. La Elongación. Se añaden los rNTP complementarios al DNA antisense, en 5’3’. Llega un momento en el que se pierde la subunidad Genética Molecular. Carlos F.R. Página 5 “σ”, y más adelante también se pierden las dos α. Sólo queda el centro catalítico. 3. La Terminación. En Procariotas depende de secuencia señal. Se clasifican según si interviene cierta proteína o no (Rho). 3.1. Terminación Rho-Independiente ó Intrínseca: sólo necesita secuencias en el DNA, no interviene Rho. Cuando se ha transcrito la secuencia en el RNA se para la transcripción, porque primero se forma un “hairpin” (o loop) debido a una región de bases complementarias entre ellas, rica en GC (esto hace que “pese” más el RNA). Después se transcribe una región con muchos U, los cuales tienen sólo 2 enlaces con la A del DNA (la tensión que hace el “hairpin” es suficiente) y se arranca el RNA. 3.2. Terminación Rho-Dependiente ó Extrínseca: se transcribe una secuencia llamada RUT (en el RNA) a la cual se le une Rho. Está a 50-70 nt del codón STOP, en el 3’UTR. Rho es un hexámero que se desplaza 5’3’ gastando ATP, a una velocidad muy rápida. Así llega a “chocar” con la RNA polimerasa, haciéndola saltar. Se rompen los enlaces de H2 entre el RNA y el DNA molde porque también tiene actividad helicasa. También se forma en éste caso un “hairpin” rico en GC, pero es insuficiente para hacer saltar el RNA. No hay cola de U. Genética Molecular. Carlos F.R. Página 6 TEMA 2: LA TRANSCRIPCIÓN PROCARIOTA: REGULACIÓN. Los genes Procariotas se organizan en operones, ya que el mRNA que producen es policistrónico (= tiene varios lugares de inicio de la traducción, cada uno con su STOP, y codifica para varias proteínas diferentes). A la región reguladora (en el Operador) se unen proteínas represoras, para hacer como un “muro” que impiden que físicamente avance la RNA Polimerasa (repasar ésto de Genética General). Así, en Procariotas, el modelo típico de regulación es mediante el Control Negativo (C-) de la transcripción, en el que por defecto las proteínas represoras se unen a la región reguladora, ya que basalmente hay transcripción. En Eucariotas, sin embargo, es al revés: hay un Control Positivo (C+) de la transcripción, en el cual es necesario activar a una serie de moléculas (Factores de Transcripción) para que pueda iniciarse la transcripción, ya que basalmente es inactiva. También encontramos en Procariotas (aparte de las proteínas represoras): -el inductor: induce la transcripción porque bloquea a la proteína represora. Lo es, por ejemplo, la lactosa y la proteína CAP (Catabolic-gene Activation Protein) activada. Permiten un sistema de C- inducible por lactosa (bloquea al represor y permite la transcripción) y un sistema de C+ inducido por CAP (estimula a la RNA Polimerasa). -el correpresor: estimula a la proteína represora bloqueando la transcripción. Lo es, por ejemplo, el triptófano. Permite un sistema de C- reprimible por triptófano. Por tanto: Op. Lactosa: C- inducible por lac: Inductor + represor = transcripción. C+ inducido por CAP: Inductor + represor + activador (CAP) = Mucha transcripción. Op. Trp: C- reprimible por trp: represor + correpresor = no transcripción. No se conoce ningún operón donde haya un C+ reprimible, ya que sería absurdo metabólicamente. Se comentarán a continuación 4 ejemplos en los que la regulación de los genes Procariotas se lleva a cabo en diferentes situaciones, usando diferentes estrategias. Nota: Por una vía metabólica que no se comenta aquí, cuando hay mucha glucosa = poco AMPc = poco CAP activado. Y al revés: poca glucosa = mucho AMPc = mucho CAP activo. CAP + AMPc = CAP activado (= CRP según algunos). Genética Molecular. Carlos F.R. Página 7 1. EL OPERÓN ARABINOSA. Contiene los genes (B, A y D) que metabolizan la arabinosa para obtener energía. Se activa en presencia de arabinosa (similar al operón lactosa: sistema de C- inducible por arabinosa). La proteína C es la represora, y la proteína CAP (con AMPc) es la proteína activadora. Basalmente, la proteína C es represor, pero al unirse a la arabinosa, no solo deja de reprimir sinó que se convierte en un activador de la transcripción y actúa sinérgicamente a CRP (el CAP activado se une a la región “CRP Binding Site”, al lado del OI). Para que haya transcripción se necesita que no tengamos glucosa en el medio (mucho CRP) y que haya arabinosa (se inhibe la represión de la proteína C). Si hay glucosa y arabinosa no hay transcripción porque falta el CRP (no hay activador); y si no hay ni glucosa ni arabinosa tampoco hay transcripción porque la proteína C está reprimiendo. Las dianas de la proteína C son AraI (con I1 y I2), AraO1 (con O1L y O1R) y AraO2. Debido a que el Promotor de la proteína C solapa con el AraO1, se dice que la proteína C regula su propia síntesis. Basalmente se sintetiza proteína C, y cuando su [ ] es alta, se une a sus 3 dianas bloqueando la transcripción; mientras que si su [ ] es baja, se desengancha y se produce más proteína C. Es un feedback -. Para regular la transcripción de AraC, la región AraO2 es optativa. La verdadera función de AraO2 es regular la transcripción de los genes BAD: - cuando hay poca arabinosa y mucha glucosa, la proteína C se une a AraO1 y simultáneamente a AraO2 y AraI, haciendo un “loop” en el DNA. No funciona ningún promotor, porque se Genética Molecular. Carlos F.R. Página 8 tapa físicamente el contacto de CRP con la RNA Polimerasa (la activaría). Tampoco se sintetiza más proteína C. Las 3 dianas de AraC son AraO2, AraI (tiene I1 e I2, la proteína C se une a I1) y AraO1 (tiene O1L y O1R, la proteína C se una a ambos). - cuando hay mucha arabinosa y sin glucosa, sucede que la arabinosa se une a la proteína C haciendo que no inhiba y se vuelva activadora; no se puede unir a AraO2 ni a AraO1, con lo cual hay más proteína C que hace de activador (porque hay arabinosa). Sí que se puede unir a AraI (a sus dos subregiones, I1 y I2), y actúa sinérgicamente a CRP (porque no hay glucosa) y se estimula mucho la transcripción de los genes BAD. Se deshace el loop en el DNA, las subunidades α de la RNA polimerasa tocan a el CRP que está unido al CRP Binding Site (un UP ELEMENT)y a la vez la proteína C unida a arabinosa es activador, hay mucha transcripción. Molecularmente, la proteína C es un homodímero. Por el dominio C’terminal se une al DNA y por el dominio N’terminal se une a la arabinosa y a otro monómero de proteína C. Así, cuando se forma el loop hay 4 monómeros de proteína C (=2 homodímeros); y cuando se deshace el loop hay 2 monómeros de proteína C (=1 homodímero) unidos cada uno a arabinosa. 2. LA RESPUESTA SOS EN E.COLI. Sirve para detectar si hay mutaciones en el DNA, generando masivamente enzimas que reparan el DNA. Basalmente esto está reprimido y se activa sólo con daños en el DNA. Genética Molecular. Carlos F.R. Página 9 Implica a las proteínas LexA y RecA (ésta última es muy importante, siempre tiene un pool basal en la célula). Debido a que cuando hay lesiones en el DNA y se realiza la reparación (en muchos de los sistemas de reparación, ver Tema 11 y Tema 12), en un momento dado hay un fragmento de ssDNA que es el sustrato de RecA. Unida así al ssDNA, RecA empieza a moverse por todo el DNA en busca de la proteína LexA, la cual de manera constitutiva se ha expresado y está unida a las cajas SOS (= operadores de LexA = dianas de LexA dentro de los promotores de los genes SOS, está allí bloqueando la transcripción). Una vez que RecA toca a LexA, hace que LexA se separe del promotor y se autoproteolice. Los genes que tenían LexA en el promotor bloqueando su expresión eran UVR-A, UVR-B, RecA, LexA (reprime su propia síntesis), los genes SOS. Así toda la proteína LexA desaparece autoproteolizándose, ya sea la que había reprimiendo como la que aparece de nueva síntesis. 3. LA ESPORULACIÓN EN Bacillus subtilis. Es muy similar a la de Bacillus antraci. La bact. se divide por bipartición mitótica, si las condiciones son óptimas. Pero si las condiciones del medio son desfavorables, entonces la bact. inicia el proceso de esporulación. En él, la bact. no se divide, sino que replica su DNA y forma una pared ó “séctum” que separa dos compartimentos internos cada uno de los cuales tiene un genoma. El compartimento grande es la madre y el pequeño es la proespora (espora incipiente que aún no se ha separado). Finalmente, la proespora se separa y se vuelve espora, queda en estado de quiescencia y la madre se autolisa. Todo ello se regula genéticamente y el proceso lo empezamos a estudiar cuando se ha formado la proespora incipiente, con el séctum. El objetivo final del proceso es conseguir que en la célula madre se activen los genes de autolisis y la proespora active los genes para definir el séctum en pared y así separarse. A medida que se va avanzando por la cascada de señalización se van cambiando las subunidades σ. De hecho, los genes que se activan mientras avanza el proceso son los genes que codifican para las subunidades σ específicas del siguiente gen. Es la transcripción diferencial, la RNA polimerasa tiene diferentes σ en función del momento. Las diferentes σ que aparecen son: - σA, σE, σK: han de quedar en la madre. - σH, σF, σG: han de quedar en la proespora. Genética Molecular. Carlos F.R. Página 10 OJO: Las subunidades σ están presentes por todos los compartimentos, pero sólo son funcionales en el compartimento correspondiente gracias a la acción de proteínas secuestradoras que atrapan a la subunidad σ que no corresponde al compartimiento. Éstas proteínas secuestradoras son: -AA: basalmente fosforilada (inactiva) en la madre y en la proespora. Se activa desfosforilándose cuando pasa al compartimento de la hija. -AB: basalmente activa en la madre y en la proespora. Secuestra a la subunidad σF en ambos compartimientos. En la proespora, AB es secuestrada por AA y σF queda libre. -Proteínas del séptum: Fosfatasa 2A. Proteasa transmembrana activada por “2r”. Proteasa transmembrana activada por “4b”. (Ver esquema del funcionamiento en la siguiente página). Hay dos puntos de control en todo el proceso para mantener los ritmos de transcripción de los genes de las subunidades σ al ritmo correcto: - Para que σE se active al mismo tiempo que σF, σF en la proespora transcribe para “2r”, proteasa transmembrana con dominio catalítico en la madre que activa a σE. - σG en la proespora transcribe para “4b”, que activa a la proteasa del séptum que activa a σK en la madre. Genética Molecular. Carlos F.R. Página 11 CONDICIONES ADVERSAS (MUCHA Tª, CO2…) (extracelular) SÉPTUM MADRE Quinasa Termosensible OFF Quinasa Termosensible ON Quinasa Termosensible OFF SpoA-P ON (prot. Master) SpoA OFF σH PROESPORA σA σF σE Quinasa Termosensible ON SpoA-P ON (prot. Master) SpoA OFF σH σA σF σE inact inact AB AB-σF AB AB-σF AA AA-P Dom. P’asa AA-AB act inact Pi σF act Transcribe para “2r” 2r σE act Transcribe para… Dom. proteasa Transcribe para… σG act Transcribe para “4b” σK inact 4b σK act Dom. proteasa GENES QUE DETERMINAN LA FORMACIÓN DE LA PARED. GENES QUE INICIAN LA AUTOLISIS EN LA MADRE. Genética Molecular. Carlos F.R. Página 12 4. EL FAGO λ. El fago lambda (λ) es un virus atemperado, es decir, que puede hacer el ciclo lítico (lisis) si decide matar a su huésped cuando se divide y así infectar a las células vecinas, o bien puede hacer el ciclo lisogénico (lisogenia) cuando integra su genoma en el del huésped (siempre en el mismo sitio) cuando no se divide. El genoma de un virus integrado en el genoma del huésped recibe el nombre de profago (fago = virus; bacteriógafo = tipo de virus cuyo huésped es una bacteria). Su genoma es lineal pero dentro del huésped se circulariza por los extremos cos. Necesita usar la maquinaria del huésped para realizar sus funciones (es decir, los promotores de sus genes son bacterianos). Se replica por el modelo del círculo rodante. La integración de λ en el genoma de E.Coli siempre es en el mismo lugar (mediante una recombinación de sitio específico, ver tema 15) y queda en estado de provirus. Organización: - Operón Izquierdo (OL): sib-attP-Int-Xis-abc-CIII-N - CI: no es un operón, es un gen. Tiene 2 promotores. - Operón Derecho (OR): Cro-CII-O-P-Q-S-R-cos - Operón Tardano (OR’): S-R-cos-Cápside-Cola. Solapa parcialmente con OR. Lleva a la lisis. Cuando el fago λ entra en E.Coli, se circulariza y sus promotores PR (del operón derecho) y PL (del operón izquierdo) se comienzan a transcribir inmediatamente con la RNA polimerasa procariota. Se codifican las proteínas N (antiterminadora de la transcripción) y Cro (represora de la transcripción, lleva a la lisis). Se mantiene así un rato, haciendo el pool de N y Cro. Se cree que la terminación de la transcripción es dependiente de Rho. Cuando N tiene [ ] suficiente, se une a las secuencias RUT en el RNA (eran las cajas NUT del DNA). Las cajas NUT estaban en el DNA después de PL y después de Cro. N compite con la afinidad de Rho para unirse al RNA, y N tiene más Genética Molecular. Carlos F.R. Página 13 afinidad, así se llega a unir a la RNA Polimerasa y hace que no salte, permitiendo que se pueda saltar la señal de terminación de la transcripción que había (= tR ó tL). nutL CI nutR N y Cro son las proteínas primerencas, que vienen de los genes primerencos. Los genes primerencos tardanos son de CII hasta Int (para OL) y de CIII hasta Q (para OR). Los genes tardanos son de S hasta la cola (para OR). De momento ésto lo hace siempre: se transcribe el operón izquierdo todo y el derecho hasta Q. Así hace la lisogenia por defecto, porque al final del OL está la integrasa que lo integra en el genoma del huésped (ya veremos cómo se expresa). Si queremos hacer lisis, la célula se tiene que dividir, hemos de pasar de Q en la transcripción y llegar a activar al promotor del OR’ (el PR’) para hacer los genes de lisis (ver esquema completo en página 19). Si pasamos de Q, se hace la lisis. Al final de Q, hay tR3 (=tR’). Gracias a la proteína Q, se puede saltar ésta señal de terminación, ya que Q actúa uniéndose a las cajas QUT (que se transcriben en el RNA) y hace la misma función que N. Tanto N como Q son proteínas antiterminadoras de la transcripción. Q nos lleva a los genes de la lisis. Si Q se acumula hay transcripción de todos los promotores del OR hasta el final. La señal de terminación tR3 afecta a dos tránscritos: el que viene desde PR y el que viene de PR’. En éste último caso, el tránscrito es muy pequeño, sin información. PR’ siempre funciona, es un promotor constitutivo, pero como tiene tR3 al lado, salta la polimerasa enseguida. Necesita a Q para saltar el tR3 y llegar a la lisis. En el caso de Cro, es una proteína represora de la transcripción. Reprime a PR y PL. En principio, Cro tiene baja afinidad por su diana (que reprime a los promotores) y por tanto para poder actuar debe estar a alta [ ]. Ello requiere tiempo, que es el tiempo que tarda en decidirse si hace lisis o lisogenia. Cuando la [ ] es alta, se une a los promotores y los bloquea, haciendo que se vaya hacia la lisis. Si PL y PR no paran de funcionar, llevan hacia la lisis (considerando que la célula se divide). Si PL y PR Genética Molecular. Carlos F.R. Página 14 son reprimidos por Cro, hará ciclo lítico si la bacteria se divide pero lo hará lisogénico si no se divide. Cro también se une a un promotor de CI para bloquearlo, ya que CI es lisogénico. Concretamente, Cro bloquea a PRM de CI a baja [ ] porque le tiene mucha afinidad. PRE PL PRM PR Con lisis (la célula se divide): se transcriben N y Cro; N permite que se transcriba todo OL y OR; se degrada CII/CIII; se bloquea CI por Cro rápidamente; se produce Q; se acumula Cro. Cuando hay Q, ya hay suficiente Cro y Cro bloquea a PR y PL (ahorro). Q hace su función: transcribir genes lisis. Cuando la célula se divide, tiene unas proteínas (HflA y HflB) que se cargan a CII/CIII. Con lisogenia (la célula no se divide): se transcriben N y Cro, N permite que se transcriba todo OL y OR, no se degrada CII/CIII, hay CI; se expresa el PantiQ, no hay Q, no hay Cro, se llegan a bloquear PR y PL por CI, se expresa Pint y se integra. En lisogenia la clave son CII/CIII, un heterodímero. Las dianas de CII/CIII son: - El promotor AntiQ (PantiQ) es estimulado por CII/CIII, en lisogenia. Se encuentra entre Q y qut. Está en dirección opuesta a PR. Produce un RNA que es complementario al 3’ del RNA que produce PR, sobretodo en la región de Q. Así los RNA son complementarios e hibridan, forman un dsRNA y no se puede traducir la Q y no hay lisis. Es parecido a la técnica del miRNA. - El promotor de la Integrasa se debe expresar en lisogenia. La integrasa y escicionasa se transcriben desde PL, y pero la célula se carga Int en lisis (por la región sib). En lisis, también se carga a CII/CIII pero por mecanismo distinto. - El promotor de CI: PRE. Se activa por CII/CIII y lleva a la lisogenia. En cuanto al gen CI, es un gen lisogénica. Tiene 2 promotores que apuntan en la misma dirección, uno de los cuales solapa parcialmente con Cro (para hacer lo parecido al miRNA que hibrida con Cro y no expresar Cro, ya que Cro Genética Molecular. Carlos F.R. Página 15 y CI tienen funciones respectivamente). opuestas; lítica y lisogénica La organización de los promotores PR y PL de λ es: PR: Tiene 3 operadores. OR3-OR2-OR1. PL: Tiene 3 operadores. OL1-OL2-OL3. Éstos operadores del promotor son dianas de las mismas proteínas pero con diferentes afinidades: - PR solapa con OR2 y OR1. - PL solapa con OL1 y OL2. - PRM solapa con OR3. PE PRM Cro PR CI es una proteína lisogénica. Se expresa gracias a CII/CIII desde PRE. Sus dianas son PR y PL (reprimirlos, igual que Cro pero a muy baja [ ] porque les tiene mucha afinidad) y estimular su propia síntesis desde PRM (después de que CII/CIII la haya estimulado para que empiece a concentrarse). Cro y CI tienen acciones opuestas sobre PRM pero iguales sobre PM y PR. CII/CIII:PantiQ LISOGENIA PRE Pint Cro: bloq. PR y PL a mucha [ ] bloq. PM a poca [ ] CI: bloq. PR y PL a poca [ ] bloq. PM a mucha [ ] estim. PM a poca [ ] LISIS LISOGENIA Molecularmente, la proteína CI presenta un dominio de unión al DNA hélix-loop-hélix básico, por lo cual, dimeriza. Genética Molecular. Carlos F.R. Página 16 También tiene dominios de unión a la RNA Polimerasa y a otras CI dimerizadas. En principio, es un homodímero pero según la situación puede llegar a ser un homotetrámero. Presenta diferentes afinidades por los diferentes operadores. Todo lo que hace en el OR también lo hace en el OL: inmediatamente, un dímero de CI se une a OR1 y recluta a otro dímero de CI que se une a OR2. Se bloquea el PR con éste homotetrámero. Así lleva a la lisogenia. A la vez, éste homotetrámero estimula a la RNA Polimerasa para que se una al PRM y regula así su propia síntesis. Cuando hay [ ] muy alta de CI, también se une a OR3 y bloquea su síntesis, quedando todo bloqueado. Por tanto, las afinidades de CI son OR1 = OR2 > OR3. En cuanto a la proteína Cro, es la primera en sintetizarse; tiene una elevada afinidad hacia OR3, se une a él y bloquea momentáneamente la síntesis de CI. Nos lleva hacia la lisis. A la larga, si llega a tener la [ ] suficientemente alta, se une a OR2 y OR1 bloqueando la transcripción desde PR (ahorradora). Por tanto, las afinidades de Cro hacia los operadores son OR1 = OR2 < OR3. Recordemos que el PRE, que es estimulado por CII/CIII, transcribe para CI (lisogénica), pero el RNA que se produce solapa parcialmente con Cro, hibridan y no hay Cro (lítica). La proteína CI a la larga lo llega a bloquear todo (PR, PL y PRM), formando loops en el DNA. Hay lisogenia. Si tiene poca [ ] estimula su propia síntesis. Dcha: CI con poca [ ]. Izq: CI con mucha [ ]. Nótense los homotetrámeros de CI. La proteína CII/CIII es clave en todo el proceso: si está, nos lleva a la lisogenia; y si no está, hacia la lisis. ¿Cómo puede estar o no estar? Cuando la bacteria se divide, expresa unas proteasas llamadas HflA y HflB, que degradan CII/CIII (lisogénicas). Así, el fago sabe cuándo se divide el huésped y va hacia la lisis porque no tiene CII/CIII. Si queremos la lisogenia, debemos tener CII/CIII, PL activo y estimular al Pint para hacer Integrasa. Pero PL se bloquea por CI, entonces, para hacer la Integrasa, el Pint Genética Molecular. Carlos F.R. Página 17 debe activarse por CII/CIII. EL Pint está dentro de Xis (escicionasa). Cuando el fago se ha integrado, sólo puede producir proteína CI. La proteína CI bloquea los PR y PL, no se transcribe nada (lisogenia avanzada); CI estimula su propia síntesis. Así, si una bacteria ya ha sido infectada previamente con un fago, no puede volver a ser infectada por otro fago lisogénico ya que la proteína CI que espresa cuando está infectada también se une a los PR y PL del nuevo fago que entra, impidiendo que exprese sus PR y PL desde el principio. Así, no hay más infección que la primera. Éste fenómeno se da gracias a la Región Inmune del fago λ, la cual es el gen CI con sus dos promotores. Sobre la secuencia sib del fago λ: Si hay mucha Xis y poca Int, se entrará en fase de lisis. Esto podrá estar ocasionado por niveles bajos de CII/CIII, con lo que la transcripción desde Pint será baja y la mayor parte de la transcripción se hará a partir del PL. En este caso deberíamos tener igual cantidad de Xis que de Int. Pero después de transcribir int, existe la secuencia sib, que también se transcribe. Esta secuencia formará un bucle que atraerá la RNAasa III, con lo que se degradará. Se degradará también en parte int, pero el daño al RNA no llegará a xis, con lo que se podrá transcribir la proteína Xis. Este tipo de regulación se llama retroregulación. No se trata de regulación a nivel de transcripción, sino que afecta a la estabilidad del transcrito. Y si hay lisogenia, pues como CII/CIII estimulan al Pint, se transcribe la integrasa hasta el tL’que hay detrás de ella, y no se forma ni bucle ni se degrada nada. Hay integrasa para consumar la lisogenia. Genética Molecular. Carlos F.R. Página 18 Sobre la inducción de λ, consiste en la desinserción del genoma de λ del genoma de E.coli. Se hace mediante luz UVA, produce daños en el DNA, cuando se repara por recombinación se genera ssDNA que es sustrato de RecA, RecA unido al DNA se mueve buscando a LexA. Cuando LexA es tocada por RecA, aparte de autoproteolizarse, busca a CI y la degrada. Así, si no hay CI, se llega a expresar Q y hay lisis. También se transcribe para la escisionasa (Xis) que desintegra (lo separa) el genoma de λ de el de E.coli. Una bacteria con λ integrado es lisogénica siempre excepto si se induce la escisión con luz UVA y se vuelve lítico. Genética Molecular. Carlos F.R. Página 19 TEMA 3: LA TRANSCRIPCIÓN EUCARIOTA I. En Eucariotas, la transcripción se da en el núcleo y la traducción en el citoplasma, es una separación espacial y también temporal. El mRNA Eucariota sufre una serie de modificaciones posttranscripcionales: capping en el 5’, adición de una cola de poliadenina (PolyA) en 3’, Splicing y recientemente se ha descubierto una nueva modificación, llamada edición del RNA. Gracias a éstos procesos, la vida media del mRNA Eucariota es mayor que la vida media del mRNA Procariota. En Eucariotas se realiza un Control + de la transcripción, se necesitan a los Factores de Transcripción (TF) para poder activar a la RNA Polimerasa. Los TF pueden ser: - Basales = Generales = GTF. Están por todo. Son imprescindibles. TF2D, etc … Se explican en éste tema. - Constitutivos = No Inducibles. Son accesorios, sólo están en algunos tejidos, pero siempre están activados. SP1, etc … Se explican en el Tema 5. - Inducibles. Son accesorios, sólo están en algunos tejidos. Necesitan activarse porque basalmente están inactivos. HR, etc … Se explican en el Tema 6. Además, aquí hay 3 RNA Polimerasas diferentes, cada una de las cuales transcribe para un grupo de genes concreto. El mRNA Eucariota es monocistrónico, es decir, contiene información para codificar una proteína (con un inicio de traducción AUG y un final STOP de traducción). Ésto es el pre-mRNA ó hnRNA ó mensajero primario. Una vez se le hace el Splicing (ver Tema 4), pierde los intrones y se vuelve un mRNA maduro ó mensajero secundario. Corresponde al ppal. tipo de tránscrito de los genes de tipo 2. Pero no todos los RNA son así, depende el tipo de gen. Tipos de RNA Polimerasas Eucariotas: - RNA Polimerasa I: Transcribe los genes de la clase I. Está en el nucléolo. Insensible a la α-amanitina. - RNA Polimerasa II: La principal. Transcribe los genes de la clase II. Está en el nucleoplasma. Sensible a la α-amanitina. - RNA Polimerasa III: Transcribe los genes de la clase III. Está en el nucleoplasma. La sensibilidad a la αamanitina es específica de cada especie. Genética Molecular. Carlos F.R. Página 20 - mtRNA Polimerasa: es amanitina. Similar a - cpRNA Polimerasa: es α-amanitina, similar mitocondrial. Resistente a la αla Procariota. cloroplastídica. Resistente a la a la Procariota. Todas las RNA polimerasas Eucariotas tienen estructura similar, tomaremos como ejemplo la de la RNA Polimerasa II. Tiene diversas subunidades, es una holoenzima como la RNA Polimerasa Procariota y las polimerasas de DNA. 1. Subunidad de unión al DNA: Tiene el dominio C’Terminal, que corresponde a la cola. Se llama CTD (Carboxi-Terminal Domain) y se activa cuando se fosforila. Recluta enzimas. El CTD tiene secuancia de AA repetida (YSPTSPS). Equivale a la β Procariota. 2. Núcleo catalítico. Equivale a la β’ Procariota. 3. Subunidades que equivalen a las 2 α Procariotas. Genes de Clase I. Son los que forman el RNA ribosómico (rRNA). No sufren capping ni poliadenilación, aunque son cortados (pero no es Splicing porque lo que se corta no son intrones). El ribosoma Eucariota tiene: - Subunidad Grande: 28s-rRNA, 5’8s-rRNA, 5s-rRNA (éste lo hace un gen de la clase III) y proteínas. - Subunidad Pequeña: 18s-rRNA y proteínas. Los genes de la clase I codifican para 28s-rRNA, 18s-rRNA y 5,8s-rRNA. Tienen promotores fuertes, están repetidos a lo largo del genoma, en “cluster”. El rRNA que genera los genes de la clase I es: Un cluster es una unidad de “x” genes que se van repitiendo en tándem (uno tras otro) por el genoma. Se encuentran en el brazo corto de los cromosomas, en el nucléolo. En éste caso corresponde a la unidad de transcripción del pre-rRNA. A partir de un promotor, se obtiene un RNA que genera varios productos (18S, 5.8S y 28S-RNA). NO se traduce. El final de la transcripción, de manera excepcional en Eucariotas, consiste en unas pequeñas secuencias (8) que agotan químicamente a la RNA Polimerasa I, que se encuentran una tras otra a 3’ del 3’ETS, dentro de la unidad de transcripción. La IGS es la InterGenic Sequence. Es lo que hay entre dos clusters. Se transcriben parcialmente porque tienen un promotor a 3’. Genética Molecular. Carlos F.R. Página 21 El ITS/ETS son los Internal Spaciator y External Spaciator. Están en el pre-rRNA. Se transcriben en forma de cromosoma plumoso/árbol de Miller. Parece un árbol de Navidad. En el proceso de cortar los ETS/ITS, que no tienen información génica, actúa una endorribonucleasa (snoRNA). No es Splicing porque los ETS/ITS no son intrones. Sucede: 1º: se corta a 5’ del 18S. 2º, se corta a 5’ del 5’8S (por dentro del 5’ITS) y a dos productos: 3º, se aparean por complementariedad el 5’8S y el 28S, quedando así: 4º, se corta el 3’ETS del 28S y el rabito 5’ITS de 5’8S, quedando el rRNA maduro. El promotor de los genes de clase I se encuentra dentro de la IGS. Tiene entre -150pb y -100pb el Up-stream Promotor Element (UCE ó UPE). Es accesorio. Entre -45 y +20pb hay el Core Promotor (CP). Es parcialmente interno, porque se transcribe 20pb. No tiene “tata box”. A éste promotor se unen los siguientes factores de Transcripción Generales/basales: - UBF1: Se une a UCE. Dobla el DNA haciendo un loop. Interactúa con… - SL1: se une al CP (según algunos, al UCE). Tiene 4 factores, uno de los cuales es la TBP (tata binding protein), una proteína posicionadora que interactúa con la RNA Polimerasa I. SL1 se une a su región en el DNA por dos factores que NO son TBP (porque no hay “tata box”). La TBP mira hacie fuera y posiciona a la RNA Polimerasa I. UCE C.P. Sobre la región IGS, tiene: - 2 promotores que transcriben para RNA abortivo, sin función. Tienen el objetico de traer a la RNA Polimerasa I para que se acerque al promotor del cluster. - Promotor del clúster: tiene lo que hemos visto arriba. Genética Molecular. Carlos F.R. Página 22 La región IGS se transcribe parcialmente, ya que el promotor de los genes de clase I es parcialmente interno. Genes de Clase II. Son los que transcriben para el mRNA y todos los snRNP (excepto snRNP-U6). Su promotor presenta variabilidad de secuencias. - Promotor con “tata box” mRNA - Promotor sin “tata box” (genes “tata-less”) snRNP y mRNA de genes “house- keeping”, vitales en el metabolismo celular. Dentro del promotor también hay las secuencias InR (Iniciation Region), con las cajas CAT (en el 50-60% de los casos, el 1er nt transcrito es una A). La “tata box”, si está, tiene función posicionadora. Es un elemento “upstream”. Los que no la tienen, la transcripción comienza dentro del leader (5’UTR) gracias a secuencias llamadas DPE (Downstream Promotor Element, promotor interno). Pero lo más frecuente es que el promotor tenga la “tata box” en upstream y la secuencia InR (secuencia específica = caja). Si sólo tiene “tata box” e InR, es el promotor basal. Pero suele tener secuencias diana de múltiples factores de transcripción (caja BREdiana de TF2B, etc), elementos downstream, enhancers (¡no forman parte del promotor!)… InR La caja InR es reconocida por el GTF llamado TF2D, que contiene entre otras, a la TBP (tata Binding Protein). Aquí, la TBP se une a la “tata box”, produciendo un efecto posicionador de la RNA Polimerasa II. Si el promotor del gen de tipo II no tenía “tata box”, entonces el TF2D también se une a InR, pero NO usa la TBP, sino a las otras proteínas, las TAF (TBP aditional factor), que se unen a las cajas DPE en downsteam. Factores implicados en la transcripción de los genes de tipo II (son los GTF): - TF2D: Contiene a TBP (se une a “tata box”) y TAF (se une a DPE). Usa a una de las 2. Genética Molecular. Carlos F.R. Página 23 - TF2A: se une a TF2D estabilizándolo. Si es un gen que transcribe para mRNA, el TF2A hace saltar a TAF porque entorpece a TBP - TF2B: No está siempre (es constitutivo), se une a caja BRE si está. Tiene efecto de helicasa y marca como molde a la cadena de ssDNA que será transcrita. - TF2F: Formado por 2 subunidades, a saber: Rap54 (helicasa que puede ayudar a TF2B) y Rap38(captura a la RNA Polimerasa II). Hasta aquí se ha formado el complejo de iniciación de la transcripción: todos los TF que se unen al DNA antes de que llegue la RNA Polimerasa II (TF2D, A, B, F). La cola CTD de la RNA Polimerasa II reconoce a TF2D. - TF2E: Se une a la RNA Polimerasa II y recluta a … - TF2H: Tiene múltiples efectos; es quinasa que fosforila a la cola CTD, es ATP’asa que hace saltar a todos los TF y es helicasa. También, TF2H contiene a XPB y XPD (helicasas) para participar en la reparación por NER en Eucariotas. La RNA Polimerasa II está fosforilada y libre, empieza a transcribir. Hay TF no basales/accesorios (los constitutivos e inducibles) que se unen a cajas accesorias en el promotor, o a elementos muy lejanos al promotor que también afectan a la tasa de transcripción de un gen (los enhancers ó silencers). Éstos TF no basales/accesorios tienen un dominio de interacción con la secuencia del DNA que reconocen y un dominio de interacción con el complejo iniciador de la transcripción ó con el complejo mediador (proteínas que actúan entre el TF y el complejo inic. de la transcr.). También pueden interaccionar con proteínas que acetilan histonas (HAT) ó con proteínas de remodelan la cromatina. Pueden suceder las 3 cosas a la vez (lo veremos con mas detalle más adelante). Hacen loops en el DNA. Los genes de clase II sufren una serie de modificaciones post-transcripcionales (nunca en Procariotas): Genética Molecular. Carlos F.R. Página 24 1) Capping: consiste en añadir un nt nuevo al 5’ del RNA que antes no estaba, llamado CAP (es una 7-metil-guanina). Se consigue mediante un enlace 5’5’ trifosfato. Los enzimas que actúan son reclutados por la cola CTD. Éstos enzimas son una fosfatasa que quita el fosfato en 5’ del RNA, luego una transferasa que une una Guanina con el enlace 5’5’ trifosfato y una metilasa que añade el metil a la guanina. A veces se metilan los 3 siguientes nt del RNA. Ésto sucede en el núcleo. El CAP tiene función de atraer al ribosoma y proteger el mRNA de las exorribonucleasas que actúan en 5’. 2) Poliadenilación: consiste en añadir una serie de adeninas, aproximadamente 200, en el extremo 3’ del mRNA. Los enzimas necesarios para ello también son reclutados por la cola CTD. Todos los señales necesarios para la poliadenilación vienen después del codón de STOP traducción. En orden, están(en el RNA): …ÚLTIMO EXÓN CON STOP-(…)-AAUAAA-(20-30nt)-CA-(10nt)-GUbox-(…)-3’. La caja AAUAAA es reconocida por CPSF (Cleavage & Polyadenilation Specific factor). La caja GU es reconocida por CStF (Cleavage & Stimulation Factor). Se unen las dos. No cortan. Reclutan a CF1 y CF2 (Cleavage Factor 1 & 2) que corta al RNA en la caja CA. Se recluta a PAP (PolyAdenilation polymerase) que añade los 200 nt aproximadamente de Adenina en el 3’ del corte. Se recluta a PAB II (PolyA Bonding II) que se une a la cola de PoliA que se está elongando y hace saltar a PAP, por lo cual, es PABII que determina la longitud de la cola de PoliA. Debido a que se corta para poner la cola de PoliA antes de que pare la transcripción, hay un pequeño trozo de mRNA que queda en la polimerasa. Función: ¿terminar de transcribir? no se sabe. Si se sabe que la función de la cola de PoliAdenina que se añade es atraer al Splicesome. 3) Splicing: Ver el Tema 4. 4) Edición del RNA: Ver el Tema 4. Genes de Clase III. Transcriben para el tRNA, 5S-rRNA, snRNP-U6, snoRNA, scRNA, 7SL-RNA (Alu)… Son RNA no traducibles. No sufren ningún Genética Molecular. Carlos F.R. Página 25 procesamiento, excepto el tRNA que sufre “modificaciones” y un Splicing diferente al de los RNA de genes de tipo II. Tienen señales de terminación de la transcripción que son ricas en G-C y en secuencias con muchas T. Tienen un promotor con 2 regiones: una externa y una interna (=ICR, Internal Control Region), con dos subregiones. La mayoría no tienen “tata box”. Los casos más típicos son (ver dibujo en la siguiente página): - El 5S-RNA: Secuencias muy conservadas. Tiene 2 cajas que constituyen la región interna (=ICR) del promotor: la caja A y la caja C. Están a 3’ del inicio de transcripción, a +55 pb. La región externa la constituye la secuencia de unión de TF3B (es TF3B quien tiene la TBP. A la caja A se une TF3A, recluta a TF3C que se une a la caja C (son GTF). TF3C hace saltar a TF3A y avanza en dirección 5’ (al inicio de la transcripción), seriándose (=polimerizándose sobre el DNA, muchos TF3C uno tras otro en dccion 5’). Cuando llega a -30pb aprox, se encuentra con la caja de unión de TF3B, lo recluta y puede iniciarse la transcripción (la TBP hace posicionar a la RNA Polimerasa III, aunque no haya “tata box”). El inicio de la transcripción, por tanto, está entre +55nt y +80 antes de la caja A. - El tRNA: La ICR la constituyen las cajas A y B. Ambas cajas son reconocidas por TF3C. No interviene TF3A. va seriándose en 5’ hasta llegar a la caja externa de unión a TF3B (el que tiene TBP), éste se une y recluta a la RNA Polierasa III. Las distancias son parecidas. - snRNP-U6, otros RNA pequeños: es parecido a los genes de clase II porque hay un promotor que tiene la “tata box”. Pero aquí quien tiene TBP es TF3B. Genética Molecular. Carlos F.R. Página 26 RESUMEN: LA TBP… - En genes de clase I, está en SL1. Atrae, posiciona y toca a la RNA polimerasa I. No hay “tata box”. - En los genes de clase II, que tienen “tata box”, TBP está en TF2D pero toca a la caja tata. Si no hay “tata box”, la TBP tiene poca importancia porque la TAF se une a DPE y hace la función de posicionar a la RNA polimerasa II. - En los genes de clase III, que no tienen “tata box”, la TBP forma parte del TF3B. Tiene efecto posicionador de la RNA polimerasa III. Genética Molecular. Carlos F.R. Página 27 TEMA 4: LA TRANSCRIPCIÓN EUCARIOTA II. Estudiaremos el splicing en detalle. El splicing es el proceso por el cual se cortan todos los intrones de un premRNA y se vuelve mRNA maduro. Sucede en el núcleo. Gracias a la cola de poliadeninas, se puede dar. Si se deja algún intrón en el RNA ó se corta algún exón (o ambos) se trata de splicing alternativo o diferencial. Existen varios grupos de intrones que sufren splicing: el grupo principal (mRNA) el tRNA, el grupo I, el grupo II y el grupo AU-AC. Se sospecha que puede haber más. Se pueden clasificar en autocatalíticos (ribozimas) o no. Los intrones no-autocatalíticos. Son el tRNA, el mRNA y los del grupo AUAC. autocatalíticos porque requieren de proteínas o accesorias que catalizan la reacción. No son enzimas 1- El tRNA: viene codificado por genes de clase III. Se considera que los tRNA inmaduros tienen un único intrón (en levaduras, aunque hay algunos que no tienen intrón). Los enzimas que actúan son los siguientes: endorribonucleasa que reconoce la estructura con hairpins y secuencias palindrómicas del tRNA inmaduro, corta el intrón y deja extremos 5’-OH y 2’-3’ P, no aptos para ligar. A continuación actúa una fosfodiesterasa que deja 5’OH y 2’P3’OH. Después actúa una quinasa que fosforila dejando un 5’P y finalmente una ligasa que une el 5’P con el 3’OH. 2- El mRNA: son la mayoría de los intrones. No depende de estructuras como el tRNA, sinó de secuencias específicas conservadas el 100% de las veces dentro del intrón (GU-AG). Se pasa de un pre-mRNA inmaduro (hnRNA ó mensajero 1ª) a un mRNA maduro ó secundario. El splicing de la mayoría de los intrones sigue la regla del “GU-AG” (porque el GU-AG está 100% conservado). Para eliminar los intrones se dan 2 transesterificaciones seguidas: son enlaces entre el 5’P de un nt y el 3’OH del nt no contiguo (lejano). La 1ª se da debido a que la A del Genética Molecular. Carlos F.R. Página 28 branchpoint tiene un 2’OH que ataca nucleofílicamente al 5’P de la G del 5’ del intrón. Éste enlace 5’2’ forma un “lairat” o lazo,, 1 lairat = 1 intrón. La 2ª transesterificación se produce cuando el 3’OH de la G del exón que ha quedado libre ataca nucleofílicamente al 5’P de la G del siguiente exón formando un enlace normal en 5’3’. El lairat queda separado, se linealiza y es degradado por nucleasas. Éstas dos transesterificaciones las realizan unas proteínas llamadas snRNP. Las snRNP constituyen el “splicesome” (pseudo-orgánulo que cataliza el splicing). Una snRNP= proteinas + snRNA. Las snRNP vienen de los genes de tipo II, por tanto tienen CAP en el extremo 5’. Excepto snRNP-U6 que viene de un gen del tipo III y no tiene CAP. No hay cola de poliadenina. Estructura de la snRNP: proteina proteina Modelo válido para snRNP-U2 y snRNP-U5. snRNP-U1, Modelo válido para la snRNP(U4-U6). Basalmente es así. snRNA de U4 y de U6, unidos, pero comparten proteína. Los snRNA de las snRNP son complementarios a regiones específicas del intrón del RNA. Considerar siempre la orientación de las cadenas del RNA (debajo de un 5’ siempre va un 3’, etc…). Para referirnos a las snRNP, usaremos la terminología “Ux” para abreviar, donde x es el número de la snRNP. Hay que saber qué hace cada Ux, si se une por complementariedad de bases en el RNA ó por afinidad de las proteínas, o por unión de proteína con RNA, en qué momento del splicing entra y dónde entra. Mecanismo de splicing del mRNA: - U1 se une al 5’GU del intrón (unión RNA-RNA). - U2AF35 se une al 3’AG del intrón. U2AF65 se une al (Py)n (uniones proteína-RNA). BBP (Branchpoint Binding Protein = SF1) se une al Branchpoint (unión proteínaRNA). Genética Molecular. Carlos F.R. Página 29 - U2 se une al Branchpoint haciendo saltar a BBP (=SF1). Es una unión RNA-RNA. - Llega el complejo (U4-U6)+U5. Unidas por afinidad de proteínas. U5 se une al exón en 5’, dando estabilidad al complejo; hace saltar a las U2AF; unión proteínaRNA. U4-U6 basalmente unidas por RNA-RNA, U6 se une a U2 (RNA-RNA) y salta U4 (mantenía estable a U6). U1 se acerca a U2-U6 sin llegar a tocarlas, pero formando una pequeña protuberancia en el intrón que acerca el 5’GU al branchpoint, lo que permitirá que se dé la 1ª transesterificación. - Se ha formado el núcleo catalítico del splicesome (U2+U6). Se da la 1ª transesterificación. - Como consecuencia de ello, U1 llega a tocar a U2 (proteína-proteína) y U1 salta. Su lugar (5’GU) queda ocupado por U6 (RNA-RNA), unida así al 5’GU. - Se da la 2ª transesterificación, juntándose los dos exones, salta el lairat con U2 y U6. Salta U5. Se separan los U2 y U6 del lairat y éste es linealizado y degradado en el núcleo. Así, los intrones del tRNA y del mRNA no son autocatalíticos y la mayoría de ellos siguen la regla del GU-AG. 3- Grupo AU-AC de Intrones: También necesitan a Splicesome, porque no son autocatalíticos. Participan otras snRNP. Al 5’AU se une la U11 y al 3’AC y al Branchpoint se une la U12. El resto del proceso es igual. Sólo coinciden en la U5. Los Intrones autocatalíticos. Son aquellos intrones que no precisan de snRNP (no requieren splicesome) para eliminarse, sino que ellos solos pueden hacerlo. - Grupo I de Intrones: son ribozimas autocatalíticos. No interviene la A del Branchpoint, sinó un nt libre que suele Genética Molecular. Carlos F.R. Página 30 ser una G que ataca el enlace entre el Exón y el Intrón 1. Se da en los intrones de orgánulos. Grupo II de Intrones: también son ribozimas autocatalíticos. La A del branchpoint hace toda la primera transesterificación, el resto lo hace el propio intrón. También se da en los intrones de los orgánulos. Recientemente se han descubierto las proteínas SR (ricas en Serina-Arginina, a veces llamadas SF2). Se unen al dominio de unión a SR en el pre-mRNA. Éstos dominios pueden ser zonas de activación ESE (Exon Splicing Enhancer) o ISE (Intron Splicing Enhancer), o zonas de silenciamiento de splicing ESS (Exon Splicing Silencer) o ISS (Intron Splicing Silencer). Los ESS, ESE, ISS, ISE están sobre un exón o un intrón respectivamente, y si son los activadores, estimulan el splicing en lugares crípticos (débiles, basalmente ocultos, no se usan en principio) o lo bloquean en los lugares normales si son silenciadores. Los dominios que activan el Splicing, ISE y ESE, se unen a SR y atraen a ésa región a U1 y a U2AF35, estabilizándolas . De manera opuesta, ISS y ESS atraen a sus SR y desestabilizan a las snRNP o compiten con ellas por su afinidad al RNA, todo para silenciar el splicing y que no se dé en las regiones adyacentes (las que se dá normalmente). Así, gracias a las proteínas SR que se expresan en tejidos específicos, se da el Splicing Alternativo, en el cual se cortan algunos exones y/o algunos intrones se dejan. A partir de un mismo pre-mRNA se pueden obtener diferentes mRNA maduros. Se cree que mas de la mitad de nuestros genes hacen splicing alternativo. Consideremos un gen que produce el siguiente pre-mRNA: Se le pueden dar diferentes tipos de splicing alternativo al mismo pre-mRNA: - splicing normal: deja los exones 1-2-3 unidos, sin intrones. - exon skipped: se unen los exones 1-3 y se pierde el 2 y los intrones. - exon extension: se dejan los exones unidos y un poco de algún intrón. Si son 3 bases (o múltiplo de 3), no pasa nada. Si no, hay corrimiento de la pauta de lectura y dependiendo de lo avanzado en la traducción que esté el intrón añadido, puede hacer más o menos efecto. - retención de intrones si hay ISS. - coexistencia de 2 transctitos maduros a la vez (raro en una misma célula). Genética Molecular. Carlos F.R. Página 31 Es frecuente que dentro de un intrón haya un final de traducción de una proteína, y que debido a secuencias flanqueantes dentro del intrón (ISS), no se corte el intrón y al traducirse, produzca una proteína mas corta porque al leerse el RNA, se topa con el STOP del intrón que normalmente no está. Puede ser también que las ISS hagan que el Splicesome se vaya a cortar a un lugar críptico, que se usa porque los otros están bloqueados. O al revés, que haya un final de la traducción en un exón y que debido a secuencias ESE se activen lugares crípticos de splicing que atraen hacia sí el Splicesome y se corte el exón, perdiéndose el STOP prematuro y produciéndose proteína más larga. Depende de qué proteínas SR exprese el tejido y en qué momentoSplicing Alternativo La determinación del sexo en Drosophila melanogaster: Es un caso típico de splicing alternativo. En primera instancia, la determinación de sexo es cromosómica; ya que si el “nº de cromosomas X/nº de juegos de autosomas” es mayor a 1, sale hembra, mientras que si es menor a 1 sale macho. Esto se debe a que en el cromosoma X hay los genes que codifican para unas SR (=SF2) que hacen el splicing alternativo, y si es hembra tiene 2 cromosomas X: mucha [ ] de SR (o almenos más que el macho). Hay 4 genes implicados en determinar el sexo, que son SexLethal (SL ó SXL), Transformer (TRA), Transformer2 (TRA2) y DoubleSeX (DBX). Son miembros de la familia de las SR (excepto DBX, que es un TF). Interaccionan con ellas. - Basalmente, se transcribe el gen de SXL en machos y en hembras. Si es hembra, hay las SR y se hace splicing alternativo.Se hace Exon skipped y se produce una proteína larga, mientras que en los machos no se hace el splicing alternativo y en el exón que la hembra eliminaba, hay un STOP de la traducción prematuro, por lo que produce una SL demasiado corta. Genética Molecular. Carlos F.R. Página 32 - La proteína SL es un represor de splicing normal y activadora del Splicing alternativo. Actúa sobre el mRNA de la proteína TRA. Se une a secuencias (ISS) en el 3’ del intrón que impiden que entre la maquinaria normal de Splicing (impide que U2AF65 entre a unirse a (Py)n), así que la maquinaria de splicing se va a cortar a un lugar críptico de splicing que está dentro del exón, produciendo que se pierda un trozo del exón que justamente contenía un STOP de la traducción prematuro (HEMBRAS). Los machos al no tener SL funcional, hacen splicing normal y la traducción se para en el STOP prematuro del exón, ese trozo de exón que se perdía en la hembra. Se produce en el macho proteína TRA demasiado corta. - La proteína TRA hace lo mismo que TRA2, funcionan igual. Ambas son estimuladoras del splicing normal, sobre el mRNA de DSX. TRA y TRA2 son SR. Actúan uniéndose a un exón en la hembra (ESE), se solvatan (envuelven) de todas las SR y evitan que se corte el exón donde está TRA2. Así, se estimula que se corte el exón posterior porque se activa el lugar de splicing críptico. En machos se realiza un splicing que elimina los intrones y el exón en el cual se une TRA2 en las hembras, dejando intacto el exón posterior. Genética Molecular. Carlos F.R. Página 33 - Finalmente, en ambos casos se genera la proteína DSX, que es un factor de transcripción, pero en machos es más corta (estimula a los genes de desarrollar macho y bloquea a los de desarrollar hembra); y en hembras es más larga (estimula los genes de desarrollar hembra y bloquea a los genes de desarrollar macho). La Edición del RNA: Mecanismo recientemente descubierto, consiste en modificar el mRNA maduro para obtener proteínas diferentes en tejidos específicos, ya que en cada tejido se expresan los enzimas que lo modifican. Es el cuarto mecanismo de modificación del RNA. Ejemplo: el caso de la ApoB. En el intestino, el pre-mRNA de la ApoB hace su splicing y se eliminan sus intrones. En el mRNA hay el codón CAAglutamina, pero se expresa independientemente una enzima “desaminasa”, que edita el mRNA, cambiando una “C” por una “U”: se produce un codón STOP prematuro y se genera una proteína corta. Mientras que en el hígado, no se expresa la enzima “desaminasa” y cuando el mRNA de la ApoB aparece, se traduce normalmente sin que haya ningún STOP prematuro, dando lugar a una proteína larga. Genética Molecular. Carlos F.R. Página 34 TEMA 5: LA TRANSCRIPCIÓN EUCARIOTA III. Para estudiar la regulación en Eucariotas, se usa al organismo modelo S.cerevisiae. Es un Eucariota muy simple, unicelular. Tiene forma esférica para incrementar la superficie de absorción de nutrientes, estímulos… En él, los genes GAL son modelo para explicar la regulación de la expresión génica en Eucariotas. Están implicados en el metabolismo de la galactosa, codifican para permeasas, quinasas, etc. El objetivo de la ruta metabólica es convertir la galactosa en glucosa-1-P. No son operones porque un mRNA codifica para una única proteína. Los promotores tienen secuencias similares, en todos hay “tata box”. -Las secuencias UAS (Upstream Activation Secuence) no son enhancers. Siempre están antes de la “tata box” y de MIG. Siempre hay almenos 1. Son secuencias palindrómicas (se leen igual en los dos sentidos). Son la diana de GAL4. -GAL4 es un activador de la transcripción. Es un homodímero. Por un dominio, se une al DNA en UAS y por el otro dominio toca a la RNA Polimerasa II y al complejo de inicio de la transcripción. Éste dominio de unión a la RNA Polimerasa II solapa parcialmente con un dominio de unión a GAL80 (represor). De manera basal, GAL4 está unida al DNA en UAS y a GAL80. -GAL80 es el represor de GAL4. Basalmente está unida a él, reprimiendo. Gal4 La galactosa se une a GAL80 haciendo que se separe de GAL4 y permitiendo que GAL4 active la transcripción porque tiene el dominio de unión al complejo de inicio de la transcripción libre,, la galactosa activa la transcripción. Genética Molecular. Carlos F.R. Página 35 Si hay glucosa, quiero bloquear la transcripción, aunque de manera basal ya lo esté. -La proteína MIG1, con glucosa (= poco AMPcno se activan ciertas quinasas) no está fosforilada y se une a la proteína TUP1 formando un heterodímero. Juntas se unen a la secuencia Mig1 en el DNA bloqueando la transcripción. Si no hay glucosa (= mucho AMPcse activan ciertas quinasas) se fosforila MIG1, no puede unirse a TUP1 y no se une al DNA, por lo tanto no se reprime y hay transcripción. -La secuencia Mig1 en el DNA está entre la “tata box” y la secuencia UAS. Es la diana del heterodímero MIG1+TUP1. Para transcribir: poca glucosa y mucha galactosa se activa GAL4 y se bloquea MIG1,, para no transcribir: mucha glucosa y mucha galactosa se activa GAL4 pero MIG está entorpeciendo la activación,, mucha glucosa y poca galacosa: GAL4 está bloqueada y MIG1 está activada entorpeciendo la transcripción,, poca glucosa y poca galactosa: GAL4 está bloqueada y no activa la transcripción aunque MIG1 no esté activada. Se demostró que en GAL4 el dominio de unión al DNA y el dominio de activación de la transcripción son partes diferentes de la misma proteína, mediante el uso de proteínas recombinantes que tenían el dominio de unión al DNA que tiene la proteína LexA. A continuación se mezclaron in-vitro con sus secuencias diana y se observó que efectivamente, cada dominio se une a regiones diferentes del DNA,y el dominio de activación de la transcripción, se une a la RNA Polimerasa II activándola sólo si su otro dominio está unido a UAS. Así nació la Ingeniería Genética. En Eucariotas, los promotores tienen (la mayoría) una “tata box” y la caja InR. Pero aparte, pueden tener muchas secuencias(cajas) diana de varios factores de transcripción no basales. Así, los Eucariotas presentan promotores modulares, es decir, que tienen muchas cajas de unión a TF no basales. Sirve de ejemplo ilustrativo el gen de las metalotioneias (proteínas que capturan metales), que contiene algunas de las cajas más frecuentes: Genética Molecular. Carlos F.R. Página 36 Recordemos la clasificación de los Factores de Transcripción (TF) en Eucariotas: - GTF: generales/basales. Están por todo, activos. Ej: TF2Dtata box. - TF no basal constitutivo: Sólo en algunos tejidos, ativos. Ej: SP1caja GC. - TF no basales inducibles: Sólo en algunos tejidos, basalmente inactivos. Ej: AP2, HR… Los no basales tienen dominio de unión al DNA y dominio de unión al GTF o al complejo mediador (formado por otros TF no basales, entre el TF unido al DNA y el complejo de inicio de la transcripción). El DNA se dobla para poder hacer todos éstos contactos. Los enhancers son exclusivos de Eucariotas. Son secuencias que no forman parte del promotor, se encuentran alejadas de él en upstream o downstream, y tienen la función de unirse a TF no basales a fin de incrementar la tasa de transcripción de un gen estimulando a la RNA Polimerasa II. El TF no basal se une por un dominio al enhancer y por otro al GTF (raro) o al complejo mediador, curvando el DNA. Los silencers funcionan igual pero con función opuesta, es decir, reducir la tasa de transcripción de un gen. Los insulators son secuencias fuera del promotor, diana de proteínas que se unen y bloquean la acción del enhancer fuera de su dominio de transcripción; es decir: los insulators separan dominios de transcripción (que contiene el/los enhancers y el gen). Todo lo que hay entre dos insulators puede interaccionar. Actúan impidiendo que un enhancer específico de un gen, active a otro gen que no le corresponde, ya que al estar tan lejos, podrían interaccionar. Así se consigue que el enhancer active únicamente al promotor de su gen diana. Los TF no basales se clasifican según la estructura de sus dos dominios, recordemos: un dominio de unión al DNA y un dominio activador de la transcripción (estimula al complejo iniciador de la transcripción). Entre ambos dominios puede existir un dominio conector (o de dimerización si es el caso). Genética Molecular. Carlos F.R. Página 37 TF según el dominio de unión al DNA: - Dedos de Zinc: Son proteínas en forma de dedo, las cuales tienen un átomo de Zn en el centro. La estructura con forma de dedo se repite 2 o 3 veces para formar UN factor, que NUNCA dimeriza. Ej: TF3A, GAL4, SP1 (se une a la caja GC)… Ésto es el dominio de unión al DNA de SP1, un factor no basal constitutivo. No dimeriza nunca. - Receptor de Hormonas Esteroideas: Es un TF inducible. Tiene un dominio de unión al DNA con 2 dedos de Zn; por uno se une al DNA y por el otro dimerizan. SIEMPRE dimerizan. La hormona esteroide (glucocorticoide ó estrógeno) se une al Receptor de Hormona, haciendo que se active y dimerice. Así se une a la caja diana en el DNA: la caja GRE ó la caja ERE (sólo 2 AA hacen que reconozca a una o a la otra). Se explica con más detalle en el Tema 6. - Hélice-vuelta-hélice: Son 3 hélices α que dan dos vueltas. Es el dominio de unión al DNA llamado “homeodominio” presente en los TF de los genes Hox (implicados en el desarrollo). NUNCA dimeriza. Presente también en la proteína Cro, CI del fago λ. Genética Molecular. Carlos F.R. Página 38 - Hélice-bucle-hélice: Tiene muchos AA básicos. Para que el dominio de unión al DNA funcione, ha de dimerizar por el dominio de dimerización. Por tanto, el dominio de unión al DNA será homodimérico. Son moléculas anfipáticas, SIEMPRE dimerizan, tienen una secuencia diana invertida y sin el dominio de unión al DNA pueden dimerizar pero no unirse. Ejemplo: Myo-D, E12, da/ACS… - Cremalleras de Leucina: Muy similares a los anteriores, SIEMPRE dimerizan y són básicas. La diferencia es que en el dominio de dimerización, cada monómero tiene una única hélice α anfipática con leucinas. Las leucinas están mirando hacia dentro, formando la región hidrofóbica, hacia el exterior está la región hidrofílica y el dominio de unión al DNA tiene los AA básicos. Lo tienen, por ejemplo, CEBP(=EBP) que se une a la caja CAAT, AP1 (=Jun+Fos)… OJO: la TBP no tiene ninguno de éstos dominios, es una estructura rica en láminas β la que se une a la “tata box”. TF según el dominio activador de la transcripción: Está poco estudiado porque hay poco consenso en cuanto a composición y funcionamiento. Éste dominio interactúa con Genética Molecular. Carlos F.R. Página 39 el complejo de iniciación de la transcripción si son TF fuertes ó interactúa con un TF mediador (también es un no basal) si son débiles. Es el mismo efecto. Tipos de dominios: - Acídicos: tienen carga negativa. Con hélice α. Ejemplo: GAL4. - Basídico: mucha cantidad de glutamina, con carga positiva. No se conoce como van (?). Ej: SP1. - Prolínicos: Mucha prolina, forma ángulos en la proteína. Tampoco se conoce como van (?). Ej: CTF (=NF1) que se une a la caja CAAT. En Eucariotas, en contra de toda regla, también se han encontrado mecanismos de represión de la transcripción. Tipos: - Competición por dominio: hay un dominio de unión a proteína activadora y un dominio de unión a proteína represora. Solapan parcialmente. Lo que decide quien gana es la [ ] de cada proteína, o quien llega priemro. - Inhibición: el dominio activador y el dominio represor están separados, pero cuando la proteína represora se une al dominio represor, tapa físicamente el acceso de la proteína activadora al dominio activador. - Represión directa: La proteína represora unida al dominio represor, interactúa de manera directa o indirecta (a través de otros factores) con la RNA Polimerasa para reducir la tasa de transcripción. Ejemplo: la proteína CDP se une a caja CAAT y bloquea la unión de otros activadores (CFT-NF1, CEBP…). Si CDP se une a OCT1, no hay trancripción porque no está CTFNF1,, mientras que si CTF-NF1 se une a OCT1, hay transcripción porque no está el represor CDP (considerar que OCT1 se une a la caja OCT, que está al lado de la caja CAAT y estimula la transcripción). - Las Histonas: pueden modificar la entrada de la Polimerasa si se altera su estado. Pueden estar abiertas (mucha transcripción) o cerradas (poca transcripción). Ésto se regula por los TF no basales que se unen al DNA y reclutan enzimas que acetilan y desacetilan histonas: Un TF activador se une a secuancia activadora, recluta a HAT (Histone Acetil Transferase), que acetila las histonas, se abren y hay mas transcripción. Por el contrario, un TF represor se une a secuencia represora, recluta a HDAC (Histone DeAcetilation Complex), que desacetila las histonas, se cierran y hay menos transcripción. Genética Molecular. Carlos F.R. Página 40 Es muy frecuente que los dominios en el DNA que son diana de TF que reclutan a HAT o a HDAC sean enhancers o silencers. También se pueden reclutar a proteínas que remodelan la cromatina (la posición de los nucleosomas), o que metilan las bases del DNA para silenciarlas. Y todo se puede dar a la vez. Algunos elementos de los promotores Eucariotas (repaso): No se conocen todos. Consideramos que son genes de tipo II. Como que hay miles de genes, estas cajas pueden solapar en algunos genes, es decir, que en el gen A a -20 haya caja GC y en el gen B a -20 haya la caja OCT. Pero como cada tejido espresa sus TF no basales concretos, sólo se expresa un gen concreto. Genética Molecular. Carlos F.R. Página 41 EXTRA TEMA 5: TÉCNICAS REGULACIÓN GÉNICA. DE ESTUDIO DE LOS ELEMENTOS DE Son válidas tanto para Procariotas como para Eucariotas. 1. Retardo en gel: Para determinar promotores. Estudia si en una región se unen proteínas o no. Tomo una secuencia conocida de DNA sospechosa de ser diana de TF, marcada en 5’ con flourescencia o radioactividad. Se mezcla el extracto de proteínas sospechosas de unirse (se mira en bases de datos para tener una idea de cuales) y se hace una electroforesis en gel de poliacrilamida. Los carriles que pongo han de ser (no en éste orden): - Secuencia de DNA para estudiar, sola (control -) - Secuencia de DNA para estudiar + DNA igual pero no marcado en 5’ es el competidor específico + proteína sospechosa de unirse. Hago varios carriles con ésta mezcla, poniendo en cada uno concentración diferente de proteína. - Secuencia de DNA para estudiar + DNA diferente pero no marcado en 5’ es el competidor inespecífico + proteína sospechosa de unirse. Hago varios carriles en ésta mezcla, poniendo en cada uno concentración diferente de proteína. DNA CON PROTEINA UNIDAPESA MÁSAVANZA MENOSMOVIMINETO RETARDADO. En los carriles de competidor específico se va atenuando la banda en la región de proteína + DNA porque la proteína se va uniendo tanto al DNA marcado como al no marcado, que tienen la misma secuencia. Pero como cada vez hay más proteína, cada vez se une más tanto al marcaco como al no marcado y por eso no veo apenas la banda, porque allí hay DNA no marcado unido a la proteína. En los carriles de competidor no específico, la banda tiene siempre la misma intensidad, porque la proteína siempre se une a la secuencia marcada y no al competidor inespecífico. Ésto se debe a que la proteína es específica de mi secuencia. Genética Molecular. Carlos F.R. Página 42 Si en los carriles con la proteínas pongo un anticuerpo marcado contra la proteína, sería confirmatoriosuperretardo en gel. 2. DNasaI footprinting: Sirve para saber a qué secuencia se une la proteína sospechosa. Si la secuencia de DNA es diana de la proteína, entonces al unirse, la proteína “tapa” las bases a las que se une, no son bases degradables, dejando “destapadas” el resto de bases a las que no se une, las cuales sí que son degradables. Se pone a digerir con la DNasaI (sólo degrada DNA libre, no la proteína ni el DNA que está tapado por la proteína). Se hace una electroforesis en gel de agarosa. En los carriles hay que poner: - DNA conocido digerido con DNasaI, que deje bandas a una altura conocida, nos servirán para comparar con el carril con la muestra a estudiar. Es el control. - DNA a estudiar + proteína + DNasaI. Hay que considerar que las digestiones nunca son 100% eficientes. Se hacen diferentes bandas. Degrada en orden los nt. La región que no tenga banda es la región unida a la proteína. Es muy preciso. 3. Gene Reporter: Sirve para determinar si una proteína que yo sospecho que activa o inhibe la transcripción de un gen determinado, se une a alguna secuencia reguladora de la expresión de ese gen, ya sea un enhancer o un silencer. Debo tomar mi gen (enhancers y/o silencers + promotor + secuencia codificante), elimino la secuencia codificante y la sustituyo por la de un gen reportero, como por ejemplo la luciferasa o CAT (son unos genes cuyo producto es detectable cuanti y cualitativamente, es decir, podemos detectar que se expresa mucho o poco, o que no se expresa). Genética Molecular. Carlos F.R. Página 43 También puedo utilizar unos vectores ya preparados con el gen de la luciferasa (o de CAT) y que debo insertar, mediante enzimas de restricción, la región reguladora a 5’. Ahora hay que ir haciendo diferentes experimentos en los que se ponen la construcción de “región reguladora + luciferasa + proteína sospechosa” de modificar la transcripción. La diferencia es que en cada experimento voy haciendo deleciones seriadas de la región reguladora, desde el 5’3’. En cada deleción que hago, miro con un luminómetro la intensidad de la luz emitida por la luciferasa. Debo hacer el control sin deleciones y a continuación las deleciones seriadas, mirando la intensidad de la luz en cada caso. Si veo que en algún punto llega a haber más luz que en el control, significa que en esa región reguladora que he delecionado había un silencer. Si por el contrario veo que a partir de un punto hay menos luz que en el control, significa que la región que he delecionado tiene un enhancer. Si observo la misma intensidad lumínica, significa que el la región delecionada no había nada relacionado con la regulación de la expresión de ese gen. Que haya más o menos luz equivale a decir que se transcribe más o menos el gen reportero, siempre gracias a la proteína sospechosa de regular la transcripción. Obviamente, si observo diferencias de intensidad lumínica respecto del original, sean las que sean, significa que la proteína se une. Genética Molecular. Carlos F.R. Página 44 TEMA 6: LA TRANSCRIPCIÓN EUCARIOTA IV. Estudiaremos ejemplos. los TF no basales inducibles, mediante 3 Ejemplo 1. CREM (o CREB, a nivel funcional es igual). Basalmente inactiva, se activa con AMPc (poca glucosa = mucho APMc). Se sintetiza constitutivamente. La diana de CREM activado es la caja CRE (Ciclic-AMP Response EleMent) en el DNA. Las isoformas de CREM formadas por splicing alternativo son CREMa (predominante, es activador, con dominio de unión al DNA y dominio activador de la transcripción) y CREMi (represor, sólo tiene dominio de unión al DNA). El dominio de unión al DNA tiene cremalleras de leucina, por tanto, dimeriza. Se regula: la poca glucosa regula al AMPc, que activa a ciertas quinasas que tienen como diana a CREM. Una vez activado (por fosforilación), CREM-P se une a la caja CRE en el DNA. La caja CRE está, por ejemplo, en el gen de la cadena α de las gonadotrofinas. Una de las cajas CRE está al lado del promotor de ICER, que se estimula y transcribe para ICER. ICER tiene como objetivo bloquear a CRE para que separar CREM y que no se una más. Además se para la transcripción de CREM porque el promotor de ICER (al lado de caja CRE, diana de CREM fosforilado)está a 3’ del promotor de CREM. Y también se deja de transcribir ICER. La afinidad de ICER por CRE es mayor que la de CREM fosforilado por CRE. Así se queda CRE bloqueado. Genética Molecular. Carlos F.R. Página 45 Por tanto, la respuesta de CREM es rápida y transitoria. Ejemplo 2. Genes Heat-Shock (HS). Son genes que se transcriben cuando incrementa ligeramente la temperatura. Los Heat Shock Factors (=HSF ó HStF) son TF inducibles que se activan cuando sube la temperatura, sufriendo un cambio conformacional. Activados, su diana en el DNA es Heat Shock Element (HSE). Se regula: HSF inactivo tiene enlaces intramoleculares que se rompen con el calor y “abren” la molécula, que al tener cremalleras de leucina, puede dimerizar. No es obligatorio que lo haga, pero si lo hace sube mas la tasa de transcripción. Una vez activado (dimerizado o no), una quinasa reconoce su estructura y lo fosforila en el dominio de unión al DNA, dándole así cargas negativas que estimulan a TF2D. Estando fosforilado, se une a la proteína GAGA que le permite unirse a las secuencias GAGA en el DNA, que se encuentran entre los nucleosomas (fuera de las histonas). Cuando la proteína GAGA se une a la secuencia GAGA, GAGA “aparta” las histonas del nucleosoma, descondensando el DNA y permitiendo que HSF fosforilado se una a HSE (estaba envuelto por las histonas), estimule a TF2D y se transcriba el gen HS. Ejemplo 3. El receptor de hormonas (HR). La hormona se une al receptor específico basalmente inactivo y dimeriza, activándose. Así inicia la transcripción de genes. Las hormonas que se captan son: Todas ellas tienen en común que derivan del metabolismo del colesterol, por lo cual tienen una naturaleza lipófila que les permite atravesar las bicapas lipídicas de las células y unirse a su receptor que es citoplasmático (o incluso a veces es nuclear). ¡El receptor es el TF! Genética Molecular. Carlos F.R. Página 46 El tipo de HR que usaremos de ejemplo: GR, el “Glucocorticoid Receptor”. Capta glucocorticoides, un tipo de hormonas esteroides. Dentro de la familia de los receptores esteroides, muestran un grado de homología del 50% aprox por lo que se refleja la especificidad del receptor por la hormona individual (Genes VII ed). El TF inducible que las capta tiene 3 dominios: - N’Terminal: activador de la transcripción, sin consenso. - C’Terminal: unión a la hormona y dimerización. Homología aprox. de 50%, por lo tanto los receptores de esteroides tiene especificidad infividual por cada hormona esteroide (Genes VII ed). Tiene dedos de Zn. - Unión al DNA: 42-90% de homología en todas las dianas de los receptores de hormonas esteroides. Significa que la mayoría de HR reconocen secuencia muy parecidas o algo parecidas, en el DNA. Tiene dedos de Zn. De manera basal, es una proteína secuestradora (Hsp90, chaperona que mantiene plegado al receptor) que retiene a los monómeros de GR en el citosol evitando que dimericen. Cuando la hormona se une al GR, Hsp90 salta y los receptores pueden dimerizar en el citosol. Cuando GR ha dimerizado, y estando unido a la hormona, se transloca al núcleo y se une a su caja diana: las secuencias HRE (Hormone Response Element). Hay dos tipos de HRE: GRE (Glucocorticoid Response Element) que es un enhancer y nGRE que es un silencer. La hormona sobre el GR hace el mismo efecto que el calor sobre HSF. Pero los dímeros de GR pueden desplazar a los nucleosomas por sí solos, mientras que los de HSF necesitaban a GAGA. Lo más frecuente es que GR dimerizado con la hormona se una a GRE y active la transcripción, pero a veces, las hormonas bloquean la transcripción en lugar de estimularla, es raro pero sucede. Involucra a la caja nGRE, un silencer. Basalmente, nGRE está unida a una proteína “A” que permite que sí que se transcriba el gen, pero al unirse GR activado a nGRE, salta “A” porque GR es más afín y se bloquea la transcripción del gen. El GR activado y unido a GRE (o a nGRE) puede desplazar a las histonas sin ninguna ayuda, así, remodela la cromatina del DNA. Para ello reclutan al Complejo Remodelador de la Cromatina (CRC). El CRC contiene enzimas que actúan en diferentes procesos: Genética Molecular. Carlos F.R. Página 47 - Sobre el DNA, se metila la Adenina por MECP2+Sin3. Metilado, atrae a HDAC para bloquear la transcripción. Desmetilando la Adenina, no vienen más proteínas desacetiladoras y se estimula la transcripción. - Sobre las histonas, HAT acetila las histonas para separarlas e incrementar la transcripción y HDAC desacetila las histonas para que se unan bien al DNA, lo compacten y no haya transcripción. Los procesos son reversibles. Así, el DNA se puede metilar en las A para silenciar la transcripción, la cromatina se puede remodelar para cambiar la posición de los nucleosomas, y las histonas se pueden acetilar para saltar y que se transcriba más. El GR unido a GRE (enhancer) recluta 1º a CRC, después quedan expuestas las secuencias dianas de los TF constitutivos que entran a HAT y de los TF constitutivos (unidos a enhancer?) y basales que activan la transcripción, y si se requiere silenciar, saltan los TF y se metila en las A. ¡Todo sucede a la vez! Así, el DNA metilado con histonas desacetiladas tiene muy poca transcripción, mientras que un DNA no metilado con las histonas acetiladas tiene una conformación más laxa y la transcripción de genes se ve estimulada. El RNA de Interferencia. Recientemente descubierto también, inactica genes de manera selectiva, se usa para estudiar enfermedades. Hay dos tipos: siRNA (small interference RNA): la célula Eucariota se defiende de los virus de dsRNA mediante 2 proteinas: DICER, que corta el dsRNA vírico en trozos pequeños de dsRNA con extremos protuberantes de ssRNA. Son el siRNA. Son reconocidos por RISC que desnaturaliza en ssRNA, se une a él y deja un extremo libre de ssRNA (gasta ATP). Éste trocito de ssRNA con RISC puede: ser degradado por RISC, ó se une a otros RNA víricos por complementariedad de bases y bloquea la traducción parando al ribosoma, ó activa a DICER que le dá más trabajo a RISC. Genética Molecular. Carlos F.R. Página 48 RISC con el ssRNA también puede traslocarse al núcleo y bloquear a otros RNA que se expresan en el huésped que proceden de DNA integrado en el genoma. miRNA (microRNA): Se produce dentro del núcleo de la célula. Regulan la producción de proteínas concretas porque se unen por complementariedad al mRNA de ésas proteínas. Es un mecanismo de regulación de la expresión génica muy nuevo, en estudio. Viene de un promotor que mira en dirección opuesta al gen que quiero regular, por eso los tránscritos son complementarios. Genética Molecular. Carlos F.R. Página 49 Cómo - se activan los TF inducibles: Sintesis de TF lento. Fosforilación HSF. Desfosforilación. Unión a ligando HR. Corte Hidrolítico. Separación de proteína inhibidora NF-kD. Change of Friend: En un heterodímero, cambiamos un miembro por otro que tenga más afinidad por el DNA y se une. Genética Molecular. Carlos F.R. Página 50 TEMA 7: LA TRADUCCIÓN. Consiste en sintetizar proteína a partir de mRNA. No se puede regular tanto como la transcripción. La estructura de los ribosomas es: - Procariotas: Subunidad grande (5S-rRNA, 23S-rRNA, 30 proteinas) y Subunidad pequeña (16S-rRNA, 20 proteinas). Coef. de sedimentación: 70S. - Eucariotas: Subunidad grande (5S-rRNA, 5’8S-rRNA, 28SrRNA, 50 proteinas) y Subunidad pequeña (18S-rRNA, 30 proteinas). Coef. de sedimentación: 80S. La “S” indica la velocidad a la que va sedimentanto la estructura. Es directamente proporcional a la masa (mucha masa = tarda poco tiempo en caer = mucha “S”). En el ribosoma Procariota, la catálisis del enlace peptídico (actividad peptidil transferasa) está catalizada por el 23S-rRNA de la subunidad grande. En Eucariotas, ésta actividad la realiza la subunidad grande al completo (rRNA y las proteínas asociadas). Los AA los aporta el tRNA. En Procariotas, la transcripción y traducción se dan en el mismo compartimento (protoplasma) y casi al instante, mientras que en Eucariotas, la transcripción se da en el núcleo y la traducción en el citoplasma, en momentos separados si hace falta. El 16S-rRNA Procariótico, de la subunidad pequeña, se une al mRNA gracias a 6 nt conservados el 100% de las veces, que están a 3’ del 16S-rRNA en el dominio 3’ menor. En el dominio 3’ mayor hay la región de unión al tRNA y al EF-G. Por el dominio 5’ o central se une a la subunidad mayor. Tiene muchas secuencias palindrómicas, lo que le da una complejidad elevada. El 16S-rRNA puede unirse al mRNA gracias a los 6 nt conservados el 100% de las veces, que son complementarios a una región del mRNA llamada “Shine-Dalgarno”. El S-D se encuentra a 5’ del mRNA. S-D = RBS (Ribosome Binding Site) = Leader = 5’UTR. El tRNA, como mínimo hay 20 tipos, uno para cada AA. Pero debido que cada AA puede venir transportado por diferentes tRNA, hay más. Estructura en forma de trébol. La unión de AA al tRNA se realiza en el extremo 3’ del tRNA, mediante un enlace covalente de tipo éster. El grupo Genética Molecular. Carlos F.R. Página 51 3’OH de la A del tRNA y el grupo COOH del AA se unen mediente éste enlace éster gracias a la AminoAcil-tRNAsintasa. Hay 1 enzima para cada tipo de AA, por tanto hay 20. Primero debe gastar ATP para activar al AA, formando AA-AMP (=AA*) + PPi. Ahora lo puede cargar en el tRNA liberando el AMP y produciendo AA-tRNA. Todo ésto sucede dentro del enzima gracias a que tiene diferentes dominios: unión al ATP, al AA, al tRNA y centro catalítico. Ésto es válido para Procariotas como Eucariotas. La estructura del ribosoma (también válido para ambos)consiste en un orgánulo formado por el ensamblaje de la subunidad grande y la subunidad pequeña, las cuales tienen los sitios P(peptidil, hace la cadena polipeptídica) y A(aminoacil, lugar aceptor de AA). El enlace éster que une el tRNA al AA en sitio P, tiene que pasar al sitio A formando el enlace peptídico propio de las proteínas. Se produce un ataque nucleofílico entre el NH3 del AA en el sitio A y el COOH del AA en el sitio P. Ya que es el NH3 quien roba los electrones, se dice que la cadena polipeptídica crece en NH3COOH. Éste proceso (actividad peptidil transferasa),en Procariotas, lo cataliza el 23SGenética Molecular. Carlos F.R. Página 52 rRNA, y en Eucariotas lo cataliza la subunidad grande del ribosoma. El NH3 queda mirando hacia el exterior del polipéptido naciente. La traducción tiene 3 fases: Iniciación (la subunidad pequeña se une al 5’), Elongación (entra la subunidad grande y comienza a formar enlaces peptídicos entre los AA) y Terminación (cuando se lee el codón STOP, en el último exón siempre, se desmonta el ribosoma y salta la proteína). Se necesitan los Factores Iniciadores (IF), Factores Elongadores (EF) y Factores de Liberación (Release Factors RF), cada uno para su respectiva fase. Específicamente en Procariotas, se encontró una secuencia conservada el 100% de las veces a 5’ del mRNA, en el Leader. Se trata del “Shine-Dalgarno”. Está a 10nt del AUG (primer codón, indica el principio del primer exón, codifica para metionina), y es complementaria a la secuencia en 3’ del 16S-rRNA. Ésto vale para Procariotas, pero en Eucariotas no es cierto: el ribosoma reconoce al CAP en 5’, que hace la Genética Molecular. Carlos F.R. Página 53 misma función que S-D en Procariotas; y hay una secuencia llamada “kozak” en el leader, que frena al ribosoma cuando hace “screening” (ahora lo veremos). Kozak no se parece en nada a Shine-Dalgarno, sólo se parece en que ambas están en el leader. 1A. Iniciación en Procariotas: Se necesita un tRNA especial para poder empezar. El primer codón siempre es AUG, por tanto se trata de una metionina, pero la del primer codón es una metionina formilada el tRNA iniciador en Procariotas tiene una N-formil-Metionina. Primero la AminoAcil-tRNA-sintasa sintetiza el Met-tRNA (enlace covalente tipo éster). A continuación, una formiltransferasa le transfiere un formil al N’terminal de la metionina, produciéndose un N’fMet–tRNA (su estructura es como el tRNA de la pág. 52 pero con Metionina formilada en el 3’) Éste es el tRNA iniciador, el único que puede entrar en el sitip P del ribosoma ensamblado sobre el mRNA. Una vez liberado el polipéptido, una formilasa puede eliminar el formil (o no). Para ensamblar el ribosoma, se necesitan los IF. - Basalmente, la subunidad pequeña del ribosoma está unida a IF1, IF2, IF3. IF3 es el encargado de mantenerlo separado de la subunidad grande, ayudar al 16S-rRNA a unirse al S-D y atrae el GTP, pero no es para él. - El IF2 capta al GTP y forma IF2-GTP. Así, sin hidrolizarlo, puede unirse al mRNA por 16S-rRNAS-D. IF1 da estabilidad al complejo. Gracia a IF3, lo hace justo en la zona de S-D y queda en la posición correcta para que puede entrar el tRNA iniciador, el cual queda en el sitio P sobre AUG. - Se produce un cambio conformacional el IF2 debido a que el fMet-tRNA se une a AUG. IF2 hidroliza ahora el GTP y saltan IF1, IF2, IF3. - Sin IF3, se une la subunidad grande a la pequeña, que ya tiene el tRNA iniciador bien situado, ocupando el lugar P. La unión tRNAiniAUG se da cuando la subunidad pequeña se ha unido al mRNA. 1B. Iniciación en Eucariotas: El tRNA iniciador es normal, no está formilado en la metionina. Es el CAP 5’ que atrae a la subunidad pequeña del ribosoma, la cual se empieza a mover sobre el mRNA haciendo “screening” en 5’3’, hasta que encuentra a la secuencia “Kozak” en el leader. Ahora se une al tRNA inicidor. En Eucariotas, la unión tRNA Genética Molecular. Carlos F.R. Página 54 iniciador subunidad pequeña se hace siempre antes de tocar el AUG. Debido a que el CAP 5’ hace que el mRNA tenga una vida más larga que el Procariota, se pueden ir uniendo varios ribosomas, uno tras otro, al mismo mRNA para traducir mucha cantidad de proteína. Son los polisomas ó polirribosomas. En Eucariotas, el tRNAini ya estaba en la subunidad pequeña antes de que ésta entrara al mRNA. Para ensamblar el ribosoma, se necesitan los IF eucarióticos (eIF). - En el citosol hay eIF4-F, que tiene varios dominios: eIF4-E (es el primero en actuar, reconoce y se une al CAP en 5’), eIF4-G (interactúa con eIF3, con PABII circularizando el mRNA y permitiendo que aparezcan los polirribosomas, y da estabilidad al complejo), eIF4-AB (heterodímero de eIF4-A + eIF4-B, evita la formación de hairpins). Se queda el mRNA con el eIF4-F y todos sus dominios en 5’. - Al mismo tiempo, la subunidad pequeña tiene eIF3, que la mantiene separada de la grande (como antes). A la subunidad pequeña se une eIF2. eIF2 captura GTP. Así, eIF2-GTP puede capturar al tRNA iniciador (¡que no tiene formil!). Se ha formado el complejo ternario: tRNAini+eIF2+GTP. - Ahora, eIF4-G unido en 5’ del mRNA reconoce a eIF3 de la subunidad pequeña (que tiene el complejo ternario) y permite que se una al mRNA. - La subunidad pequeña con el complejo ternario y el eIF4-F se empieza a mover en 5’3’ del mRNA. Éste movimiento se llama “screening”, gasta ATP. Cuando se detecta la secuencia “kozak”, que es adyacente al AUG, se para de mover y el tRNAini, que ya estaba de antes, encaja bien sobre el AUG. - Una vez quieto y con el tRNA unido a AUG, se recluta a eIF5, “una GTP’asa” que hace que el GTP de eIF2 se hidrolice. Cuando salta eIF2, conserva el GDP unido. - Con la energía liberada de la hidrólisis, saltan todos los eIF. eIF2 puede reactivarse por eIF2-B, una quinasa que fosforilaría a GDPGTP. - La subunidad grande, que ya estaba rondando cerca, tenía unida basalmente a eIF6, que la mantenía separada de la pequeña. Con la energía de la hidrólisis del GTP, también salta eIF6 de la subunidad grande. - Se pueden unir las subunidades, con el tRNAini ya en su posición, que ocupa el lugar P. Genética Molecular. Carlos F.R. Página 55 2A. Elongación en Procariotas: Intervienen los EF, se forman los enlaces peptídicos. - Con el ribosoma ensamblado, con fMet-tRNA en AUG ocupando el sitio P, ha entrado gracias a IF2+GTP. Hay el sitio A libre. En el sitio A sólo pueden entrar los tRNA con AA mediante EF-TU (GTP’asa). Cuando ha dejado el tRNA unido a su codón, se hidroliza el GTP y salta EF-TU. - Con tRNA en ambos lugares, el 23s-rRNA de la subunidad grande cataliza la actividad peptidil transferasa y forma el enlace peptídico como antes se ha explicado. - El sitio P queda con un tRNA sin AA, y el sitio A con un tRNA que carga la cadena polipeptídica naciente, con el NH3 apuntando siempre hacia fuera. El ribosoma se mueve 3nt en 5’3’ gracias a EF-G, otra GTP’asa y sucede que el tRNA sin AA pasa al “sitio E” (compartimento virtual que expulsa inmediatamente al tRNA vacio), el sitio P pasa a estar ocupado por el tRNA con la cadena polipeptídica y el sitio A vacia, listo para volver a empezar de nuevo con EF-TU que entra al tRNA. Para que se desplace el ribosoma, hace falta GTP que es aportado por EF-G. Entra en el sitio A cuando el tRNA con la cola polipeptídica está allí, hidroliza el GTP y salta él y el ribosoma se mueve 3nt. Atención: EF-TU es una GTP’asa que hidroliza GTP cuando deja el tRNA en el sitio A, con el objetivo de salir ella y reciclarse. Al hidrolizarlo, se queda unida al GDP. Afuera le espera EF-TS, el intercambiador de nt: quita el GDP y pone un GTP, con lo cual EF-TU puede volver a entrar en el siguiente. EF-G, que también es una GTP’asa, hidroliza el GTP para que se mueva el ribosoma, pero de manera que se separa todo y al salir EF-G sin nada, es ella misma que capta a un nuevo GTP, tal cual. Así puede volver a entrar en el sitio A. Las actividades GTP’asa se activan en contacto con el rRNA, con sus dominios de contacto para cada molécula. EF-TU es diana de muchos antibióticos, como la kirromicina. 2B. Elongación en Eucariotas: El proceso es el mismo, pero los factores tienen el nombre cambiado: EF-TUeEF1-α , EF-TSeEF1-βγ , EF-GeEF-2. Recordar que para formar el enlace peptídico hay que romper el enlace éster, por un ataque nucleofílico en NH3COOH catalizado por la actividad peptidil transferasa de la subunidad grande. Genética Molecular. Carlos F.R. Página 56 3A. Terminación en Procariotas: Intervienen los RF1, RF2 y RF3, que se unen al sitio A cuando aparece un codón STOP (también entran EF-G y EF-TU): RF1 reconoce los codones UAA, UAG. FR2 reconoce los codones UAA, UGA. RF3 se une RF1 o a RF2 activándolos, cuando se han unido al codón STOP. Es debido a él que salta todo: el polipéptido, el mRNA, las subunidades del ribosoma, los RF. Cuando salta, la subunidad pequeña se une de inmediato a IF3. 3B. Terminación en Eucariotas: Es más fácil que en Procariotas (cosa rara). Sólo hay un factor implicado, el eRF1, que hace la misma función que los RF Procariotas. _________________________________________________________ La Pauta de Lectura Abierta (Open Reading Frame, ORF): (¿porqué no lo explican en clase?) En Eucariotas, no hay operones. El mRNA sólo codifica para una única proteína. Los codones (3 nt) se leen linealmente. A veces se da que en un mismo mRNA hay dos AUG, cada uno de ellos con su secuencia STOP. Vienen uno tras otro, linealmente. Es como tener 2 genes diferentes en un mRNA. Wikipedia “...se llama marco abierto de lectura (siglas ORF del inglés Open reading frame) a cada una de las secuencias de ADN comprendida entre un codón de inicio (ATG) de la traducción y un codón de terminación, descontando las secuencias que corresponden a los intrones en caso de haberlas. Se encuentra acotado por los UTRs, o secuencias no traducidas. En una secuencia de ADN cualquiera hay, a priori, 6 posibles sentidos en los que pueden aparecer marcos abiertos de lectura; dado que cada codón toma 3 nucleótidos, existen 3 posibles lugares de inicio para tomar los nucleótidos de 3 en 3, si se tomara un cuarto nucleótido como lugar de inicio, haría coincidir el marco abierto de lectura con el mismo que si se toma el primer nucleótido. A lo que hay que sumar los otros 3 posibles marcos abiertos de lectura si el ADN es traducido tomando como molde la hebra complementaria, dando el sentido de lectura opuesto. Estos marcos abiertos de lectura se denominan +1, +2, +3, -1, -2 y -3. Genética Molecular. Carlos F.R. Página 57 En un ejemplo con la secuencia 5' aactgcagtacgtaacgtca 3' +3 +2 +1 -1 -2 -3 5' a act gca gta 5' aa ctg cag tac 5' aac tgc agt acg 3' ttg acg tca tgc 3' tt gac gtc atg 3' t tga cgt cat cgt gta taa att cat gca aac acg cgt gca tgc ttg gtc a 3' tca 3' ca 3' gt 5' agt 5' cag t 5' Cada uno de los 6 posibles marcos abiertos de lectura dará lugar a una secuencia proteica absolutamente diferente. En inglés el marco abierto de lectura se denomina ORF (open reading frame).” _______________________________________________________ Genética Molecular. Carlos F.R. Página 58 TEMA 8: LA REPLICACIÓN PROCARIOTA. Es una replicación simple. Se da mediante un único Replicón: toda la longitud de un DNA que se replica a partir de un único origen de replicación (el concepto de Replicón es válido para Procariotas y Eucariotas). La síntesis de DNA es semiconservativa, lo catalizan las DNA Polimerasas, que dependen de un molde de DNA que contiene la información original. Necesitan un extremo 3’OH libre a partir del cual empezar a elongar en 5’3’. Siempre se elonga en 5’3. También necesita cationes divalentes y dNTP (cuando entran en el DNA, pierden el P en βγ, quedando el P en α unido al DNA). En una burbuja de replicación hay 2 horquillas de replicación, cada una de las cuales avanza en la dirección contraria a la otra. El DNA de nueva síntesis, mientras se replica, recibe el nombre de cadena “leading”(5’3’) si está sobre el molde en sentido 3’5’. No da problemas. La cadena “lagging” está sobre el molde en 5’3’, y también se elonga en 5’3’, pero para poder ir en el mismo sentido, va lenta y necesita los Fragmentos de Okazaky (FO). Las etapas de la Replicación son: 1. Iniciación: La secuencia OriC es el punto de origen de la replicación único en el cromosoma circular de E.Coli. Tiene 245pb y 2 subregiones: - 3 cajas de 13pb (unos 13 mer cada una), ricas en A-T, en repetición directa. - 4 cajas de 9pb (unos 9 mer cada una), con orientaciones invertidas de la misma secuencia. La proteína DNA-A reconoce a las cajas de 9 mer de OriC (tiene que estar metilado). Es una ATP’asa. Cuando llega a 30 monómeros de DNA-A sobre las cajas de 9 mer, recluta a HU e IHF, que se unen a DNA-A y rompen los puentes de H2 de la región anterior: las cajas de 13 mer. Lo hacen porque estiran, no porque sean helicasa. Genética Molecular. Carlos F.R. Página 59 Al “agujero” de las cajas de 13 mer se une DNA-C, la cual permite que entre DNA-B (=Helicasa) gastando ATP. Cuando DNA-C ha ayudado a entrar a DNA-B, se va. DNA-B, la helicasa, es un homohexámero en forma de anillo, sin especificidad de secuencia, a través de ella pasa la cadena de ssDNA que será la molde a la lagging (es decir, se coloca sobre la que está en 5’3’). La helicasa rompe los enlaces de H2 entre las bases. A continuación vienen las SSBP (Single Strand Binding Proteins) que se unen al ssDNA, ya que el ssDNA sin protección es MUY peligroso (puede recombinar, etc). Las SSBP se separan cuando se ha replicado. Ahora entra la DNA-G (=Primasa), un tipo de RNA Polimerasa. No tiene especificidad de secuencia. Necesita activarse, para ello, la DNA-G se activa al tocar a la DNA-B. Queda enganchada a las 2 cadenas molde donde está DNA-B. El 1er primer que se hace es el de la cadena leading. Es un primer de RNA. Mientras la Helicasa avanza, va reclutando Primasas, lo cual es necesario para sintetizar la lagging. La Primasa se marcha después de hacer el primer. La replicación normal dura unos 40’. En cultivo con medio rico, dura 20’. Esto pasa gracias a que la activación de los OriC se hace antes de que acabe la replicación anterior. La célula hija recibe un cromosoma circular que se está replicando. El inicio de la replicación se regula con dos enzimas: - SeqA: se une a la secuencia GATC de OriC, cuando está hemimetilado (=recién sintetizado). Genética Molecular. Carlos F.R. Página 60 SeqA bloquea que entre la metilasa DAM, que metila. Pero con el tiempo, se llega a soltar SeqA. Entonces entra metilasa DAM, metila y puede entrar DNA-A (necesita DNA metilado, no vale el hemimetilado)si hay que replicar. La metilasa DAM y SeqA tienen la misma diana. - Metilasa DAM: puede añadir grupos metil a las Adeninas que no estén metiladas, que estén en un DNA hemimetilado. Reconoce a la secuencia GATC El DNA no metilado es reciente. El DNA metilado es antiguo. El hemimetilado es recién sintetizado. Cuando está metilado en las dos cadenas, puede entrar DNA-A. La reacción es Adenina + SAM6-metilAdenina + SAM sin el grupo metil. OJO: los factores en CIS son secuencias de DNA adyacentes a un gen. Los factores en TRANS son proteínas que se mueven por el citosol, o secuencias de otro DNA que no es del genoma que considero. 2. Elongación: siempre hay que tener presente que 1 burbuja tiene 2 horquillas de replicación. La replicación es bidireccional, a partir de un único OriC. El DNA siempre se sintetiza en 5’3’. Un fragmento de Okazakt (F.O.) tiene el primer de RNA + segmento de DNA elongado por la Polimerasa III. Los primers son fragmentos pequeños de RNA que que sintetiza la DNA-G, al activarse en contacto con la helicasa. El primer es de unos 10-15nt, sin diana definida, pero suele empezar por 5’-AG-3’. La cadena leading necesita un único primer. La cadena lagging necesita un primer por cada fragmento de okazaky. En la lagging, la primasa va entrando y saliendo, ya que al sintetizar el primer salta enseguida porque es poco Genética Molecular. Carlos F.R. Página 61 procesiva. ¡Siempre se activa al tocar a la helicasa! (la helicasa toca a la DNA Polimerasa, la primasa no). El 1er primer es el de la cadena leading. El de la lagging se hace cuando la horquilla de replicación se ha abierto un poco. Realmente, es el DNA que se mueve dentro de la Polimerasa y la helicasa, no al revés. Son como dos cuerdas que se estira cada una por el lado opuesto. Para poder acompasarse a la leading, la cadena lagging va formando bucles para acompasar el ritmo. Sobre las DNA Polimerasas Procariotas son complejos multienzimáticos. Todas polimerizan en 5’3’. Hay diferentes tipos: - DNA Polimerasa I: es poco procesiva (= se separa rápido del DNA); tiene actividad exonucleasa 5’3’ y actividad exonucleasa 3’5’ proofreading (corrige errores en el DNA). Los mutantes son poco viables. - DNA Polimerasa II: Es similar a la DNA Polimerasa III pero es prescindible. - DNA Polimerasa III: Hay pocas en cada célula, es un agregado de 10 polipéptidos. Tiene actividad exonucleasa 3’5’ (gracias a ello hace el proofreading: pone una base mal por error, lo detecta, se para y da marcha atrás degradándola y poniendo la buena en 5’3’). No puede hacer exonucleasa en 5’3’. Es la más procesiva (aguanta mucho unida al DNA) y rápida. Los mutantes son letales condicionales: mueren si se han de replicar. Su estructura tiene 3 subunidades: Core/núcleo catalítico. Tiene 3 polipéptidos: α (actividad catalítica 5’3’, es el “pulgar”), ξ (exonucleasa 3’5’, proofreading) y Ө (mantiene unido el core) Asociación. Tiene 2 polipéptidos: ββ (también llamado “Sliding clamp”, es un anillo homodimérico por dentro del cual pasa el ssDNA; toca a la polimerasa por la parte de atrás del núcelo catalítico y también toca a γ, pero en momentos separados) y γ (carga el ssDNA dentro de Sliding clamp, es un pentámero de 5 polipéptidos γ,δ,δ’,Ψ,χ; es una ATP’asa que unida a ATP carga el ssDNA dentro de Sliding clamp, y al hidrolizar el ATP se separa). Puente. Son dos proteínas τ (unen el núcleo catalítico con la subunidad de asociación). Genética Molecular. Carlos F.R. Página 62 La Sliding clamp es necesaria para mantener el core catalítico unido al ssDNA, sinó se separaría de golpe durante la replicación (malísimo). Gracias a que se carga el ssDNA dentro de la Sliding clamp (ββ) gracias a γ+ATP. Lo hidroliza y se separa de ββ. Para ir poniendo las ββ dentro de la cadena molde de la lagging, se tiene que ir sintetizando más ββ, la cual es reclutada por γ para anillarla al ssDNA de la siguiente región. El replisoma en acción. Replisoma= conjunto de todos los enzimas funcionando que intervienen en la replicación. La actividad proofreading (exonucleasa 3’5’) de la DNA Polimerasa I convierte el primer de RNA en DNA cuando ya está constituido el fragmento de Okazaky, y también convierte el primer de RNA en DNA de la cadena leading. Genética Molecular. Carlos F.R. Página 63 Revisa a la nueva cadena: es una actividad exonucleasa de RNA en 5’3’ (por delante) y exonucleasa de DNA en 3’5’ (sólo degrada los errores, no degrada el DNA que acaba de sintetizar la DNA Polimerasa III); evidentemente el DNA nuevo se polimeriza en 5’3’ (lo hace por detrás). Si encuentra un error que la DNA Polimerasa III haya pasado por alto (porque también hace proofreading) lo repara degradándolo. Avanza así por todo el DNA. Finalmente actúa la ligasa uniéndolo todo, forma los enlaces fosfodiéster típicos entre los fragmentos de Okazaky, gastanto ATP. Actualmente hay visiones alternativas de la replicación (the replication factory), que afirman que aunque el funcionamiento es el mismo, la estructura que se adquiere es distinta. Hasta ahora considerábamos que 1 Replisoma está sobre 1 horquilla. Una burbuja tendrá, por tanto, dos replisomas. Cada replisoma tiene una cadena molde de la leading y una cadena molde de la lagging. Pero según algunos modelos recientes, una misma cadena (la 5’3’ molde de la lagging ó la 3’5’ molde de la leading) se replica mediante el mismo replisoma, y todo el resto es igual. Los enzimas están quietos, se muede el DNA. Las helicasas unidas entre ellas, inmovilizan a la DNA Polimerasa III. 3. Terminación: (lo explican muy mal en clase). El final teórico es la mitad del cromosoma circular, en línea recta Genética Molecular. Carlos F.R. Página 64 respecto al OriC. Si se pasa de ese final teórico es porque el otro replisoma se ha atascado. La dirección de replicación y de transcripción de los genes es la misma. Hay genes que se tienen que expresar durante la replicanción, si lo hacen en la horquilla de replicación donde está el replisoma que no se ha pasado del final, no hay problema porque van en el mismo sentido y no se topan. Pero si se pasa el replisoma del final y se topa con la RNA polimerasa que está transcribiendo en la otra horquilla, es MUY malo porque se chocan y se “estropean” los enzimas. Al tener aproximadamente la misma velocidad de replicación las dos horquillas, en teoría deberían encontrarse en el final teórico y saltar los dos. Pero si esto no sucede (porque uno de los dos se ha atascado), hay un mecanismo para hacer saltar al replisoma si se pasa del final de manera alarmante. Pasado el final teórico, hay una serie de secuencias en el DNA llamadas TER (terminación), hay 3 ó 4 en cada horquilla. Sucede que cuando, por ejemplo, el replisoma derecho pasa por encima de las secuencias TER trampa del replisoma izquierdo, se activa la transcripción de la proteína TusA en el la horquilla derecha. Va en el mismo sentido la transcripción y la replicación. Ésta proteína TusA sintetizada por la horquilla derecha tiene como diana las secuencias TER de la horquilla izquierda. Así, TusA sintetizada en una horquilla se une a TER de la horquilla opuesta, para asegurarse que si el replisoma se pasa del final, se pare. La proteína TusA unida a TER tiene una actividad antihelicasa que hace que se desmonte el replisoma que viene de la otra horquilla, no haciendo nada al replisoma de la horquilla donde está ella (se parará cuando se tope con el DNA de la otra). Por eso se dice que Genética Molecular. Carlos F.R. Página 65 TusA actúa asimétricamente. funciona TusA. Sólo cuando hay replicación RESUMEN DE LA REPLICACIÓN. Genética Molecular. Carlos F.R. Página 66 TEMA 9: LA REPLICACIÓN EUCARIOTA. Se da por Replicones múltiples: hay muchos “OriC” sobre un cromosoma. Aparte, hay muchos cromosomas. Son lineales y están encerrados en el núcleo. Cada origen de replicación es bidireccional. Como es más complejo, hay más Replicones, aunque ello no implica que haya más cantidad de genoma. Un tamaño pequeño del cromosoma indica unos replicones más largos. Los replicones se activan cuando la célula ha de dividirse (para que un tejido prolifere, etc), pero cada uno se puede activar en diferentes momentos. Ya que hay tantos replicones, hay algunos que se utilizan y algunos que no. Los que no se llaman orígenes de replicación críptico. Un origen de replicación nunca puede ocupar nada que tenga que ver con la transcripción: ni la región reguladora ni la región codificante. Por eso, los orígenes de replicación siempre están en lugares no codificantes. Un tamaño pequeño del genoma indica muchas secuencias codificantes, muy juntas y por tanto pocos OriC, cuyos replicones serán muy grandes. Por el contrario, un gran tamaño del genoma indica muchas secuencias codificantes, y también muchas no codificantes, por tanto hay muchos replicones, pero de poca longitud. En levaduras (S.Cerevisiae): El origen de replicación se llama ARS (Autonomous Replication Secuence). Son regiones de 50pb imprescindibles, muy conservadas. A ella se une la proteína ORC (homóloga de DNA-A). Hace que las dos cadenas se empiecen a separar un poco más atrás, en B2-B3. La proteína ABF1, a veces, se une un poco más atrás de B3 y ayuda a replicar. ABF1 no tiene correspondencia en Procriotas. En Mamíferos: Muy relacionado con el ciclo celular. En el punto de origen de la replicación, el cual no tiene una secuencia consenso, se une la proteína ORC (homóloga de DNA-A). Recluta a CDC-6 y CDT-1 (son homólogas a DNA-C). En cada horquilla se une un heterodímero de CDC6+CDT1. Genética Molecular. Carlos F.R. Página 67 Reclutan a MCM7 (homóloga a la helicasa, DNA-B), un heterohexámero formado por MCM2 a MCM7. En Procariotas era un homohexámero. Habrá, también, uno para cada horquilla. Así se ha formado el complejo pre-replicativo (pre-RC). Está en estado latente, pudiendo quedar mucho tiempo así formado unido a su secuencia diana, a la espera de recibir el estímulo que lo activa. El pre-RC se forma al final de la telofase y al principio de la fase G1, y se activa al principio de la fase S. El estímulo que activa al pre-RC implica la pérdida de CDT1 y CDC6, que sólo ayudaban a entrar a la helicasa. Ambas son fosforiladas por CDK y DDK, y posteriormente degradadas. La helicasa también se debe fosforilar por CDK y DDK para activarse, pero evidentemente no se degrada. El sentido es que al final de la fase G1 se produce un incremento en la concentración intracelular de CDK y DDK, por lo que se fosforila el pre-RC permite que empiece la fase S. Una RC, - vez se han dado las fosforilaciones y activado al preentra el Replisoma Eucariota. Contiene: RPA: equivale a las SSBP RFC: equivale al complejo cargador γ Procariota. Pone la PCNA detrás de la Polimerasa δ-ξ. - PCNA: Equivale a la Spliding clamp Procariota (=anillo ββ) - MCM7: La helicasa heterohexamérica. Se activa por fosforilación. - Polimerasas: α (es una primasa. No hace proofreading, hace un “primer híbrido”) y δ-ξ (son el core catalítico intercambiable, tiene actividad proofreading). En orgánulos, hay la γ (sustituye a δ-ξ en la mitocondria). El primer híbrido que sintetiza la polimerasa α tiene una parte de RNA en 5’ y una parte de DNA en 3’. Aparte, hay otras polimerasas que no participan en replicación asociada a división celular, sino en replicación asociada a reparación (por ejemplo, Genética Molecular. Carlos F.R. la la la Página 68 Polimerasa β participa en el mecanismo de reparación BER, y la polimerasas Ө,λ,κ,η,µ,ι en otros tipos de reparación). Una vez que se han fosforilado CDC6 y CDT1, se van. Se fosforila MCM7 y empieza a separar las cadenas. Enseguida entra la polimerasa δ-ξ y la polimerasa α en la que será la molde de la leading (en la que está 3’5’). Hacen los primers hibridos, la MCM7 va avanzando, entran RFC y PCNA. Salta la polimerasa α y así sigue elongando la leading. Una vez que se ha sintetizado un trozo de la leading, empieza la lagging. El procesado de los fragmentos de Okazaky se realiza mediante un enzima llamado Fen1. No actúa la DNA Polimerasa I, porque es Procariota. Las actividades de Fen1 son exonucleasa 5’3’ (sobre un trozo del RNA y todo el DNA del primer)y endonucleasa de ssDNA. No polimeriza. Modelos hipotéticos para explicar su funcionamiento: A) Modelo de la RNasaH: Actúan la RNasaH y Fen1. Tenemos un dsDNA, en el cual una cadena es la molde, de DNA, y la otra tiene los fragmentos de Okazaky formados por el primer híbrido. No están unidos. Actúa la RNasaH degradando un trozo del RNA, en 5’3’. Ahora actúa Fen1 degradando el trocito de RNA que queda y el fragmento de DNA, en 5’3’. Después, la DNA Polimerasa δ-ξ sintetiza el fragmento de DNA complementario al primer degradado. Finalmente la ligasa lo une. B) Modelo flap. Actúan la MCM7 y la Polimerasa δ-ξ. Tenemos un dsDNA, en el cual una cadena es la molde, de DNA, y la otra tiene los fragmentos de Okazaky formados por el primer híbrido. No están unidos. Entra MCM7 por el 5’ de la zona con RNA y la separa del DNA, dejando al aire el trozo de RNA. Inmediatamente entra la DNA Polimerasa δ-ξ que sintetiza el DNA complementario al fragmento de RNA que ha levandado la MCM7. Van avanzando la DNA Polimerasa δ-ξ y MCM7 “empujando” el primer, haciendo que se separe, avanzando con la síntesis. Cuando casi ha separado el fragmento de Okazaky completo, llega Fen1, corta el ssDNA del fragmento de Okazaky que está colgando y saltan la DNA Polimerasa δ-ξ y MCM7. No se sintetiza todo el DNA de nuevo. Finalmente, la ligasa lo une. Se ha de resintetizar la zona del primer porque la DNA Polimerasa α no tiene proofreading, no degrada RNA y se equivoca. La DNA Polimerasa δ-ξ sí tiene proofreading. Sucede que debido a la reparación de los fragmentos Okazaky, se van acortando cada vez más los cromosomas los brazos 5’, ya que el RNA se pierde. Ésto pasa en dos extremos del cromosoma, porque la replicación bidireccional. Genética Molecular. Carlos F.R. de por los es Página 69 De las 4 “nietas”, la mitad ya tiene delecion estable. Para evitar que ésto suceda (sería catastrófico para la especie), están los telómeros. Los telómeros son unas secuencias de 10-15nt repetidas “n” veces, en los extremos 3’ del cromosoma. Son de ssDNA, 3’protuberante. Únicamente se encuentran en las células germinales, debido a que los sinetiza un enzima llamado telomerasa, que se expresa sólo en el tejido germinal. Actúa al final del ciclo celular, añadiendo el telómero a ambos extremos 3’ del cromosoma. En humanos, un telómero es una repetición de 1000 veces de la secuencia 5’-TTAGGG-3’. El sentido de ésto es que ya que se ha de perder forzosamente una secuencia en 5’ debido a la reparación del fragmento de Okazaky, pues que sea la complementaria a algo inútil* (el telómero). *es inútil desde el punto de vista codificante, pero de inútil nada porque sin ellos, cada espermatozoide u óvulo que se genera tendría cada vez menos DNA extinción. Molecularmente, la telomerasa es una DNA polimerasa dependiente de RNA. Es un enzima de la familia de las Transcriptasas Inversas. Sintetiza DNA a partir de un RNA molde que tiene ella en su estructura. Es un RNA molde igual en los organismos de la misma especie. El telómero lo añade a los 2 extremos 3’ del cromosoma, antes de que se empiece a replicar. Se engancha al 3’ del cromosoma, y añade nt en 5’3’. Genética Molecular. Carlos F.R. Página 70 El DNA que sintetiza en ssDNA. Cuando ha acabado con la secuencia 5’-TTAGGG-3’, salta y se pone en el 3’ de 5’TTAGGG-3’. Y le añade al lado otra secuencia igual. Así 1000 veces. Éste 3’ protuberante de ssDNA que forma ha de evitar ser degradado por nucleasas. Para ello, forma estructuras en forma de lazo o “loop”. En Tetrahymena, se forma un tetrámero de Guaninas que determina a un hairpin. Ya que el telómero de Tetrahymena tiene muchas guaninas, se dobla y se aparean 2 guaninas con otras 2 guaninas, mediante enlaces de H2 entre ellas en lugares que no son los típicos. Son 8 enlaces entre 4 Guaninas, formando un bucle cerrado. En humanos, se forman lazos o “loops” terminales. El 3 protuberante (telómero) enlaza con la secuencia anterior suya. Primero se forma el t-loop separándose las dos cadenas, se engancha el 3’ por complementariedad y se forma el d-loop. Genética Molecular. Carlos F.R. Página 71 En la superficie de ambos loops hay proteínas asociadas que interactúan con la telomerasa. Siempre se unen al dsDNA, no a la zona con ssDNA.: - TRF1: Tiene unidas las subunidades Tankyasa y Tin2 (dímeros también). Bloquea la entrada de la telomerasa. Una sobreexpresión acorta a los cromosomas. Cuando se va, entra la telomerasa. Se encuentra distribuida por los t-loop y d-loop, de manera más o menos uniforme. - TRF2: Tiene una función estructural, está por ambos loops, pero a mayor [ ] en el punto donde se hibridan las cadenas (en el d-loop). Cuando una célula somática se vuelve tumoral, sobreexpresa ciclinas. Si además expresa la telomerasa, como consecuencia de que es tumoral, se vuelve inmortal. En la línea germinal (células que hacen los espermatozoides y óvulos), la telomerasa funciona. La longitud del telómero siempre es igual. En las células somáticas, el acortamiento progresivo de los brazos de los cromosomas se debe a que no hay Una de las causas telomerasasenescenciaapoptosis. principales de que envejezamos. Los telómeros cortos en células somáticas cancerosas, podrían ser el señal que induce la expresión de la telomerasa (no se sabe). La p53 también tiene un papel importante en la tumorogénesis, que se activa (p53) por telómeros muy cortos, aunque las células tumorales suelen tener mutada a p53. Genética Molecular. Carlos F.R. Página 72 TEMA 10: REPARACIÓN DE LAS MUTACIONES EN PROCATIOTAS I. Las mutaciones pueden ser por bases no complementarias (inserción, deleción, cambio de nt) o por lesiones el el DNA (aparición de substancias que perjudican la estructura). Frecuencia teórica de aparición de las mutaciones: - Longitud del genoma humano: 3000x106 - Nº medio de replicaciones en 1 vida: 1015 - Error en selección de nt: 10-5 o 10-6 - Error al revisar el nt(falla proofreading): 10-2 ó 10-3 - Error al revisar cadena ya sintetizada: 10-1 o 10-2 Teóricamente se cometerían 3x1018 errores en una vida, un número inadmisible. Si consideramos que para que se quede la mutación en el organismo han de darse los 3 errores juntos, entonces la tasa real de errores es de 10-10 aprox., lo cual ya es relativamente tolerable. El sistema de reparación reconoce la cadena de DNA no metilada (= nueva) para detectar posibles mutaciones en ella. A la larga, se llega a metilar todo (ver Tema 8). Reparación de apareamientos erróneos: Es el missmatch repair. En Procariotas. Supongamos que cuando el DNA se replica, la Polimerasa coloca una base equivocada. Supongamos también que la Polimerasa III no se ha dado cuenta, y que la Polimerasa I tampoco. Así queda la mutación en un DNA, por elegir el nt que no toca. No se aparean las bases porque no son complementarios, y se forma una estructura extrusionada en la dóble hélice de DNA. Ésta estructura que sobresale, es detectada en primera instancia por los enzimas reparadores. Actúan después de la replicación. Éstos son: - MUT-S: Homodímero que contacta con el punto en el DNA que tiene el apareamiento erróneo (estructura extrusionada). Tiene forma de “manos en pregaria” (?). - MUT-L: Homodímero reclutado por MUT-S. Se une a la cadena de DNA que está metilada (antigua), en GATC. Genética Molecular. Carlos F.R. Página 73 - MUT-H: Endonucleasa reclutada por MUT-S que hace un corte por debajo de MUT-L, en la cadena no metilada. Las MUT tienen más afinidad por la estructura extrusionada del DNA que la Metilasa DAM por GATC. Cuando MUT-S está sobre la zona con el error, capta ATP. Así recluta a MUT-L y MUT-H, y hace que se unan al DNA. La diana de MUT-L es GATC metilado, quedando MUT-H debajo de ella (en la cadena no metilada, nueva, con el error). Entonces MUT-L se acerca a MUT-S, haciendo que el DNA adquiera una estructura en forma de loop entre el error y el GATC. Entonces, actúa MUT-H (endonucleasa) haciendo el corte en 1 cadena, la no metilada. Deja un Nick (separación entre dos bases contiguas, no se pierde información, sólo se rompe el enlace fosfodiéster), justo debajo de la GATC metilada (justo debajo de MUT-L). Éste sistema es bidireccional, es decir, la secuencia GATC puede estar a 5’ ó a 3’ de la zona con el apareamiento erróneo. Según donde esté, actúan diferentes enzimas después de hacer el corte. - Si GATC está a 5’ del error, entonces viene la exonucleasa I y degrada en 3’5’ aprovechando el 3’ del Nick. Degrada el DNA de la cadena nueva (la del Nick) hasta un poco pasado el error (osea, elimina la base mal apareada). Deja un GAP (“agujero” en el DNA en el que falta información, es una zona con ssDNA). - Si GATC está a 3’ del error, actúa la exonucleasa VII ó RecJ, que degradan el DNA en 5’3’ aprovechando el Nick, igual que antes degradan el DNA de la cadena nueva con el error, hasta un poco más allá, y se separan. Dejan también un GAP. Los GAPS que quedan, se siga el camino que se siga, tienen ssDNA, el cual es el sustrato favorito de RecA. Como han dejado el mismo producto, ahora actúa la DNA Polimerasa III rellenando el GAP y la ligasa finalmente lo une. No actúa la DNA Polimerasa I porque tiene exonucleasa. Genética Molecular. Carlos F.R. Página 74 Los mutantes de MUT no pueden reparar, causa directa de inviabilidad. En eucariotas, mutantes en las proteínas homólogas de MUT tienen cáncer. Los Eucariotas tienen un sistema homólogo a missmatch repair, pero con Polimerasas de DNA específicas y enzimas concretos. Las proteínas que intervienen son homólogas a MUT y otras llamadas PMS (forman heterodímeros, se combinan los diferentes tipos). Las principales diferencias respecto a Procariotas son que los homólogos a MUT son heterodímeros siempre(no homodímeros) y que su ausencia causa tumorogénesis. - La MUT-S procariota tiene de homóloga en S.cerevisiae a MHS1, 2, 3, 4, 5 y 6. En humanos son MSH2, 3, 4, 5 y 6 (=GTBP). - La MUT-L procariota tiene de homóloga en S.cerevisiae a MLH1, 2 y 3, y PMS1. En humanos son MLH1 y PMS1 y 2. - La MUT-H procariota no tiene homólogos ni en S.cerevisiae ni en humanos. No se han encontrado todas las combinaciones posibles, sólo algunas. Otras no se dan nunca. teóricas Los complejos equivalentes a missmatch repair en S.cerevisiae son: - MUT-S MSH2 (siempre está) + MSH3 (para inserciones y deleciones de todo tipo) ó MSH6 (pequeñas inserciones y deleciones, mutación puntual). - MUT-L MSH1 (siempre está) + PMS2 (para mutaciones puntuales, inserciones y deleciones) ó PMS1 (inserciones y deleciones) ó MLH (también para inserciones y deleciones). - MUT-H no se ha encontrado. Los complejos equivalentes a missmatch repair en humanos son: - En células somáticas: Genética Molecular. Carlos F.R. Página 75 - En células germinales (hacen meiosis): Genética Molecular. Carlos F.R. Página 76 TEMA 11: REPARACIÓN DE LAS MUTACIONES EN PROCATIOTAS II. Las mutaciones pueden ser por bases no complementarias (inserción, deleción, cambio de nt) o por lesiones el el DNA (aparición de substancias que perjudican la estructura). Supongamos un punto mutado en el DNA. Si por algún motivo no actúa el mecanismo anterior, actúa el siguiente. Se pueden clasificar según cómo actúan o según cuando actúan: - Según cuando actúan los enzimas reparadores: - Según cómo actúan los enzimas reparadores: 1) Reversión de la lesión: Se arregla el daño en el DNA. Lo que arregla son las bases dañadas, no erróneas. Antes de replicar. Fotoliasa. 2) Escisión del trozo dañado: Se arreglan bases dañadas. Antes de replicar. A continuación se resintetiza el trozo escisionado. Lo hacen el BER y el NER. 3) Tolerancia de la lesión: Se permite que termine la replicación, función vital de la célula, antes de reparar. Después de replicar. Son el missmatch repair (corrige bases mal apareadas), Reparación por recombinación (actúa frente a bases dañadas permitiendo que siga la replicación, pero no las arregla) y Reparación sobre lesión (=SOS, actúa sobre bases dañadas permitiendo que siga la replicación pero no las arregla). Estudiaremos los sistemas con detalle, basándonos en la 2ª clasificación. 1) Reversión de la lesión: Repara los dímeros entre 2 pirimidinas contiguas (CC ó TT), que se unen mediante 2 enlaces ciclobutilo. Se forman debido a la luz UVA (260nm). Genética Molecular. Carlos F.R. Página 77 Éstos enlaces normales. son transversales a los enlaces de H2 El enzima que repara éstos enlaces es la fotoliasa. El mecanismo mediante el cual actúa se llama fotoreactivación: deshace los enlaces ciclobutilo entre las dos pirimidinas contiguas, gracias a la energía que obtiene de la luz blanca (activa a la fotoliasa). Esto se explica teniendo en cuenta que la fotoliasa tiene nucleótidos de flavina reducidos (FADH2). Tiene 2 FADH2. Cada FADH2, en presencia de luz blanca, cede 2e- (se oxida) a uno de los dos enlaces ciclobutilo (captan el e-, se reducen), dejando al final a las dos pirimidinas sin ninguna anomalía. Se ha de unir al lugar con la anomalía, y NO tiene ningún homólogo en Eucariotas. 2A)Base Excision Repair (BER): Corta y resintetiza un fragment de DNA. Actúan enzimas llamados N-Glucosidasas ó DNA-Glucosidasas. Repara bases dañadas, antes de replicar. No actúa frente a dímeros de pirimidina. Excepcionalmente, alguna también actúa frente a apareamientoe erróneos. Cortan el enlace N-glucosídico entre la pentosa y la base nitrogenada de un nucleótido. Eliminan la base, y dejan un lugar AP (apurínico si era una purina; apirimidínico si era una pirimidina). La más conocida es la N-Glucosidasa de Uracilo, ya que tener un uracilo en el DNA es una aberración. A continuación actúa lugar AP, y luego una AP. Se rompen así flanqueaban al nt que una endonucleasa que corta a 5’ del endonucleasa que corta a 3’ del lugar los dos enlaces fosfodiéster que tenía la anomalía. Finalmente, actúa la DNA Polimerasa I y pone el nt correcto que falta (sería mucha casualidad que se equivocara, pero, ¿porqué no?). La ligasa une los nicks que puedan quedar. 2B)Nucleotide Excision Repair (NER): Es el mecanismo principal. Corta y resintetiza un fragment de DNA. Repara bases dañadas, antes de replicar. También actúa frente a dímeros de pirimidina. Lo realizan los enzimas UVR-A, B, C y D. La zona con error de apareamiento forman una estructura extrusionada, que es reconocida por un heterotrímero (ααβ): dos monómeros de Genética Molecular. Carlos F.R. Página 78 UVR-A y un monómero de UVR-B. El ααβ necesita unirse a ATP para poder unirse al DNA. Una vez unido al DNA, UVR-B deshace los puentes de H2 de la región con el error. Ahora saltan los dos monómeros de UVR-A. Queda UVR-B unido, que dobla al DNa formando un “codo”. UVR-B recluta a UVR-C, la única endonucleasa, que hace dos cortes (nicks) en la cadena con el error: un Nick a 8nt en 5’ del error y un Nick a 4-5nt en 3’ del error. Siempre mantiene las distancias. Entra UVR-D, que es una helicasa y separa los puentes de H2 del fragmento con los nicks (en total, 12-13nt que incluyen al error). Éste fragmento se separa, no hay ningún enlace ya que lo una. El GAP que queda, como tiene ssDNA, puede ser sustrato de RecA. Ahora entra la DNA Polimerasa que resistetiza el trozo que falta y la ligasa, une. UVR-B se puede unir al DNA gracias a que detecta la estructura extrusionada que adquiere. Tiene unos AA con secuencias aromáticas laterales que le permiten intercalarse entre las bases del DNA que son erróneas. Así, UVR-B queda intercalada dentro del DNA para separar los enlaces de H2 (algunos) estirando, ya que dobla al DNA formando el codo. Se puede incrustar en el DNA gracias a que el punto donde la base se debería unir a la complementaria no hay ningún enlace, porque es una base errónea y UVR-B tiene sitio para unirse. Es posible que la reparación se acople con la transcripción si, por casualidad, la maquinaria transcripcional está funcionando sobre una región con un error. Entonces, se para la maquinaria transcripcional (no salta aún) y se recluta a TRFC (Transcription-Repair Compling Factor), una proteína. TRFC se une a la RNA Polimerasa, y hidrolizando ATP, la hace saltar ahora, junto al RNA. Entonces, TRFC recluta a ααβ, que comienza el NER. Junto a los dos monómeros de UVR-A, también salta TRFC (en Eucariotas, hay el TCR-NER ó TCNER, pero es un tipo de respuesta en la que participan diversos enzimas, no se trata de una única proteína como en Procariotas). 3A) Missmatch Repair. Se permite que termine la replicación, función vital de la célula, antes de reparar. Actúa después de replicar. Ver Tema 10. 3B) Reparación por Recombinación Homóloga. Se permite que termine la replicación, función vital de la célula, antes de reparar. Actúa después de replicar. En principio no repara por si mismo ni las bases dañadas ni los dímeros de pirimidinas, pero si después actúa la fotoliasa o el NER, Genética Molecular. Carlos F.R. Página 79 sí. El sentido es que si se para la replicación, la célula muere (y por eso se permite que termine). Supongamos que hay un daño en el DNA, el cual aparece justo antes de que la DNA Polimerasa copie el DNA. Entonces, cuando el replisoma llega, la DNA Polimerasa III “salta” y sigue más adelante. El resultado: La cadena de nueva síntesis complementaria a la cadena original con el daño, tiene un GAP (=una hija tiene un gap en la zona complementaria al daño) porque la polimerasa III ha saltado. Éste GAP con ssDNA podría ser sustrato de RecA para procesos que no interesan. Se arregla por recombinación: la cadena de abajo que sería complementaria a la mutada de arriba, es arrastrado hasta arriba, y se hibrida con las bases que le son complementarias (únicamente no son complementarias por el error). Originalmente, la donadora del trozo de DNA y la que tiene el daño eran las dos cadenas del DNA de la célula madre. Ahora la ligasa los une. Para el GAP que queda en el DNA donador, rápidamente la DNA polimerasa III resistetiza lo que falta (sinó, sería sustrato de RecA). La ligasa lo une. 3C) Reparación Sobre Lesión (SOS). Se permite que termine la replicación, función vital de la célula, antes de reparar. Actúa después de replicar. En principio no repara por si mismo ni las bases dañadas ni los dímeros de pirimidinas, pero si después actúa la fotoliasa o el NER, sí. El sentido es que si se para la replicación, la célula muere (y por eso se permite que termine). La respuesta SOS es una respuesta masiva, se expresan muchos genes a la vez, y en mucha cantidad. Los genes de la reparación sobre el cromosoma de E.Coli son los genes SOS: UVR (para hacer el NER), UMU-D y C, LexA, RecA, y muchos otros. Genética Molecular. Carlos F.R. Página 80 - RecA: es imprescincible para recombinar en Procariotas. Aquí no recombina, sino que aparece porque tiene mucha afinidad por el ssDNA. Puede considerarse, en éste contexto, producto de un gen SOS. - LexA: Represor constitutivo de los genes de la respuesta SOS, está unida a la caja SOS del operador de todos los promotores de los genes SOS. Es un producto de los genes SOS. - Genes SOS: reparan el DNA. UVR, UMU, RecA, LexA… Todos están bajo el control de un promotor con caja SOS, diana de LexA. Basalmente, LexA está expresada. Se une a las cajas SOS del operador de los promotores de los genes SOS (inlcuyendo su propio promotor, regula su propia síntesis). Como hemos visto en Reparación por recombinación, la DNA polimerasa III salta cuando se topa con daños en el DNA y sigue sintetizando un poco más adelante. Así, hay un instante en el que hay ssDNA sin protección. Es éste ssDNA el estímulo que activa a RecA, la cual se une al ssDNA. Entonces RecA pasa a estar activada por contacto con el ssDNA. Estando activa, se mueve por el DNA del cromosoma buscando a LexA, la cual está unida a muchos sitios a la vez. Cuando RecA toca a LexA, se activa la actividad autoproteolítica de LexA, la cual se degrada a si misma, a LexA que bloqueaba a los promotores y a toda la nueva LexA que se pueda producir (estaba bloqueando a su propio promotor). Es un feedback positivorespuesta masiva. Uno de los productos de los genes SOS son las DNA Polimerasas IV y V. La más conocida es la DNA Polimerasa V. Tiene subunidades codificadas por los genes UMU-D y C, los cuales pueden transcribirse cuando LexA se autodegrada. UMU-C basalmente es activa. UMU-D basalmente no. Necesita procesamiento post-traduccional por RecA. Poco claro. Se convierte en UMU-D2’. Finalmente, UMU-D2’ + UMU-C = DNA Polimerasa V. Genética Molecular. Carlos F.R. Página 81 Las Polimerasas IV y V son un tipo de polimerasas llamadas polimerasas translesión (= TLS = Polimerasas Y). Así, cuando el replisoma llega a la región con el error, salta el core y el complejo cargador γ, todo excepto la Sliding clamp (anillo ββ). Se carga el core de la DNA Poliemrasa V al anillo ββ, polimeriza en 5’3’ poniendo nt al azar sobre la región con el daño y su región circundante. Además es poco procesiva por lo cual se separa rápido y vuelve el core de la DNA Polimerasa III, que sigue con la síntesis normalmente. La ventaja de éste sistema es que salva la vida de la célula y la replicación, lo cual es el primer objetivo. Existen pocos mecanismos para reparar apareaminetos erróneos frente a los que hay para reparar daños. Eso indica que la célula se permite cierta plasticidad en cuanto a cambios de nt, para ir variando a lo largo del tiempo. Lo que no se tolera es dañar esas bases, por eso hay varios mecanismos para arreglarlas. Para reparar los dímeros de pirimidinas en el DNA, se puede: 1) Fotoliasa, antes de replicar. 2) NER. Antes de Replicar. 3) Reparación por Recombinación: no repara por si misma pero permite que siga la síntesis. Si después se da fotoliasa o NER, sí que repara. Después de la replicación. 4) Síntesis sobre lesiónSOS: no repara por si misma pero permite que siga la síntesis. Si después se da fotoliasa o NER, sí que repara. Después de la replicación. Genética Molecular. Carlos F.R. Página 82 TEMA 12: REPARACIÓN DE LAS MUTACIONES EN EUCARIOTAS. En humanos, el mecanismo más importante es, con diferencia, el NER. Las enfermedades genéticas asociadas a mutaciones en NER son autosómicas recesivas y los pacientes presentan gran sensibilidad a la luz UVA. Son las siguientes: - XP: Xenoderma Pigmentosum. Elevada predisposición al cáncer de piel, la cual está alterada. El 25% sufre neurodegeneración. No hay UDS. - CS: Síndrome de Cockayne. No tienen predisposición al cáncer, piel alterada. Todos tienen neurodegeneración. Reparan con UDS, pero sin preferencia de zona. - TTD: TricoTrioDistrofia. No hay predisposición al cáncer. Fragilidad en piel y pelo. Descamaciones abundantes. Retraso en el desarrollo físico y mental. Baja fertilidad. No hay UDS. Genéticamente, los fibroblastos de éstos pacientes presentan patologías moleculares en la Sintesis de DNA no Programada (UDS, Unscheduled DNA Synthesis). El UDS consiste en que el DNA no sólo se sintetiza durante la fase S del ciclo celular, sinó también antes y después. Es en éstos momentos que no corresponden a la fase S cuando se repara el DNA y hay síntesis de nuevo material genético (la UDS). Ello se estudió haciendo la Prueba de Complementación (ver Genética General) hibridando dos células y observando el fenotipo. Hay que considerar que los enzimas reparadores son como los enzimas de una vía metabólica, donde si falla un intermediario, o uno de los iniciales, no hay producto final: - Al hibridar 2 células mutantes del mismo genmutanteno complementa. - Al hibridar 2 células mutantes de diferentes genesnormalcomplementan. Lo que no tiene uno, lo produce el otro. Célula A (paciente A)+Célula B (paciente B)Fusión por aglutinación. Resultado: Monocarionte (no han fusionado, porque las cosas no siempre son perfectas), Dicariontes (heterocariontes si son A+B complementados ó homocariontes si son A+A o B+B, no complementados). Los genotipos de las células iniciales se saben porque se han marcado las células con bolas de látex “pequeñas” en A y “grandes” en B. Se ven al M.O. Así, se llegaron a establecer los detalles Eucariota. El NER Eucariota tiene 2 modalidades: Genética Molecular. Carlos F.R. del NER Página 83 -NER-GGR: NER con reparación Global del Genoma. -NER-TCR: NER con reparación acoplada a Transcripción. NER nunca arregla apareamientos erróneos, solo lesiones. Ambas tienen vías de entrada diferente pero el resultado es el mismo. Ambas se encuentran operativas en individuos sanos. NER-GGR: Global Genome reparation. Partimos de dsDNA genómico con una base dañada. Se pone “XP-algo” porque se encontraron en pacientes de XP. - XPC: Reconoce y se une al punto de la lesión, junto a R-23. Marca la cadena con la mutación. - XPE: Ayuda a XPC. Juntas, XPC+XPE forman un heterodímero que recluta al reparasoma, formado por: - XPA: marca la cadena con lesión, para los enzimas de después. - XPB y XPD: Son helicasas que forman parte de TF2H. Hay un heterodímero de XPB+XPD por cada horquilla (TF2H forma parte, también, del reparasoma). - RPA: equivale a la SSBP Procariota, protege al ssDNA. - XPG: Endonuclesa que corta en una cadena, a 3’ de la lesión, haciendo 1 nick. - XPF: Endonuclesa que corta en una cadena, a 5’ de la lesión, haciendo 1 nick. Actúa unida a ERCC1. El reparasoma es un agregado proteico, formado por éstos enzimas y alguno más. El ssDNA con la lesión cortado es más largo que el de los Procariotas (12-13 nt). La lesión no está centrada, suele quedar hacia el 3’ del trozo cortado. El Gap que queda implica que la DNA Polimerasa δ-ξ tiene que sintetizar DNA allí, y la ligasa lo une. NER-TCR: Transcription Coupled Reparation. Acoplado a la transcripción, cuando la RNA Polimerasa toca la lesión, se para. Entonces se unen las siguienes proteinas (se pone CS porque se encontraron en pacientes de CS): - CSA+CSB: Heterodímero que se une a la RNA Polimerasa ya parada, y la “retiran”*. Ellas reclutan al reparasoma, que como antes, tiene: - XPA: marca la cadena con lesión, para los enzimas de después. - XPB y XPD: Son helicasas que forman parte de TF2H. Hay un heterodímero de XPB+XPD por cada horquilla (TF2H forma parte, también, del reparasoma). - RPA: equivale a la SSBP Procariota, protege al ssDNA. - XPG: Endonuclesa que corta en una cadena, a 3’ de la lesión, haciendo 1 nick. - XPF: Endonuclesa que corta en una cadena, a 5’ de la lesión, haciendo 1 nick. Actúa unida a ERCC1. Genética Molecular. Carlos F.R. Página 84 * No se sabe si realmente, la RNA Polimerasa se aparta momentáneamente por acción de CSA-CSB o si se separa del complejo y se desmontan todos los factores y el tránscrito. Se cree que se aparta momentáneamente ya que los Eucariotas producen un pre-mRNA muy largo, y si justamente hay un error antes del final de la transcripción, el tener que desmontarlo todo y empezar de nuevo es muy costoso. Interesa no perder el tránscrito, así que por eso se cree que se aparta momentáneamente. Relación entre mutación y sintomatología. Las mutaciones en las proteínas implicadas pueden estar en dominios catalíticos de acción ó en dominios de interacción con otras proteínas. Son vitales siempre XPB y XPD: las helicasas. Forman parte de TF2H, el cual está en el reparasoma. Están en los dos tipos de NER: GGR (entran por XPC+XPE) y TCR (entran por CSA+CSB). - En pacientes de XP, se afecta la via NER-GGR. Hay una mutación en XPB y en XPD en el dominio de unión a XPC+XPEno entra el reparasomano UDS. - En pacientes de CS, se afecta la via NER-TCR. La mutación está preferentemente en CSA+CSB (en el dominio de unión a XPB y XPD), pero también puede estar en XPB y XPD en el dominio de unión a CSA+CSB. Se da el GGR porque el XPB y XPD pueden unirse a XPC+XPE, pero no a CSA+CSB, por lo tanto, no hay preferencia de zona. - En pacientes de TTD, se afecta al dominio de unión de XPB y XPD con XPC+XPE, pero sólo cuando XPB y XPD están en el transcriptoma (TF2H + RNA Polimerasa + XPB y XPD). Hay poca transcripción, pero la hay, no es absoluto. No GGR porque no entra reparasomano UDS. Sintesis sobre lesión en Eucriotas. Actúa en caso de que se encuentren dímeros de pirimidinas en el genoma. En Procariotas, actuaban la DNA Polimerasa IV y V. En Eucariotas, actúan las DNA Polimerasas η, ι, ζ. Todas ellas son polimerasas translesión (TLS) ó polimerasas Y. Polimerizan en 5’3’, ponen nt aleatoriamente sobre dímeros de pirimidinas, por lo que cometen muchos errores. No tienen proofreading, y por lo tanto su tasa de error es alta. Además son poco procesivas (factor de infidelidad). Se estudió mediante el mutante XPV, que tenía la DNA Polimerasa η no funcional. En su lugar, se observó que la Genética Molecular. Carlos F.R. Página 85 célula utilizaba en lugar de la DNA Polimerasa δ-ξ a las subunidades ι y ζ, con las características ya citadas. Las Polimerasas Translesión también están relacionadas estrechamente con en fenómeno de hipermutación somática (ver Tema 20). Éste fenómeno sucede en los linfocitos B. Primero, realizan recombinaciones somáticas para reordenar sus genes y después, mitosis para “clonarse”. Pero sus células hijas tienen variedad elevada, no son como las parentales, debido a que, entre otras cosas, cuando hay errores en la mitosis, se suelen usar las DNA Polimerasas translesión µ y ι para reparar y replicar el DNA, junto con la DNA Polimerasa δ-ξ. Sistema NHEJ. Non-Homologous End Joining. Es un mecanismo de reparación del DNA Eucariota (exclusivo) de muy reciente descubrimiento. Si se rompe el DNA genómico generando extremos romos, pueden suceder translocaciones, etc. No interesa. Por ello, cuando aparecen los extremos romos se activan KU70 y KU80. Se unen formando un heterodímero. Un heterodímero se une a un extremo. Otro heterodímero, se une al otro extremo. Tienen mucha afinidad el uno por el otro, y acercan los extremos. Cuando están muy juntos, se activa la DNA-PK (kinasa), que fosforila a ARTEMIS. Cuando ARTEMIS se ha activado por fosforilacion, es una endonucleasa. No se sabe qué hace. También aparece XRCC4, cuya función no está muy clara, pero está relacionada con la ligasa. Si en lugar de extremos romos se generan protuberantes, las Polimerasas translesión los pasándolos a romos, añadiento nt al azar. extremos arreglan Actualmente se intenta relacionar NHEJ con la replicación, y con la recombinación. Genética Molecular. Carlos F.R. Página 86 TEMA 13: RECOMBINACIÓN GENERAL: INTRODUCCIÓN. Éste tema es introductorio y conceptual. Se explica cómo se resuelve la cruz de Holliday, un intermediario presente en todo proceso de Recombinación Homóloga Procariota. Recombinar es reordenar genes ó marcadores génicos siempre como consecuencia de un intercambio físico. Funcionalmente, consiste en cortar un trozo de DNA y unirlo en un lugar diferente al original. La Recombinación puede ser Natural (Homóloga, de Sitio Específico, Transposición) ó Artificial (la que provoca la Ingeniería Genética, con enzimas de restricción). La Artificial actúa sobre la Natural. Tipos de Recombinación (Natural): 1. Recombinación Homóloga: Es lo visto en Genética General, actúa sobre regiones grandes del genoma (de más de 100pb) que han de ser homólogas (casi iguales en cuanto a composición de nt, pero iguales estrictamente en cuanto a la región que ocupan del genoma) en los dos DNA. La Recombinación Homóloga origina la Recombinación General (se considera sinónimo de Recombinación Homóloga, implica apareamiento y entrecruzamiento en los cromosomas homólogos, con cambio o no de orden en los alelos) ó Recombinación Ilegítima (=“Recombinación no-homóloga”, sucede por error, dos regiones no homólogas o con muy poca homología recombinan entre sí, sin cambiar el orden de los genes). Temas 13 y 14. 2. Recombinación de Sitio Específico: Interactúan 2 DNA con una pequeña región de homología de unos 10-15 nt, demasiado pequeña para que pueda actuar RecA. Ésta región de 10-15 nt es igual en cuanto a composición de nt. Lo hacen Integrasas, Resolvasas (resuelve intermediarios de la fusión) ó Invertasas. Ver Tema 15. Genética Molecular. Carlos F.R. Página 87 3. Transposición: Se escinde un dsDNA de un sitio donador, se mueve por el citoplasma libremente y se integra en un sitio receptor, totalmente al azar. No requiere ningún tipo de homología. Sólo se da en momentos concretos de la vida de la célula, y se da en múltiples organismos. Implica la actividad de la Transposasa. Hay muchos tipos, se estudia en los Temas 16 a 19. Un ejemplo: Otra Clasificación: Genética Molecular. Carlos F.R. Página 88 La Recombinación Homóloga. En Procariotas, se resuelve mediante la cruz de Holliday, siguiendo el “modelo de Holliday” (1960). Se ha demostrado que la recombinación homóloga Procariota no es estrictamente así, pero se explica por ser didáctico y sirve para entender el que se cree que es el verdadero modelo (el de Meselson-Radding, Tema 14). Eso si, TODOS los modelos comparten que hay un intermediario común, llamado la cruz de Holliday. Son, por ejemplo, un dsDNA lineal que he introducido para transformar y otro dsDNA lineal que pueda hacer en el citosol. La polaridad de las cadenas no hermanas ha de ser la misma. Es AB/ab. Necesitan una región de 100pb de homología MÍNIMO. Una endonucleasa hace 1 nick en 1 cadena de cada una de las cromátidas no hermanas. Suponemos entre A y B. Genética Molecular. Carlos F.R. Página 89 Una ligasa une una cadena cortada con la otra. Es la invasión. Se ha producido ENTRECRUZAMIENTO = RECOMBINACIÓN FÍSICA. Éste es el 1er Intermediario. Es la juntura de Holliday. La zona con la cruz es el Branchpoint ó punto de ramificación. Siempre, los intermediarios requieren una resolución. Migración del Branchpoint. Al moverse el branchpoint por acción de una helicasa, la cadena de abajo sube hacia arriba y la de arriba baja hacia abajo. Se aparean con la otra porque eran homólogas. Es el 2º intermediario. Ésto es un DNA heterodúplex: regiones de un dsDNA donde cada una de las dos cadenas viene de un origen distinto. El 2º intermediario se estira: Un enzima gira la parte de abajo 180º sobre sí misma. Esto es la cruz de Holliday. Se puede resolver de dos maneras diferentes, cada una de las cuales tiene 1/2 de probabilidades de suceder (al azar): - Corte Este-Oeste: Una endonucleasa corta a la cruz de Holliday de derecha a izquierda, por el centro. Genera 2 dsDNA heterodúplex en los cuales no ha habido reordenación de alelos: es un recombinante físico (por Genética Molecular. Carlos F.R. Página 90 el entrecruzamiento)pero no un recombinante génico. Es como los dsDNA parentales, los mismos alelos. - Corte Norte-Sur: Una endonucleasa corta de arriba hacia abajo por el centro de la cruz de Holliday. Genera 2 dsDNA heterodúplex que tienen cada uno un alelo que antes no tenía. Son recombinantes físicos (por el entrecruzamiento) y recombinantes génicos (por los nuevos alelos). Dos DNA homólogos son aquellos que comparten la misma región física del genoma de 100nt o más, aunque no tienen el 100% de sus bases iguales (de hecho nunca lo tienen). El entrecruzamiento ó recombinación física consiste en que diferentes cadenas de ssDNA se juntan y forman el heterodúplex, no se aparean perfectamente porque la que “sube” del cromosoma de abajo al de arriba (por ejemplo), puede tener alelos diferentes (con bases diferentes). Éste problema se solventa con la conversión génica. Se detecta mediante los recombinantes genéticos (1/2 veces), usando genes marcadores. Consideremos ahora 3 genes. También se resuelve por la cruz de Holliday. Seguimos en Procariotas. Igual que antes, considero lineales bajo las mismas ABC/abc. Nick en cadena. una cadena entre A y B. Invasión dos dsDNA premisas. de Primer Intermediario. Branchpoint. Migración del Branchpoint. Segundo Intermediario. Heterodúplex. Nueva distribución de B. Se gira lo de abajo 180º. Cruz de Holliday. Tiene 2 resoluciones, N-S ó E-O. Cada una tiene 1/2 de probabilidades. Genética Molecular. Carlos F.R. Página 91 - El corte E-O forma un heterodúplex que no tiene nuevas combinaciones de alelos, es recombinante físico a secas. Sigue siendo ABC/abc. “Apedazado”. - El corte N-S forma un heterodúplex que aparte de recombinante físico, es recombinante génico porque tiene nuevas combinaciones de alelos respecto al parental. Es ABc/abC. “Empalmado”. La conversión génica es consecuencia de la recombinación física (entrecruzamiento) que forma regiones heterodúplex. Inmediatamente se da la reparación…o no. Consideremos el gen B en el ejemplo anterior. Evidentemente se trata de un dsDNA. El gen B tiene dos alelos B: b: Cuando llegamos al heterodúplex final, producto del corte N-S, tenemos que: Éste pequeño error genera problemas de apareamiento, debe repararse (o no). Considero que: - No repara ninguno de los dos dsDNA se queda así. - Repara uno de los 2 dsDNA - Repara a los dos dsDNA, lo más frecuente. Dependiendo de cual de las dos bases se repare, tendremos uno u otro alelo. ½ de que se repare 1 de las dos cadenas de 1 dsDNA X ½ que se repare una de las 2 cadenas del otro dsDNA = 1/4. Hay 4 combinaciones posibles: ¼ bb, ¼ bB, ¼ Bb, ¼ BB. Genética Molecular. Carlos F.R. ½ de que sea . Puede reparar la TC (½) y hacer alelo “b”, o la GA (½)y hacer alelo “B” ½ de que repare . Puede reparar la AG (½) y hacer alelo “b”, o la CT (½) y hacer alelo “B”. Página 92 En Eucariotas, la meiosis implica siempre entrecruzamientos (recombinación física). Si no sale recombinante genético, se llama heterodúplex parental. Si sale recombinante génico, se llama heterodúplex recombinante, que puede ser en región no codificante (poco importante a nivel de expresión del gen) ó en región codificante: se da la conversión génica, la cual puede reparar ninguna, una o ambdas cadenas de dsDNA. Es decir, se calculan las proporciones igual que antes. Esto se demostró en Neurospora (hongo Eucariota, ascomiceto, ciclo haplodiplonte, mitosis post-meiótica que duplica las células después de hacer meiosis, era 2n antes de hacer meiosis). No mantenía proporciones de herencia mendeliana de un gen porque hay recombinación que puede o no repararse. Se demuestra partiendo de un individuo 2n heterocigoto para B (Bb de genotipo). Se resuelve igual que el ejemplo con el gen B de antes. Recordar que una vez que se ha terminado la meiosis, las células n hacen mitosis. Volviendo a Procariotas, el modelo de la cruz de Holliday se puede aplicar a dsDNA circular también. De nuevo, las cadenas deben estar en la misma polaridad (se indica con + ó -). Resolución con Corte E-O: endonucleasa corta por fuera y ligasa une. Recombinante no génico. Cambia orden de alelos en 1 plasmidio. Endonucleasa corta en lugar específico de recombinación entre A y B. Hace un Nick en cada dsDNA. Cuando invade una cadena el otro DNA, se forma la Cruz de Holliday (con el branchpoint). Genética Molecular. Carlos F.R. Se gira la parte de abajo. Primer intermediario Resolución con Corte N-S: endonucleasa talla por dentro, ligasa une y se forma el 2º intermediario el COINTEGRANTE. Página 93 El Cointegrante no es el final de la resolución N-S. Tiene secuencias diana de enzimas específicas que son reconocidas por nucleasas. Siempre, los intermediarios requieren una resolución. El cointegrante se resuelve generando circulares que son recombinantes genétivos dos dsDNA La cruz de Holliday siempre aparece en Procariotas cuando hay recombinación Homóloga. Reúne una serie de características: - Primero se sinapsan los dsDNA (se juntan mucho uno con otro), y después se cortan. - Se hace un corte en una sola cadena (Nick) en cada dsDNA. - Los heterodúplex que se generan son 100% recíprocos. Supongamos que tenemos dos dsDNA lineales homólogos que van hacen recomb. homóloga. Los dos brazos cortos de la cruz y los dos brazos largos de la cruz tienen la misma longitud, y si sumamos la longitud en pb de un brazo corto y un brazo largo, obtenemos la longitud de la molécula original de dsDNA: porque son RECÍPROCOS (todo lo que lo que le falta a uno de los dos dsDNA, lo tiene el otro). Los Eucariotas también hacen Recombinación Homóloga y generan DNA heterodúplex, pero no es válido el modelo de la cruz de Holliday porque los Eucariotas… - Primero cortan y después sinapsan los homólogos. - El corte que hacen es un corte de doble cadena, se corta un dsDNA. - No tienen porqué hacer un heterodúplex 100% recíproco. Los Eucariotas siguen el modelo de Szöstack (=DSB), no de Holliday. Genética Molecular. Carlos F.R. Página 94 TEMA 14: RECOMBINACIÓN GENERAL: MECANISMO ENZIMÁTICO. La recombinación General sucede, realmente (o eso creemos), por el modelo de Meselson-Radding en el que se resuelve la cruz de Holliday. En Procariotas, la Recombinación General (la principal consecuencia de la Recombinación Homóloga) tiene 3 grandes etapas en las cuales se resuelve la cruz de Holliday: 1. Iniciación: Se rompe el dsDNA y se generan extremos de ssDNA. Lo hace RecBCD. 2. Invasión: Se cambia de cadena, la cadena de ssDNA va a aparearse con la complementaria de la otra molécula de DNA. Lo hace RecA. 3. Desplazamiento y Resolución: Migra el branchpoint, gira 180º y se corta. Lo hace RuvABC. 1. Iniciación. Lo inicia todo RecBCD. Es un heterotrímero formado por: - B: helicasa lenta basal en 3’5’, endonucleasa 3’5’ basal y endonucleasa 5’3’ críptica. - C: Función poco clara. ¿Reconoce secuencia χ? - D: ATP’asa dependiente de ssDNA, helicasa rápida en 5’3’ críptica. Se comienza uniendo RecBCD a 1 de los extremos romos de uno de los 2 dsDNA. Se situa, según el dibujo, en la cadena de arriba. La orientación de la molécula sigue el consenso. Actúa RecB como helicasa lenta en 3’5’, sobre la cadena de arriba, separándola de la de abajo. Mientras, va haciendo de endonucleasa 3’5’ dejando trozos de ssDNA que se van. También se va usando la endonucleasa para la cadena de abajo, pero muy poco. Va avanzando hasta que RecC detecta la secuencia χ en la cadena de arriba. La secuencia χ sólo es la cadena de arriba, y se lee en 3’5’. Es un hot-spot de recombinación. Una vez leída la secuencia χ, se inactiva la helicasa lenta 3’5’ de RecB y cambia su nucleasa 3’5’ por la nucleasa 5’3’ críptica. Se activa la helicasa 5’3’ empieza a hacer cosas ahora. Genética Molecular. Carlos F.R. rápida de RecD, la cual Página 95 Ahora se degrada la cadena de abajo porque las actividades enzimáticas así lo permiten. El extremo de ssDNA con χ en el extremo no se degrada, porque se ha bloqueado esa actividad enzimática 3’5’. Se degrada un trocito más de la de abajo, para definir bien el fragmento de ssDNA protuberante con χ en el extremo. RecBCD no se separa aún. Ahora, se unen las SSBP y RecA al ssDNA. Se unen por todo. En principio, la afinidad de SSBP por el ssDNA es algo mayor que la afinidad de RecA por el ssDNA. Se soluciona gracias a que cuando RecA se une al ssDNA y toca a RecBCD, su afinidad por el ssDNA se vuelve mucho mayor, y empieza a cargarse sobre el ssDNA en 5’3’ desplazando a las SSBP. Sólo se carga RecA sobre el fragmento de ssDNA con χ en el extremo, porque es en esa cadena a la que se había unido RecBCD. Según éstos dibujos, el extremo con ssDNA y la secuencia χ envuelto en RecA sería el que presenta el 3’ invasor. Esto no tiene porque ser así siempre, RecA se unirá siempre al que aporte el ssDNA, tenga el 3’ o el 5’ libre. Los sustitutos de RecBCD en caso de que éste falle son: - RecJ (para la nucleasa) y RecQ (para la helicasa 3’5’ lenta) sustituyen a RecB. - RecC no tiene sustituto, los mutantes RecC- tienen menos capacidad de reconocer a χ. - RecQ también tiene helicasa 5’3’ rápida, que sustituye la de RecD. 2. Invasión. RecA cataliza el intercambio de pareja. Se descubrió mezclando, en una proveta, RecA + ATP + SSBP + (ssDNA circular + dsDNA linealmodelo de las 3 cadenas) ó (dsDNA circular con Gap + dsDNA lineal modelo de las 4 cadenas) ó (dsDNA circular + ssDNA lineald-loop). SON MODELOS QUE SE HAN DEDUCIDO IN-VITRO. - Modelo de las 3 cadenas: RecA (bolitas) se carga sobre el ssDNA acceptor polimerizando en dirección 5’3’. Es la única cosa que se mueve. La tracción que genera hace que la molécula de ssDNA gire en 5’3’ como indica la flecha curvada, y mientras gira, se va Genética Molecular. Carlos F.R. Página 96 uniendo a la cadena de DNA complementaria que aporta el 3’ libre: la invasora. Ésta se mueve en 3’5’. Finalmente queda dsDNA con un Nick (no había ligasa) y ssDNA. - Modelo de las 4 cadenas: RecA se une a la zona de ssDNA que hay en el Gap del dsDNA. RecA polimeriza en 5’3’ sobre la aceptora haciendo tracción, por lo que ésta gira como indica la flecha curva (en 5’3’) mientras se va uniendo a la cadena invasora que aporta un 3’ libre, la cual se mueve en 3’5’. Obsérvese la cruz. Finalmente queda un dsDNA circular con un Nick porque no había ligasa y un dsDNA lineal con Gap en los extremos. Cada uno de los dsDNA tiene una de las dos cadenas que pertenecía al otro, es decir, son dos HETERODÚPLEX. - Modelo d-loop: RecA se carga sobre el ssDNA en 5’3’ como siempre, pero en éste caso, es también el DNA invasor (porque aportará el 3’). Así, cuando se introduce en el dsDNA para unirse a la complementaria, desplaza a la cadena exterior sin romperla. La cadena de ssDNA que tenía RecA (la invasora en éste caso Genética Molecular. Carlos F.R. Página 97 porque aporta un 3’) se mueve en 3’5’, desplazándose como indica su flecha debido a la tracción de RecA, mientras que la aceptora va girando en 5’3’ por la tracción, como indica la flecha curva. Obsérvese la cruz. Finalmente se extrusiona la cadena de DNA exterior intacta, y queda un dsDNA circular con Nick. Los fragmentos a unir tenían en los 3 casos, regiones homólogas de unos 50nt, o con diferencias de bases mínimas. Si no las tuvieran, no podrían hibridar por complementariedad (porque por eso se unen). Lo que los 3 modelos comparten es que la proteína RecA (p.m. de 38 KDa) se une al ssDNA con mucha afinidad, SIEMPRE. El DNA invasor ha de aportar SIEMPRE un 3’OH libre, y “girará” en 3’5’. El receptor “girará”, por tanto, en 5’3’ (a veces coincide que el invasor con el 3’ es de ssDNA, será él quien tiene a RecA por ser de ssDNA). Los DNA “giran” porque RecA hace tracción, es lo único que se mueve. In-vivo, RecA se une al ssDNA formando un nucleofilamento = filamento presináptico. El ssDNA al que se une puede ser un fragmento tal cual de ssDNA, un gap en un dsDNA o un extremo protuberante del dsDNA. Debe haber una homología de mínimo unos invasor que incluye el 3’ y el aceptor. 50nt entre el RecA se carga sobre el ssDNA, en el centro, polimerizando en 5’3’ de manera helicoidal, para formar el nucleofilamento. Cada vuelta de RecA son 6 monómeros, y ello ocupa unas 19 bases. También se ha visto que se carga en 3’5’, pero tan lenta que es despreciable. RecA estira al filamento, lo pone rígido, recubriéndolo hasta el Genética Molecular. Carlos F.R. Página 98 extremo. Se ha visto también que si se trata de recubrir un gap en un dsDNA, RecA puede pasarse un poco cuando recubre el ssDNA y llegar a ponerse sobre el dsDNA. Por afinidad, llega a desplazar a SSBP. Los monómeros que salen por un extremo pueden entrar por el otro, haciendo “treadmilling” (intercambio rotatorio). Funcionamiento de RecA (consideremos un ssDNA de un extremo protuberante 3’ que será invasor y un dsDNA circular que será invadido). - Se forma el nucleofilamento (ssDNA + RecA) polimerizando RecA en 5’3’. - El nucleofilamento captura al dsDNA en principio en cualquier zona. - Los dos DNA giran uno respecto al otro hasta que las regiones homólogas quedan sinapsadas. RecA debe tener ATP para hacer esto, aunque aún no lo hidroliza. - RecA cataliza la desnaturalización del dsDNA (es helicasa, aunque sigue sin hidrolizar el ATP) formando una “burbuja” y une el nucleofilamento (el 3’ invasor) al DNA invadido (el dsDNA circular). - Se forma un branchpoint que va migrando debido a que RecA hace tracción sobre las cadenas de DNA. Sigue usando su actividaa helicasa. Al unir un DNA con el otro de la otra molécula, forma los heterodúplex. Para hacer los puentes de H2 entre las bases, hidroliza el ATP. Las bases se unen porque son complementarias (han de estar en regiones homólogas, si hay alguna base de diferenteconversión génica). El dominio de intercambio de las cadenas de RecA puede formar una triple hélice (ssDNA + dsDNA) o una cuádruple hélice (dsDNA + dsDNA), según. RecA se une físicamente a las cadenas que han de intercambiarse, las toca. Como por Genética Molecular. Carlos F.R. Página 99 el otro lado puede tener la complementaria (puede ser un dsDNA), puede haber triples y cuádruples hélices. Sólo dentro de RecA, momentáneamente. No son los típicos enlaces de Watson y Crick. RecA aparea unos 100nt, después se va y entra RuvBCD. NO TIENE NINGÚN SUSTITUTO, los mutantes de RecA no pueden recombinar. Se venden mutantes RecA- para que no recombinen de manera imprevista si se hacen otros experimentos. 3. Desplazamiento y Resolución. Lo hace RuvABC. Es un complejo multienzimático. Actúa cuando RecA ha unido 100 nt. - RuvA: Tetrámero que reconoce la estructura de la cruz de Holliday y se une con un monómero en cada parte. Tiene un pequeño centro catalítico. - RuvB: Dímero, cada uno de sus 2 monómeros tiene 6 subunidades. Cada monómero se une a un dsDNA que recombina. Es una helicasa dependiente de ATP. Cuando se une a RuvA (y forma RuvAB), desnaturaliza las cadenas de dsDNA y permite que se siga formando el heterodúplex mediante la migración del branchpoint. - RuvC: Es una endonucleasa de ssDNA. Se ponen dos monómeros en cada uno de los dos ssDNA del branchpoint. Tiene un hot-spot de corte, 5’-ATTG-3’. Hace 2 cortes en total. También es la encargada de hacer girar 180º la parte de debajo de la cruz de Holliday. No se sabe si para que entre RuvC ha de salir RuvAB. RuvC puede hacer esos 2 cortes de dos formas diferentes, con ½ de probabilidad cada una: el corte N-S ó el corte E-O. Hay un sistema alternativo de Migración y Resolución, suponiendo que RuvABC falle: RecG (unión a la cruz, Genética Molecular. Carlos F.R. Página 100 helicasa y ATP’asa, sustituye a RuvAB) y RusA (endonucleasa de ssDNA,, sustituye a RuvC) juntas equivalen a RuvABC. Si en un tubo de ensayo mezclamos el intermediario primario y… - RecG + RusA migración y resolución. - RusA el branchpoint se corta justo donde ha salido RecA, a 100nt. Apenas hay formación de un heterodúplex significativo. - RecG El branchpoint migra y cuando llega al final, se para y vuelve hacia atrás desnaturalizando al heterodúplex y dejándolo todo como estaba al principio antes de recombinar. Deja los dsDNA originales separados, sin unirse por el branchpoint porque aún no se ha formado el enlace fosfodiéster que falta en el punto de invasión, donde entraba RecA. No recombina de ninguna manera pero conserva la integridad de los dsDNA. RESÚMEN RECOMBINACIÓN HOMÓLOGA EN PROCARIOTAS,SEGÚN EL MODELO DE MESELSON-RADDING, QUE INCLUYE LA CRUZ DE HOLLIDAY: En Eucariotas, ésto no es válido porque los Eucariotas: - Primero cortan el dsDNA y luego sinapsan. - Sólo se corta uno de los dos dsDNA. - La reciprocidad no es obligatoria. De éstas 3 premisas parte el modelo de Szöstack (=DSB ó Double Strand Breaks) para explicar cómo los Eucariotas hacen Recombinación Homóloga sin la cruz de Holliday. Se estudió en S.cerevisiae. Genética Molecular. Carlos F.R. Página 101 Modelo DSB ó de Szöstack. Poco claro. Hay que entender las generalidades y el funcionamiento de los enzimas del principio, las homologías… DNA duplicado. Los extremos se ponen iguales el uno respecto al otro. SPO11 es un homodímero con actividad endonucleasa de ssDNA. Corta las dos cadenas en el mismo dsDNA. Cada subunidad tiene una Tyr (con grupo OH), que se une momentáneamente al 5’P. No tiene secuencia diana específica. La recombinación es aleatoria. Una vez que SPO11 se une al 5’P, viene el complejo MRX (MREII+Rad50+XRSII), se une a SPO11 y hace que se vaya. Se activa la endonucleasa 5’3’ de MRX y deja extremos 3’ protuberantes. Se va al acabar. Entra DMC1+Rad51. Rad51 es la homóloga de RecA en Eucariotas. Se unen ambas a los ssDNA formando 2 nucleofilamentos (que también aportan el 3’ libre), de los cuales sólo uno será invasor. Específicamente, en meiosis hay DMC1+Rad51, y en mitosis sólo Rad51. Sucede que “baja” uno de los dos nucleofilamentos, es complementario con el que se aparea. A la vez, el DNA que ocupaba la región en la que ahora está el DNA invasor, “sube” y se une al otro nucleofilamento que no se ha movido. Es el Primer entrecruzamiento (ver ultimo dibujo). Ahora entra la DNA Polimerasa Eucariota δ-ξ y sintetiza DNA, aprovechando el 3’ del nucleofilamento invasor (va empujando mientras sintetiza al DNA con el que se topa, para que “suba”) y a la vez, se sintetiza DNA en el 3’ libre que hay en la cadena de “arriba”, desde el 3’ del nucleofilamento no invasor. Genética Molecular. Carlos F.R. Página 102 Debido a que la DNA Polimerasa está empujando al DNA de “abajo” para que “suba”, llega un momento que de tanto subir, se toca con el 5’ complementario al nucleofilamento no invasor. Entonces, éste 5’ “baja” y se une al 3’ del extremo que se está sintetizando abajo. Se forma así el Segundo entrecruzamiento. Por tanto, CONCLUSIONES: -La recombinación está acoplada a la replic. -Las polimerasas al empujar, hacen migrar los puntos de entrecruzamiento. -Se sintetiza DNA a partir del 3’ que aporta una cadena del homólogo y a partir del 3’ del nucleofilam. no invasor. -Hay un 5’ invasor sin Rad51 y un 3’ invasor con Rad51. -Se forman 2 heterodúp. “abajo” y uno “arriba”. El heterodúp. es, por definición, DNA de cromosomas diferentes, no se forma con el fragmento sintetizado por la polimerasa. -NO SON ENTRECRUZAM. RECÍPROCOS, NO TIENEN PORQUÉ. -La homóloga a RecA en humanos es Rad51. DMC1 se parece pero no lo es tanto, además Rad51 siempre está. -SPO11 es endonucleasa de ssDNA, corta los dos ssDNA del dsDNA en la misma posicióndeja extremos romos. Genética Molecular. Carlos F.R. Página 103 -MRX es exonucleasa 5’3’ que deja 3’ protuberantes. -Primero se corta, luego se sinapsan. Proteinas (que se sepa) que intervienen: Spo11, MRX (Mre11/Rad50/Xrs2), Rad52, Rad51, Rad54, Rad55, Rad57, Rad59, Rdh54/Tid1, Dmc1, Red1, Hop1, Trd1/Rdh54, Sac3, Msh4/Msh5, Endo – X1, Endo – X2... Éste mecanismo se da en la meiosis, pero sucede algo muy parecido en la recombinación ilegítima y en algún tipo de reparación. RECOMBINACIÓN-REPLICACIÓN-REPARACIÓN: CONJUNTO FUNCIONAL Genética Molecular. Carlos F.R. Página 104 TEMA 15: RECOMBINACIÓN DE SITIO ESPECÍFICO. Suceso de recombinación independiente de RecA, consideramos dos secuencias de nt de dsDNA. Se les llama “cajas de homología”: son secuencias homólogas pero NO se da recombinación homóloga (no RecA porque la secuencia es demasiado corta, y es independiente de la replicación). Pueden estar en el mismo dsDNA o en distintos dsDNA. Son pequeñas secuencias de unos 10-15 nt cada una, por tener las mismas bases: pueden recombinar. Para que recombinen, han de superponerse una a la otra y el sentido de las secuencias ha de ser igual. La orientación se indica con flechas. Cuando recombinan, un trozo de la caja de homología queda en un dsDNA y el otro trozo se va al otro dsDNA. Así, después de recombinar, cada caja de homología tiene aproximadamente la mitad de bases suya original y la otra mitad, de la otra caja. Después de recombinar siguen estando en la misma orientación. Si las 2 cajas de homología están sobre un mismo DNA, se trata de recombinación intramolecular. Pueden estar: - Misma orientación = repetición directa al recombinar se escinde el fragmento intermedio. Se dobla el DNA. Queda una caja de Homología en cada dsDNA. - Orientación opuesta = repetición invertida al recombinar se invierte el fragmento intermedio. Quedan las dos cajas sobre el dsDNA y en la misma orientación. Los enzimas que actúan son Recombinasas (recA también era una recombinasa). Son: - Recombinación intramolecular: Si están en repetición invertida, actúa la Invertasa (Inv). Si están en repetición directa, puede actuar la Escisionasa (Xis, no corta, es estructural) o la Resolvasa (Res, si es un intermediario que requiere resolución, sólo en los transposones). Genética Molecular. Carlos F.R. Página 105 - Recombinación intermolecular: lo cataliza la Integrasa (Int, fusiona dos moléculas de dsDNA diferentes, cada una de las cuales tiene una caja de homología). Caso1: Repetición Directa: El fago λ. Hace recombinaciones de sitio específico para integrarse y escindirse del genoma del huésped (ver Tema 2). Leyenda: att (attachment=sujeción) P= phage Son las cajas de homología. B= bacteria El DNA libre del fago se integra, L= left y el virus integrado se escinde. R= right Integración: Es una recombinación de sitio específico intermolecular. Lo protagoniza la Int de λ (la codifica él). Cuando λ hace el ciclo lisogénico, siempre se integra en el mismo sitio del cromosoma de E.Coli: entre los Operones Gal y Bio. La escisión permitirá el paso de lisogenia a lisis. En ambos casos, tanto en integración como en escisión, quien actúa es la Int. La Xis es estructural, y a elevadas [ ] bloquea a la Int. Composición de las secuencias: La reacción es dirigida por el fago, así que la secuencia attP del fago es la más larga siempre (porque ella lo dirige). Las cajas de homología son el “core O”, de 15pb siempre, han de ser iguales en virus y bacteria para que se integre y encontrarse en repetición directa. Genética Molecular. Carlos F.R. Página 106 La Int cataliza la integración, la codifica λ. También es necesaria la proteína IHF (integration Host Factor) que viene de E.Coli, la cual dobla el DNA y permite que entren las otras. La Int de λ es muy parecida a las Res de los transposones, que también hace Recombinación de Sitio Específico, pero éstas últimas actúan resolviendo intermediarios de transposición. Características diferenciales de la Int: - El AA activo es una Tyr. - Se requieren 4 Int que hacen 4 cortes secuenciales (2 cortes que cruzan dos cadenas, otros 2 cortes para las otras dos cadenas). - Dejan un 5’OH y un 3’P que se une al -OH de la Tyr. La formación del “Intasoma” es el proceso en el que se organizan en el espacio alineándose en repetición directa las dianas attP y attB juntamente con 4 moléculas de Int y una de IHF, para recombinar e integrarse: - Primero se forma el core proteico con 4 Int + 1 IHF. - El core proteico se une a attP enrollándolo. - Éste complejo se une a attB. El sitio attP tiene (no se indicaba arriba): Detalle del proceso molecular de integración: - Se unen 2 Int al attP y 2 Int al attB. - Corta, en el dsDNA de attP, dejando un Nick en la cadena de arriba. A la vez, corta en el dsDNA de attB dejando un Nick en la cadena de abajo. Son los cortes secuenciales. Ha hecho 2. - Los extremos que deja son 3’P y 5’OH. Su AA activo, una Tyr, se une por su grupo OH al 3’P. - Así se mueve del 3’P de “arriba” al 5’OH de abajo formando un entrecruzamiento. Lo mismo para el otro extremo libre que vendrá de “abajo” a “arriba”. No depende de ATP. - Ahora, hace lo mismo con las otras dos cadenas que aún no había cortado. Genética Molecular. Carlos F.R. Página 107 En el proceso se llega a formar una verdadera cruz de Holliday. Son reversibles. Escisión: Se trata de otra recombinación de sitio específico, pero es intramolecular. Requiere la Int (siempre corta) y la Xis (estructural). IHF podría unirse a alguna diana del att correspondiente, pero NUNCA interviene en la reacción. Requiere que el dsDNA de E.Coli que tenía las secuencias en repetición directa se doble (ver esquema página siguiente). Sentido: Si Xis no estuviera, sería un bucle constante de integración escición, no fucionaría nada. Xis lo regula. IHF puede unirse a una caja durante la escisión, pero nunca actúa, gracias a que la Xis lo impide. Genética Molecular. Carlos F.R. Página 108 ESCISIÓN. Entran Int y Xis. Puede entrar IHF pero NUNCA actuar. Integración Entran Int e IHF. La Xis inhibe a la Int Caso2: Repetición Invertida: Salmonella. La Salmonella tiene flagelina en el flagelo, una proteína muy antigénica que desencadena una respuesta inmune intensa. Pero si alguna sobrevive a eso, se multiplica y su flagelina ya no es reconocida por los mismos anticuerpos originales. Sucede porque pueden codificarla diferentes Genética Molecular. Carlos F.R. Página 109 genes. Puede venir del gen H1 ó H2. Sólo hace falta uno de los dos para que haya flagelina. En principio, se expresan los dos Promotores a la vez. Hay H1, H2 y H1R. Pero ésta situación acaba inmediatamente, porque H1R es represor del Promotor de H1. Así no hay H1, hay H2. Si queremos la H1, tenemos que transcribir el gen HIN (activación¿estrés? ). HIN codifica para una recombinasa llamada Invertasa (Inv). Inv reconoce a las secuencias HIX-L y HIX-R, que están en repetición invertida. Las pone cara a cara, haciendo que en el DNA se forme una protuberancia. Cuando se han dado la vuelta por la inversión, el Promotor de H2 queda mirando hacia fuera y no se puede transcribir ni H2 ni el represor H1R. Así, sin el represor y gracias a la Inv, se puede expresar la “nueva” flagelina H1. Se trata de una Recombinación de Sitio Específico Intramolecular con secuencias de repetición Invertida. El gen de la Inv también se da la vuelta porque queda entre las secuencias invertidas (no se ve en el dibujo con fondo negro) pero no le afecta. Genética Molecular. Carlos F.R. Página 110 TEMA 16: TRANSPOSICIÓN PROCARIOTA. Un Transposón (=Tn) es un fragmento de material genético que se mueve en el citoplasma de la célula, sin ningún tipo de restricción. Se encontraron en maíz. Pueden moverse gracias a la Transposasa (Tnp=Tra). Los transposones de Procariotas consideramos que todos son de DNA. Los transposones Eucariotas pueden ser de DNA ó de RNA (ver Temas 17 y 19). Una de las cosas más importantes en los transposones son las secuencias de bases de los extremos. Si hay mutaciones en ellas, no pueden transponerse y son defectivos. La mayoría lo son, pero consideremos que no, que funcionan bien porque tienen bien las secuencias de los extremos. En Procariotas (todos DNA) Elemento IS (exclusivo) Elemento IS estricto -Sólo -En transposones Compuestos Módulo IS. Nunca solo, siempre en los Complejos. Transposones Compuestos -Tn5 -Tn10 Complejos Tn3 Los elementos IS. Sólo en Procariotas. - Elemento IS estricto: Es lo más simple que transpone. Tiene lo esencial para ello: el gen de la transposasa flanqueado por 2 secuencias Invertidas y Repetidas (IRS = IR = ITR). Se puede encontrar sólo (raro, flanqueado por secuencias DR en repetición directa que no se pintan aquí) o formando parte de los extremos de un transposón compuesto (por un lado tendrá la DR y por el otro, la secuencia del Compuesto). - Módulo IS: No tiene vida propia, nunca está sólo, siempre forma parte de los transposones complejos. Simplemente es un elemento IS con más cosas aparte de la Transposasa, con sus secuencias IR (IRS = ITR) que, a su vez, tienen en sus extremos más exteriores secuencias en repetición directa (DR = DRS) SIEMPRE. Éstas DR son las secuencias del huésped (escojida “al azar”) que se han duplicado, dentro de las cuales se Genética Molecular. Carlos F.R. Página 111 inserta el transposón. Se transpone (=mueve) de manera diferente al IS estricto. Si encontramos genético. ésto en un genoma, es un fósil El gen de la Tnp codifica para la Transposasa, una endonucleasa. Es un heterodímero formado por una subunidad de unión al DNA y una subunidad catalítica que corta (¡tanto en Procariotas como en Eucariotas!). Corta a ambos lados del transposón (entre la IRS y la DR) y lo hace “saltar” del lugar donde está. Le ha dejado extremos romos. Después, corta al azar una secuencia en el genoma del huésped, dejando unos extremos protuberantes. Dentro se pone el transposón, unido únicamente por los “enlaces fosfodiéster” (se basan en ataques nucleofílicos)a esos extremos protuberantes del genoma. Así quedan “gaps” a ambos lados del transposón con ssDNA. Viene la DNA polimerasa Procariota y los rellena los dos en 5’3’. Con ello, se duplica la diana del huésped. Así se forman las secuencias en repetición directa que flanquean a todos los transposones. Ésto corresponde a la transposición no-replicativa, una de las 3 maneras que tienen los transposones de transponer. La diana se duplica siempre, se mueva como se mueva. La Transposasa viene codificada por el propio transposón. Hay varios tipos de elementos IS, y cada tipo de IS codifica para una transposasa, la cual reconoce secuencias en el huésped de una determinada longitud pero de composición de nt aleatoria (se dice por ello que corta al azar en cuanto a secuencia, pero en cuanto a longitud, cada tipo de transposasa corta secuencias de una longitud deterinada). La frecuencia de transposición es de 10-3 – 10-4 divisiones. Se cree que cada IS puede tener hasta 10 copias por célula. Ya que se insertan al azar, 10-5 – 10-7 causa mutación Genética Molecular. Carlos F.R. Página 112 porque cae dentro de un gen o una región reguladora. La transposición está controlada por el propio transposón, ya que si transpone y cae donde no toca, mata al huésped el transposón se comporta como un parásito. Transposones Compuestos. Estudiaremos a Tn5 y Tn10. Son regiones grandes de DNA que se mueven como un solo bloque(si hubiera 1 mutación en 1 IRS del IS, se movería sólo el otro IS). Siempre tiene 2 elementos IS que flanquean un gen de, por ejemplo, resistencia a un antibiótico. La orientación de los promotores de la transposasa en el IS puede ser igual en los 2 o diferente (se dice que estan en repetición directa o invertida uno respecto al otro según esté el promotor de la transposasa). Puede haber uno de los dos IS que no codifique para una transposasa funcional, ya que si basta una sola transposasa, es redundante que haya los dos IS haciendo transposasa. De hecho, lo más frecuente es que un IS haga transposasa y el otro haga una transposasa no funcional o no haga transposasa (hay algún transposón compuesto que tiene sus dos IS que hacen tranposasa funcional: Tn9). Siempre tienen la DR del huésped flanqueándolos, porque se mueven por transposición no replicativa. Transposones Complejos. Son la familia de ejemplo, Tn3. Su principal diferencia es secuencia IR (=ITR) en los extremos en lugar IS. La transposasa la codifican en la región a otras cosas. Estructura de Tn3: los TnA, por que tienen la de un elemento central, junto Regulación de la transposición. El transposón se comporta como un parásito intracelular, que si mata al huésped, muere él también. La transposición es una herramienta de mutagénesis elevada, ya que puede ir a parar a secuencias Genética Molecular. Carlos F.R. Página 113 reguladoras o codificantes. Por ello puede silenciar genes, recombinar, hacer deleciones… A pesar de ello, están seleccionados a favor porque incrementan la variabilidad, y han ido evolucionando disminuyendo el número de copias y la tasa de transposición. - Tn5. Es un transposón compuesto. IS50-L es no funcional porque tiene 1nt diferente en el gen de la transposasa. Éste único nt de diferencia causa un codón STOP prematuro de su transposasa. Pero también, ese nt determina que se forme el promotor del gen de resistencia al antibiótico (kanamicina ó neomicina). Si no hubiera esa mutación, no habría resistencia a antibiótico y se formarían dos mRNA complementarios (por venir de promotores en dirección opuesta) que hibridarían y formarían un dsRNA que no se traduceno habría transposasa. IS50-R es funcional. Su mRNA tiene 2 AUG (ORF, ver Tema 7): uno que codifica para la transposasa, es el primer AUG, hace proteína larga. El segundo AUG está más adentro y codifica proteína corta represora de la transposasa. Éste represor, se cree que puede unirse directamente a la transposasa funcional y bloquear su dominio de unión al DNA, o bien unirse a la diana de la transposasa en el transposón y bloquear que entre, entorpeciéndola. - Tn10: Transposón compuesto también. Regula su transposición mediante 3 mecanismos de control. Consideramos que IS10L no es funcional. 1) mRNA: Dentro de IS10R hay 2 promotores que hacen dos mRNA en direcciones opuestas, solapando parcialmente. Genética Molecular. Carlos F.R. Página 114 El promotor in (Pin) apunta hacia dentro, codifica para una proteína larga, la transposasa. El promotor out (Pout) apunta hacia fuera, codifica para un mRNA corto no codificante. Resulta que los 36 primeros nt de ambos mRNA son complementarios, se pueden hibridar los dos mRNA por el extremo 5’. Así, no se traduce la transposasa. El mRNA de Pout tiene 100 veces más afinidad por el mRNA de Pin que el ribosoma. También tiene más afinidad por el mRNA de Pin que la RNA polimerasa por Pin. Además es más estable. Si la [ ] de mRNA de Pout es 5 veces mayor que la de mRNA de Pin, entonces se unen. Si es igual o menor a 5 veces, no se unen porque está más disuelto en el citosol, y hay transposasa porque no se bloquea el mRNA de Pin. 2) La transposasa: Supongamos que la [ ] de mRNA de Pout es menor a 5, entonces se traduce el mRNA de Pin y hay transposasa. La transposasa Procariota actúa en CIS: sólo corta a su propio transposón Tn10. No sucede así en Eucariotas. Ello determina que se incremente de manera lineal la transposición (1 transposón 1 transposasa, 2 transposones 2 transposasas, etc), si no fuera así, todos cortarían a todos y sería un incremento exponencial de tranposición (¡malo!). 3) La metilación: Un tranposón sólo puede transponer si está hemimetilado o no metilado. Ello sólo sucede justo cuando ha acabado la replicación, que hay DNA hemimetilado. Es entonces que la transposasa puede actuar y transponer, no en otro momento. Sentido: DNA hemimetiladoDNA nuevocélula jovencitosol con pocos radicales perjudiciales y toxinas, pocas nucleasas, puede enfrentarse mejor a los daños que podría hacer el transposónbuen momento para “saltar” y transponer (es como un parásito). Tipos de transposición: - Transposición no replicativa: el transposón se mueve, no se copia. Lo hacen IS estrictor, Tn compuestos. Es lo explicado al principio. No sabemos qué pasa con el DNA desde el cual “salta” el transposón: ¿reparadocómo? ¿letal?. Implica forzosamente la duplicación de la diana del huésped. - Transposición replicativa: Se transpone a la vez que se duplica el transposón. Queda en el sitio original y en la diana. Lo hacen los transposones complejos. - Transposición conservativa: Se transpone durante la replicación pero sin duplicarse. Se reparan siempre. Es propia de Eucariotas (ver Tema 17). Genética Molecular. Carlos F.R. Página 115 La transposición Replicativa de Tn3. Es un transposón complejo. Necesita la transposasa y la resolvasa, ya que se debe resolver un intermediario hay una recombinación de sitio específico. La región de resolución tiene 3 subregiones. Una de ellas es una caja de homología, concretamente, la subregión 1. Es la diana de la Resolvasa (TnpR), para resolver el intermediario de la transposición. La transposición replicativa se lleva a cabo por el modelo de Shappiro. Se parte de un DNA con Tn3 (el donador) que suele estar en un plasmidio (o no), y de un DNA sin Tn3 (el receptor) que suele ser el cromosoma bacteriano (o no). El Tn3 también está flanqueado por las secuencias DR del sitio receptor. Recordar que es un dsDNA. El modelo de Shappiro es así (ver página siguiente): Genética Molecular. Carlos F.R. Página 116 + La transposasa corta en el donador haciendo nicks (entre DR e ITR), dejando el Tn3 con 3’ libre (sin separar las dos cadenas),, en el receptor corta dejando 5’ protuberantes (de ssDNA). + Tn3 es de dsDNA. Se separan sus dos cadenas. Cada una de las dos cadenas que forman Tn3 tiene un extremo que finaliza con ITR y el 3’ (es como si fuera un extremo protuberante 3’). Así, siendo ssDNA separado, se va al receptor que está cortado y los 3’ libres del Tn3 se unen a los 5’ protuberantes del receptor por “un enlace fosfodiéster” ( en realidad es un ataque nucleofílico,, no se aparea ninguna base). Así, se unen el 3’ del ssDNA separado de Tn3 con el 5’ del ssDNA protuberante de la diana del receptor. Ahora actúa la DNA Polimerasa Procariota, la cual aprovecha los extremos 3’ libres que quedaban en el cromosoma bacteriano, y polimerizando en 5’3’ como indican las flechas discontinuas, sintetiza “arriba” un DNA complementario a la diana del receptor y al transposón; y “abajo” también: un DNA complementario a la diana del receptor y al transposón. Así se duplica la diana del receptor y se replica el transposón. Finalmente, la ligasa une los nicks que quedan. Llegados aquí, ésta figura en forma de “8” es el COINTEGRANTE. Es un intermediario, no producto final, y requiere resolución. Recordemos que dentro del Tn3 hay la región de resolución, cuya subregión 1 es diana de la Resolvasa. Ahora está duplicado el transposón, por tanto ya hay dos subregiones 1 (cajas de homología). Para que actúe la Resolvasa , se forma una estructura con 4 monómeros de resolvasa unidos a las 2 subregiones 1. También puede unirse a las otras regiones en forma de tetrámero, pero sólo corta en la 1. Genética Molecular. Carlos F.R. Recombina en Res y se une la región donadora con la donadora, y la receptora con la receptora, rompiéndose el cointegrante. Finalmente, quedan el DNA donador con el transposón y sus secuencias DR originales, y en el DNA receptor, está el transposón y las secuencias DR suyas, las cortadas al principio. El Tn3 final, en las 2 moléculas, es hírido de cadena (porque vienen de otro sitio, recombina) y 1/2 de cadena quimera (1/2 nuevo sintetizado y 1/2 antiguo). Página 117 En total, hay 12 monómeros de Res unidos a la región de resolución (4 en cada una de las 3 subregiones). Sólo cortan los de la subregión 1. Los otros 8 hacen función estructural. Los cortes que hace la Res para resolver el cointegrante: - Hay un monómero de Res en cada una de las 4 cadenas de DNA. Como son dos dsDNA, son 4 cadenas. - Los cortes que hace la resolvasa son concertados: 4 cortes a la vez, en cada una de las cadenas de DNA. - Deja extremos normales, 5’P y 3’OH. - La Serina es el AA activo de la Res, y se une por su grupo OH al 5’P momentáneamente. - Giran 180º arrastrando lo que llevan unido, hacia la molécula de DNA opuesta. Es el entrecruzamiento. R2 se cambia con R4 y R1 con R3 - Cuando se han intercambiado las cadenas, se suelta el 5’P del OH de la Ser de la Res. - La ligasa une los 5’P con los 3’OH de las moléculas y queda separado. Las recombinaciones de sitio específico: Integrasa de λ 1. Cortes secuenciales 2 a 2 2. 3’P-Int ,, 5’OH 3. AA activo: Tyr Genética Molecular. Carlos F.R. Resolvasa Cortes concertados 4 a la vez 3’OH ,, 5’P-Res AA activo: Ser Página 118 TEMA 17: TRANSPOSICIÓN EUCARIOTA. Puede ser por vía DNA (similar al Procariota, se estudia en el maíz y en Drosophila) ó por vía RNA (los retrotransposones, los retrovirus). Consideramos las panochas del maíz. La panocha es una infrutescencia. El grano de maíz es el fruto. Cada grano tiene un genoma independiente del grano de al lado. Los granos provienen de división mitótica de una célula original. Si durante el desarrollo de la panocha se da algún evento que propicia la pérdida de un alelo dominante, entonces los descendientes de ésa célula tendrán esa pérdida de alelo: si la pérdida del alelo sucede pronto en el desarrollo, muchas células(grano) de la panocha tendrán la pérdida. Si sucede tarde en el desarrollo de la panocha, entonces pocas células (grano) tendrán la pérdida. Ello se explicó por “movilizaciones” del DNA, ya que no cuadraba ninguna de las otras hipótesis conocidas. Lo propuso Barbara McClintock en los años 50 y apenas nadie se fijó en su trabajo. Pero acababa de descubrir los transposones Eucariotas. En el grano de maíz hay 4 loci con los que se estudió toda ésta teoría. Todos tienen un patrón de herencia mendeliano con relación de dominancia. El más importante es “C”. Tener el genotipo “C_” da un fenotipo lila, porque hay antocianinas. El genotipo “cc” da un color blanquecino, no hay antocianinas. Las mutaciones ocasionadas pueden mantenerse estables (no revierten) o inestables (revierten a normal). Así, el transposón es Autónomo cuando procude mutaciones inestables que pueden revertir a normal, ya que codifica para una transposasa funcional y si entra en una región del genoma, también puede salir, por si mismo puede transponer. Por contraposición, el transposón es No Autónomo si produce mutaciones estables que no revierten a normal, ya que codifica para una transposasa no funcional y si entra en una región, no puede salir de ella y queda allí estable(puede entrar porque previamente había uno Autónomo que lo ha movido, y podría salir si un autónomo lo mueve), por si mismo no puede transponer. La transposasa que codifica el Autónomo puede actuar sobre el propio autónomo que la codifica y también sobre otros tranposones no autónomos que no pueden producirla, es decir, la transposasa Eucariota actúa en TRANS.La transposasa la usan para saltar y para insertarse en la diana, a la cual corta generando como siempre la DR). Genética Molecular. Carlos F.R. Página 119 Las familias de transposones en el maíz son: - AC(autónomo)-DS (no autónomo). - SPM (autónomo)-dSPM (no autónomo). La familia AC-DS. Los AC (autónonos) tienen una secuencia más larga que los DS (no autónomos). El elemento AC es: Miden 4563 pb. Un elemento DS es igual, pero con deleciones en exones y algún intrón. Dependiendo del tipo faltan más o menos, pero siempre faltan (por eso es más corto). Debido a que falta siempre alguna región exónica, la transposasa es no funcional. CUANDO SE INSERTAN, SIEMPRE FLANQUEADOS POR LAS DR (NO SE PINTAN). Debido a que los AC tienen la misma secuencia IR que los DS, son reconocidos por la transposasa de AC. Cómo transponen: Es una transposición conservativa. No se copian los AC-DS por sí mismos, pero pueden copiarse durante la replicación. Sólo pueden transponer inmediatamente después de la replicación (porque el DNA está hemimetilado). Siempre hay reparación después de transponer. Los elementos AC-DS producen mutaciones en el fenotipo que son estables si DS entra en la célula (origen???) y cae en Genética Molecular. Carlos F.R. Página 120 un punto del genoma que rompe la pauta de lectura de un gen, por ejemplo del color ( fen. incoloro), o bien cae en una región no codificante (fen. color). Sea como sea, al ser un DS únicamente, no puede moverse y ahí se quedará, siendo un fenotipo estable. Causan mutaciones inestables (que revierten) si hay un AC (origen???) aparte del DS, el cual puede moverlo y hacer que caiga en región codificante o no codificante. Como puede moverse, la mutación puede revertir, generando fenotipos con manchas. Regulación poco conocida. Y siempre hay reparación del punto de escisión. La familia SPM-dSPM. También los no autónomos (dSPM) tienen secuencia más corta que los autónomos (SPM), pero algún autónomo puede tener secuencia corta también. ¿Cómo? Primero hay que considerar la estructura de un transposón “salvaje”: CUANDO SE INSERTAN, SIEMPRE FLANQUEADOS POR LAS DR (NO SE PINTAN). El salvaje codifica para una transposasa funcional, por tanto es SPM (autónomo). Todos los salvajes son autónomos. Pero los mutantes, algunos pierden trozos de los últimos exones y codifican para una transposasa no funcional, por tanto son no autónomos (dSPM). Otros mutantes pierden trozos del intron 1 que contienen una de las dos ORF (suele ser la ORF2). Ello da lugar a un autónomo porque aunque falte un trozo de intrón, los exones están todos bien, y ello da lugar a una transposasa funcional. Por tanto, algunos mutantes son dSPM (no autónomos) y otros son SPM (autónomos). Cómo transponen: También es una transposición conservativa con reparación del sitio de escisión. Debido a que el maíz es poliploide, a veces algún punto de escisión no se repara (porque hay muchos) y puede dar lugar a problemas de viabilidad aunque fuera mutación inestable. Genética Molecular. Carlos F.R. Página 121 Así se rompe la pauta de lectura del locus C y debería, en principio, quedar incoloro. Pero pueden pasar dos cosas que hacen que a veces si que haya “algo” color: a) No había SPM. Llega un dSPM (origen???) que con mala suerte cae dentro del gen C, y hace una mutación estable: color intermedio. Es intermedio porque cuando se transcribe a mRNA, se hace el Splicing de los intrones normales de C y también del tránscrito de dSPM, que se elimina casi todo como si fuera un intrón también. Ésto es un caso de PSEUDOSPLICING. Debido a que se elimina casi todo, quedan algunos nt (2-3 codones) de dSPM extra en el mRNA maduro, que no ocasionan un corrimiento de la pauta de lectura deleterio (porque son 2-3 codones extra). Así, la enzima del color codificada tiene algún AA extra que no estaba en la original, aparte de todos los AA normales, por eso su actividad se ve algo reducida y produce menos pigmento del normal. Grano de color INTERMEDIO. b) Había un SPM: Llega un dSPM (origen???) que con mala suerte cae dentro del gen C. Se produce un fenotipo “manchado” en el grano, se considera “null”, incoloro. Es una mutación inestable suprimida por el SPM. Sucede que la transposasa que codifica SPM se une, como siempre, a los extremos del transposón dSPM para cortarlo y hacer que salte. Entonces pueden suceder dos cosas dentro de un mismo grano: b.I.) La transposasa al estar unida a los extremos del dSPM, bloquea físicamente a la RNA Polimerasa cuando transcribe, no puede avanzar y salta. Aborto transcripcional, no hay color. b.II.) La transposasa tiene éxito y corta antes de que llegue la RNA Polimerasa a transcribir. Hay transcipción de Chay color. Ya que son cosas que pueden pasar dentro del mismo grano, hay fenotipo “a manchas”. No se considera color, se le llama “null” incoloro. Genética Molecular. Carlos F.R. Página 122 En Drosophila: se estudió la transposición mediante la disgénesis híbrida (híbridos estériles). Era debido a los “elementos P”. Moscas con el elemento P se llaman “P” y moscas salvajes (sin P) se llaman “M”. Son transposones Eucariotas de DNA. Un elemento P es así: Tiene varios lugares de Poliadenilación diferentes (no son el STOP del dibujo, aunque funcionalmente es indicativo), ya que sufre Splicing Alternativo (ver Tema 4) según el tejido. Por tanto, al tener diferente Splicing, hay diferente mRNA maduro que se poliadenilan en diferentes lugares. Su estructura es similar a Tn5: - El splicing Normal elimina todos los intrones, se da en células germinales. Codifica para la transposasa (proteína larga). - El splicing Alternativo deja el intrón 3 con un STOP prematuro, se da en los tejidos somáticos. Codifica para el represor de la transposasa (proteína corta). Hay dos hipótesis acerca de cómo funciona el represor de la transposasa: Puede ser una transposasa que no tiene el dominio catalítico, con lo cual se une al dsDNA pero no lo corta y bloquea la entrada de la transposasa normal. Tambien puede ser que el represor se una a monómeros de la transposasa bloqueando que se una al DNA. Existen muchos tipos de elementos P con diversas deleciones internas, similar a la variedad en el maíz. Explicación de la disgénesis híbrida: primero de todo hay que repasar la fecundación. La hembra hace un oocito (n) a partir de las células germinales, dentro del cual hay muchas sustancias de reserva (y otras cosas…) que se sintetizan en las células foliculares (somáticas). Cuando el oocito es fecundado, se vuelve óvulo, se fusionan los pronúcleos y se vuelve zigoto 2n. Se empieza a desarrollar el embrión. Genética Molecular. Carlos F.R. Página 123 Así, se pueden explicar los resultados de los cruces: - Hembra M X Macho M Control. La descendencia es toda fértil. - Hembra P X Macho P Descendencia toda fértil. Las células foliculares somáticas hacen el represor que va al citosol del óvulo y bloquea a la transposasa. Se fecunda. El represor siempre se une a la transposasa que hace el óvulo y a la que viene del espermatozoide. Se queda unida a ella para siempre, no deja que actúe. En las del polo animal quedan determinadas así, sin proliferar más. Las del polo vegetal por diferenciarse en somáticas hacen más represor por su cuenta, bloqueando toda la transposasa que pudiera quedar. - Hembra P X Macho M Descendencia toda fértil, por el mismo motivo. - Hembra M X Macho P Descendencia estéril. El ovulo que hace la hembra no tiene ni transposasa ni represor. El espermatozoide tiene transposasa. Al fecundarse, la transposasa nunca encuentra al represor ni en el óvulo ni en el zigoto. Al volverse embrión, en el polo vegetal se hace represor y se bloquea la transposasa, pero en el polo animal no se puede hacer represor y la transposasa que hay desorganiza el genoma de allí hijos estériles, y nietos inviables? Biología de los elementos P: Actualmente la mayoría de moscas son P, pero no siempre ha sido así, se estudió la transposasa en líneas muy antiguas conservadas y se vió que cuando más antiguas, menos elementos P. En Europa y Asia, todas eran M. En África y Sudamérica, muchas eran P. También se ha dado el salto entre especies de los elementos P, debido al Plasmodium (parásito) transmisión horizontal del DNA. Origen desconocido. Por crear limitaciones reproductivas, son un mecanismo de especiación y se seleccionan a favor. Los elementos P, actualmente, son la forma más común de introducir mutaciones estables en Drosophila. En 2 generaciones se puede fijar una mutación si se hacen los cruces correctos con la F1 y se tiene algo de suerte (por lo de las proporciones). Genética Molecular. Carlos F.R. Página 124 TEMA 18: BIOLOGÍA DE LOS RETROVIRUS. Los retrovirus tienen un funcionamiento muy similar al de los retrotransposones (transposones vía RNA, ver Tema 19). Afectan a aves, mamíferos… nunca Procariotas. Causan tumores o inmunodeficiencias. Ejemplo: el virus VIH causa la enfermedad SIDA. El primer retrovirus que se encontró fue el que causa tumores el las aves de corral, el RSV (Rous Sarcomer Virus) a principios del siglo XX. Todos los retrovirus tienen como material genético RNA. Integran la información en el genoma de DNA de los huéspedes. Éste cambio en el materia genético (ssRNAdsDNA) lo consiguen mediante la RT (Reverse Transcriptase). Gracias a ella se acabó de establecer el Dogma Central de la Biología Molecular. Según lás últimas filogenias, estan todos emparentados. Todos los retrovirus tienen en su estructura: -Membrana externa (vida extracel.): con proteínas del propio virus (TM y SU, una de ellas es la famosa gp120) y restos de membrana celular del último huésped. -Membrana Interna: MA (matriz), CA (cápside), NC (nucleoprot.). -Material interno: dos copias del ssRNA, dos el tRNA, RT, Int y Proteasa. El ciclo vital: las proteínas de la membrana externa del virus que vienen de otras células ya infectadas interactúan uniéndose a receptores extracelulares de la que será su nueva célula huésped (en el caso del VIH: gp120 CD4 de los linfocitos T). El virus está “disfrazado” con la membrana de las células huésped anteriores. Hay fusión de las membranas por endocitosis (gp41 en el caso del VIH). El virus queda en el citosol limitado por su membrana interna. Ahora ha de retrotranscribirse el ssRNAdsDNA e integrarse. Después, cuando se expresa, puede salir por exocitosis y quedar envuelto por la membrana del huésped. Genética Molecular. Carlos F.R. Página 125 Así, el virus puede estar en estado de latencia (desde la infección hasta que acaba la integración en forma de provirus) o de virulencia (se forman nuevos virones, exocitosis). Siempre usa las funciones del huésped. No hay acuerdo acerca de cómo el material genético vírico atraciesa la membrana nuclear. Organización genómica de los retrovirus: Genética Molecular. Carlos F.R. Página 126 Como siempre, al integrarse se duplica la diana del huésped. También se da que se pierden dos bases en los extremos del LTR. LTR (Long Targed Repeat)es U3 + R + U5 es éste orden, siempre. Está en repetición Directa, se considera respecto a R. El promotor es MUY fuerte (dominante) y está entre U3 y R. Sólo se expresa si el virus está integrado en el huésped (latente, profago). R es igual en los dos LTR. Tiene un PolyA, que funciona para parar la transcripción en el LTR de 3’. La secuencia Ψ (psi) sirve para empaquetar el mRNA que la tiene. indicar que se sólo ha de Las zonas codificantes son GAG (proteínas de la cápside viral, membrana interna), POL (los 3 enzimas), ENV (proteínas de la cubierta externa, membrana externa). El PBS (Primer Binding Site) es el sitio de unión al Primer en la retrotranscripción. El primer tiene, obviamente, una secuencia complementaria al PBS. La Transcriptasa Reversa (RT): Es una DNA Polimerasa dependiente de RNA o DNA. Necesita un primer que aporte un 3’OH libre a partir del cual elongar. Tiene actividad RNasaH (degrada el RNA que forma parte de los híbridos de doble cadena de RNA-DNA, dejando ssDNA). También es capaz de moverse o “saltar” sobre el material genético sin polimerizar (????). El primer que utiliza es el tRNA que llevaba el virus. Funcionamiento: El ssRNA del retrovirus entra en la célula huésped. En su región PBS se une el primer de tRNA que llevaba el retrovirus. Da un 3’OH libre. La RT polimeriza DNA (U5 y R) a partir del primer de tRNA. Es el 1er trozo de la 1ª cadena. Ahora usa su actividad RNasaH sólo en la zona del híbrido que acaba de formar, dejando un ssDNA protuberante con un 3’. Genética Molecular. Carlos F.R. Página 127 Se circulariza y se hibrida por los R (que son iguales). La el de el el RT hace un salto y queda en 3’ libre del R que acababa sintetizar. Polimeriza sobre molde de RNA, pero elongando DNA. Ahora usa de nuevo la RNasaH degradando el RNA del híbrido (por donde acaba de pasar) excepto un trozo, el PPT. A partir del 3’ del PPT, se polimeriza DNA con la RT. Se degrada todo el RNA, incluido el primer de tRNA y el PPT, y se circulariza el DNA por las secuencias PBS, que son complementarias. Se separa de U3, R y U5, queda unido sólo por las PBS. Aprovechando los dos extremos 3’ que dejan las dos PBS y usando el molde de DNA, la RT salta de nuevo y polimeriza DNA. Ya tenemos dsDNA libre, listo para integrar. Éste dsDNA se integra al azar en el genoma del huésped, gracias a la reacción que cataliza la integrasa. Los LTR (U3-R-U5) son atacados por la integrasa: les degrada dos nt en los extremos 3’, dejando un dsDNA vírico con extremos 5’ protuberantes de 2nt de longitud. Ahora, la integrasa corta en el DNA diana del huésped al azar, dejando extremos protuberantes en 5’ de 2nt o más de longitud. El DNA del virus de sitúa entre los dos gracias a complementariedad de bases (OJO: como sólo son dos nt, es bastante probable que por azar encuentre las que son complementarias). A continuación, la DNA Polimerasa Eucariota rellena los gaps de la diana que están a loa extremos del genoma vírico, generando así los extremos con repetición directa característicos. Genética Molecular. Carlos F.R. Página 128 Se suelen integrar de una a diez copias del retrovirus en un genoma. Expresión de los Retrovirus: Sólo se expresan cuando se han integrado. EL promotor está en el U3 del LTR 5’. Es muy fuerte (el promotor). Es específico de la RNA Polimerasa II (cajas CAAT). Si se modifica éste U3, no expresan nada. El mRNA producido puede seguir dos caminos diferentes (50% cada uno). - Splicing: se cortan los lugares de Splicing eliminando la secuencia de empaquetamiento Ψ, GAG y POL, como si fueran intrones. Sólo se traduce el gen ENV (prots de membrana Externa). La proteína inmadura que inmediatamente se traduce requiere 1 corte con la proteasa que viajaba con el retrovirus para que salgan los productos SU y TM. Ya que se ha cortado Ψ, éste mRNA no es bueno para encapsidar (falta GAG y POL). Su función es hacer ENV para el bueno. - No Splicing: se traduce desde el AUG de GAG. Hay un STOP al final de GAG, que en el 5%-10% de los casos es saltable* para hacer POL. El STOP de después de POL no es saltable. GAG codifica una proteína inmadura que al recibir los cortes de la proteasa, genera MA, CA y MC (las proteínas de la cápside Interna). Cuando POL se ha traducido, recibe cortes de la proteasa y genera los Enzimas del retrovirus: RT, Int y más proteasa. La célula huésped no las degrada porque las reconoce como propias. Ya que tiene a Ψ (lo tiene todo), se puede encapsidar con ENV para salir de la célula e infectar a otras. Las terapias antirretrovirales se basan en combinar fármacos que inhiben a las 3 proteinas a la vez y al tRNA. *El STOP de GAG es saltable. Para expresar POL, es imprescindible saltarse ése STOP. Tampoco se puede hacer Splicing (se eliminaría POL, con GAG). Existen varias maneras de que el ribosoma se salte el STOP: Frameshift-1, Frameshift -2, Frameshift +1 y tRNA complementario a un STOP. Los frameshift consisten en cambiar la pauta de lectura del ribosoma sobre el mRNA para que no reconozca el codón STOP. -Frameshift -1 (se retrocede 1 nt, el más común, el del HIV). -Frameshift -2 (MMTV). -tRNA supresor (reconoce al codón STOP aportanto un tRNA con ácido glutámico, pero es un mecanismo MUY raro. Virus MLV). Genética Molecular. Carlos F.R. Página 129 En el caso del HIV es un frameshift -1. Funcionamiento: - El ribosoma llega al final de GAG y se forma un loop en el RNA. - El loop hace que se pare la traducción. No salta el polipéptido ni el ribosoma. - Se rompen los puentes de H2 entre codón y anticodón con polipéptido naciente. - EL ribosoma se mueve una posición hacia atrás, se mueve -1nt. Aprovechando la “wobble position” del tRNA, se mantiene el AA cambiando la tercera base. Se une por 2 puentes de H2 entre las dos bases del anticodón y el codón (que tiene 2 de las bases que han parado al ribosoma), que ya estaba preparado para que fueran complementarias. - Se deshace el loop y el ribosoma sigue leyendo el mRNA, pero con la nueva pauta de lectura -1. Sigue añadiendo AA a la proteína que NO había saltado. Los Retrovirus como transductores de oncogenes. Un oncógen es un gen que hace tumores (estimula la mitosis) debido a que: - Expresa una proteína nueva - Expresa a elevada [ ] algo - Expresa a baja [ ] algo - Expresa cuando no debe. Tipos de oncogenes: - c-onc: gen normal, funciona correctamente, implicado en la división celular. Regulan la mitosis, ciclinas, factores de transcripción… Se una la terminología “conc” en el contexto de los retrovirus. Genética Molecular. Carlos F.R. Página 130 - v-onc: es la variante vírica de un gen que funciona correctamente en la célula. Las diferencias son de un 3-10% respecto al “c-onc” en cuanto a nt. Son c-onc que están fuera de control. Los retrovirus que llevan oncogenes pueden ser: - con algún componente de menos (GAG, POL o ENV, o los 3). - El gen tiende a estar a 3’ del retrovirus. Para estudiarlo, se hace una infección simultánea (coinfección) del normal con el recombinante. El origen de los v-onc constituye un misterio (como otros tantos), pero se baraja alguna hipótesis al respecto: Célula normal con c-onc (intrones) infección con retrovirus (1-10 copias/genoma) el retrovirus se integra al azar, y ésta vez lo hace a 5’ del c-onc por azar también, se produce una deleción entre el virus y el c-onc (deleción de POL, ENV, y el LTR de 3’ por ejemplo) al trascribirse desde el U3 del LTR de 5’, se transcribe también el c-onc porque no hay el señal de poliadenilación de la R del LTR 3’ se realiza el splicing sobre el mensajero y se obtiene un mRNA con 5’R-U5-GAG-E1-E2…-AAA3’. Los exones son del c-onc, ya no tiene intrones. Ahora se daría una infección con el normal (de nuevo, 1-10 copias por genoma) que aporta los genes que faltan virus que ha recombinado con el c-onc. Le aporta los genes POL y ENV, los codifica el normal. Ahora, se podrá volver un v-onc. Se encapsida: - 2RNA que tengan Ψ (por probabilidad, uno de normal y uno con c-onc). - El resto de material. Ahora infecta a una nueva célula. Si hay 2 RNA de moldes, la RT puede saltar mientras retrotranscribe de un RNA a otro, generando nuevas combinaciones de genes. El dsDNA con c-onc se integra en la célula del huésped, y se vuelve vonc. Genética Molecular. Carlos F.R. Página 131 Genética Molecular. Carlos F.R. Página 132 TEMA 19: RETROTRANSPOSONES Y RETROGENES. Un retrotransposón (=retroposón) es un transposón que transpone en forma de RNA. Se retrotranscribe a DNA y se integra en el DNA del huésped. Sólo en Eucariotas. Es como un retrovirus que ha perdido la capacidad de pasar de una célula a otra, y ha de hacer el ciclo dentro del huésped. Su origen, por tanto, es desconcertante: ¿se trata de un retrovirus que por azar perdió la capacidad de infectar a otras células (env) o bien se trata de un retrotransposón ancestral que por azar ganó la capacidad de infectar a otras células (env) y originó, así, a todos los retrovirus? A día de hoy, no se sabe. Consideramos los elementos Ty de la levadura (Transposon yeast), son los retrotransposones que primero se descubrieron. Los elementos Ty integrados son así: Las cajas δ(=LTR) también se pueden encontrar solas en el genoma, flanqueadas por la DR del huésped. Ésto es debido a que se dan recombinaciones de sitio específico entre las cajas δ para eliminar exceso de Ty. La traducción del mRNA del Ty: - Normal: se traduce el TyA (desde AUG hasta el primer STOP), hace la P1 que requiere un corte con la proteasa para volverse P2, la forma madura. Con ella, se hacen las VLP (virus-like proteins). Polimerizan. - Frameshift +1: en retrovirus era -1. Se traducen el TyA y el TyB saltándose el STOP entre ellos. Se sintetiza una P3, que al ser cortada produce la proteasa, RT e Int. También se sintetiza la P1 que al ser cortada se vuelve P2, para hacer VLP. El frameshift +1 funciona cuando se acerca al codón STOP entre TyA y TyB. No hay loop. Cerca hay un codón de Arg (raro en levadura, no viene al ribosoma porque hay pocos). Se para la traducción, se separa el tRNA con el polipéptido y el ribosoma avanza 1 nt sobre el mRNA, sin hacer nada (solo se mueve 1 nt hacia adelante). Ahora, el codón que se lee codifica para un Genética Molecular. Carlos F.R. Página 133 AA común en la levadura (Gly) y se sintetiza el nuevo polipéptido como si nada. mRNA + VLP + P3 (las 3 enzimas) “retrovirus” que no puede salir de la célula pero puede hacer muchas copias de sí mismo. Hay diferentes tipos de Ty (1, 2, 3, 4, 5). Todos funcionan como TyA y TyB. También se han encontrado retrotransposones en Drosophila (llamados elementos “Copia”). Tienen estructura equivalente al Ty de levadura. Como en Ty, hay diferentes tipos de elementos Copia. Se estudiaron haciendo hibridaciones con sonda sobre los cromosomas politénicos de Drosophila. Todos, cuando se integran, tienen la diana del huésped repetida en DR. Así, los retrotransposones pueden ser: - Clase I: Retrovirus Like (como los retrovirus), tienen LTR. Son Ty en levadura y Copia en Drosophila. - Clase II: non-Retrovirus Like (no son como los retrovirus), no tienen LTR. Son los LINE. LINE (Long Interspersed Nuclear Element): El primero en ser descubierto fue el LINE1. Hay muchas copias por nº haploide de cromosomas, de 50000 a 100000 copias. Todas ellas presentan diferente longitud: - Cortas: muchas copias, ocupan pocos centenares de bases. Están truncados a 5’. - Largas: pocas copias, ocupan hasta 7kb. Se les considera completos. LINE1. La diferencia entre unos y otros es que las cortas, siempre están acortadas por el 5’ (ahora veremos porqué). El extremo 3’ (secuencia de Polyadenilación) se mantiene siempre. El LINE1 (completo) es: No hay acuerdo sobre cómo se transcriben los LINES truncados a 5’, ya que no deberían tener promotor. Tampoco está claro de dónde vienen. Codifica para una RT no homóloga a la de los retrovirus (diferente seq de AA, misma función). Se retrotranscriben por TPRT (Target Primed Reverse Transcription). Genética Molecular. Carlos F.R. Página 134 El ORF1 codifica para una proteína llamada P40 ó ORF1. Función poco clara. El ORF 2 codifica para una proteína llamada ORF2 que tiene 2 dominios: endonucleasa y RT. Se forma la partícula nucleoproteica en el citosol: ORF2+(2xP40)+mRNA del LINE. Se unen en 3’ del mRNA. Cuando entra en el núcleo, se pierden las dos ORF1 (=P40). Ahora, gracias a ORF2, el mRNA toca al DNA del huésped, en una región que ha de ser rica en T (considero que es en la cadena de “abajo”). A ella, la ORF2 le acerca la cola de PolyA del mRNA. Ahora, ORF2 usa su dominio endonucleasa y hace un corte en el extremo izquierdo de la zona con TTTT, dejando un 3’ libre. ORF2 usa entonces su dominio RT aprovechando ese 3’OH libre para elongar DNA. El sustrato es el RNA enganchado con sus A a la zona de T: La RT sintetiza la primera cadena del cDNA en 5’3’ aprovechando ese 3’ libre del Nick. Usa la actividad RN’asaH para degradar el molde de RNA y sintetiza la segunda cadena del cDNA. Queda un dsDNA “colgando”, el cual se integra bien en el lugar donde está. Hay reparación de los posibles daños. En el momento de integrarse éste DNA que “cuelga”, se produce un corte en el DNA del huésped que deja extremos protuberantes (pasa lo que indica el dibujo, por ataque nucleofílico???), en-tre los cuales se une el DNA que “cuelga” (muy similar a los transposones). Genética Molecular. Carlos F.R. Página 135 Por eso hay la DR que flanquea al LINE, como siempre, y siempre se repara. En general, el TPRT es un mecanismo con muchos puntos oscuros y poco conocido. Debido a que la RT es poco procesiva, se desengancha con facilidad del molde de RNA. Ello ocasiona que se separe antes de hora, y no llegue a retrotranscribir todo hasta el 5’. Por eso, la mayoría de LINE tienen deleciones en 5’, están “truncados”. Se dice que los LINE son autónomos porque codifican ellos para su ORF1 y ORF2. Así, las ORF1 y ORF2 actúan en CIS si se unen al mRNA del LINE en el citosol. Pero a veces sucede que, como estamos en el citosol, hay más RNA que no son sólo del LINE. Puede suceder que las ORF1 y ORF2 (y de hecho sucede) se equivoquen y se unan al RNA de otro gen. En éstos casos se dice que las ORF1 y ORF2 han actuado en TRANS. Cuando actúan en TRANS, pueden originar 2 cosas según el sustrato: - Si actúan sobre mRNA (de la RNA Polimerasa II) generan un Retropseudogen = Pseudogen Procesado = Retrogen. - Si actúan sobre pequeños RNA (los de la RNA Polimerasa III) forman los SINE. Los SINE pueden ser retro t-RNA (se encontraron en ratón) o elementos ALU (en primates). Se dice que son todos no autónomos porque para retrotransponerse necesitan las ORF1 y ORF2 que codifica previamente el mRNA de un LINE, pero como las ORF1 y ORF2 se equivocan, van a éstos RNA y los hacen retrotranscribirse. Los Retropseudogenes = Pseudogenes Procesados = Retrogenes vienen de mRNA de la RNA Polimerasa II. Son el principal grupo. No tienen promotor porque el mRNA molde que los forma nunca tiene promotor,, no tienen intrones porque el mRNA al madurar sufre Splicing,, zona rica en A-T debido a la cola de PolyA del mRNA,, dos repeticiones directas, como siempre, los flanquean, debido a la integración del cDNA de doble cadena cuando estaba “colgando” (ver arriba). Al ser no codificante (no tiene promotor), no está sometido a presión selectiva y acumula mutaciones a un ritmo aproximadamente constante. Es como un Pseudogen, pero el Retropseudogen no tiene intrones ni promotor, mientras que el pseudogen sí tiene intrones y no es codificante por mutaciones en la región reguladora (puede originarse por Genética Molecular. Carlos F.R. Página 136 duplicación con inactivación por inactivación por mutación directa). selección ó simple Los SINE (Short Interspersed Nuclear Element) se forman cuando ORF1 y ORF2 se unen a tRNA, 5S-rRNA… es decir, todos los tránscritos de la RNA Polimerasa III. Son de escaso tamaño pero tienen un elevadísimo número de copias. Tipos: - Retro tRNA: Vienen del tRNA. Se encontraron en roedores. El AA era generalmente una Ala o una Ser. - Elementos Alu: Comunes en todos los primates superiores (usadas para hacer filogenias). Son pequeñas secuencias producidas por los tránscritos de la RNA Polimerasa III. Un elemento Alu es: Son dos “dímeros” de secuencias (uno de 130pb y otro de 160pb) que están en tándem (uno tras otro, tras otro…) por el genoma, muchas veces. En total, una secuencia Alu mide 300pb. Al venir de la RNA Polimerasa III, son genes de clase III y tienen promotores internos (se pueden transcribir). El nombre de Alu viene de que tienen dianas del enzima de restricción AluI. Las secuencias Alu vienen del 7S(L)-RNA. Al ser transcrito por primera vez por la RNA Polimerasa III, el RNA es captado por ORF1 y ORF2 (TRANS), y se integra en el genoma. Forma un Alu. Como tiene promotor interno, ahora puede volver a transcribirse y volver a retrotransribirse (si es captado por ORF1 y ORF2), y así una y otra vez. Por eso hay tantos. El 7S(L)-RNA es citosólico, y está implicado en la traducción de proteínas. El 7S(L)-RNA + proteína estructural forma la SRP (una ribonucleoproteina). Está implicada en la translocación de proteínas al Retículo Endoplasmático Rugoso (ver Biología Celular). EL 7S(L)-RNA está muy replegado sobre sí mismo, con hibridaciones, etc. Tiene muchas estructuras secundarias. Genética Molecular. Carlos F.R. Página 137 Tiene dominio en común con las retrotransponerse, el 7S-RNA Alu. Alu porque al No se retrotranscribió todo porque falta un trozo en la homología con los Alu, un trozo propio del 7S-RNA. La retrotransposición accidental (TRANS) se da mucho con el RNA implicado en la traducción. De manera comparativa, consideremos un individuo haploide. - LINE1: es poco frecuente, entero representa el 5% de los LINE, y truncado en 5’ es el 95% de los LINE (en humanos). En ratón, hay 300 veces más del LINE1. 1 de cada 1000 mutaciones en humanos es debida a un LINE1. 1 de cada 50 individuos tiene un nuevo LINE1 en la línea germinal. - SINE (las Alu): 1.1x106 copias, forman el 11% del genoma en humanos y el 3% del genoma de los ratones. Hay 20 enfermedades genéticas humanas asociadas a Alu: por tenerlo en región reguladora, codificante, o por recombinar las secuencias Alu. 1 de cada 30 individuos tiene un nuevo Alu en la línea germinal. Enfermedades asociadas a los Alu: nuestro DNA está lleno de LINE’s y Alu’s en diferente (o igual) orientacion. Ejemplo: patología asociada al receptor de las LDL en región no codificante. Supongamos que en el gen del receptor de las LDL llegan a retrotransponerse 2 7S-RNA en forma de Alu. Hay dos Alu. Quedan, cada una, dentro de un intrón. Además, hay una diana de EcoR1 en un intrón que está en medio de los dos intrones con Alu. Un individuo “sano”, no habrá recombinado entre las dos Alu, al cortar el DNA con EcoR1 y hacer un Southern (con sonda determinada) se verán dos bandas. En un individuo con la patología, se ha dado recombinación entre las dos Alu y el fragmento entre ambas se ha perdido. Como tiene exones, al codificar para el receptor de LDL sale una proteína no funcional y si digerimos el DNA con EcoRI, no se digeriría porque se ha delecionado la diana debido a esa recombinación, y al hacer el Southern e hibridar con la sonda específica de antes, saldría una sola banda. Genética Molecular. Carlos F.R. Página 138 Genética Molecular. Carlos F.R. Página 139 TEMA 20: INMUNOGLOBULINAS. El sistema inmune consta de células precursoras que se pueden diferencias en células linfoides (hacen la respuesta tisular células citotóxicas y los linfocitos T ó hacen la respuesta humoral linfocitos B) ó en células mieloides (macrófagos, plaquetas, etc). Los anticuerpos son sintetizados por los linfocitos B. Los anticuerpos son el principal tipo de inmunoglobulinas (las usaremos como sinónimos, pero estrictamente no lo son). Las inmunoglobulinas cadena pesada. Tipos: - IgA secuencia - IgD secuencia autoinmunidad. - IgE secuencia - IgG secuencia - IgM secuencia se clasifican según los AA de la α de AA en cadena pesada. Saliva. δ de AA en cadena pesada, regula la ξ en cadena pesada. Alergias. γ en cadena pesada. Principal. µ en cadena pesada. Constitutiva. Estructura de la más abundante (IgG): Una Ig tiene dos cadenas ligeras (“l”) y dos cadenas pesadas (“h”). Tanto la ligera como la pesada tienen cada una su región Constante (“C”) y su región Variable (“V”). Están unidas por puentes disulfuro. Las letras (J, C, L…) de cada gen son cajas que codifican para diferente secuencia de polipéptido, habrá sólo 1 de cada en la IG final. Están en clúster. Se puede elegir para que el AC pueda reconocer muchos antígenos. Cadena ligera, región Variable: en la cadena ligera, puede haber una región variable que sea de tipo λ ó de tipo κ. Genética Molecular. Carlos F.R. Página 140 - Tipo λ: Poca preferencia por ésta, se prefiere más el clúster κ. Tiene un pseudogen en una constante. Sólo se usa si falla la κ. En raton, el 5% de las Ig tiene la Vl tipo clúster λ y hay pocas L-V donde elegir. En humanos, el 60% de las Ig tienen la Vl tipo clúster λ, y hay muchas L-V donde elegir. - Tipo κ: Se elige como primera preferencia. Si éste falla, usa el clúster λ. En raton, el 95% de las Ig tiene una Vl tipo clúster κ, y hay muchas L-V donde elegir. En humanos al revés, el 60% lo tiene y hay pocas L-V donde elegir. Cadena ligera, región Constante: Poca importancia, si la variable es κ, la constante es κ. Si la variable es λ, la constante es λ1, λ2 ó λ3 (la λ4 es el pseudogen). Genética Molecular. Carlos F.R. Página 141 Cadena pesada, región Variable: La variable es más fácil de hacer que la constante. No se indican todas aquí, pero la constante (ver siguiente dibujo) tiene muchas posibilidades. Se pone como ejemplo que la constante se vuelva M (ahora se explica). Para que se forme el DNA listo para transcribir, requiere 2 recombinaciones somáticas. Hay mucho donde elegir. Al hacer las recombinaciones somáticas en el DNA, ya queda determinado para siempre en esa célula (porque implica que se pierda un trozo, el trozo que está entre las dos zonas que recombinan) Cadena pesada, región Constante: Pueden presentar, a parte de toda la variedad de la Variable, diferente Forma (Ssecretable, M1 o M2 de membrana) y también diferente Clase (tipo de Ig, si IgMIgD es revesible, pero si IgMIgA, IgG, IgE es irreversible). Suponemos que ya se han dado las 2 recombinaciones (siempre son somáticas porque son linfocitos) de la región Variable, y ya está determinado el DNA. Ahora, para la región Constante, pueden suceder diversos eventos, ¡se combinan los dos! - Clase: 1º se elige la clase. Determina el tipo de Ig. Puede ser reversible o irreversible. Por defecto, siempre se va a transcribir a la IgM, por tanto, no es imprescindible el cambio de clase (si no se diera cambio de clase, quedaría IgM). Cuando se han hecho Genética Molecular. Carlos F.R. Página 142 las 2 recombinaciones somáticas de la variable, el DNA de la Constante es: Los cambios de Clase Reversibles implican manipular el mRNA. Es pasar de IgMIgD. Se trascribe todo hasta el final de C-δ, se elige si quiero que sea IgD ó IgM y después la Forma. Para que sea IgD, tengo que hacer Splicing alternativo y perder todo IgM. Para que sea IgM, no tengo que tocar nada (hay STOP detrás de C-µ). Luego se elige si es secretable o de membrana. Los cambios de Clase Irreversibles implican una tercera recombinación somática, pero ésta se da entre las regiones de homología llamadas “cajas Switch” (SWletra). Es una recombinación muy parecida a la de sitio específico, porque hay una deleción de un segmento por recombinar dos secuencias (cajas SW) repetidas. Las cajas Switch están al principio de todas las regiones C, excepto de Cδ (no existe la SWδ). Siempre se recombina la SW-µ con la SW-diana de la C que quiero. Se elimina el trozo de DNA de en medio (por eso es irreversible). Luego se transcribe y se elige si es de membrana o secretable. - Forma: Es lo 2º que se elige. Los cambios de forma son todos reversibles, ya que afectan al mRNA una vez se ha elegido la Clase. Es decir, a partir de un mismo genoma siempre se pueden generar formas secretable y formas de membrana de la misma clase de Ig. Al mRNA se le puede hacer un Splicing alternativo de la región C, en el cual se pierde la región S, y luego se unen las cajas M forma de Membrana, tiene AA hidrofóbicos. Si se usa una región críptica de PoliAdenilación, que está detrás de S (se pierde M)forma Secretable, tiene AA hidrófilos. La Recombinación Somática: sólo se dan en los linfocitos B porque son las únicas células del cuerpo con las Recombinasas Rag1 y Rag2 funcionales. Son homólogas a Transposasas. Éstas recombinaciones somáticas implican regiones en el DNA con secuencias de bases en repetición Directa, un entrecruzamiento, y la pérdida del segmento Genética Molecular. Carlos F.R. Página 143 intermedio (parecido pero no igual a recombinación de sitio específico). Así, gracias a ésta recombinación, se unen los segmentos de DNA pueden expresarse los genes de las inmunoglobulinas, ya que un enhancer específico del promotor de las Ig se acerca a éste cuando se deleciona el fragmento intermedio por recombinación. Éste enhancer que activa al promotor se encuentra entre J y Cµ, y el promotor está a 5’ de J. Por eso cuando se hacen las dos recombinaciones somáticas, se acerca el enhancer al promotor y lo activa. Como para esa recombinación se necesitan a Rag1 y Rag2, y sólo las expresan los linfocitos, son las únicas células del cuerpo aparte de las germinales que pueden recombinar. Y como no son células germinales porque no hacen gametos, sino que son células somáticas, al fenómeno se le llama recombinación somática. Rag1 y Rag2 actúan como transposasas, catalizando todas las recombinaciones somáticas de los Linfoctos B. Son elementos de recombinación en “Trans”. Por ejemplo, si quiero unir la caja V con la caja J (en la cadena ligera), Rag1 y Rag2 cortan a los lados de las cajas de homología (no cortan dentro de ellas, por eso no es igual que la recombinación de sitio específico, aunque el resultado es equivalente). Es fundamental que haya las cajas de homología HeptámeroNonámero-(cosa a delecionar)-Nonámero-Heptámero. Cada una tiene 7-9-X-9-7 bases, respectivamente. Siempre se deben conservar las distancias de 23pb entre las 7-9 y de 12pb entre las 9-7. No son distancias arbitrarias, son reconocidas por Rag1 y Rag2 ya que corresponden con los giros del DNA. Éstas cajas, son elementos en “Cis” de recombinación. 1 heptámero + 1 nonámero = 1 RSS. Se necesitan 2 RSS para recombinar. Los dos RSS están en repetición invertida. Genética Molecular. Carlos F.R. Página 144 Las recombinasas Rag1 y Rag2 no cortan dentro de las cajas 7-9 y 9-7, sino que cortan en el trozo que hay entre la RSS y el la caja V ó J. Funcionan como transposasas, así que no cortan dejando extremos protuberantes. Cómo se da la recombinación Somática: - Las cajas 7-9-X-9-7 se enfrentan una con la otra formando una protuberancia. - Rag1 y Rag1 reconocen las estructuras y cortan, haciendo un Nick en cada una de las 2 cadenas. - El 3’OH ataca nucleofílicamente al 5’P que tiene la cadena de abajo, y forma una estructura en “hairpin”. A la vez, se separa el fragmento intermedio, con las cajas 7-9-9-7 y la región que se deleciona del genoma. Éste DNA que se deleciona se ha circularizado por los extremos romos. - Una endonucleasa corta el punto del “hairpin” a los dos extremos, haciendo un Nick, la posición del cual es variable. Se rompen los puentes de H2 por la tensión. Por tanto, deja extremos protuberantes 3’ de longitud variable (los nt no “caen”, no son goteras xD). Éstos nt protuberantes son los nt P. - La Nucleotidil Transferasa Terminal (NTT) añade algunos nt aprovechando el 3’ libre, en 5’3’. No tiene molde, por tanto los pone al azar. Los nt que pone la NTT son los nucleótidos N. - Los nt son al azar, pero basta que añada dos que sean complementarios en las cadenas opuestas y se hibridan, la distancia de lo cual será, obviamente, variable. Genética Molecular. Carlos F.R. Página 145 - Al hibridarse, ya hay un gap con un extremo 3’ con un gap. Una exonucleasa corta la protuberancia 3’ que no se ha apareado. - Ahora puede venir la DNA Polimerasa Eucariota a reparar el gap, a partir del 3’ libre y usando el molde de la otra. Debido a que esto se da en regiones codificantes, hay posibilidad de que haya un corrimiento de la pauta de lectura y produzca una proteína no funcional. Por eso, 2/3 veces éste fenómeno falla y no produce una cadena funcional. Pero si funciona (1/3), hay variabilidad generada por los nucleótidos N que añade la NTT. La Hipermutación Somática: igual que el fenómeno anterior, sólo pasa en los linfocitos B. Sucede en las regiones LVJ ó LVDJ, dependiendo de si es pesada o ligera, pero siempre sucede en la región V almenos. Sucede cuando se han producido las Recombinaciones Somáticas, no antes. Ocurre en elevada frecuencia, del orden de 1/1000 a 1/10000 veces (muta 100 o 1000 veces más rápido de lo normal). Consiste en sustituir bases mediante un mecanismo enzimático. Sobretodo en la región V y sus zonas flanqueantes. Siempre necesita a los enhancers cerca (dos enhancers: el Eµ que está entre V-C a 5’ de Cµ ,, el E3’α que es característico de la cadena pesada y está a 3’ de Cα). También necesita secuencias intrónicas cerca, para “comprobar” que es una secuencia activa transcripcionalmente (porque quiere mutar secuencias codificantes para generar variabilidad). Sucede cuando una base (C, por ejemplo) es atacada por un enzima (citosina desaminasa en éste caso) y se convierte en uracilo. Tener uracilo en el DNA es una aberración, y viene la Uracilo D-Glucosilasa, que corta la base y deja un lugar AP (con MSH, MLH, PMS… no es NER porque no son bases dañadas, y no es translesión porque no son dímeros de pirimidina). Es reparado por la DNA Polimerasa ι, una polimerasa translesión. Como se equivoca mucho, sólo ¼ de las veces pone la base correcta, los otros ¾ añade una incorrecta. Así, la región variable tiene aún más variabilidad. Genética Molecular. Carlos F.R. Página 146 Maduración Y Diferenciación de los Linfocitos B: Éste proceso implica al factor de transcripción NF-κB. Suponemos que queremos producir una IgM para la membrana. La célula madre se diferencia en célula nula cuando une D-J en la cadena pesada. Tiene dos intentos porque es 2n. Si falla, apoptosis. La célula nula se diferencia en célula Pre-B cuando une VDJ en la cadena pesada. También 2 intentos por ser 2n y si falla, apoptosis. Se decide la clase de la Ig (IgM) y luego se decide la forma (membrana). Se dá la exclusión alélica. La célula Pre-B acumula las cadenas pesadas y se diferencia en célula B cuando sintetiza la cadena ligera (1º κ1 ó κ2, si falla usa λ. Fusión V-J). Se unen las cadenas ligera y pesada, y se une la IgM a la membrana por la ruta secretora, fusión vesicular. La célula B se especializa en producir otras Ig cuando su IgM de membrana se une al antígeno. Entonces se da un cambio de clase reversible (IgMIgD) y se producen IgD, también de membrana, para evitar la autoinmunidad. Entonces se exponen al antígeno y: - Se dan cambios de clase irreversibles (IgMIgA, IgG, IgE). - Cambios en la línea celular porque cambia el tipo celular células de memoria (acumulan Ig en la membrana) y células plasmáticas (Ig secretables, expresan los factores para hacer el cambio de forma a Ig Secretable). La Exclusión Alélica: Sucede cuando se producen las cadenas pesadas en las células Pre-B. Son 2n, por tanto, tienen el genoma duplicado. Hay dos copias de cada cromosoma, que contiene la información para codificar las cadenas. Si uno de los dos, al fusionar las cajas, rompe la pauta de lectura o daña la cadena, se inactiva y lo intenta hacer el otro cromosoma. Tiene otra oportunidad, pero si también falla, la célula hace apoptosis. Si ya funciona bien desde el primero, entonces el que funciona bien bloquea al que aun no se ha activado. Con la cadena pesada pasa algo parecido, pero si falla la κ, antes se inactivar al cromosoma se pasa a la λ. Numéricamente, en Ratón, si se consideran todas las probabilidades mencionadas hasta ahora, se pueden producir más de 270 millones de Ac diferentes para reconocer a todos los antígenos que podrían llegar al organismo. Genética Molecular. Carlos F.R. Página 147 En humanos, hay un orden de magnitud más (se producen más de 2700 millones de Anticuerpos, debido a que hay 1800 combinaciones posibles LVJC de la variable-ligera λ frente a las 6 de ratón). Factores que generan la Variabilidad: - Nº de segmentos V, D, J. - Uniones aleatorias de DJ y V-DJ es la variabilidad combinacional, en elegir qué región se une. - Uniones aleatorias de DJ y V-DJ es la variabilidad en la juntura/inprecisional, ya que se corre la pauta de lectura pudiendo producir STOP prematuro o vete tú a saber. - Los nucleótidos N añadidos por NTT a los extremos de las cajas VDJ. - La hipermutación somática en la región V y circundantes. - Una cadena pesada se puede unir a cualquier cadena ligera. Nunca mejor dicho, “en la variedad está el gusto”. Genética Molecular. Carlos F.R. Página 148