Documento descargado de http://www.elsevier.es el 17/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. Secuencias largas terminales repetidas de los retrovirus: estructura y función 51.459 Eva Lospitao, África Holguín y Vicente Soriano Laboratorio de Biología Molecular. Servicio de Enfermedades Infecciosas. Hospital Carlos III. Instituto de Salud Carlos III. Madrid. España. Los retrovirus presentan al final de su genoma unas secuencias genéticas características denominadas secuencias terminales repetidas largas (long terminal repeat, LTR) que median la integración del ácido nucleico viral en los cromosomas de las células huésped. Además, regulan la transcripción de los genes de los retrovirus y, de este modo, influyen en su virulencia. Existen diferencias en la estructura de las LTR de los distintos subtipos del virus de la inmunodeficiencia humana tipo 1 (VIH-1), que podrían explicar las diferencias biológicas entre ellos y quizá también una distinta progresión de la enfermedad. tamaño y secuencia la presenta la región U3. La comparación de estas secuencias ha permitido establecer qué zonas se conservan en los distintos retrovirus y las funciones en las que participan (tabla 2). El mantenimiento de todas estas secuencias en los distintos retrovirus, así como la relevancia de las funciones en las que intervienen, nos sugieren la importancia de las LTR en el ciclo replicativo de estos virus. Palabras clave: Retrovirus. VIH. LTR. Estructura. LTR y replicación del VIH-1 Retroviral long terminal repeats: structure and function Characteristic genetic sequences, named as LTR, are present at the end of retroviral genomes. They are involved in the integration of viral nucleic acid into chromosomes of cell host. In addition, LTR modulates the transcription of retroviral genes and, in this form, determine their virulence. LTR from distinct HIV-1 subtypes show structural differences which may result in distinct biological behaviors and, ultimately, different disease progression. Key words: Retrovirus. HIV. LTR. Structure. Reciben el nombre de secuencias terminales repetidas largas (long terminal repeat, LTR) los fragmentos de ácido nucleico que aparecen repetidos en los extremos 3’ y 5’ del genoma proviral de los retrovirus, constituidos por el material genético viral integrado en el ADN de la célula infectada. Aparecen en los virus de la familia Retroviridae y están implicadas en la retrotranscripción y replicación viral. Existen secuencias genéticas específicas de dichos procesos. Hay diferencias entre LTR de distintos subtipos del grupo M (main o principal) del virus de la inmunodeficiencia humana tipo 1 (VIH-1), al que pertenece la mayor parte de los aislados. Actualmente se pueden distinguir 9 subtipos y 14 formas recombinantes intersubtipo (circulating recombinant forms, CRF), en función de su secuencia genética1. Estructura de las LTR La organización de las LTR es distinta en el ARN viral y en el ADN proviral (fig. 1). Así, en el ARN viral podemos distinguir dos regiones dentro de las LTR: U5 y U3, en el extremo 5’ y 3’, respectivamente, y las secuencias R, que aparecen en ambos extremos del ARN viral. Sin embargo, el ADN del provirus presenta en ambos extremos las tres regiones (U5, R y U3)2 (fig. 1). Cada retrovirus posee un tamaño de LTR característico, como se observa en la tabla 1. La mayor variabilidad en cuanto a Correspondencia: Dr. V. Soriano. Nueva Zelanda, 54, 4.o B. 28035 Madrid. España. Correo electrónico: vsoriano@dragonet.es Recibido el 2-12-2002; aceptado para su publicación el 23-4-2003. 74 Med Clin (Barc) 2003;121(2):74-7 El VIH-1 presenta un genoma constituido por dos cadenas de ARN homólogas con polaridad positiva. Este ARN debe convertirse en ARN de doble cadena para poder integrarse en el genoma celular. Este proceso se conoce como retrotranscripción. La presencia de las regiones U5 y U3 en los extremos 3’ y 5’ del ARN integrado del virus, respectivamente, es consecuencia directa del mecanismo de retrotranscripción. Este proceso se lleva a cabo por un complejo ribonucleoproteico que incluye la retrotranscriptasa inversa del virus, el genoma ARN viral, los ARNt cebadores y otras proteínas que participan en el proceso. Una vez terminada la retrotranscripción, es necesario que el ADN generado se integre en el genoma celular. De esta forma, la misma maquinaria que utiliza la célula para la producción de sus propias proteínas será empleada por el virus para generar sus proteínas y el ARN de los nuevos genomas virales. En este proceso también participan muy activamente las LTR, por ser las zonas por donde se va a producir la integración. TABLA 1 Tamaño del genoma de distintos retrovirus y de las regiones U3, U5 y R de las secuencias terminales repetidas largas (LTR) Virus RNA Genómico (nt) U3 (pb) R (pb) U5 (pb) LTR (pb) RSV MLV HIV-1 HTLV-1 HFV 9.300 8.300 9.200 8.500 11.200 230 450 450 350 910 20 70 100 230 190 80 80 80 220 160 330 600 630 800 1.260 Pb: pares de bases; nt: nucleótidos; RSV: virus respiratorio sincitial; MLV: virus de la leucemia de Moloney; VIH-1: virus de la inmunodeficiencia humana tipo 1; HTLV-1: virus de la leucemia T tipo 1; HFV: virus humano foamy. TABLA 2 Secuencias conservadas en las secuencias terminales repetidas largas (LTR) de los retrovirus y procesos en los que intervienen Secuencia conservada Localización Función TG-AC CCAAT G/CT/AAT/AT/ATAAG G CA AA/GTAAA TTGT Inicio y final LTR U3 (75 pb antes de R) U3 (23 pb antes de R) Inicio de R Final de R 20 pb antes de la unión R-U5 U5 (25 pb después del final de R) Integración Inicio de transcripción Inicio de transcripción Poliadenilización Poliadenilización Poliadenilización Terminación de transcripción 44 Documento descargado de http://www.elsevier.es el 17/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. LOSPITAO E, ET AL. SECUENCIAS LARGAS TERMINALES REPETIDAS DE LOS RETROVIRUS: ESTRUCTURA Y FUNCIÓN ARN viral VIH-1 ( no integrado) R U5 U3 R 100 80 450 100 Extremo 5’ Extremo 3’ ADN proviral VIH-1 (integrado) Fig. 1. Esquema de la estructura de las secuencias terminales repetidas largas (LTR) del virus de la inmunodeficiencia humana tipo 1 (VIH-1). Se indican los pares de bases de cada región. U3 R 450 U5 U3 100 80 Extremo 5’ AATCCAAT AT CA TC AA Núcleo o core TAPS TBP AATCCAAT IIE ARN polimerasa U5 100 100 Extremo 3’ cipan los elementos de control, la secuencia promotora (región que contiene el lugar de iniciación para la síntesis del ARN), RNA polimerasa II (se une al promotor) y factores de transcripción (fig. 2)3. El promotor, localizado en la LTR del extremo 5’ del ADN proviral, contiene la secuencia TATAA, denominada TATA box. A ésta se unen las proteínas de unión a TATA (TBP), y otras que finalmente reclutan la ARN polimerasa II al complejo de transcripción. A la zona activadora (enhancer) (fig. 2) se unen los distintos factores proteicos que regulan la transcripción. La LTR del extremo 3’ dará lugar a la región que se poliadeniliza y codifica para la proteína viral nef4 (fig. 3). Activador Factores reguladores de la transcripción R 450 TATA IH Sitios de unión a factores de transcripción en LTR Promotor Fig. 2. Esquema del inicio de la transcripción. (Tomado de Coffin et al 3.) LTR y transcripción del VIH-1 La transcripción es el proceso por el cual el ADN proviral es convertido en ARN. Posteriormente, éste puede ser traducido a proteínas, o bien constituir nuevos genomas virales. En este proceso se emplea la maquinaria celular, en que parti- En la región U3 de la LTR del ADN proviral, a la que se van a unir la mayor parte de los factores de transcripción, se pueden distinguir tres zonas: el núcleo (core), el activador (enhancer) y la zona reguladora (NRE) (fig. 4). En el núcleo se encuentran: a) la caja TATA, que une las proteínas TBP que reclutan a la ARN polimerasa II, y b) los sitios SP1, que unen distintos factores de transcripción de la familia SP1. El activador es la zona que contiene los sitios para la unión a la proteína celular que activa la transcripción de NF-κB (nuclear factor kappa B) y factores relacionados. En la zona reguladora existen secuencias específicas para la unión de Fig. 3. Genoma del virus de la inmunodeficiencia humana tipo 1 (VIH-1) en el que se muestra la superposición de la secuencia terminal repetida larga (LTR) del extremo 3’ y la región de ADN que codifica para la proteína viral nef. } Superposición gag rev vif nef tat LTR 5’ LTR 3’ pol vpr vpu env TAR NF AT-1 NF-κB USF-1 RBE III SP1 U3 ARN CAJA TATA GR Zona reguladora (+/–) NRE Ets TCF-1 R U5 ADN AP2 Enhancer (+) Núcleo Core Fig. 4. Esquema de sitios de unión a factores de transcripción en las secuencias terminales repetidas largas (LTR) del virus de la inmunodeficiencia humana tipo 1 (VIH-1). 45 Med Clin (Barc) 2003;121(2):74-7 75 Documento descargado de http://www.elsevier.es el 17/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. LOSPITAO E, ET AL. SECUENCIAS LARGAS TERMINALES REPETIDAS DE LOS RETROVIRUS: ESTRUCTURA Y FUNCIÓN Región TAR Complejo iniciación ARN (Pol II) ARN Tat +1 ADN proviral lación de la transcripción sea un proceso complejo. De hecho, se dan diferentes grados de transcripción, en función del gen a transcribir y del entorno celular específico. Hasta aquí nos hemos referido a la regulación en cis, es decir, aquella que ocurre por la unión de proteínas a las secuencias específicas existentes en la LTR del ADN proviral. Sin embargo, además de este tipo de regulación, existe la regulación en trans, producida al unirse la proteína viral Tat6 a una zona del ARN naciente TAR7 en el proceso de transcripción (fig. 5). +44 NF-BSP-I TATA LTR y subtipos del VIH-1 U3 R Fig. 5. Regulación en trans (Tat-TAR) en el virus de la inmunodeficiencia humana tipo 1 (VIH-1). CFR VIH-2 VIH A B C D E F G M VIH-1 N A B C D E (A/E) F G H I (A/G/H/K) J K L (?) 01-AE 02-AG 03-AB 04-cpx 05-DF 06-cpx 07-BC 08-BC 09 No publicado 10-CD 11-cpx 12-BF 13-cpx 14-BG (España y Portugal) 15-AEB O Fig. 6. Clasificación genética de los subtipos del virus de la inmunodeficiencia humana (VIH). muchas proteínas que modulan la transcripción. Aunque inicialmente se pensó que dichos factores reguladores aumentaban el nivel de transcripción, hoy sabemos que existen no sólo factores de regulación positiva sino también de regulación negativa. La figura 4 muestra algunos de los sitios de unión a factores reguladores. Hay una gran cantidad de secuencias conservadas y muchas de las proteínas que se unen a ellas5. Todo esto, unido a la existencia de determinados factores de transcripción en tipos celulares distintos, hace que la regu- Ya se ha señalado que existen 9 subtipos (A, B, C, D, F, G, H, J y K) y hasta 14 formas recombinantes dentro del grupo M del VIH-1 (fig. 6). Por tanto, cabe preguntarse si la estructura y las secuencias específicas de unión a proteínas reguladoras son iguales en todos ellos o si, por el contrario, existen diferencias características de subtipo. En caso de existir, habría que plantearse qué repercusión tienen éstas en la transcripción de estos subtipos, y si confieren propiedades biológicas características en alguno de ellos. Para contestar a todas estas preguntas se han secuenciado y comparado las LTR de distintos subtipos del VIH-1, midiéndose los valores transcripcionales de las distintas LTR. A continuación se resumen las diferencias más significativas que se han encontrado. El estudio de la zona reguladora (NRE) en la región U3 (fig. 4) ha permitido establecer la presencia de secuencias conservadas específicas de subtipo (tabla 3). En esta región se encuentra la secuencia de unión a la proteína USF (fig. 4), que regula la transcripción8. Esta secuencia parece presentar también diferencias específicas de subtipo9,10. La zona de unión a la proteína RBE III, localizada también en la región NRE, está muy conservada en todos los subtipos, aunque el subtipo F presenta una duplicación parcial. En la región del núcleo (core) de la LTR se localizan la caja TATA y tres sitios de unión a SP-1, los cuales aparecen en todos los subtipos, aunque con una elevada variabilidad genética. Esto sugiere que podría haber una unión específica a distintos factores dentro de la familia SP-1. En cuanto a la caja TATA (situada en la posición –28 en todos los subtipos), el subtipo E presenta una mutación, de forma que la secuencia TATAA cambia a TAAAA. Además, este subtipo presenta en la posición –136 la secuencia correspondiente a una caja TATA convencional. Ciertos experimentos de mutagénesis dirigida han demostrado que la única caja funcional que une TBP y recluta la ARN polimerasa II es la caja de la posición –2811. En la región activadora se han encontrado diferencias en el número de sitios NF-κB en los distintos subtipos12,13. Esto condiciona la activación por el factor de necrosis tumoral TABLA 3 Diferencias en las secuencias terminales repetidas largas (LTR) de distintos subtipos del virus de la inmunodeficiencia humana tipo 1 (VIH-1) Secuencia TATA-136 Secuencia TATA-28 (Caja TATA) F No No No No Sí No funcional No Sí Sí Sí Sí No Funcional Sí G No Sí Suptipo A B C D E RBE III AP1 N.O de sitios NF-κB Aumento de la transcripción en presencia de TNF-α (veces) TAR Conservado 2 No 1 No 1 2 2 3 2 1/GABP 2,5-3 2,5-3 3,4 2,5-3 1,5 Deleción 1 nt – – – Deleción 1 nt No No CG (Pu)ACA TTTGAACAAAG CGAAAACACATA 1 + duplicación parcial 1 2 2,5-3 – No 2 2,5-3 – No Secuencia característica en la región NRE Nt: nucleótido. 76 Med Clin (Barc) 2003;121(2):74-7 46 Documento descargado de http://www.elsevier.es el 17/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. LOSPITAO E, ET AL. SECUENCIAS LARGAS TERMINALES REPETIDAS DE LOS RETROVIRUS: ESTRUCTURA Y FUNCIÓN alfa (TNF-α), el factor que promueve la producción de NFκB en la célula. Así, tras la adición de TNF-α a células infectadas con distintos subtipos del VIH-1, la actividad transcripcional aumenta en los subtipos con mayor número de sitios NF-κB14,15. Es decir, la transcripción en estos subtipos es más inducible por TNF-α (tabla 3). El subtipo E presenta un sitio mutado para NF-κB, de forma que no une NF-κB sino GABP (GA-binding protein), un factor modulador de la transcripción. El número de sitios de unión al factor regulador AP1, localizado en la región activadora, también varía en los distintos subtipos del VIH-1. Existen también diferencias en la región TAR de los distintos subtipos del VIH-1, principalmente en los subtipos E16 y A. Estos presentan la deleción de un nucleótido, lo que modifica el tamaño de uno de los bolsillos que se generan en la estructura secundaria de su ARN. En presencia de Tat (proteína viral que se une a TAR), todos los LTR de distintos subtipos presentan una actividad transcripcional similar. Además, dicha actividad es mucho mayor que la que se produce en su ausencia10. Cuando no existe Tat para transactivar, es decir, en condiciones basales, parecen apreciarse algunas diferencias en el grado transcripcional de los distintos subtipos, pero sólo en determinados tipos celulares. Así, por ejemplo, los subtipos E, A y C presentan mayor actividad que el subtipo B en líneas celulares de linfocitos T. Hasta aquí hemos descrito la existencia de diferencias en la secuencia de las LTR en los distintos subtipos del VIH-1, y cómo muchas de ellas son características de subtipo (tabla 3). De todos ellos, el que presenta una arquitectura más diferenciada es el subtipo E16,17, muy extendido en el sudeste asiático18. Este subtipo no es tan estimulable por TNF-α como el resto y presenta, además, cambios en la secuencia de TAR que no impiden el reconocimiento de la proteína Tat del subtipo B. Todo ello sugiere que el subtipo E podría tener algún cambio capaz de otorgarle una estrategia alternativa al control de la transcripción18. Esta opción podría estar mediada por cambios genéticos en la caja TATA, en TAR o en los sitios de unión a SP1. Se requieren más estudios para establecer las bases por las cuales se regula la transcripción en los distintos subtipos del VIH-1. Este tipo de análisis es crucial, considerando que los factores virales genéticos determinan, al menos en parte, el curso de la enfermedad por el VIH-1. 47 REFERENCIAS BIBLIOGRÁFICAS 1. Kuiken C, Foley B, Hahn B, Marx P, McCutchan F, Mellors J, et al. HIV sequence Compendium 2000. Los Alamos: Theoretical biology and biophysics group, Los Alamos National Laboratory Press, 2000. 2. Krebs F, Hogan T, Quiterio S, Gartner S, Wigdahl B. Lentiviral LTR-directed expression, sequence variation, and disease pathogenesis. En: Kuiken C, Foley B, Hahn B, Marx P, McCutchan F, Mellors J, et al, editors. HIV Sequence Compendium 2001. Los Alamos: Los Alamos National Laborary Press, 2001. p. 29-70. 3. Coffin J, Hughes S, Varmus H. Retroviruses. Cold Spring Harbor: Laboratory Press, 1997. 4. Baar M, Ronde A, Berkhout B, Cornelissen M, Van der Horn K, Van der Schoot A, et al. Subtype-specific sequence variation of the HIV type 1 long terminal repeat and primer binding site. AIDS Res Hum Retroviruses 2000;16:499-504. 5. Pereira L, Bentley K, Peeters A, Churchill M, Deacon N. A compilation of cellular transcription factor interactions with the HIV-1 LTR promoter. Nucleic Acids Res 2000;28:663-8. 6. Daelemans D, De Clercq, Vandamme AM. Control of RNA initiation and elongation at the HIV promoter. AIDS Rev 2000;2:229-40. 7. Roebuck K, Saifuddin M. Regulation of HIV-1 transcription. Gene Expr 1999;8:67-84. 8. Giacca M, Gutiérrez M, Menzo S, D’Adda di Fagagna F, Falaschi A. A human binding site for transcription factor USF/MLTF mimics the negative regulatory element of HIV-1. Virology 1992;186:133-47. 9. Hunt G, Johnson D, Tiemesse C. Characterization of the long terminal repeat regions of South African HIV-1 isolates. Virus Genes 2001;23:27-34. 10. Naghavi M, Schwartz S, Sonnerborg A, Vahlne A. Long terminal repeat promoter/ enhancer activity of different subtypes of HIV type 1. AIDS Res Hum Retroviruses 1999;15:1293-303. 11. Jeeninga R, Armand-Ugon M, Baar M, Verhoef K, Berkhout B. Functional differences between the long terminal repeat transcriptional promoters of HIV-1 subtypes A through G. J Virol 2000;74:3740-51. 12. Hunt C, Tiemessen C. Occurrence of additional NF-kappa B-binding motifs in the long terminal repeat region of South African HIV-1 C isolates. AIDS Res Hum Retroviruses 2000;16:305-6. 13. Roof P, Ricci M, Genin P, Montano M, Essex M, Wainberg M, et al. Differential regulation of HIV-1 clade-specific B, C and E long terminal repeats by NF-κB and the Tat transactivator. Virology 2002;296:77-83. 14. Montano M, Nixon C, Ndung’u T, Bussmann H, Novistsky V, Dickman D, et al. Elevated tumor necrosis factor-alpha activation of HIV-1 subtype C in Southern Africa is associated with an NF-kappa B enhancer gain of function. J Infect Dis 2000;181:76-81. 15. Naghavi M, Schwartz S, Sonnerborg A, Vahlne A. Long terminal repeat promoter/enhancer activity of different subtypes of HIV-1. AIDS Res Hum Retroviruses 1999;15:1293-303. 16. Montano M, Nixon C, Essex M. Dysregulation through NF-κB enhancer and TATA box of the HIV-1 subtype E promoter. J Virol 1998;72:8446-52. 17. Wasi C, Herring B, Raktham S, Vanichseni S, Mastro T, Young N, et al. Determination of HIV-1 subtypes in injecting drug users in Bangkok, Thailand, using peptide-binding enzyme immunoassay and heteroduplex mobility assay: evidence of increasing infection with HIV-1 subtype E. AIDS 1995;9:843-9. 18. Montano M, Novistsky V, Blackard J, Cho L, Katzenstein D, Essex M. Divergent transcriptional regulation among expanding HIV-1 subtypes. J Virol 1997;71:8657-65. Med Clin (Barc) 2003;121(2):74-7 77